Subido por Werner Ucañay

ANOVA Ejercicios

Anuncio
1. En un diseño experimental completamente aleatorizado se probó la capacidad absorbente
de agua de tres marcas de toallas de papel. Se usaron toallas de un mismo tamaño para probar
cuatro secciones de toalla por marca. A continuación, se dan los datos de la capacidad de
absorción. Emplee 0.05 como nivel de significancia. ¿Parece haber alguna diferencia en la
capacidad de absorción de estas marcas?
x
91
100
88
89
Marca
y
99
96
94
99
z
83
88
89
76
2. En un estudio publicado en el Journal of Small Business Management se concluyó que los
individuos que se autoemplean no experimentan tanta satisfacción en el trabajo como los que
no se autoemplean. En este estudio, la satisfacción en el trabajo se midió empleando 18
puntos, cada uno de los cuales se evaluaba con una escala de Liker con 1–5 opciones de
respuesta que iban de totalmente de acuerdo a totalmente en desacuerdo. En esta escala una
puntuación mayor corresponde a mayor satisfacción con el trabajo. La suma de las
puntuaciones de los 18 puntos, que iba de 18–90, se empleó para medir la satisfacción con el
trabajo. Suponga que se emplea este método para medir la satisfacción en el trabajo de
abogados, terapeutas físicos, carpinteros y analistas de sistemas. A continuación, se
encuentran los resultados obtenidos en una muestra de 10 individuos de cada profesión.
Abogados
44
42
74
42
53
50
45
48
64
38
Terapeutas físicos
55
78
80
86
60
59
62
52
55
50
Carpinteros
54
65
79
69
79
64
59
78
84
60
Analistas de sistemas
44
73
71
60
64
66
41
55
76
62
Con a α = 0.05 como nivel de significancia, pruebe si hay diferencia en la satisfacción con
el trabajo en estas cuatro profesiones.
3. La revista Money publicó porcentajes de las proporciones de rendimientos y gastos de
acciones y fondos de bonos. Los datos siguientes son las proporciones de gastos en 10 fondos
de acciones “midcap”, 10 fondos de acciones “small-cap”, 10 fondos de acciones híbridos y
10 fondos por sector especialista (Money, marzo de 2003).
Midcap
1.2
1.1
Small-Cap
2.0
1.2
Híbridos
2.0
2.7
Especialista
1.6
2.7
1.0
1.2
1.3
1.8
1.4
1.4
1.0
1.4
1.7
1.8
1.5
2.3
1.9
1.3
1.2
1.3
1.8
1.5
2.5
1.0
0.9
1.9
1.4
0.3
2.6
2.5
1.9
1.5
1.6
2.7
2.2
0.7
Use α = 0.05 para probar si hay diferencias significativas entre las proporciones de gastos
medios de estos cuatro fondos de acciones.
4. La primera encuesta anual sobre empleo de Business 2.0 proporcionó datos sobre los
salarios anuales de 97 empleos diferentes. Los datos siguientes son salarios anuales de 30
empleos diferentes en tres campos, software y hardware para computadoras, construcción e
ingeniería.
Computación
Empleo
Salario
Administrador de datos
94
Administrador de fabricación 90
Programador
63
Administrador de
84
Proyecto
Desarrollador de software
73
Diseñador
75
Sistemas de personal
94
Analista de sistemas
77
Construcción
Empleo
Administrador
Arquitecto
Administrador arquitecto
Administrador de
la construcción
Maestro de obras
Diseñador de interiores
Arquitecto de paisaje
Estimador
Ingeniería
Empleo
Salario
Aeronáutica
75
Agrícola
70
Química
88
Civil
77
Salario
55
53
77
60
Eléctrica
Mecánica
Minera
Nuclear
41
54
51
64
89
85
96
105
Use α = 0.05 para probar si hay alguna diferencia significativa entre los salarios medios
anuales de los tres campos de trabajo.
5. Se proponen tres nuevos métodos de fabricación para un producto nuevo. Para determinar
con cuál de los métodos se producen más unidades por hora se elige un diseño experimental
completamente aleatorizado y a 30 trabajadores tomados al azar se les asigna alguno de los
métodos de fabricación.
En la tabla siguiente se presenta el número de unidades producidas por cada uno de los
trabajadores.
A
97
73
93
100
73
91
100
86
92
Método
B
93
100
93
55
77
91
85
73
90
C
99
94
87
66
59
75
84
72
88
95
83
86
Utilice estos datos y realice una prueba para ver si el número medio de unidades producidas
es la misma con los tres métodos de fabricación. Use α = 0.05.
6. En un estudio realizado para investigar la actividad de los clientes en las tiendas grandes,
a cada cliente se le clasificó al inicio como poco activo, medianamente activo y muy activo.
De cada cliente se obtuvo un valor que medía cuán a gusto se encontraba el cliente en la
tienda. Valores más altos indicaban que el cliente se encontraba más a gusto. Los datos
obtenidos fueron los siguientes.
Poco activo
4
5
6
3
3
4
5
4
Medianamente
activo
5
6
5
4
7
4
6
5
Muy
activo
5
7
5
7
4
6
5
7
a. Use α = 0.05 para probar si hay diferencia en el grado en que se sienten a gusto los tres
tipos de clientes.
b. Use el procedimiento de la LSD de Fisher para comparar los grados en que se encuentran
a gusto los poco activos y los medianamente activos. Use α = 0.05 ¿Cuál es la conclusión?
7. Una empresa realiza una investigación para determinar el rendimiento, en millas por galón,
característico de tres marcas de gasolina. Como cada gasolina da rendimientos distintos en
automóviles de marcas diferentes, se eligen cinco marcas de automóviles que se tratan como
bloques en el experimento; es decir, el automóvil de cada marca se prueba con los tres tipos
de gasolina. Los resultados del experimento (en millas por galón) se presentan a
continuación.
A
B
Automóviles C
D
E
I
18
24
30
22
20
Marcas de gasolina
II
21
26
29
25
23
III
20
27
34
24
24
a. Con α = 0.05, ¿se encuentra alguna diferencia entre los rendimientos medios en millas por
galón de los tres tipos de gasolina?
b. Analice los datos experimentales usando el ANOVA para diseños completamente
aleatorizados.
Compare sus hallazgos con los obtenidos en el inciso a. ¿Cuál es la ventaja de tratar de
eliminar el efecto de bloque?
8. Wegman’s Food Markets y Tops Frendly Markets son cadenas grandes de tiendas de
abarrotes en una zona de Nueva York. Cuando Wal-Mart abrió un supermercado en esta zona,
los expertos predijeron que Wal-Mart vendería más barato que estas dos tiendas locales. Un
periódico publicó los precios de 15 artículos que se presentan en la tabla siguiente.
Artículo
Plátanos (1 lb)
Sopa Cambell’s (10.75 oz)
Pechuga de pollo (3 lb)
Pasta de dientes (6.2 oz)
Huevos (1 docena)
Salsa cátsup (36 oz)
Jell-o (3 onz)
Cacahuatina (18 oz)
Leche (descremada, 1/2 gal)
Oscar Meyer hotdogs (1 lb)
Salsa ragú para pasta (1 lb, 10 oz)
Galletas Ritz (1 lb)
Detergente Tid (líquido, 100 oz)
Jugo de naranja Tropicana (1/2 gal)
Twizzlers (frambuesas, 1 lb)
Tops
0.49
0.60
10.47
1.99
1.59
2.59
0.67
2.29
1.34
3.29
2.09
3.29
6.79
2.50
1.19
Wal-Mart
0.48
0.54
8.61
2.40
0.88
1.78
0.42
1.78
1.24
1.50
1.50
2.00
5.24
2.50
1.27
Wegmans
0.49
0.77
8.07
1.97
0.79
2.59
0.65
2.09
1.34
3.39
1.25
3.39
5.99
2.50
1.69
Con α = 0.05 como nivel de significancia, pruebe si hay una diferencia significativa entre
las tres tiendas en las medias del precio de estos 15 artículos.
9. El U.S. Department of Housing and Urban Development publica datos que muestran el
mercado de rentas mensuales en las áreas metropolitanas. Los datos siguientes son las rentas
mensuales aceptables en cinco zonas metropolitanas para departamentos de 1, 2 y 3
recámaras (The New York Times Almanac, 2006).
1 recámara
2 recámaras
3 recámaras
Boston
1077
1266
1513
Miami
775
929
1204
San Diego
975
1183
1725
San José
1107
1313
1889
Washington
1045
1187
1537
Emplee 0.05 como nivel de significancia, pruebe si las rentas mensuales aceptables son
iguales en estas cinco zonas metropolitanas.
10. Se tienen dos sistemas de software para traducción del inglés a otros idiomas. Para ver si
hay diferencia en la rapidez de estos dos sistemas de traducción se diseña un experimento
factorial. Como el idioma al que se traduzca es también un factor importante, los dos sistemas
se prueban traduciendo a tres idiomas: español, francés y alemán. Los datos siguientes dan
el tiempo en horas que se necesitó en cada uno de los sistemas.
Sistema 1
Sistema 2
Idioma
Francés
10
14
14
16
Español
8
12
6
10
Alemán
12
16
16
22
Realice una prueba para determinar si hay alguna diferencia significativa de rapidez entre
los dos sistemas de software, entre los idiomas a que se traduce y si hay algún efecto de
interacción. Use α = 0.05.
11. En una fábrica se diseña un experimento factorial para determinar si hay diferencia entre
el número de artículos defectuosos producidos por dos máquinas y si el número de defectos
depende también de si a estas máquinas se les suministra la materia prima que necesitan,
manualmente o mediante un sistema de alimentación automático. A continuación, se
presentan los datos del número de artículos defectuosos producidos. Use α = 0.05 para probar
si hay algún efecto significativo debido a la máquina, al sistema de suministro de la materia
prima y a la interacción.
Máquina 1
Máquina 2
Suministro de la materia prima
Manual
Automático
30
30
34
26
20
22
24
28
12. Con el fin de determinar la respuesta de las mujeres profesionales a las marcas de
guardarropa de trabajo, On the Job, una boutique local, encuestó grupos de mujeres agentes
de bienes raíces, secretarias, empresarias y ejecutivas de cuenta con respecto al estilo de ropa
que usaban con más frecuencia (A, B, C, D). Se recolectaron los siguientes datos:
Estilo
Ocupación
A
B
C
D
Agente de bienes raíces
5
7
6
8
Secretaria
10
15
12
8
Empresaria
8
12
21
25
Ejecutiva de cuenta
12
14
20
25
Al nivel de significancia de 0.10, pruebe si el estilo que prefieren las mujeres depende de sus
actividades.
13. En el desarrollo de nuevas medicinas para el tratamiento de la ansiedad, es importante
verificar el efecto de los medicamentos sobre varias funciones motrices, una de las cuales es
conducir un automóvil. La compañía farmacéutica Confab está probando cuatro ansiolíticos
diferentes respecto a su efecto sobre las capacidades para conducir. Los sujetos toman una
prueba de manejo simulada y su calificación refleja los errores cometidos. Los errores más
graves producen calificaciones más altas. Los resultados de estas pruebas se presentan en la
siguiente tabla:
Medicina 1
Medicina 2
Medicina 3
Medicina 4
245
277
215
241
258
276
232
253
239
263
225
237
241
274
247
246
226
240
Al nivel de significancia de 0.05, ¿los cuatro medicamentos afectan de manera diferente las
habilidades de manejo?
14. James Clark acaba de adquirir dos fábricas de papel y está preocupado porque tienen una
variabilidad significativamente diferente en sus producciones, aun cuando las dos plantas
producen aproximadamente la misma cantidad promedio de papel cada día. La siguiente
información se obtuvo para ver si las preocupaciones
del señor Clark son justificadas.
Al nivel de significancia α=0.02, ¿las dos plantas revelan la misma varianza en su
producción?
Planta
Número 1
Número 2
n
31
41
s2
984 toneladas al cuadrado
1,136 toneladas al cuadrado
15. Los costos de combustible son importantes para alcanzar la rentabilidad en las líneas
aéreas. Un pequeño transportista regional opera tres tipos de equipo y recolectó los siguientes
datos de sus 14 aviones, expresados en costo de combustible (en centavos de dólar) por
asiento-milla disponible.
Tipo A
Tipo B
Tipo C
7.3
5.6
7.9
8.3
7.6
9.5
7.6
7.2
8.7
6.8
8.0
8.3
9.4
8.4
A un nivel de significancia de 0.01, ¿se puede concluir que no existe una diferencia verdadera
en los costos del combustible entre los tipos de aviones?
16. Las tiendas establecen sus precios, pero los fabricantes tienen interés en el precio de venta
final como parte de su estrategia de promoción. El gerente de mercadotecnia de los bolígrafos
marca C se queja de que el resultado de un recorte de precios excesivo en las tiendas es que
la marca C se percibe como una “pluma corriente”. El gerente de ventas contesta que “todos
dan descuentos, todas las marcas, hasta cierto punto”.
Durante las llamadas de ventas recolectaron datos del precio final de cuatro marcas de
bolígrafos, incluyendo la de ellos, en cinco tiendas diferentes. Para un nivel de confianza de
0.05, ¿existe una variación significativa en el precio entre las marcas?
Marca A
61
55
57
60
62
Precio (en centavos de dólar)
Marca B
Marca C
Marca D
52
47
67
58
52
63
54
49
68
55
49
59
58
57
65
17. Una compañía publicitaria de espectaculares debe saber si hay volúmenes de tránsito
significativamente distintos que pasen frente a anuncios situados en tres lugares en Newark,
debido a que la compañía cobra precios diferentes dependiendo de la cantidad de autos que
pasan frente al anuncio. Se mide el volumen del tránsito en los tres sitios durante intervalos
de 5 minutos elegidos aleatoriamente. La tabla muestra los datos obtenidos. Al nivel de
significancia de 0.05, ¿son iguales los volúmenes de autos que pasan frente los tres anuncios?
Anuncio 1
Anuncio 2
Anuncio 3
30
29
32
45
38
44
Volumen de tránsito
26
44
18
38
36
21
36
18
40
43
24
28
42
17
18
29
30
32
18. Un estudio compara el número de horas de alivio que proporcionan cinco marcas de
antiácidos administrados a 25 personas diferentes, cada una con acidez estomacal
considerada fuerte. Los resultados son los siguientes:
A
4.4
4.6
4.5
4.1
3.8
B
5.8
5.2
4.9
4.7
4.6
Marca
C
4.8
5.9
4.9
4.6
4.3
D
2.9
2.7
2.9
3.9
4.3
E
4.6
4.3
3.8
5.2
4.4
a) Calcule el número medio de horas de alivio para cada marca y determine la gran media.
b) Estime la varianza de la población usando la varianza entre columnas (ecuación 11-6).
c) Estime la varianza de la población usando la varianza dentro de columnas calculada a
partir de la varianza dentro de las muestras.
d) Calcule el cociente F. Para un nivel de significancia de 0.05, ¿las marcas producen
cantidades significativamente diferentes de alivio a las personas con acidez estomacal fuerte?
19. Se compararon tres métodos de capacitación para ver si los empleados tienen una mayor
productividad después de capacitarse. Los datos que se presentan a continuación son medidas
de la productividad de los individuos capacitados por cada método.
Método 1
Método 2
Método 3
45
59
41
40
43
37
50
47
43
39
51
40
53
39
52
44
49
37
Al nivel de significancia de 0.05, ¿los tres métodos de entrenamiento llevan a diferentes
niveles de productividad?
20. Los datos siguientes indican el número de solicitudes de pago de seguro procesadas
diariamente por un grupo de cuatro empleados de aseguradoras observados durante cierto
número de días. Pruebe la hipótesis de que las solicitudes medias de los empleados por día
son las mismas. Utilice un nivel de significancia de 0.05.
Empleado 1
Empleado 2
Empleado 3
Empleado 4
15
12
11
13
17
10
14
12
14
13
13
12
12
17
15
14
12
10
9
21. Dadas las siguientes mediciones de cuatro muestras, ¿podemos concluir que vienen de
poblaciones que tienen el mismo valor medio? Utilice el nivel de significancia de 0.01.
Muestra 1
Muestra 2
Muestra 3
Muestra 4
16
29
14
21
21
18
15
28
24
20
21
20
28
19
19
22
29
30
28
18
21
17
22. El gerente de una línea de ensamble de una planta manufacturera de relojes decidió
estudiar de qué manera las diferentes velocidades de la banda transportadora afectan la tasa
de unidades defectuosas producidas en un turno de 8 horas. Para ello, corrió la banda a 4
velocidades distintas en 5 turnos de 8 horas cada uno y registró el número de unidades
defectuosas encontradas al final de cada turno. Los resultados del estudio son los siguientes:
Unidades defectuosas por turno
Velocidad 1 Velocidad 2 Velocidad 3 Velocidad 4
37
27
32
35
35
32
36
27
38
32
33
33
36
34
34
31
34
30
40
29
23. El supervisor de seguridad de una tienda departamental grande desea saber si el personal
de seguridad sorprende a una cantidad relativamente mayor de ladrones durante la temporada
navideña que en las semanas anteriores o posteriores. Reunió datos correspondientes al
número de ladrones aprehendidos en la tienda durante los meses de noviembre, diciembre y
enero, durante los seis años anteriores. La información es:
Noviembre
Diciembre
Enero
43
54
36
Número de ladrones
37
59
55
38
41
48
35
50
28
34
41
30
48
49
32
Al nivel de significancia de 0.05, ¿es el número medio de ladrones sorprendidos el mismo
durante estos tres meses?
24. Un curso de introducción a la economía se ofrece en 3 secciones, cada una con diferente
instructor. Las calificaciones finales del semestre de primavera se presentan en la tabla.
¿Existe una diferencia significativa en los promedios de calificaciones dadas por los
instructores? Establezca las pruebas de hipótesis adecuadas para α = 0.01.
Sección 1
98.4
97.6
84.7
88.5
77.6
84.3
81.6
88.4
95.1
90.4
89.4
65.6
94.5
99.4
68.7
83.4
Sección 2
97.6
99.2
82.6
81.2
64.5
82.3
68.4
75.6
Sección 3
94.5
92.3
92.4
82.3
62.6
68.6
92.7
82.3
91.2
92.6
87.4
Análisis de varianza (ANOVA) Técnica estadística utilizada para probar la igualdad de tres
o más medias muestrales y hacer inferencias sobre si las muestras provienen de poblaciones
que tienen la misma media.
Cociente F Cociente utilizado en el análisis de varianza, entre otras pruebas, para comparar
la magnitud de dos estimaciones de la varianza de la población para determinar si las dos
estimaciones son aproximadamente iguales; en ANOVA se usa el cociente de la varianza
entre columnas dividido entre la varianza dentro de columnas.
Distribución F Familia de distribuciones diferenciadas por dos parámetros (gl del
numerador, gl del denominador), utilizada principalmente para probar hipótesis sobre
varianzas.
Gran media La media para el grupo completo de sujetos provenientes de todas las muestras
del experimento.
Tabla de contingencia Tabla que contiene R renglones y C columnas. Cada renglón
corresponde a un nivel de una variable; cada columna, a un nivel de otra variable. Los
elementos del cuerpo de la tabla son las frecuencias con que ocurre cada combinación de
variables.
Varianza dentro de columnas Estimación de la varianza de la población basada en las
varianzas dentro de k muestras, utilizando un promedio ponderado de k varianzas muestrales.
Varianza entre columnas Estimación de la varianza de la población derivada de la varianza
entre las medias de las muestras.
Tabla ANOVA Tabla usada para resumir los cálculos y los resultados del análisis de
varianza. Esta tabla tiene columnas en las que se muestran las fuentes de variación, las sumas
de cuadrados, los grados de libertad, los cuadrados medios y el o los valores F.
Partición. Proceso que distribuye la suma total de cuadrados y de grados de libertad entre
sus diversos
componentes.
Procedimientos de comparación múltiple. Procedimientos estadísticos que se emplean
para realizar comparaciones estadísticas entre pares de medias poblacionales.
Tasa de error tipo I por comparación Probabilidad de cometer un error tipo I en la
comparación de un solo par.
Tasa de error tipo I por experimentación Probabilidad de cometer un error tipo I en por lo
menos una de varias comparaciones por pares.
Factor. Otro término empleado para la variable independiente de interés.
Tratamientos Los diferentes niveles (valores) del factor.
Experimento de un solo factor Experimento en el que hay un solo factor con k poblaciones
o tratamientos.
Variable de respuesta Otro término para la variable dependiente de interés.
Unidades experimentales Los objetos de interés en el experimento.
Diseño completamente aleatorizado Diseño experimental en el que los tratamientos se
asignan en forma aleatoria a las unidades experimentales.
Formación de bloques Proceso que consiste en usar una misma o similares unidades
experimentales para todos los tratamientos. El objetivo de la formación de bloques es
eliminar, del término del error, fuentes extrañas de variación y con esto proporcionar una
prueba más sólida para diferenciar las medias de las poblaciones o tratamientos.
Diseño de bloques aleatorizado. Diseño de experimentos en el que se usa la formación de
bloques.
Experimento factorial Diseño experimental en el que se obtienen simultáneamente
conclusiones acerca de dos o más factores.
Replicaciones Número de veces que en un experimento se repite una condición
experimental.
Interacción Efecto que se produce cuando los niveles (valores) de un factor interactúan con
los niveles (valores) del otro factor e influyen en la variable de respuesta.
Descargar