Práctica 3 - Universidad Austral

Anuncio
Universidad Austral
Estadística II
Práctico No 3
Test de igualdad de varianzas
Tests de igualdad para dos medias y para más medias
Ejercicio 1:
El gerente de sistemas de una empresa desea estudiar el uso de la computadora en dos
departamentos: administración y producción. Se seleccionó una muestra de 5 trabajos
del departamento de administración en el mes pasado y 6 trabajos del departamento de
producción del mismo mes. En ambas se registró el tiempo de procesamiento (en
segundos) para cada trabajo, con los siguientes resultados:
Administración
Producción
9
4
3
13
8
10
7
9
12
9
6
a.- Verificar si existe diferencia entre la varianza del departamento administración y la
del departamento de producción.
b.- ¿Qué suposiciones se requieren para efectuar el análisis en el punto a?
Ejercicio 2:
Una agencia de informes de consumidores desea comparar el precio, en pesos, de una
marca particular de whisky en dos ciudade. Para ello selecciona una muestra aleatoria de
6 tiendas en una ciudad y de 8 tiendas en la otra, obteniendo los siguientes resultados:
Ciudad I
Ciudad II
10
13
12
16
9
8
14
12
12
14
10
13
11
14
a.- ¿Existe alguna diferencia entre las varianzas del precio de ese whisky en las dos
ciudades?
b.- ¿Bajo qué supuestos se lleva a cabo la prueba del punto a?
Ejercicio 3:
Cierto metal se produce por la común, mediante un proceso estándar. Se desarrolla un
nuevo proceso en el que se añade una aleación a la producción del metal. Los
fabricantes se encuentran interesados en estimar la verdadera diferencia entre las
tensiones de rotura de los metales producidos por ambos procesos. Para cada metal se
seleccionan 12 piezas y cada una se somete a una tensión hasta que se rompe. La
siguiente tabla muestra las tensiones de rotura de estas piezas en kg/cm2.
Proceso estándar
428
419
458
439
441
456
463
429
438
445
441
463
Proceso nuevo
462
448
435
465
429
472
453
459
427
468
452
447
13
Práctico 3
Test de igualdad de varianzas - ANOVA
a.- Plantee un test para decidir si puede concluir que existe diferencia real entre las
medias de ambos procesos con un nivel de significación del 5%, 10% y 1%. ¿Cuáles
son los supuestos del test?
b.- ¿Podría pensar que las varianzas de las dos muestras son iguales?
c.- ¿Cuál es su conclusión?
Ejercicio 4:
En un experimento se desea estudiar los efectos del nivel de iluminación en el
rendimiento por tarea. Para ello se tomaron 9 personas y se les solicitó que insertaran
rápidamente y en forma sucesiva un medidor de punta fina en los ojos de 10 agujas
tanto para un bajo nivel de luz con fondo negro como para un alto nivel de luz con
fondo blanco. Se midió el tiempo en segundos necesario para que cada persona finalice
la tarea.
Persona Numero
1
2
3
4
5
6
7
8
9
Fondo
Negro 25.85 28.84 32.05 25.74 20.89 41.05 25.01 24.96 27.47
Blanco 18.23 20.84 22.96 19.68 19.50 24.98 16.61 16.07 24.59
a.- ¿La información de esta tabla indica que el nivel de iluminación mas alto produce
una disminución de mas de 5 segundos en el promedio verdadero de tiempo de
terminación de la tarea? Pruebe esta hipótesis con un nivel de significación del 10%.
b.- ¿Qué supuestos tuvo que efectuar para contestar la pregunta a? ¿Se verifican?
Ejercicios 5:
En dos ciudades se llevó a cabo una encuesta sobre el costo de la vida para obtener el
gasto promedio en alimentación en familias constituidas por cuatro personas. De cada
ciudad se seleccionó en forma aleatoria una muestra de 20 familias y se observaron sus
gastos semanales en alimentación. Se cuenta con la siguiente información:
Ciudad 1:
Ciudad 2:
Media = $135
Media = $122
Desviación estándar = $15
Desviación estándar = $10
Si se supone que se muestrearon dos poblaciones independientes con distribución
normal cada un y con varianzas iguales, obtener los intervalos de confianza estimados
del 95% y 99% para la diferencia entre las medias reales de la ciudad 1 y la ciudad 2.
¿Se estaría inclinado a concluir que existe una diferencia real entre las medias de ambas
ciudades?
Ejercicio 6:
Un inversionista desea comparar los riesgos asociados con dos mercados diferentes, el
A y el B. El riesgo de un mercado está dado por la variación diaria de precios. El
inversionista piensa que el riesgo asociado con el mercado B es mayor que el del
mercado A. Se obtienen muestras aleatorias de 21 cambios de precios diarios para el
mercado A y de 16 para el mercado B. Se obtienen los siguientes resultados:
Mercado A:
Mercado B:
Media = 0.3
Media = 0.4
Desviación estándar = 0.25
Desviación estándar = 0.45
Si se supone que las muestras provienen de dos poblaciones independientes con
distribución normal, ¿podrá ser cierta la creencia del inversionista al nivel de
significación del 5%?
14
Práctico 3
Test de igualdad de varianzas - ANOVA
Ejercicio 7:
Una revista para consumidores estaba interesada en saber si existía o no alguna
diferencia entre la duración promedio de cuatro marcas diferentes de pilas. Se probó una
muestra aleatoria de cuatro pilas de cada marca, con los siguientes resultados en horas:
Marca 1
12
15
18
10
Marca 2
14
17
12
19
Marca 3
21
19
20
23
Marca 4
14
21
25
20
Con un nivel de significación del 5%, determinar si hay alguna diferencia en la
producción promedio de estas 4 marcas de pilas.
Ejercicio 8:
El gerente de una cadena de tiendas desea determinar si la ubicación de producto en
exposición tiene o no algún efecto sobre la venta de un determinado juguete.
Se van a considerar tres ubicaciones diferentes: Frente, Centro y Posterior.
Se seleccionó una muestra aleatoria de 18 tiendas y se hizo una asignación aleatoria de
6 tiendas a cada ubicación en el pasillo. Al final de un período de prueba de una
semana, las cantidades de ese juguete que se han vendido fueron las siguientes:
Frente
86
72
54
40
50
62
Ubicación en el pasillo
Centro
Posterior
20
46
32
28
24
60
18
22
14
28
16
40
a.- Con un nivel de significación del 5%, ¿hay pruebas de una diferencia en las ventas
según las ubicaciones del producto en los pasillos?
b.- En base a estos resultados, ¿qué comparaciones entre los grupos sugieren estos datos?
Ejercicio 9:
Un auditor del Departamento de Impuestos desea comparar la eficiencia de cuatro
centros regionales de procesamiento de datos de impuestos. Se seleccionó una muestra
aleatoria de cinco declaraciones, y se determinó el número de días entre la recepción de
la declaración de impuestos y el procesamiento. Los resultados en días fueron:
Este
49
54
40
60
43
Centros Regionales
Centro
Sur
47
39
56
55
40
48
51
43
55
50
Oeste
52
42
57
46
50
Con un nivel de significación del 5%, ¿hay pruebas de una diferencia en el tiempo de
procesamiento de las declaraciones de impuestos entre los cuatro centros regionales?
15
Práctico 3
Test de igualdad de varianzas - ANOVA
Ejercicio 10:
Se determinó el tiempo de respuesta, en milisegundos, para tres tipos diferentes de
circuitos empleados en mecanismos de corte automáticos. Los resultados fueron:
Tipo de circuito
1
2
3
9
20
6
Tiempo de respuesta
12 10
8 15
21 23 17 30
5
8
16
7
a.- Escribir el modelo adecuado.
b.- Pruebe la hipótesis de que los tres tipos de circuitos tienen igual tiempo de respuesta,
con  = 0.01.
Ejercicio 11:
Se sospecha que 5 máquinas alimentadoras en cierta planta, están llenando frascos a
diferentes niveles. Se tomaron muestras al azar de la producción de cada máquina, con
los siguientes resultados:
A
11.95
12.00
12.25
12.10
B
12.18
12.11
12.15
12.16
Máquina
C
12.16
12.15
12.08
12.10
D
12.25
12.30
12.10
12.02
E
12.10
12.04
12.02
12.07
a.- Escribir el modelo apropiado para este experimento.
b.- Analizar los datos y extraer conclusiones, al 5%.
c.- Enuncie las conclusiones que se extraen del estudio.
Ejercicio 12:
Una fábrica dispone de varios hornos que funcionan a igual temperatura. Se sospecha
que esto no es cierto, por lo que se eligen al azar tres hornos y se determinan las
temperaturas alcanzadas en las sucesivas pruebas. Los datos son los siguientes:
Horno
1
2
3
491.50
488.50
499.10
498.30
484.65
484.80
Temperatura
498.10 493.50
479.90 477.35
488.25 473.00
493.60
471.85
478.65
a.- Escribir el modelo adecuado y especificar cada uno de los términos.
b.- ¿Hay diferencias significativas en las temperaturas de los hornos?
Ejercicio 13:
Una planta textil posee un gran número de telares. Se supone que cada telar produce la
misma cantidad de tela por minuto. Para corroborar este supuesto, se eligen al azar
cinco telares y se registran sus producciones en diferentes momentos. Se obtuvieron los
siguientes resultados:
Telar
1
2
3
4
5
14.0
13.9
14.1
13.6
13.8
Producción (lb/min)
14.1 14.2 14.0 14.1
13.8 13.9 14.0 14.0
14.2 14.1 14.0 13.9
13.8 14.0 13.9 13.7
13.6 13.9 13.8 14.0
16
Práctico 3
Test de igualdad de varianzas - ANOVA
a.- En este experimento, ¿son los efectos fijos o aleatorios? Indique el modelo y
especifique cada uno de sus componentes.
b.- ¿Es igual la producción de los telares?
c.- Estimar la variabilidad entre telares.
d.- Estimar la varianza del error.
Ejercicio 14:
Los siguientes datos corresponden al contenido de ácido ascórbico de tres tipos de
variedades de duraznos, en cierta localidad. Se eligieron 10 duraznos al azar de cada
variedad para hacer las determinaciones. Todos los valores fueron convertidos a
mg/100g.
Variedad 1
5.34 5.50
5.58 5.42
5.26 5.47
5.47 5.71
5.39 5.62
Variedad 2
7.12 6.80
6.89 6.91
6.93 6.76
6.82 6.97
7.06 6.88
Variedad 3
6.28 6.40
6.01 6.12
6.27 6.24
6.15 6.31
6.38 6.37
a.- Especificar el modelo lineal para este experimento, explicando cada uno de los
términos.
b.- Probar la hipótesis de que el contenido de ácido ascórbico es el mismo de las tres
variedades, al 5%.
c.- En el caso en que sea posible estudiar las medias que difieren significativamente con
un nivel del 5%.
Ejercicio 15:
Un investigador estudió 3 sistemas de rotación con la finalidad de controlar los
nemátodos. El diseño utilizado fue el completamente aleatorizado y se usaron 12
parcelas por cada sistema. El ensayo duró 12 años, al cabo del cual se tomó una muestra
de suelo por cada parcela y se determinó el número de nemátodos por muestra.
1
3
5
2
6
3
5
Sistemas de rotación
2
8
31
10
9
6
15
19
7
5
12
11
3
4
18
20
6
6
22
15
8
3
12
10
7
3
7
14
8
5
9
6
a.- Obtener los residuales.
b.- Verificar los supuestos y extraer conclusiones.
Ejercicio 16:
Los datos de la tabla que se presentan en este ejercicio corresponden a un experimento
realizado para investigar si la producción de cierto proceso químico dependía de la
fórmula de una entrada en particular o de la velocidad de la mezcladora.
Un paquete estadístico provee los siguientes resultados: SS(Fórmula) = 2253.44;
SS(Velocidad) = 230.81; SS(Fórmula *Velocidad) = 18.58; SS(Error) = 71.87.
17
Práctico 3
Test de igualdad de varianzas - ANOVA
1
60
189.7
188.6
190.1
Velocidad
70
80
185.1 189.0
179.4 193.0
177.3 191.1
Fórmula
2
165.1
165.9
167.6
161.7
159.8
161.6
163.3
166.6
170.3
a.- ¿Existe interacción entre los dos factores?
b.- ¿La producción depende de la fórmula o de la velocidad?
c.- Calcule las estimaciones de los efectos principales. Verifique los supuestos según
las salidas del test que se encuentran al final de la práctica.
Ejercicio 17:
A continuación se presenta parte de la tabla ANOVA de un diseño completamente
aleatoriazado con dos factores (Factor A y Factor B), los cuales tienen 3 y 5 niveles
respectivamente y en cada nivel se realizaron 2 repeticiones.
Fuente de variación
A
B
AB
Error
Total
Suma de cuadrados Grados de libertad
800
900
300
400
Cuadrados Medios
F
a.- Suponga efectos fijos, explique el modelo estadístico apropiado y formule las
hipótesis a probar para este experimento.
b.- Complete la tabla
c.- ¿Con la información disponible se pueden extraer conclusiones válidas si las fuentes
de variación son significativas estadísticamente? Si es necesaria otra información,
explique cuál es y cómo la obtendría.
Ejercicio 18:
Con el mismo enunciado del ejercicio anterior, suponga que ahora que B es un bloque.
a.- Suponga efectos fijos, explique el modelo estadístico apropiado y formule las
hipótesis a probar para este experimento.
b.- Complete una tabla similar a la del ejercicio anterior.
c.- ¿Con la información disponible se pueden extraer conclusiones válidas si las fuentes
de variación son significativas estadísticamente? Si es necesaria otra información,
explique cuál es y cómo la obtendría.
Ejercicio 19:
Para mejorar la resistencia a la torsión de las adhesiones de componentes electrónicos
sobre placas, se estudiaron dos tipos de pegamentos (A y B) y tres temperaturas de
curado (60, 80 y 100 grados centígrados). En cada combinación se analizaron dos
componentes.
a.- Plantee las hipótesis de interés y el modelo estadístico correspondiente.
b.- Extraiga conclusiones según las salidas adjuntas.
18
Práctico 3
Test de igualdad de varianzas - ANOVA
ANALYSIS OF VARIANCE TABLE FOR RESPUESTA
SOURCE
DF
SS
MS
------------- ---- ---------- ---------PEGAMENTO (A)
1
0.69120
0.69120
CURADO (B)
2
10.3544
5.17720
A*B
2
1.36640
0.68320
RESIDUAL
6
0.37720
0.06287
------------- ---- ---------TOTAL
11
12.7892
F
------10.99
82.35
10.87
P
-----0.0161
0.0000
0.0101
TUKEY (HSD) COMPARISON OF MEANS OF RESPUESTA BY CURADO
HOMOGENEOUS
CURADO
--------100
80
60
MEAN
---------4.3000
3.3000
2.0300
GROUPS
----------I
.. I
.... I
CRITICAL Q VALUE
CRITICAL VALUE FOR COMPARISON
STANDARD ERROR FOR COMPARISON
ERROR TERM USED: RESIDUAL, 6 DF
4.341
0.5443
0.1773
REJECTION LEVEL
TUKEY (HSD) COMPARISON OF MEANS OF RESPUESTA BY PEGAMENTO
HOMOGENEOUS
PEGAMENTO
MEAN
GROUPS
--------- ---------- ----------1
3.4500
I
2
2.9700
.. I
19
Práctico 3
Test de igualdad de varianzas - ANOVA
0.050
CRITICAL Q VALUE
CRITICAL VALUE FOR COMPARISON
STANDARD ERROR FOR COMPARISON
ERROR TERM USED: RESIDUAL, 6 DF
3.461
0.3542
0.1448
REJECTION LEVEL
0.050
Ejercicio 20:
En una compañía dedicada a la fabricación de bombas y válvulas, algunos componentes
crísticos tienen tolerancias muy estrechas que son dificiles de cumplir. De aquí la
necesidad de estimar el error de medición con el fin de reducirlo para cumplir con las
especificaciones. Este es el objetivo del estudio R&R (Reproducibilidad y
Repetitividad) que aquí exlpicamos simplificadamente. Se seleccionan dos inspectores y
siete piezas para correr un experimento para estimar la contribución de los inspectores
en la variabilidad total observada.
a.- Plantee las hipótesis de interés y el modelo estadístico correspondiente. ¿Este es un
modelo de efectos fijos o de efectos aleatorios?
b.- Extraiga conclusiones según las salidas adjuntas.
ONE-WAY AOV FOR ANCHO BY INSPECTOR
SOURCE
DF
SS
MS
------- ---- --------- --------BETWEEN
1
0.02240
0.02240
WITHIN
12
0.33977
0.02831
TOTAL
13
0.36217
BARTLETT'S TEST OF
EQUAL VARIANCES
CHI-SQ
-----0.01
COCHRAN'S Q
LARGEST VAR / SMALLEST VAR
F
-----0.79
DF
-----1
P
-----0.3912
P
-----0.9073
0.5247
1.1040
COMPONENT OF VARIANCE FOR BETWEEN GROUPS -8.449E-04
EFFECTIVE CELL SIZE
7.0
SAMPLE
GROUP
INSPECTOR
MEAN
SIZE
STD DEV
------------------ ------ ---------1
69.589
7
0.1724
2
69.669
7
0.1641
TOTAL
69.629
14
0.1683
20
Práctico 3
Test de igualdad de varianzas - ANOVA
TUKEY (HSD) COMPARISON OF MEANS OF ANCHO BY INSPECTOR
HOMOGENEOUS
INSPECTOR
MEAN
GROUPS
--------- ---------- ----------2
69.669
I
1
69.589
I
CRITICAL Q VALUE
3.083
REJECTION LEVEL
CRITICAL VALUE FOR COMPARISON
0.1961
STANDARD ERROR FOR COMPARISON
0.0899
0.050
Ejercicio 21:
Para determinar la calidad de una alimentación, quince ratas fueron alimentadas
asignandolas al azar a una de tres dietas con distintos niveles de proteínas, obteniendose
distintas ganancias de peso.
a.- Plantee las hipótesis de interés y el modelo estadístico correspondiente. ¿Este es un
modelo de efectos fijos o de efectos aleatorios?
b.- Extraiga conclusiones según las salidas adjuntas.
ONE-WAY AOV FOR PESOS BY PROTEINAS
SOURCE
DF
SS
MS
------- ---- --------- --------BETWEEN
2
960.578
480.289
WITHIN
12
262.115
21.8429
TOTAL
14
1222.69
BARTLETT'S TEST OF
EQUAL VARIANCES
CHI-SQ
-----25.20
DF
-----2
F
-----21.99
P
-----0.0001
P
-----0.0000
COCHRAN'S Q
0.9879
LARGEST VAR / SMALLEST VAR
COMPONENT OF VARIANCE FOR BETWEEN GROUPS
91.6892
EFFECTIVE CELL SIZE
5.0
21
Práctico 3
Test de igualdad de varianzas - ANOVA
216.54
KEY (HSD) COMPARISON OF MEANS OF PESOS BY PROTEINAS
HOMOGENEOUS
PROTEINAS
MEAN
GROUPS
--------- ---------- ----------3
22.584
I
CRITICAL Q VALUE 3.783
2
9.2900
.. I
REJECTION LEVEL 0.050
1
3.4620
.. I
CRITICAL VALUE FOR COMPARISON 7.9075
CRITICAL VALUE FOR COMPARISON 7.9075
STANDARD ERROR FOR COMPARISON 2.9559
Ejercicio 22:
Un ingeniero de procesos ha identificado dos causas potenciales que provocan vibración
en un motor eléctrico: el material de la caja del motor y la fuente de suministro de los
cojinetes del motor. Para decir cual o cuales son las que influyen significativamente en
provocar vibración en el motor se tomaron los datos siguientes que indican la cantidad
de vibración (en micras) registradas con cajas de motor de acero, de aluminio y de
plástico y con rodamientos suministrados por 5 proveedores seleccionados al azar.
Proveedor de rodamientos
2
3
4
5
Acero
13.1 13.2 16.3 15.8 13.7 14.3 15.7 15.8 13.5 12.5
Material Aluminio 15.0 14.8 15.7 16.4 13.9 14.3 13.7 14.2 13.4 13.8
Plástico 14.0 14.3 17.2 16.7 12.4 12.3 14.4 13.9 13.2 13.1
1
a.- Escriba el modelo y sus respectivos supuestos. ¿Se verifican?
b.- Escriba las respectivas hipótesis nulas y alternativas.
c.- ¿Cuál es su conclusión con un nivel de significación del 5%.
d.- En el caso en que sea posible estudiar las medias que difieren significativamente con
un nivel del 5%.
22
Práctico 3
Test de igualdad de varianzas - ANOVA
Ejercicio 23:
Se desea estimar la durabilidad de escritura de las distintas marcas de bolígrafos del
mercado. Como se sabe que la superficie de escritura afecta de forma directa la duración
se eligieron aleatoriamente tres tipo de superficie. Se trabajo con 4 de las marcas de
bolígrafos existentes en el mercado elegidas al azar. La tabla siguiente presenta los dos
tiempos de vida en minutos obtenidos para cada combinación marca de bolígrafo-tipo
de superficie.
1
1 709
Marca de 2 668
Bolígrafo 3 659
4 698
Superficie de escritura
2
3
659 713 726 660 645
685 722 740 692 720
685 666 684 678 750
650 704 666 686 733
a.- Escriba el modelo y sus respectivos supuestos. ¿Se verifican?
b.- Escriba las respectivas hipótesis nulas y alternativas.
c.- ¿Cuál es su conclusión con un nivel de significación del 5%.
d.- En el caso en que sea posible estudiar las medias que difieren significativamente con
un nivel del 5%.
Ejercicio 24:
En un experimento para observar si la cantidad de cubrimiento de pintura de latex de
color azul pálido para interiores depende de la marca de pintura o de la marca de rodillo
utilizada en su aplicación, se probó un galón de cada una de las 4 marcas de pintura
utilizando cada una de las tres marcas de rodillo existentes en el mercado lo cual generó
la siguiente información en números de pies cuadrados cubiertos.
1
Marcas de 2
Pintura
3
4
Marcas de Rodillo
1
2
3
454 446 451
446 444 447
439 442 444
444 437 443
a.- Construya la tabla de ANOVA, sugerencia: puede restar 400 a todos los datos y eso
no afectara al resultado final.
b.- Establezca y pruebe hipótesis adecuadas para determinar si la marca de pintura tiene
efecto en el cubrimiento. Utilice   0.05 .
c.- Repita el inciso b para la marca de rodillo.
d.- ¿Hay alguna marca de pintura que parezca claramente mejor que las demás?
23
Práctico 3
Test de igualdad de varianzas - ANOVA
Descargar