Universidad Austral Estadística II Práctico No 3 Test de igualdad de varianzas Tests de igualdad para dos medias y para más medias Ejercicio 1: El gerente de sistemas de una empresa desea estudiar el uso de la computadora en dos departamentos: administración y producción. Se seleccionó una muestra de 5 trabajos del departamento de administración en el mes pasado y 6 trabajos del departamento de producción del mismo mes. En ambas se registró el tiempo de procesamiento (en segundos) para cada trabajo, con los siguientes resultados: Administración Producción 9 4 3 13 8 10 7 9 12 9 6 a.- Verificar si existe diferencia entre la varianza del departamento administración y la del departamento de producción. b.- ¿Qué suposiciones se requieren para efectuar el análisis en el punto a? Ejercicio 2: Una agencia de informes de consumidores desea comparar el precio, en pesos, de una marca particular de whisky en dos ciudade. Para ello selecciona una muestra aleatoria de 6 tiendas en una ciudad y de 8 tiendas en la otra, obteniendo los siguientes resultados: Ciudad I Ciudad II 10 13 12 16 9 8 14 12 12 14 10 13 11 14 a.- ¿Existe alguna diferencia entre las varianzas del precio de ese whisky en las dos ciudades? b.- ¿Bajo qué supuestos se lleva a cabo la prueba del punto a? Ejercicio 3: Cierto metal se produce por la común, mediante un proceso estándar. Se desarrolla un nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de rotura de los metales producidos por ambos procesos. Para cada metal se seleccionan 12 piezas y cada una se somete a una tensión hasta que se rompe. La siguiente tabla muestra las tensiones de rotura de estas piezas en kg/cm2. Proceso estándar 428 419 458 439 441 456 463 429 438 445 441 463 Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447 13 Práctico 3 Test de igualdad de varianzas - ANOVA a.- Plantee un test para decidir si puede concluir que existe diferencia real entre las medias de ambos procesos con un nivel de significación del 5%, 10% y 1%. ¿Cuáles son los supuestos del test? b.- ¿Podría pensar que las varianzas de las dos muestras son iguales? c.- ¿Cuál es su conclusión? Ejercicio 4: En un experimento se desea estudiar los efectos del nivel de iluminación en el rendimiento por tarea. Para ello se tomaron 9 personas y se les solicitó que insertaran rápidamente y en forma sucesiva un medidor de punta fina en los ojos de 10 agujas tanto para un bajo nivel de luz con fondo negro como para un alto nivel de luz con fondo blanco. Se midió el tiempo en segundos necesario para que cada persona finalice la tarea. Persona Numero 1 2 3 4 5 6 7 8 9 Fondo Negro 25.85 28.84 32.05 25.74 20.89 41.05 25.01 24.96 27.47 Blanco 18.23 20.84 22.96 19.68 19.50 24.98 16.61 16.07 24.59 a.- ¿La información de esta tabla indica que el nivel de iluminación mas alto produce una disminución de mas de 5 segundos en el promedio verdadero de tiempo de terminación de la tarea? Pruebe esta hipótesis con un nivel de significación del 10%. b.- ¿Qué supuestos tuvo que efectuar para contestar la pregunta a? ¿Se verifican? Ejercicios 5: En dos ciudades se llevó a cabo una encuesta sobre el costo de la vida para obtener el gasto promedio en alimentación en familias constituidas por cuatro personas. De cada ciudad se seleccionó en forma aleatoria una muestra de 20 familias y se observaron sus gastos semanales en alimentación. Se cuenta con la siguiente información: Ciudad 1: Ciudad 2: Media = $135 Media = $122 Desviación estándar = $15 Desviación estándar = $10 Si se supone que se muestrearon dos poblaciones independientes con distribución normal cada un y con varianzas iguales, obtener los intervalos de confianza estimados del 95% y 99% para la diferencia entre las medias reales de la ciudad 1 y la ciudad 2. ¿Se estaría inclinado a concluir que existe una diferencia real entre las medias de ambas ciudades? Ejercicio 6: Un inversionista desea comparar los riesgos asociados con dos mercados diferentes, el A y el B. El riesgo de un mercado está dado por la variación diaria de precios. El inversionista piensa que el riesgo asociado con el mercado B es mayor que el del mercado A. Se obtienen muestras aleatorias de 21 cambios de precios diarios para el mercado A y de 16 para el mercado B. Se obtienen los siguientes resultados: Mercado A: Mercado B: Media = 0.3 Media = 0.4 Desviación estándar = 0.25 Desviación estándar = 0.45 Si se supone que las muestras provienen de dos poblaciones independientes con distribución normal, ¿podrá ser cierta la creencia del inversionista al nivel de significación del 5%? 14 Práctico 3 Test de igualdad de varianzas - ANOVA Ejercicio 7: Una revista para consumidores estaba interesada en saber si existía o no alguna diferencia entre la duración promedio de cuatro marcas diferentes de pilas. Se probó una muestra aleatoria de cuatro pilas de cada marca, con los siguientes resultados en horas: Marca 1 12 15 18 10 Marca 2 14 17 12 19 Marca 3 21 19 20 23 Marca 4 14 21 25 20 Con un nivel de significación del 5%, determinar si hay alguna diferencia en la producción promedio de estas 4 marcas de pilas. Ejercicio 8: El gerente de una cadena de tiendas desea determinar si la ubicación de producto en exposición tiene o no algún efecto sobre la venta de un determinado juguete. Se van a considerar tres ubicaciones diferentes: Frente, Centro y Posterior. Se seleccionó una muestra aleatoria de 18 tiendas y se hizo una asignación aleatoria de 6 tiendas a cada ubicación en el pasillo. Al final de un período de prueba de una semana, las cantidades de ese juguete que se han vendido fueron las siguientes: Frente 86 72 54 40 50 62 Ubicación en el pasillo Centro Posterior 20 46 32 28 24 60 18 22 14 28 16 40 a.- Con un nivel de significación del 5%, ¿hay pruebas de una diferencia en las ventas según las ubicaciones del producto en los pasillos? b.- En base a estos resultados, ¿qué comparaciones entre los grupos sugieren estos datos? Ejercicio 9: Un auditor del Departamento de Impuestos desea comparar la eficiencia de cuatro centros regionales de procesamiento de datos de impuestos. Se seleccionó una muestra aleatoria de cinco declaraciones, y se determinó el número de días entre la recepción de la declaración de impuestos y el procesamiento. Los resultados en días fueron: Este 49 54 40 60 43 Centros Regionales Centro Sur 47 39 56 55 40 48 51 43 55 50 Oeste 52 42 57 46 50 Con un nivel de significación del 5%, ¿hay pruebas de una diferencia en el tiempo de procesamiento de las declaraciones de impuestos entre los cuatro centros regionales? 15 Práctico 3 Test de igualdad de varianzas - ANOVA Ejercicio 10: Se determinó el tiempo de respuesta, en milisegundos, para tres tipos diferentes de circuitos empleados en mecanismos de corte automáticos. Los resultados fueron: Tipo de circuito 1 2 3 9 20 6 Tiempo de respuesta 12 10 8 15 21 23 17 30 5 8 16 7 a.- Escribir el modelo adecuado. b.- Pruebe la hipótesis de que los tres tipos de circuitos tienen igual tiempo de respuesta, con = 0.01. Ejercicio 11: Se sospecha que 5 máquinas alimentadoras en cierta planta, están llenando frascos a diferentes niveles. Se tomaron muestras al azar de la producción de cada máquina, con los siguientes resultados: A 11.95 12.00 12.25 12.10 B 12.18 12.11 12.15 12.16 Máquina C 12.16 12.15 12.08 12.10 D 12.25 12.30 12.10 12.02 E 12.10 12.04 12.02 12.07 a.- Escribir el modelo apropiado para este experimento. b.- Analizar los datos y extraer conclusiones, al 5%. c.- Enuncie las conclusiones que se extraen del estudio. Ejercicio 12: Una fábrica dispone de varios hornos que funcionan a igual temperatura. Se sospecha que esto no es cierto, por lo que se eligen al azar tres hornos y se determinan las temperaturas alcanzadas en las sucesivas pruebas. Los datos son los siguientes: Horno 1 2 3 491.50 488.50 499.10 498.30 484.65 484.80 Temperatura 498.10 493.50 479.90 477.35 488.25 473.00 493.60 471.85 478.65 a.- Escribir el modelo adecuado y especificar cada uno de los términos. b.- ¿Hay diferencias significativas en las temperaturas de los hornos? Ejercicio 13: Una planta textil posee un gran número de telares. Se supone que cada telar produce la misma cantidad de tela por minuto. Para corroborar este supuesto, se eligen al azar cinco telares y se registran sus producciones en diferentes momentos. Se obtuvieron los siguientes resultados: Telar 1 2 3 4 5 14.0 13.9 14.1 13.6 13.8 Producción (lb/min) 14.1 14.2 14.0 14.1 13.8 13.9 14.0 14.0 14.2 14.1 14.0 13.9 13.8 14.0 13.9 13.7 13.6 13.9 13.8 14.0 16 Práctico 3 Test de igualdad de varianzas - ANOVA a.- En este experimento, ¿son los efectos fijos o aleatorios? Indique el modelo y especifique cada uno de sus componentes. b.- ¿Es igual la producción de los telares? c.- Estimar la variabilidad entre telares. d.- Estimar la varianza del error. Ejercicio 14: Los siguientes datos corresponden al contenido de ácido ascórbico de tres tipos de variedades de duraznos, en cierta localidad. Se eligieron 10 duraznos al azar de cada variedad para hacer las determinaciones. Todos los valores fueron convertidos a mg/100g. Variedad 1 5.34 5.50 5.58 5.42 5.26 5.47 5.47 5.71 5.39 5.62 Variedad 2 7.12 6.80 6.89 6.91 6.93 6.76 6.82 6.97 7.06 6.88 Variedad 3 6.28 6.40 6.01 6.12 6.27 6.24 6.15 6.31 6.38 6.37 a.- Especificar el modelo lineal para este experimento, explicando cada uno de los términos. b.- Probar la hipótesis de que el contenido de ácido ascórbico es el mismo de las tres variedades, al 5%. c.- En el caso en que sea posible estudiar las medias que difieren significativamente con un nivel del 5%. Ejercicio 15: Un investigador estudió 3 sistemas de rotación con la finalidad de controlar los nemátodos. El diseño utilizado fue el completamente aleatorizado y se usaron 12 parcelas por cada sistema. El ensayo duró 12 años, al cabo del cual se tomó una muestra de suelo por cada parcela y se determinó el número de nemátodos por muestra. 1 3 5 2 6 3 5 Sistemas de rotación 2 8 31 10 9 6 15 19 7 5 12 11 3 4 18 20 6 6 22 15 8 3 12 10 7 3 7 14 8 5 9 6 a.- Obtener los residuales. b.- Verificar los supuestos y extraer conclusiones. Ejercicio 16: Los datos de la tabla que se presentan en este ejercicio corresponden a un experimento realizado para investigar si la producción de cierto proceso químico dependía de la fórmula de una entrada en particular o de la velocidad de la mezcladora. Un paquete estadístico provee los siguientes resultados: SS(Fórmula) = 2253.44; SS(Velocidad) = 230.81; SS(Fórmula *Velocidad) = 18.58; SS(Error) = 71.87. 17 Práctico 3 Test de igualdad de varianzas - ANOVA 1 60 189.7 188.6 190.1 Velocidad 70 80 185.1 189.0 179.4 193.0 177.3 191.1 Fórmula 2 165.1 165.9 167.6 161.7 159.8 161.6 163.3 166.6 170.3 a.- ¿Existe interacción entre los dos factores? b.- ¿La producción depende de la fórmula o de la velocidad? c.- Calcule las estimaciones de los efectos principales. Verifique los supuestos según las salidas del test que se encuentran al final de la práctica. Ejercicio 17: A continuación se presenta parte de la tabla ANOVA de un diseño completamente aleatoriazado con dos factores (Factor A y Factor B), los cuales tienen 3 y 5 niveles respectivamente y en cada nivel se realizaron 2 repeticiones. Fuente de variación A B AB Error Total Suma de cuadrados Grados de libertad 800 900 300 400 Cuadrados Medios F a.- Suponga efectos fijos, explique el modelo estadístico apropiado y formule las hipótesis a probar para este experimento. b.- Complete la tabla c.- ¿Con la información disponible se pueden extraer conclusiones válidas si las fuentes de variación son significativas estadísticamente? Si es necesaria otra información, explique cuál es y cómo la obtendría. Ejercicio 18: Con el mismo enunciado del ejercicio anterior, suponga que ahora que B es un bloque. a.- Suponga efectos fijos, explique el modelo estadístico apropiado y formule las hipótesis a probar para este experimento. b.- Complete una tabla similar a la del ejercicio anterior. c.- ¿Con la información disponible se pueden extraer conclusiones válidas si las fuentes de variación son significativas estadísticamente? Si es necesaria otra información, explique cuál es y cómo la obtendría. Ejercicio 19: Para mejorar la resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas, se estudiaron dos tipos de pegamentos (A y B) y tres temperaturas de curado (60, 80 y 100 grados centígrados). En cada combinación se analizaron dos componentes. a.- Plantee las hipótesis de interés y el modelo estadístico correspondiente. b.- Extraiga conclusiones según las salidas adjuntas. 18 Práctico 3 Test de igualdad de varianzas - ANOVA ANALYSIS OF VARIANCE TABLE FOR RESPUESTA SOURCE DF SS MS ------------- ---- ---------- ---------PEGAMENTO (A) 1 0.69120 0.69120 CURADO (B) 2 10.3544 5.17720 A*B 2 1.36640 0.68320 RESIDUAL 6 0.37720 0.06287 ------------- ---- ---------TOTAL 11 12.7892 F ------10.99 82.35 10.87 P -----0.0161 0.0000 0.0101 TUKEY (HSD) COMPARISON OF MEANS OF RESPUESTA BY CURADO HOMOGENEOUS CURADO --------100 80 60 MEAN ---------4.3000 3.3000 2.0300 GROUPS ----------I .. I .... I CRITICAL Q VALUE CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 6 DF 4.341 0.5443 0.1773 REJECTION LEVEL TUKEY (HSD) COMPARISON OF MEANS OF RESPUESTA BY PEGAMENTO HOMOGENEOUS PEGAMENTO MEAN GROUPS --------- ---------- ----------1 3.4500 I 2 2.9700 .. I 19 Práctico 3 Test de igualdad de varianzas - ANOVA 0.050 CRITICAL Q VALUE CRITICAL VALUE FOR COMPARISON STANDARD ERROR FOR COMPARISON ERROR TERM USED: RESIDUAL, 6 DF 3.461 0.3542 0.1448 REJECTION LEVEL 0.050 Ejercicio 20: En una compañía dedicada a la fabricación de bombas y válvulas, algunos componentes crísticos tienen tolerancias muy estrechas que son dificiles de cumplir. De aquí la necesidad de estimar el error de medición con el fin de reducirlo para cumplir con las especificaciones. Este es el objetivo del estudio R&R (Reproducibilidad y Repetitividad) que aquí exlpicamos simplificadamente. Se seleccionan dos inspectores y siete piezas para correr un experimento para estimar la contribución de los inspectores en la variabilidad total observada. a.- Plantee las hipótesis de interés y el modelo estadístico correspondiente. ¿Este es un modelo de efectos fijos o de efectos aleatorios? b.- Extraiga conclusiones según las salidas adjuntas. ONE-WAY AOV FOR ANCHO BY INSPECTOR SOURCE DF SS MS ------- ---- --------- --------BETWEEN 1 0.02240 0.02240 WITHIN 12 0.33977 0.02831 TOTAL 13 0.36217 BARTLETT'S TEST OF EQUAL VARIANCES CHI-SQ -----0.01 COCHRAN'S Q LARGEST VAR / SMALLEST VAR F -----0.79 DF -----1 P -----0.3912 P -----0.9073 0.5247 1.1040 COMPONENT OF VARIANCE FOR BETWEEN GROUPS -8.449E-04 EFFECTIVE CELL SIZE 7.0 SAMPLE GROUP INSPECTOR MEAN SIZE STD DEV ------------------ ------ ---------1 69.589 7 0.1724 2 69.669 7 0.1641 TOTAL 69.629 14 0.1683 20 Práctico 3 Test de igualdad de varianzas - ANOVA TUKEY (HSD) COMPARISON OF MEANS OF ANCHO BY INSPECTOR HOMOGENEOUS INSPECTOR MEAN GROUPS --------- ---------- ----------2 69.669 I 1 69.589 I CRITICAL Q VALUE 3.083 REJECTION LEVEL CRITICAL VALUE FOR COMPARISON 0.1961 STANDARD ERROR FOR COMPARISON 0.0899 0.050 Ejercicio 21: Para determinar la calidad de una alimentación, quince ratas fueron alimentadas asignandolas al azar a una de tres dietas con distintos niveles de proteínas, obteniendose distintas ganancias de peso. a.- Plantee las hipótesis de interés y el modelo estadístico correspondiente. ¿Este es un modelo de efectos fijos o de efectos aleatorios? b.- Extraiga conclusiones según las salidas adjuntas. ONE-WAY AOV FOR PESOS BY PROTEINAS SOURCE DF SS MS ------- ---- --------- --------BETWEEN 2 960.578 480.289 WITHIN 12 262.115 21.8429 TOTAL 14 1222.69 BARTLETT'S TEST OF EQUAL VARIANCES CHI-SQ -----25.20 DF -----2 F -----21.99 P -----0.0001 P -----0.0000 COCHRAN'S Q 0.9879 LARGEST VAR / SMALLEST VAR COMPONENT OF VARIANCE FOR BETWEEN GROUPS 91.6892 EFFECTIVE CELL SIZE 5.0 21 Práctico 3 Test de igualdad de varianzas - ANOVA 216.54 KEY (HSD) COMPARISON OF MEANS OF PESOS BY PROTEINAS HOMOGENEOUS PROTEINAS MEAN GROUPS --------- ---------- ----------3 22.584 I CRITICAL Q VALUE 3.783 2 9.2900 .. I REJECTION LEVEL 0.050 1 3.4620 .. I CRITICAL VALUE FOR COMPARISON 7.9075 CRITICAL VALUE FOR COMPARISON 7.9075 STANDARD ERROR FOR COMPARISON 2.9559 Ejercicio 22: Un ingeniero de procesos ha identificado dos causas potenciales que provocan vibración en un motor eléctrico: el material de la caja del motor y la fuente de suministro de los cojinetes del motor. Para decir cual o cuales son las que influyen significativamente en provocar vibración en el motor se tomaron los datos siguientes que indican la cantidad de vibración (en micras) registradas con cajas de motor de acero, de aluminio y de plástico y con rodamientos suministrados por 5 proveedores seleccionados al azar. Proveedor de rodamientos 2 3 4 5 Acero 13.1 13.2 16.3 15.8 13.7 14.3 15.7 15.8 13.5 12.5 Material Aluminio 15.0 14.8 15.7 16.4 13.9 14.3 13.7 14.2 13.4 13.8 Plástico 14.0 14.3 17.2 16.7 12.4 12.3 14.4 13.9 13.2 13.1 1 a.- Escriba el modelo y sus respectivos supuestos. ¿Se verifican? b.- Escriba las respectivas hipótesis nulas y alternativas. c.- ¿Cuál es su conclusión con un nivel de significación del 5%. d.- En el caso en que sea posible estudiar las medias que difieren significativamente con un nivel del 5%. 22 Práctico 3 Test de igualdad de varianzas - ANOVA Ejercicio 23: Se desea estimar la durabilidad de escritura de las distintas marcas de bolígrafos del mercado. Como se sabe que la superficie de escritura afecta de forma directa la duración se eligieron aleatoriamente tres tipo de superficie. Se trabajo con 4 de las marcas de bolígrafos existentes en el mercado elegidas al azar. La tabla siguiente presenta los dos tiempos de vida en minutos obtenidos para cada combinación marca de bolígrafo-tipo de superficie. 1 1 709 Marca de 2 668 Bolígrafo 3 659 4 698 Superficie de escritura 2 3 659 713 726 660 645 685 722 740 692 720 685 666 684 678 750 650 704 666 686 733 a.- Escriba el modelo y sus respectivos supuestos. ¿Se verifican? b.- Escriba las respectivas hipótesis nulas y alternativas. c.- ¿Cuál es su conclusión con un nivel de significación del 5%. d.- En el caso en que sea posible estudiar las medias que difieren significativamente con un nivel del 5%. Ejercicio 24: En un experimento para observar si la cantidad de cubrimiento de pintura de latex de color azul pálido para interiores depende de la marca de pintura o de la marca de rodillo utilizada en su aplicación, se probó un galón de cada una de las 4 marcas de pintura utilizando cada una de las tres marcas de rodillo existentes en el mercado lo cual generó la siguiente información en números de pies cuadrados cubiertos. 1 Marcas de 2 Pintura 3 4 Marcas de Rodillo 1 2 3 454 446 451 446 444 447 439 442 444 444 437 443 a.- Construya la tabla de ANOVA, sugerencia: puede restar 400 a todos los datos y eso no afectara al resultado final. b.- Establezca y pruebe hipótesis adecuadas para determinar si la marca de pintura tiene efecto en el cubrimiento. Utilice 0.05 . c.- Repita el inciso b para la marca de rodillo. d.- ¿Hay alguna marca de pintura que parezca claramente mejor que las demás? 23 Práctico 3 Test de igualdad de varianzas - ANOVA