PRUEBAS DE HIPÓTESIS SOBRE LA IGUALDAD DE DOS MEDIAS. A) Varianzas conocidas Supóngase que hay dos poblaciones de interés X1 y X2, Suponemos que X1 tiene 2 media desconocida 1 y varianza conocida 1 y que X2 tiene media desconocida 2 y varianza conocida 2 2 . Estaremos interesados en la prueba de la hipótesis de que las medias 1 y 2 sean iguales. Considérense primero las hipótesis alternativas de dos lados: H 0 : 1 2 H 1 : 1 2 Donde H0 = Hipótesis nula H1 = Hipótesis alternativa. 1 = media de la población 1 2 = media de la población 2 El procedimiento para probar H 0 : 1 2 es calcular la estadística de prueba Z0 mediante la siguiente fórmula: Z0 X1 X 2 21 n1 22 n2 Donde: X 1 = media de la muestra 1 X 2 = media de la muestra 2 2 1 = varianza de la población 1 1 2 2 = varianza de la población 2 n1 = tamaño de la muestra 1 n2 = tamaño de la muestra 2 La hipótesis nula H0 se rechaza si: Z 0 Z 2 o Z 0 Z 2 Donde Z0 = Valor calculado del estadístico de prueba Z 2 = Valor obtenido de las tablas. Las hipótesis alternativas de un lado se analizan de manera similar. Para probar H 0 : 1 2 H 1 : 1 2 Se calcula la estadística de prueba Z0 , y se rechaza H 0 : 1 2 si Z 0 Z . Para probar las otras hipótesis alternativas de un lado H 0 : 1 2 H 1 : 1 2 Se utiliza la estadística de prueba Z0 y se rechaza H 0 : 1 2 si Z 0 Z 2 Ejemplo 6: Se emplean dos máquinas para llenar botellas de plástico con un volumen neto de 16 onzas. El proceso de llenado puede suponerse normal, con desviaciones estándar de 1 .015y 2 .018. Ingeniería de calidad sospecha que ambas máquinas llenan hasta el mismo volumen neto, sin importar que este volumen sea o no de 16 onzas. Se toma una muestra aleatoria de la salida de cada máquina. ¿Piensa usted que ingeniería de calidad está en lo correcto? Utilizando .05 . máquina 1 16.03 16.04 16.05 16.05 16.02 16.01 15.96 15.98 16.02 15.99 máquina 2 16.02 15.97 15.96 16.01 15.99 16.03 16.04 16.02 16.01 16 H 0 : 1 2 H 1 : 1 2 Calculando las medias de cada máquina obtenemos X 1 16.015, X 2 16.005. Z0 X1 X 2 2 n1 1 2 = 2 n2 16.015 16.005 .0152 .0182 10 10 1.34 Z 2 = Z.025 = 1.96 3 El uso de la tabla es el siguiente: 1-.025 =.975 buscando el valor de Z correspondiente a .975 encontramos Z = 1.96 Utilizando el criterio de decisión Z 0 Z 2 para rechazar la hipótesis nula H0, nos damos cuenta de que 1.34 no es mayor que 1.96. por lo cual no rechazamos H 0. No existe suficiente evidencia estadística para pensar que las medias son diferentes. Cuando rechazamos la hipótesis nula se considera que la prueba es potente, si aceptáramos la hipótesis nula el criterio de decisión es débil, ya que generalmente se busca rechazar H0. PROCEDIMIENTO EN EXCEL Seleccionar análisis de datos en el menú herramientas. En funciones para análisis elija la opción : Prueba z para medias de dos muestras. 4 PRUEBAS PARA LA IGUALDAD DE DOS VARIANZAS. Presentaremos ahora pruebas para comparar dos varianzas. Supóngase que son dos las poblaciones de interés, por ejemplo X1 y X2, donde 1, 12 , 2 , 22 , se desconocen. Deseamos probar hipótesis relativas a la igualdad de las dos varianzas, H 0 : 12 22 . Considérese que se disponen dos muestras aleatorias de tamaño n1 de la población 1 y de tamaño n2 de la población 2, y sean S12 yS22 las varianzas de muestra. Para probar la alternativa de dos lados H 0 : 12 22 H1 : 12 22 Utilizamos el hecho de que la estadística F0 S12 S 22 Se distribuye como F, con n1-1 y n2 –1 grados de libertad. Rechazaríamos H0 si F0 F 2, n1 1, n2 1 o si F0 F1 2,n1 1,n2 1 Donde F 2,n1 1,n2 1 y F1 2,n1 1,n2 1 son los puntos porcentuales 2 superior e inferior de la distribución F con n1-1 y n2-2 grados de libertad. La tabla F proporciona sólo los puntos de la cola superior de F, por lo que para determinar F1 2,n1 1,n2 1 debemos emplear F1 2,n1 1,n2 1 = 1 F 2,n1 1,n2 1 La misma estadística de prueba puede utilizarse para probar hipótesis alternativas de un lado. La hipótesis alternativa de un lado es: 5 H 0 : 12 22 H1 : 12 22 Si F0 F ,n1 1,n2 1 , rechazaríamos H 0 : 12 22 . Ejemplo 7: Los siguientes son tiempos de quemado (en minutos) de señales luminosas de dos tipos diferentes. Tipo 1 63 81 57 66 82 82 68 59 75 73 Tipo 2 64 72 83 59 65 56 63 74 82 82 Pruebe la hipótesis de que las dos varianzas sean iguales. Use .05 H 0 : 12 22 H1 : 12 22 X 1 70.6 X 2 70 S12 88.71 S 22 100.44 F0 S12 88 .71 .877 = S 22 100 .44 6 F 2,n1 1,n2 1 = F.025,9,9= 4.03 F1 2,n1 1,n2 1 =.248 .877 no es mayor que 4.03, por lo cual no se rechaza la hipótesis nula H 0 : 12 22 . PROCEDIMIENTO EN EXCEL: Seleccionar análisis de datos en el menú herramientas. En funciones para análisis elija la opción : Prueba F para varianzas de dos muestras. 7 Prueba F para varianzas de dos muestras Media Varianza Observaciones Grados de libertad F P(F<=f) una cola Valor crítico para F (una cola) Variable 1 70.6 88.7111111 10 9 0.88318584 0.42811371 0.2483862 Variable 2 70 100.444444 10 9 De la tabla deducimos que .248 es menor que .883 por lo cual no rechazamos H 0. Prueba z para medias de dos muestras Media Varianza (conocida) Observaciones Diferencia hipotética de las medias z P(Z<=z) una cola Valor crítico de z (una cola) Valor crítico de z (dos colas) Valor crítico de z (dos colas) Variable 1 16.015 0.000225 10 0 1.34962722 0.08856785 1.644853 0.17713571 1.95996108 Variable 2 16.005 0.000324 10 En la tabla de Excel tenemos el valor z = 1.34 y el valor crítico de z (dos colas) = 1.96, como 1.34 no es mayor que 1.96 no rechazamos la hipótesis nula. B) Varianzas desconocidas: Consideraremos ahora pruebas de hipótesis respecto a la igualdad de las medias 1 y 2 de dos distribuciones normales donde no se conocen las varianzas 12 y 22 . Tenemos dos casos en el primero las varianzas son iguales y en el segundo las varianzas son desiguales, a continuación analizaremos cada uno de ellos. Caso 1 varianzas iguales Sean X1 y X2 dos poblaciones normales independientes con medias desconocidas 1 y 2 , y varianzas conocidas pero iguales 12 22 2 . Deseamos probar: H 0 : 1 2 H 1 : 1 2 8 Sean X1, X2, S12 , S 22 , las medias y las varianzas de las muestras, respectivamente. Puesto que tanto S12 comoS 22 estiman la varianza común 2 , podemos combinarlas para producir una sola estimación, mediante la siguiente fórmula: n1 1S12 n2 1S 22 Sp n1 n 2 2 Para probar H 0 : 1 2 calcúlese la estadística de prueba X1 X 2 1 1 Sp n1 n2 Si t 0 t 2,n1 n2 2 o si t 0 t 2,n1 n2 2 , rechazamos H 0 : 1 2 Las alternativas de un lado se tratan de modo similar. Para probar: t0 H 0 : 1 2 H1 : 1 2 Calcúlese la estadística de prueba t0 y rechácese H 0 : 1 2 si: t 0 t ,n1 n2 2 Para la otra alternativa de un lado, H 0 : 1 2 H1 : 1 2 Calcúlese la estadística de prueba y rechácese H 0 : 1 2 si: t 0 t a,n1 n2 2 Ejemplo 8: Se está investigando la resistencia de dos alambres, con la siguiente información de muestra. Alambre 1 2 .140 .135 .141 .138 Resistencia (ohms) .139 .140 .140 .139 .138 - .144 - Suponiendo que las dos varianzas son iguales, ¿ qué conclusiones puede extraerse respecto a la resistencia media de los alambres? 9 H 0 : 1 2 H 1 : 1 2 Calculando la media y la desviación estándar de la muestra: x1 .140 x 2 .138 S1 .0021 S 2 .0022 Sp t0 n1 1S12 n2 1S 22 n1 n 2 2 = .0021 X1 X 2 = 1.72 1 1 Sp n1 n2 Buscamos en la tabla de distribución t el valor t 2,n1 n2, 2 = t.025,8 =2.306 Utilizando el criterio de rechazo t 0 t 2,n1 n2 2 , 1.72 no es mayor que 2.306, por lo tanto no rechazamos H0. PROCEDIMIENTO EN EXCEL Seleccionar análisis de datos en el menú herramientas. En funciones para análisis elija la opción : Prueba t para dos muestras suponiendo varianzas iguales. 10 Prueba t para dos muestras suponiendo varianzas iguales Media Varianza Observaciones Varianza agrupada Diferencia hipotética de las medias Grados de libertad Estadístico t P(T<=t) una cola Valor crítico de t (una cola) P(T<=t) dos colas Valor crítico de t (dos colas) Variable 1 0.14033333 4.2667E-06 6 4.4167E-06 0 8 1.72002633 0.06187033 1.85954832 0.12374065 2.30600563 11 Variable 2 0.138 4.6667E-06 4 En la tabla de Excel encontramos los valores deseados: 1.72 no es mayor que 2.306 por lo cual no rechazamos Ho. Caso 2 Varianzas diferentes Cuando las varianzas 12 y 22 son diferentes utilizamos la estadística de prueba: X1 X 2 t0 S12 S 22 n1 n 2 Para el calculo de lo grados de libertad utilizamos: 2 S12 S 22 n1 n2 2 2 2 S12 n1 S 22 n2 n1 1 n2 1 El procedimiento para llevar a cabo la prueba de hipótesis es el mismo que el caso 1, varianzas iguales excepto que se emplean t0 como estadística de prueba y n1 + n2 -2 se sustituye por en la determinación de los grados de libertad para la prueba. Ejemplo 9: Se están investigando dos métodos para producir gasolina a partir de petróleo crudo. Se supone que el rendimiento de ambos procesos se distribuye normalmente. Los siguientes datos de rendimiento se han obtenido de la planta piloto. Proceso 1 2 24.2 21.0 26.6 22.1 Rendimiento % 25.7 24.8 21.8 20.9 25.9 22.4 26.5 22.0 ¿Hay alguna razón para creer que el proceso 1 tiene un rendimiento medio mayor? 12 H 0 : 1 2 H1 : 1 2 Calculamos la media y la varianza para ambos procesos: x1 25.62 x 2 21.70 S12 .9017 S 22 .3760 X1 X 2 t0 2 1 2 2 = S S n1 n 2 25.62 21.70 8.48 .9017 .376 6 6 2 2 S12 S 22 . 9017 . 376 n1 n2 6 6 2 9.32 9 2 = 2 2 .9017 62 .376 62 S12 n1 S 22 n2 7 7 n1 1 n2 1 Buscando el valor en la tabla t encontramos t.05,9 = 1,833, mediante el criterio de rechazo para una cola t0>t.05,9 , 8.48>1.833, por lo tanto rechazamos la hipótesis nula, y aceptamos la hipótesis alterna, el proceso 1 tiene mayor rendimiento que el proceso 2. PROCEDIMIENTO EN EXCEL Seleccionar análisis de datos en el menú herramientas. En funciones para análisis elija la opción : Prueba t para dos muestras suponiendo varianzas desiguales. 13 Prueba t para dos muestras suponiendo varianzas desiguales Media Varianza Observaciones Diferencia hipotética de las medias Grados de libertad Estadístico t P(T<=t) una cola Valor crítico de t (una cola) P(T<=t) dos colas Valor crítico de t (dos colas) Variable 1 Variable 2 25.61666667 21.7 0.901666667 0.376 6 6 0 9 8.487571675 6.87798E-06 1.833113856 1.3756E-05 2.262158887 8.48 mayor que 1.83 (valor crítico de t de una cola), se rechaza Ho. 14 PRUEBAS DE HIPÓTESIS SOBRE DOS PROPORCIONES En las pruebas de hipótesis sobre proporciones tratamos de probar: H 0 : p1 p 2 H 1 : p1 p 2 Considérese que se toman dos muestras aleatorias de tamaño n 1 y n2 de dos poblaciones, y sea X1 y X2 el número de observaciones que pertenecen a la clase de interés en la muestra 1 y 2 respectivamente. Una estimación del parámetro común p es: pˆ X1 X 2 n1 n2 La estadística de prueba para H 0 : p1 p2 es entonces: Z0 pˆ 1 X1 n1 pˆ 1 pˆ 2 1 1 pˆ (1 pˆ ) n1 n2 pˆ 2 X2 n2 Si Z 0 Z 2 o Z 0 Z 2 , la hipótesis nula se rechaza. Ejemplo 5: La fracción de productos defectuosos producidos por dos líneas de producción se está analizando. Una muestra aleatoria de 1000 unidades de la línea 1 tiene 10 defectuosas , en tanto que una muestra aleatoria de 1200 unidades de la línea 2 tiene 25 defectuosas. ¿ Es razonable concluir que la línea de producción 2 produce una fracción más alta de producto defectuoso que la línea 1? Use .01 . 15 H 0 : p1 p2 H1 : p1 p2 pˆ X1 X 2 10 25 .015909 = n1 n2 1000 1200 pˆ 1 X1 n1 = 10 .01 1000 pˆ 2 Z0 X2 n2 = pˆ 1 pˆ 2 1 1 pˆ (1 pˆ ) n1 n2 25 .020833 1200 = .01 .020833 1 1 . .015909(.98409) 1000 1200 = -2.02 Z Z.01 2.35 Se utiliza la estadística de prueba Z0 y se rechaza H 0 : p1 p2 si Z 0 Z -2.02 no es menor que –2.35 por lo cual H0 no se rechaza. PRUEBA T POR PARES Cuando es posible resulta ventajoso utilizar muestras pareadas en las pruebas de comparación. En una prueba de comparación pareada, la reducción en la variabilidad experimental puede permitir la detección de pequeños movimientos en los datos. A pesar de que los grados de libertad sean reducidos, porque ahora el tamaño de muestra corresponde al número de comparaciones. Un ejemplo de este tipo de prueba es la evaluación de dos piezas de equipo de inspección para determinar si existe alguna diferencia significativa entre los equipos. Las hipótesis de prueba en torno a la igualdad 1 y 2 pueden realizarse efectuando una prueba t de una muestra en D . Específicamente, probar H 0 : 1 2 contra H 1 : 1 2 es equivalente a probar H0 : D 0 H1 : D 0 16 La estadística de prueba apropiada es t0 D SD donde D n D j n y SD D D 2 j n 1 Rechazaríamos H 0 : D 0 si t 0 t 2,n1 o si t 0 t 2,n1 , las alternativas de un lado se tratarían de manera similar. Ejemplo 6: Un fabricante desea comparar el proceso de armado común para uno de sus productos con un método propuesto que supuestamente reduce el tiempo de armado. Se seleccionaron ocho trabajadores de la planta de armado y se les pidió que armaran las unidades con ambos procesos. Los siguientes son los tiempos observados en minutos. Trabajador 1 2 3 4 5 6 7 8 Proceso actual Proceso propuesto 38 30 32 32 41 34 35 37 42 35 32 26 45 38 37 32 En .05 , ¿existe alguna razón para creer que el tiempo de armado para el proceso actual es mayor que el del método propuesto por más de dos minutos? H0 : D 2 H1 : D 2 Trabajador 1 2 3 4 5 6 7 8 Proceso actual Proceso propuesto 38 30 32 32 41 34 35 37 42 35 32 26 17 45 38 37 32 Dj 8 0 7 -2 7 6 7 5 4.75 (Dj-D)^2 10.5625 22.5625 5.0625 45.5625 5.0625 1.5625 5.0625 0.0625 95.5 D D = 4.75 n SD t0 j D D 2 j n 1 D SD n = = 3.69 4.75 2 = 2.107 3.69 8 t ,n1 t.05,7 1.895 , debido a que 2.107 > 1.895 rechazamos H0, y aceptamos la H1: el tiempo de armado para el proceso actual es mayor en dos minutos que el método propuesto. PROCEDIMIENTO EN EXCEL Seleccionar análisis de datos en el menú herramientas. En funciones para análisis elija la opción : Prueba t para medias de dos muestras emparejadas. 18 Prueba t para medias de dos muestras emparejadas Media Varianza Observaciones Coeficiente de correlación de Pearson Diferencia hipotética de las medias Grados de libertad Estadístico t P(T<=t) una cola Valor crítico de t (una cola) P(T<=t) dos colas Valor crítico de t (dos colas) Variable 1 37.75 22.2142857 8 0.64648725 2 7 2.10583831 0.03661855 1.89457751 0.0732371 2.36462256 Variable 2 33 15.1428571 8 De la tabla concluimos que 2.105 > 1.895 (valor crítico de t una cola), por lo cual rechazamos Ho. 19