1.-Prueba de hipotesis para una media conocida La duración de las bombillas de 100 watt que fabrica una empresa sigue una distribución normal con una desviación de 120 horas. Su vida media está garantizada durante un mínimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de 750 horas. a) Con un nivel de significación de 0,01¿habría que rechazar el lote por no cumplir la garantía? ÍTEM A Queremos hacer una prueba de hipotesis sobre la media de la duración de las bombillas. ¿Durán en promedio más de 800 horas o menos? La variable es X: duración (en horas) de una bombilla de 100 watts, fabricada por cierta empresa. Se sabe que: X∼N(μ=?;σ=120) No conocemos el valor de la media. Pero sí conocemos la media muestral de una muestra de tamaño 50: n=50;¯x=750 A primera vista parecería que las bombillas están durando menos que lo prometido por el fabricante. (El fabricante garantiza que duran en promedio 800 horas o más y obtuvimos una media muestral de 750 horas.) Pero no podemos tomar la decisión “a ojo”. Tenemos que realizar una prueba de hipótesis. Vamos a hacer la prueba de hipótesis realizando los pasos recomendados. No es necesario escribir todos estos pasos, pero lo hacemos porque lo hace mucho más fácil de entender. Paso 1: Definir la variable. X: duración (en horas) de una bombilla de 100 watts, fabricada por cierta empresa. X∼N(μ=?;σ=120) Paso 2: Plantear las hipótesis estadísticas El fabricante afirma que duran 800 horas o más: H0:μ≥800 Queremos contrastar esa hipótesis con: H1:μ<800 Paso 3: Establecer un estadístico de prueba. En este caso hay dos posibles. Que son equivalentes. Cómo X∼N y σ es conocida, conocemos la distribución de la variable media muestral: ¯X∼N(μ,σ√ n ) Este es un estadístico de prueba adecuado. Pero también se puede estandarizar esta variable, y obtener: ¯X–μσ√ n ∼N(0,1) Cualquiera de los dos sirve. (Son básicamente el mismo. En un caso está estandarizada la variable normal y en el otro no está estandarizada). Vamos a usar los dos para poder explicar cómo se hace con ambos. Pero no es necesario que usen los dos. Paso 4: Seleccionar un nivel de significación El enunciado determina que: α=0,01 Paso 5: Determinar la zona de rechazo y la regla de decisión Cómo la hipótesis alternativa afirma que μμ es menor que un cierto valor, entonces decimos que la prueba es unilateral izquierda: la zona de rechazo queda ubicada a la izquierda. La distribución de ambos estadísticos es normal. Así que el diagrama con la distribución del estadístico y la zona de rechazo a izquierda es así: Pero ahora queremos determinar exactamente cuál es la región de rechazo. ¿Cuál es el valor de la abscisa que define la región de rechazo? Si usamos el estadístico de prueba ¯X–μσ√ n ∼N(0,1) el diagrama con la zona de rechazo unilateral izquierda y el nivel de significación sería así: ¿Cuál es el valor de la variable normal estándar que acumula una probabilidad de 0,010,01 a su izquierda? z0,01=–2,33z0,01=–2,33 (Eso se busca en la tabla de la normal estándar o usando software) Entonces la regla de decisión es: • • Rechazo H0H0 si ep≤–2,33 No rechazo H0H0 si ep>–2,33 Si quisiéramos usar el otro estadístico de prueba posible ¯X∼N(800,120√ 50 ≅16,97), la lógica es exactamente la misma: Pero ¿cómo averiguamos el valor crítico ¯XCX¯C que acumula una probabilidad de 0,01 a su izquierda? -Opción 1: usando software cómo Probability Distributions (para Android) o GeoGebra (para Windows). -Opción 2: usando la tabla de probabilidad normal estándar. En general en un examen no se permite usar software. Así que no nos queda otra que esta opción. Veamos cómo es. Si ¯XC es aquel valor que acumula una probabilidad de 0,01 a su izquierda, entonces al estandarizarlo obtendremos z0,01=–2,33z: –2,33=¯XC–800120√ 50 –2,33=X¯C–80012050 De acá podemos despejar ¯XC: ⇒¯XC=–2,33.120√ 50 +800≅760,46 Obtenemos que el valor crítico es ¯XC=760,46X¯C=760,46. Luego la regla de decisión es: • Rechazo H0H0 si ¯X≤760,46X¯≤760,46. • No rechazo H0H0 si ¯X>760,46. Paso 6: Calcular el valor observado del estadístico de prueba Usando el estadístico de prueba ¯XX¯: El valor observado ¯X=750pertenece a la zona de rechazo (–∞;760,46) Si usamos el estadístico estandarizado tenemos que realizar el siguiente cálculo: ep,obs=750–800120√ 50 ≅–2,95 También ocurre que el valor observado (–2,95) pertenece a la zona de rechazo (–∞;–2,33). Paso 7: Obtener la conclusión Decidimos rechazar la hipótesis nula. La conclusión podría ser: “Con un nivel de significación del 1% hay evidencias suficientes para afirmar que la media de la duración de las bombillas es inferior a 800 horas.” Referencia: https://probafacil.com/prueba-de-hipotesis-sobre-la-media-poblacional/ 2.- Referencia : https://www.ugr.es/~mvargas/Infe2.pdf Prueba de hipotesis para la diferencia de dos medias con sigmas conocidas 1. Ejemplo 1: Para tomar una importante decisión a nivel profesional se desea determinar si existen diferencias significativas fundamentadas entre dos empresas referentes al salario de sus empleados. Se realiza una investigación revisando el salario de 60 trabajadores de la empresa A y 70 de la empresa B. Se obtiene un salario medio de 30000 euros anuales con una desviación típica de 1000 euros en el primer grupo y un salario medio de 25000 euros anuales con una desviación típica de 1500 en el segundo grupo. ¿Podríamos decidir a favor de alguna de las dos empresas con un nivel de significación del 1 % ? 1. Se formula la hipótesis nula H0 y la hipótesis alternativa H1. Hipótesis nula : H0 : μx μy = 0 Hipótesis alternativa : H1 : μx μy ≠ 0 En este caso tenemos un contraste bilateral, ya que nuestra hipótesis nula se encuentra formulada en forma de igualdad. 2. Identificamos la distribución de probabilidad y el tamaño de la muestra. Tenemos una distribución de la diferencia de las medias, con μ1 - μ2 = 5000, un tamaño de muestra en A de n = 60 y en B de n = 70. La distribución de las medias se distribuye : 3. Construimos las regiones de aceptación y rechazo. 4. Calcular el estadistíco de contraste y verificar la hipótesis. El estadístico de contraste que emplearemos será la diferencia de las medias de las muestras, μ1 μ2 = 30000 25000 = 5000. 5000 ∉ ( -569,99 ; 569,99 ) ⇒ Nuestro estadístico de contraste no pertenece a nuestra región de aceptación. 5. Interpretación de la decisión. Dado que nuestro estadístico de contraste no pertenece a la región de aceptación, rechazamos la hipótesis nula. Consideramos por tanto que existen diferencias significativas y hay diferencias entre las dos empresas. Referencia: https://calculo.cc/temas/temas_estadistica/hipotesis/teoria/hipo_dif_medias.html 2.Se quieren probar dos tipos de alimentos para los 75 pingüinos de un zoológico cuyo peso se distribuye normalmente. Se separan en dos grupos, uno formado por 40 pingüinos y otro por 35. Al cabo de un mes son pesados, y se obtiene para el primer grupo un peso medio de 13 kg y desviación típica de 0,7 y para el segundo grupo, un peso medio de 11 kg y desviación típica 0,3. ¿Se puede afirmar, con el nivel de confianza del 99 %, que están mejor alimentados los del primer grupo que los del segundo? 1. Se formula la hipótesis nula H0 y la hipótesis alternativa H1. Hipótesis nula : H0 : μx μy > 0 Hipótesis alternativa : H1 : μx μy ≤ 0 En este caso tenemos un contraste unilateral, ya que nuestra hipótesis nula se encuentra formulada en forma de igualdad. 2. Identificamos la distribución de probabilidad y el tamaño de la muestra. Tenemos una distribución de la diferencia de las medias, con μ1 - μ2 = 2, un tamaño de muestra n = 40 en el primer grupo y n = 35 en el segundo grupo. La distribución de las medias se distribuye : 3. Construimos las regiones de aceptación y rechazo. 4. Calcular el estadistíco de contraste y verificar la hipótesis. El estadístico de contraste que emplearemos será la diferencia de las medias de las muestras, μ1 μ2 = 13 11 = 2. 2 ∈ ( -2,208 ; +∞ ) ⇒ Nuestro estadístico de contraste sí pertenece a nuestra región de aceptación. 5. Interpretación de la decisión. Dado que nuestro estadístico de contraste sí pertenece a la región de aceptación, aceptamos la hipótesis nula. Consideramos por tanto que los pingüinos del primer grupo están mejor alimentados que los del segundo. Referencia: https://calculo.cc/temas/temas_estadistica/hipotesis/teoria/hipo_dif_medias.html 3.-Prueba de hipotesis para una media desconocida X=17 Referencia: https://es.slideshare.net/chcluz/tarea-10-prueba-de-hipotesis-con-desconocida Referencia: https://es.slideshare.net/chcluz/tarea-10-prueba-de-hipotesis-con-desconocida 4.-Prueba de hipotesis para la diferenciacion de dos medias con sigmas desconocidos pero iguales. 1. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que el peso promedio de calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido de manera normal. Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por otra parte, supóngase que las dos poblaciones normales tienen la misma desviación estándar. Solución: El estimador combinado de la desviación estándar es: Al calcularle raíz cuadrada a este valor nos queda que sp = 4.41 expresión que se reduce a � 0.72 1- 2 6.72 Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente, para este nivel confianza, no puede concluirse la existencia de una diferencia entre las medias. Referencia: https://virtual.uptc.edu.co/ova/estadistica/docs/libros/estadistica1/cap03d.html 1. Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule un intervalo de confianza del 95% para la diferencia del tiempo promedio. Suponga varianzas iguales. Solución: Medicamento A Medicamento B nA = 12 nB = 12 SA2= 15.57 SB2 = 17.54 2.35 B- A 9.25 Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es mayor para el medicamento B. Referencia: