Estadística Inferencial UNIDAD III. PRUEBAS DE HIPÓTESIS 3.5 Prueba para diferencia de medias, muestras grandes y pequeñas En algunos diseños de investigación, el plan muestral requiere seleccionar dos muestras independientes, calcular las medias muestrales y usar la diferencia de las dos medias para estimar o probar una diferencia entre dos medias poblacionales. Por ejemplo si dos empresas en Tabasco que ofrecen servicios de encuestas y análisis estadístico indica que la calificación promedio que le asigna la población al gobierno es de 6 y la otra empresa dice que es de 5.5; podemos notar que hay una diferencia ¿estarán bien tomadas las muestras de las dos empresas? Si creemos que si la hipótesis nula será que la diferencia entre las dos medias poblacionales es igual a cero ya que estamos hablando de la misma población. El estadístico Z para estos casos se calcula de la siguiente manera: x1 − x 2 − ( µ1 − µ 2 ) z= ( ) σ 12 n1 + σ 22 n2 Donde: x1 Promedio de la muestra 1 x 2 Promedio de la muestra 2 µ1 Media de la población 1 µ 2 Media de la población 2 σ 1 Varianza de la población 1 σ 2 Varianza de la población 2 n1 Número de elementos de la muestra 1 n 2 Número de elementos de la muestra 2 3.5. Prueba para diferencia de medias muestras grandes y pequeñas muestras pequeñas (es decir, menor a 30 elementos) en cambio si no se conocen las varianzas poblacionales se pueden aproximar con las varianzas muestrales; pero en dicho caso no es posible usar muestras pequeñas, solo para estudios de 30 o más elementos muestreados. Aunque el tema en el plan de estudios abarca muestras grandes y pequeñas, dado que las varianzas poblacionales raramente se conocen en estudios sociales y políticos, este tema solo desarrollará mediante ejemplos las aplicaciones para muestras grandes con varianzas poblacionales desconocidas; solo conoceremos las varianzas muestrales. Solo se insiste en que el procedimiento para muestras pequeñas (menores a 30 elementos) es exactamente el mismo pero debe conocerse la varianza poblacional. Ejemplo 1. Una muestra de 87 mujeres trabajadoras profesionales mostró que la cantidad promedio que pagan a un fondo de pensión privado es de $3,352 con una desviación estándar muestral de $1,100. Una muestra de 76 hombres trabajadores profesionales muestra que la cantidad que paga a un fondo de pensión privado es de $5,727 con una desviación estándar de $1,700. Un grupo activista de mujeres desea demostrar que las mujeres no pagan tanto como los hombres en fondos de pensión privados. Si se usa alfa = 0.01 ¿Se confirma lo que el grupo activista de mujeres desea demostrar o no? Paso 1. Determinar la hipótesis Nula “Ho” y Alternativa “Ha”. Nótese que este problema es de una cola. Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor a lo que pagan los hombres. Ha: _______________________________________ (El estudiante debe describir la Ha) La hipótesis alternativa es lo que las mujeres del grupo activista desea demostrar. Es importante mencionar que en caso de que las varianzas de la población sean conocidas, es posible usar el estadístico de prueba para Elaboró: MC. Marcel Ruiz Martínez 1 Estadística Inferencial 3.5. Prueba para diferencia de medias muestras grandes y pequeñas Paso 2. Determinar el nivel de significancia. Definido por el analista, en este caso se desea usar α = 0.01 Gráficamente el nivel de significancia se distribuye en la curva de distribución normal tal como se muestra en la figura: Paso 3. Calcular los intervalos que implican ese nivel de significancia. Para dicho nivel de significancia el valor de Z es: Z=-2.326 Gráficamente queda de la siguiente manera: Z = -2.326 Región de rechazo de Ho Región de aceptación de Ho Región de rechazo de Ho Región de aceptación de Ho Ho: µ mujeres - µ hombres = 0 Ho: µ mujeres ≥ µ hombres Despejando: Ho: µ mujeres - µ hombres ≥ 0 Paso 4. Calcular el “estadístico” de la prueba. Para volverlo ecuación algunos autores toman: Ho: µ mujeres - µ hombres = 0 El estadístico Z se calcula de la siguiente manera: x1 − x 2 − ( µ1 − µ 2 ) z= ( ) σ 12 n1 + σ 22 n2 Donde: x1 Promedio de la muestra 1 x 2 Promedio de la muestra 2 µ1 Media de la población 1 µ 2 Media de la población 2 σ 1 Varianza de la población 1 σ 2 Varianza de la población 2 n1 Número de elementos de la muestra 1 n 2 Número de elementos de la muestra 2 Elaboró: MC. Marcel Ruiz Martínez 2 Estadística Inferencial 3.5. Prueba para diferencia de medias muestras grandes y pequeñas Para el caso del presente ejemplo: considerando la población de mujeres como 1 y la de hombres como 2 tenemos la siguiente sustitución: z= ( x − x ) − (µ 1 2 σ 12 n1 + 1 − µ2 ) σ 22 n2 = ( $3,352 − $5, 727 ) − 0 = −10.42 $1,1002 $1, 7002 + 87 76 Paso 6. Aceptar o rechazar la hipótesis nula. En este caso como el estadístico de la prueba cae FUERA de la región que hace verdadera la hipótesis nula, por lo cual dicha hipótesis se RECHAZA y se toma como verdadera la hipótesis alternativa: Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor a lo que pagan los hombres. (FALSO) Ha: Lo que pagan las mujeres en el fondo de pensión privado es menor a lo que pagan los hombres. (VERDADERO) Paso 5. Determinar si el estadístico cae dentro de la región que hace la Hipótesis nula verdadera. Z = -2.326 Región de rechazo de Ho Región de aceptación de Ho Ho: µ mujeres - µ hombres = 0 Estadístico de prueba z = -10.42 Como podrá notarse, el estadístico esta FUERA de la región que hace verdadera la hipótesis nula. Elaboró: MC. Marcel Ruiz Martínez A continuación realice los siguientes ejercicios, tenga en cuenta que puede considerarse de una o dos colas de acuerdo a la naturaleza del problema: Dueño de un café. El dueño de un café realizó un estudio estadístico por cuenta propia y otro usando los servicios de dos practicantes universitarios que cursan la materia de estadística inferencial. Según los datos de muestreo del dueño para 30 personas su edad fue de 21 años con una desviación estándar de 0.5 años; en cambio en el muestreo realizado por los estudiantes para 40 personas encontraron que la media es de 19 años con una desviación estándar de 0.3 años. La pregunta del dueño ahora es si se requiere invertir en un nuevo estudio dado que alguno de los dos realizados hasta ahora está mal hecho. Si ambos estudios analizaron una muestra representativa de la misma población las medias poblacionales son iguales y no se requiere un estudio adicional. Determine: a) Hipótesis nula y alternativa b) Concluya si se requiere un estudio estadístico adicional basándose en la prueba de hipótesis para medias, use un nivel de significancia de alfa = 0.05. 3 Estadística Inferencial 3.5. Prueba para diferencia de medias muestras grandes y pequeñas Proveedor de focos. Una empresa de fabricación de focos desea venderle al gobierno del estado; y para concursar con el resto de las compañías asegura que la vida media de sus focos es de 3000 horas, un estudio previo de 50 focos de forma aleatoria obtuvo un promedio de 2980 horas de vida media con una desviación estándar de 10 horas; como el dueño de la empresa no desea quedarse con ese estudio (ya que a simple vista la media es menor a la que él asegura) se contrata otro estudio independiente y éste indica una media de 3005 horas de vida promedio con una desviación estándar de 15 horas. ¿El primer estudio estuvo mal realizado? Si mediante la prueba de hipótesis se confirma que las medias poblacionales son iguales: µ estudio 1 - µ estudio2 = 0 Entonces ambos estudios son estadísticamente equivalentes. Determine lo siguiente: a) Defina la hipótesis nula y alternativa b) Realice la prueba de hipótesis con un nivel de significancia de alfa = 0.1 Debate político. El gobierno del estado ha obtenido una calificación de 7.1 por parte de la población con una desviación estándar de 1.2 puntos tomando como base una muestra de 1000 personas; estos datos según la empresa consultora A; un partido opositor contrata a la empresa consultora B y la calificación promedio que reporta es de 5.1 con una desviación estándar de 1.3 puntos tomando como base una muestra de 1200 personas. El partido de oposición acusa al gobierno del estado de subirse 2 puntos arriba, siendo que su calificación real es de 5.1 y no de 7.1. ¿Será verdad lo que afirma la oposición? Con un nivel de significancia de 0.05 realice lo siguiente: a) Planté como hipótesis nula que en efecto la oposición tiene razón es decir, la diferencia de µ estudio B - µ estudio A = 2 y confirme si es verdad mediante la prueba de hipótesis. b) Planté como hipótesis nula que ambos estudios son estadísticamente independientes es decir, la diferencia de µ estudio B - µ estudio A = 0 y confirme si es verdad mediante la prueba de hipótesis. Elaboró: MC. Marcel Ruiz Martínez 4 Estadística Inferencial Actividad 3.4. Pruebas de hipótesis para diferencia de medias. Problema 1. Un contratista “A” ha ganado el contrato del gobierno para colocar los adornos luminosos de navidad; un competidor “B” acusa de fraude en dicho proceso ya que sus focos técnicamente son mejores que los del ganador; asegurando que duran 100 horas más de uso. Para verificar lo anterior cada contratista ofrece un estudio de duración realizado de forma independiente, en resumen se ofrecen los siguientes datos: Tiempo de vida focos de la empresa A: 3050 horas Tiempo de vida focos de la empresa B: 3150 horas Cantidad de elementos muestreados empresa A: 400 Cantidad de elementos muestreados empresa B: 400 Desviación estándar focos de la empresa A: 50 horas Desviación estándar focos de la empresa B: 50 horas Con un nivel de significancia de 0.05 realice lo siguiente: a) Redacte la hipótesis nula y alternativa; además ¿Será correcto analizar el problema como una o como dos colas? b) Con un nivel de significancia de 0.1 determine la veracidad para la hipótesis nula Ho. 3.5. Prueba para diferencia de medias muestras grandes y pequeñas Problema 2. La cantidad de habitaciones ocupadas que debe a un hotel en el 2008 fue de 200 personas en promedio con una desviación estándar de 15 personas; para los datos anteriores se usaron los 365 días del año. En el 2009 en el mismo hotel la ocupación promedio fue de 220 personas con una desviación estándar de 12 personas; de la misma forma se muestrearon todos los días del año. Hay un aumento en la cantidad de personas que demandan el servicio hotelero ¿pero será una diferencia estadísticamente significativa? ¿se está recuperando y reactivando el turismo? Para comprender lo anterior realice con un nivel de significancia del 0.005 lo siguiente: Considere como hipótesis nula que la media en ambos años en realidad es igual y realice la prueba de hipótesis. Elabore una PRÁCTICA DE EJERCICIOS de este trabajo (INDIVIDUAL), las rúbricas se indican en la liga siguiente: http://marcelrzm.comxa.com/Rubricas/Rubricas.htm SIN EL PROCEDIMIENTO LA ACTIVIDAD NO ES VÁLIDA Puede enviar el documento final por correo electrónico a las siguientes direcciones: [email protected]; [email protected]; [email protected] y [email protected] No olvide enviarse copia a sí mismo del correo que envía, si usa Outlook solicite confirmación de entrega y de lectura. Elaboró: MC. Marcel Ruiz Martínez 5