Sesión 15 Prueba de Hipótesis para la Diferencia de medias Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro ¿En qué contexto es útil una prueba de hi ót i para lla diferencia hipótesis dif i de d medias? di ? 1. Cuando se trabaja j simultáneamente con una variable categórica g (posible VI) y una variable dependiente (posible VD). • Se debe considerar el número de niveles de la variable categórica. • El objetivo bj ti es comparar los l valores l d la de l variable i bl cuantitativa tit ti en función de los niveles de la variable categórica. • Se asume q que los ggrupos p son independientes. p • ¿Es posible asumir que la población se distribuye normalmente? 2. Cuando se trabaja con muestras relacionadas, lo que significa dos mediciones di i cuantitativas tit ti en ell mismo i grupo. • Lo habitual es considerar al mismo grupo de sujetos medidos dos veces;; también se p pueden comparar p a p pares de sujetos j ((ej: j gemelos). Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Actividad 1: Determine las variable(s) incluida(s) en el objetivo y si las muestras son independientes o no. • • • Establecer el nivel de satisfacción conyugal que muestran ambos miembros de la pareja transcurridos 7 años de matrimonio. Evaluar el grado de impacto que tiene un tratamiento para controlar la ansiedad entre hombres y mujeres. Determinar el efecto que tiene un taller de reforzamiento en Estadística Inferencial para estudiantes que asisten y no asisten a clases. Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Contexto de la prueba de Hipótesis para l diferencia la dif i de d medias di • Dos poblaciones Y1 e Y2, con medias μ1 y μ2, y dos muestras de tamaño n1 y n2, que se han seleccionado aleatoriamente de su población. p • Lo que se pretende, en términos generales, es contrastar la hipótesis de que las medias poblacionales no difieren. • Es decir: μ1 = μ2. • ¿Cómo realizar dicho contraste? Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Posibilidades en la Prueba de Hipótesis para muestras t independientes i d di t 1. Las poblaciones se distribuyen normalmente con varianzas conocidas. 2. Las p poblaciones se distribuyen y normalmente con varianzas desconocidas pero iguales. 3. Las p poblaciones se distribuyen y normalmente con varianzas desconocidas y diferentes. 4. Las Poblaciones no se distribuyen normalmente. Para escoger g entre 2 y 3 debemos analizar el IC p para la razón de varianzas: el resultado permitirá tomar la opción correcta. Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro 1. Poblaciones normalmente distribuidas con varianzas i iiguales l • Si es posible conocer las varianzas poblacionales, poblacionales se utiliza como estadístico de prueba a Z. • En este caso Ho: μx – μy = 0 (Contraste bilateral). bilateral) • La fórmula es la siguiente (ver Dócimas de hipótesis paramétricas): paramétricas) Z = X − Y − δ σ 2 x nx + σ 0 2 y ny Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro 2. Poblaciones normalmente distribuidas con varianzas i d desconocidas id pero iiguales l • En p primer lugar g se debe establecer si efectivamente las varianzas poblacionales son iguales (Supuesto). • Para ello es necesario construir un IC para la razón de varianzas (se obtiene bi utilizando ili d ell estadístico dí i F). F) • Ya verificada la igualdad de varianzas, se utiliza como estadístico de prueba a T. • La Ho es: μx – μy = 0 (Contraste bilateral) y el estadístico se calcula así: T = X − Y − δ Sp ⋅ 0 1 1 + nx ny Nota: Sp es la Varianza ponderada. Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Construcción del IC para razón de varianzas i 2 2 ⎡ S12 ⎤ σ1 S1 IC ⎢ 2 ⋅ Fα ≤ 2 ≤ 2 ⋅F α = 1−α ⎥ ,n2 −1,n1 −1 1− ,n2 −1,n1 −1 S σ S 2 2 ⎣ 2 2 ⎦ 2 ⎡ 2 ⎤ 2 2 σ 1 S1 1 ⎢ S1 ⎥ IC ⎢ 2 ⋅ ≤ 2 ≤ 2 ⋅F α = 1−α ⎥ S2 F α σ 2 S2 1− 2 ,n2 −1,n1 −1 ⎢⎣ ⎥⎦ 1− , n1 −1, n2 −1 2 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro 3. Poblaciones normalmente distribuidas con varianzas i d desconocidas id y dif diferentes t •Cuando se determina,, mediante el IC p para la razón de varianzas,, q que éstas difieren se debe modificar el estadístico de prueba. •De esta manera los grados de libertad del estadístico Tcrítico (teórico) se d determinan i d una forma de f dif diferente. • La Ho sigue siendo: μx – μy = 0 (Contraste bilateral). El estadístico es el siguiente: T= X − Y − δ0 2 x 2 y S S + nx n y 2 ⎛S S ⎞ + ⎜⎜ ⎟⎟ n n x y ⎠ G.L(v) = ⎝ 2 2 2 2 ⎛ ⎞ S ⎛ Sx ⎞ y ⎜ ⎟ ⎜⎜ n ⎟⎟ Y los grados de libertad: ⎝ nx ⎠ + ⎝ y ⎠ nx − 1 ny − 1 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro 2 x 2 y Poblaciones que se distribuyen normalmente y las varianzas poblacionales son desconocidas pero iguales Ejercicio: dos profesores en una escuela desean comparar el rendimiento de los alumnos de octavo año que han sido móviles (población 1) con los puntajes de los alumnos que no lo han sido (población ( 2). ) ¿Se puede concluir con los datos de las muestras si el puntaje de rendimiento promedio es diferente en los dos grupos? Grupo1 n= 15 Promedio= 85 S2 =30 Grupo 2 n= 22 Promedio= 87 S2 =25 Móviles= estudiantes que asistieron a dos o más escuelas No móviles= estudiantes que permanecen en la misma escuela Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Procedimiento de verificación de hi ót i hipótesis 1. Planteamiento de las hipótesis 1.‐ Ho: µ1 = µ2 Ho: µ1 ‐ µ2 = 0 µ1 ≠ µ µ2 H1: µ µ1 ‐ µ µ2 ≠ 0 H1: µ 2.‐ Nivel se significación: α = 0,05 3.‐ Descripción de la población y supuestos: ambas poblaciones se distribuyen normalmente Las σ2 son desconocidas. Las muestras son independientes. M.a.s.i Para saber b si las l σ2 poblacionales bl l son iguales, l es preciso realizar l ell IC para la razón de varianzas IC[ S21 / S22 * Fα/2 ; gl2, gl1 ≤ σ21/σ22 ≤ S21 / S22 * F1‐α/2 ; gl2, gl1 ]= 1‐α Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Fα/2 ; gl2, Fα/2 ; gl2, 1 = 0,39 gl2 gl1 = 1 gl2 gl1 = F1‐α/2; gl1, gl2 2,5632 IC [ 30/25*0,39 ≤ σ12/σ22 ≤ 30/25*2,8437]= 1‐α IC [ 0,468 ≤ σ12/σ22 ≤ 3,4124 ]= 0,95 Como el intervalo contiene al 1, las varianzas son iguales. 4.‐ El estadístico pertinente: Diferencia de medias muestrales. 5.‐ El estadístico de prueba: t de student con n1+n2‐2 gl. 6.‐ RR y RA: la hipótesis es bilateral. Para 35 gl y alfa= 0,05 el t crítico es 2,0301 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro 7.‐ Recolección de datos y cálculos: 7. T= σ X −X 1 X − Y − δ0 1 1 Sp ⋅ + nx n y 2 27 27 = + = 1.76 15 22 14(30) + 21(25) S = = 27 35 2 p 85 − 87 −2 T= = = −1.14 1.76 1.76 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro 8 ‐ Decisión Estadística: 8. • Como ‐2.03 2 03 < ‐1.14 1 14 < 2.03 2 03 no es posible rechazar Ho. Ho • Por lo tanto, se acepta. 9.‐ Conclusión: • No hay diferencia entre las medias poblacionales. Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Muestreo en poblaciones no distribuidas normalmente. l t Ejercicio: • Un equipo de consejeros de rehabilitación juvenil tiene la impresión de que los jóvenes no reincidentes (NR) son mayores en cuanto al promedio de edad que los sujetos reincidentes (R) al momento en que caen en poder de las autoridades. • El equipo eq ipo obtiene una na m.a. m a de n1= n1 50 registros de reincidentes y n2= 60 no reincidentes. Estadísticos: • Promedio NR = 14.3; Varianza = 4. • Promedio R = 12.3; varianza = 6.25 • Alfa = 0.05 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro