Estadística Contrastes para los parámetros de dos poblaciones Normales Independientes y dependientes Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Estadística Contrastes para dos Poblaciones independientes Ejemplo de problema a resolver: Se quiere comprobar si entre la zona Norte (x) y Sur (y) del Cabo de Santa Pola existen diferencias en la Litorina punctata. Para ello se han recogido mediante observación dos muestras en cada zona, obteniéndose los siguientes datos: Comprobar si se observan diferencias entre ambas poblaciones Estadística Contrastes para dos Poblaciones independientes Objetivo y contenidos Comparación de medias de dos poblaciones a partir de muestras independientes. Se pueden dar tres situaciones que vamos a estudiar: 1. Varianzas conocidas 2. Varianzas desconocidas iguales 3. Varianzas desconocidas y distintas Recordar: Para el segundo y tercer caso se debe averiguar si en efecto las varianzas son iguales a partir de: Contraste de igualdad de varianzas Estadística Contrastes para dos Poblaciones Independientes Estadística Contrastes para dos Poblaciones independientes. Igualdad de varianzas Intervalos de confianza Para dos variables independientes X ≡ N ( µ x , σ x ) y sabiendo que (nx − 1) S x σ x2 ≅χ 2 n x −1 (n y − 1) S y σ y2 Y ≡ N (µ y ,σ y ) ≅ χ n2y −1 Para obtener los intervalos de confianza para los cocientes de las varianzas se busca una variable aleatoria con función de distribución conocida y parámetro desconocido σ x2 σ y2 Distribución F de Sdenecor: S x2σ y2 2 y Sσ 2 x = Fnx −1,n y −1 Estadística Contrastes para dos Poblaciones independientes. Igualdad de varianzas Intervalos: ⎛ ⎞ ⎛ ⎞ S x2σ y2 S x2σ y2 ⎟ P⎜ a ≤ 2 2 ≤ b ⎟ = 1 − α ⇒ P⎜ F α ≤ 2 2 ≤F α ⎟ = 1 − α ⎜ ⎟ ⎜ n −1, n −1,1− nx −1, n y −1, S yσ x 2 ⎠ ⎝ ⎠ ⎝ x y 2 S yσ x que queda como: Iσ1−2α/ σ 2 x y ⎛ ⎞ 2 2 ⎟ ⎜ Sx Sx 1 = ⎜ , F α 2 2 ⎟ n − 1 , n − 1 , y x S y ⎟ ⎜ Fnx −1,n y −1,α S y 2 2 ⎝ ⎠ Estadística Contrastes para dos Poblaciones independientes. Igualdad de varianzas Contraste de hipótesis (bilateral) H 0 : σ x2 = σ y2 ⎫⎪ H 0 : σ x2 / σ y2 = 1⎫⎪ ⇔ ⎬ 2 2 ⎬ 2 2 H1 : σ x ≠ σ y ⎪⎭ H1 : σ x / σ y ≠ 1⎪⎭ 1. Región de aceptación: ⎛ ⎞ 2 2 ⎟ ⎜ Sx Sx 1 1∈ ⎜ , F α 2 2 ⎟ n − 1 , n − 1 , y x S y ⎟ ⎜ Fnx −1,n y −1,α S y 2 2 ⎝ ⎠ 2. Método alternativo (recomendado por su simplicidad): 2 σ mayor <F 2 n σ menor num −1, nde nom −1, α 2 ⇒ 2 S mayor S 2 menor <F nnum −1, nde nom −1, α 2 Estadística Contrastes para dos Poblaciones independientes. Igualdad de varianzas Ejemplo: Para comparar la efectividad de dos medicamentos en la hipertensión se administran cada uno de ellos a dos grupos de pacientes diferentes, obteniéndose los siguientes resultados: Admitiendo normalidad, ¿se puede aceptar la igualdad de varianzas para un alfa de 0.1? 1. Formula hipótesis: H 0 : σ x2 = σ y2 ⎫⎪ H 0 : σ x2 / σ y2 = 1⎫⎪ ⇔ ⎬ 2 2 ⎬ 2 2 H1 : σ x ≠ σ y ⎪⎭ H1 : σ x / σ y ≠ 1⎪⎭ 2. Calcula datos necesarios: nx = 7 n yy = 7 x = 15.571 y = 13.857 S x2 = 17.619 S y2 = 14.476 Estadística Contrastes para dos Poblaciones independientes. Igualdad de varianzas 3. Calcula la región de aceptación ⎛ ⎞ 2 2 ⎜ Sx S x ⎟ 1 1∈ ⎜ ,F α 2 2 ⎟ n y −1, n x −1, S F S y ⎟ ⎜ nx −1,n y −1,α y 2 2 ⎝ ⎠ ⎛ ⎞ ⎜ 1 17.619 17.619 ⎟ ⎛ 1 17.619 17.619 ⎞ 1∈ ⎜ ,F ,4.28 ⎟ ⎟ = ⎜ 0.05 7 − 1 , 7 − 1 , 14.476 ⎟ ⎝ 4.28 14.476 14.476 ⎠ ⎜ F7 −1,7 −1, 0.05 14.476 2 2 ⎝ ⎠ 1∈ (0.284,5.209) No rechazamos Estadística Contrastes para dos Poblaciones independientes. Diferencia de medias, varianzas conocidas Intervalos de confianza ⎧ X ≡ N ( µ x , σ x ) Sabiendo que ⎨ ⎩Y ≡ N ( µ y , σ y ) y 2 ⎞ 2 ⎛ σ σ x X − Y ≅ N ⎜ µ x − µ y , + y ⎟ ⎜ nx n y ⎟ ⎝ ⎠ Al conocer las varianzas de la pob. es posible tipificar la var. aleatoria a partir de: Z= ( X − Y ) − (µ x − µ y ) σ x2 nx + σ y2 ny Estadística Contrastes para dos Poblaciones independientes. Diferencia de medias, varianzas conocidas Por tanto: ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ ( X − Y ) − (µ x − µ y ) P⎜ a ≤ ≤ b ⎟ = 1 − α 2 2 ⎜ ⎟ σx σy + ⎜⎜ ⎟⎟ n n x y ⎝ ⎠ I µ1−xα− µ y 2 2 ⎞ 2 2 ⎛ σ σ σ σ y y x x ⎟ = ⎜ ( X − Y ) − Zα / 2 + , ( X − Y ) + Zα / 2 + ⎜ nx n y nx n y ⎟ ⎝ ⎠ Estadística Contrastes para dos Poblaciones independientes. Diferencia de medias, varianzas conocidas ⎧⎪H 0 : µ x = µ y ⎧⎪H 0 : µ x − µ y = 0 ⇔ ⎨ ⎨ H : µ ≠ µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y ≠ 0 y 1. No se rechaza para un determinado nivel de significación si Contraste de hipótesis 2 2 ⎞ 2 2 ⎛ σ σ σ σ x x X − Y ∈ ⎜ − zα / 2 + y , zα / 2 + y ⎟ ⎜ nx n y nx n y ⎟ ⎝ ⎠ X −Y 2. Que traducido a estadístico queda como σ 2 x nx + σ 3. Recordad que para el p-valor p > α ⇒ No Re chazo ⎛ ⎞ ⎛ ⎜ ⎟ ⎜ ⎜ ⎜ X − Y ⎟ X −Y p / 2 = P⎜ Z > ⇒ p − valor = 2 * P Z > ⎟ ⎜ 2 2 ⎜ ⎜ σ x2 σ y ⎟ σ x2 σ y + + ⎜⎜ ⎟⎟ ⎜⎜ n n n ny x y ⎠ x ⎝ ⎝ 2 y < zα / 2 ⇒ No Re chazo ny calculado como: ⎞ ⎟ ⎟ ⎟ ⎟ ⎟⎟ ⎠ Estadística Contrastes para dos Poblaciones independientes. Diferencia de medias, varianzas conocidas ⎧⎪H 0 : µ x ≥ µ y ⎧⎪H 0 : µ x − µ y ≥ 0 ⇔ ⎨ ⎨ H : µ < µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y < 0 y 1. No se rechaza si 2 2 ⎛ ⎞ σ σ y x X ∈ ⎜ − Zα + ,+∞ ⎟ ⎜ ⎟ nx n y ⎝ ⎠ 2 ⎞ 2 ⎛ σ σ x X ∈ ⎜ − ∞, Zα + y ⎟ ⎜ nx n y ⎟ ⎝ ⎠ 2. Estadístico: No Re chazo ⇒ σ 3. p-valor: 2. Estadístico X −Y 2 x nx + σ ⎧⎪H 0 : µ x ≤ µ y ⎧⎪H 0 : µ x − µ y ≤ 0 ⇔ ⎨ ⎨ H : µ > µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y > 0 y 1. No se rechaza si 2 y X −Y > − zα ny ⎛ ⎞ ⎜ ⎟ ⎜ X − Y ⎟ p − valor = P⎜ Z < ⎟ 2 2 ⎜ σ x σ y ⎟ + ⎜⎜ ⎟⎟ n n x y ⎠ ⎝ σ 3. p-valor: 2 x nx + σ 2 y < zα ⇒ No Re chazo ny ⎛ ⎞ ⎜ ⎟ ⎜ X − Y ⎟ p − valor = P⎜ Z > ⎟ 2 2 ⎜ σ x σ y ⎟ + ⎜⎜ ⎟⎟ n n x y ⎠ ⎝ Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales Intervalos de confianza ⎧ X ≡ N ( µ x , σ x ) Sabiendo que ⎨ ⎩Y ≡ N ( µ y , σ y ) y 2 ⎞ 2 ⎛ σ σ y x ⎟ X − Y ≅ N ⎜ µ x − µ y , + ⎜ nx n y ⎟ ⎝ ⎠ La varianza desconocida se puede estimar como media ponderada de las varianzas muestrales: 2 2 Sd = Y el estadístico sería t = (nx − 1)S x + (n y − 1)S y nx + n y − 2 ( X − Y ) − (µ x − µ y ) Sd 1 1 + nx n y Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales Por tanto: I 1−α µx −µ y ⎛ ⎞ ⎜ ⎟ ( X − Y ) − (µ x − µ y ) ⎜ ⎟ P⎜ a ≤ ≤ b ⎟ = 1 − α 1 1 ⎜ ⎟ Sd + ⎜ ⎟ n n x y ⎝ ⎠ ⎛ 1 1 1 1 ⎞⎟ ⎜ = ( X − Y ) − t nx + n y − 2,α / 2 S d + , ( X − Y ) + t nx + n y − 2,α / 2 S d + ⎜ nx n y nx n y ⎟⎠ ⎝ Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales ⎧⎪H 0 : µ x = µ y ⎧⎪H 0 : µ x − µ y = 0 ⇔ ⎨ ⎨ H : µ ≠ µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y ≠ 0 y 1. No se rechaza para un determinado nivel de significación si Contraste de hipótesis ⎛ ⎞ 1 1 1 1 X − Y ∈ ⎜ − t nx + n y − 2,α / 2 S d + , t nx + n y − 2,α / 2 S d + ⎟ ⎜ nx n y nx n y ⎟⎠ ⎝ 2. Que traducido a estadístico queda como No Re chazo ⇒ X −Y < t nx + n y −2,α / 2 1 1 Sd + nx n y 3. Recordad que para el p-valor p > α ⇒ No Re chazo calculado como: ⎛ ⎞ ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ X −Y X −Y p / 2 = P⎜ t nx + n y − 2 > ⎟ ⇒ p − valor = 2 * P⎜ t nx + n y − 2 > ⎟ 1 1 1 1 ⎜ ⎟ ⎜ ⎟ Sd + Sd + ⎜ ⎜ nx n y ⎟ nx n y ⎟ ⎝ ⎠ ⎝ ⎠ Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales ⎧⎪H 0 : µ x ≥ µ y ⎧⎪H 0 : µ x − µ y ≥ 0 ⇔ ⎨ ⎨ H : µ < µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y < 0 y 1. No se rechaza si ⎛ ⎞ 1 1 ⎜ X − Y ∈ − t nx + n y ,α S d + ,+∞ ⎟ ⎜ ⎟ nx n y ⎝ ⎠ 2. Estadístico: No Re chazo ⇒ 3. p-valor: ⎧⎪H 0 : µ x ≤ µ y ⎧⎪H 0 : µ x − µ y ≤ 0 ⇔ ⎨ ⎨ H : µ > µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y > 0 y 1. No se rechaza si ⎛ ⎞ 1 1 X − Y ∈ ⎜ − ∞, t nx + n y ,α S d + ⎟ ⎜ nx n y ⎟⎠ ⎝ 2. Estadístico X −Y > −tnx + n y −2,α 1 1 sd + nx n y ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ X −Y p − valor = P⎜ t nx + n y −2 < ⎟ 1 1 ⎜ ⎟ sd + ⎜ nx n y ⎟⎠ ⎝ No Re chazo ⇒ 3. p-valor: X −Y < tnx + n y −2,α 1 1 sd + nx n y ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ X −Y p − valor = P⎜ t nx + n y −2 > ⎟ 1 1 ⎜ ⎟ sd + ⎜ nx n y ⎟⎠ ⎝ Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales Ejemplo 1: Los sig. datos corresponden a muestras de la sp. Jania de dos zonas cercanas a un punto de vertido de aguas residuales. Verificar si hay diferencias entre ambas zonas. x y Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales 1. Comprueba si se da la igualdad de varianzas: ⎛ ⎞ 2 2 ⎜ Sx S x ⎟ 1 1∈ ⎜ ,F α 2 2 ⎟ n y −1, n x −1, S F S y ⎟ ⎜ nx −1,n y −1,α y 2 2 ⎝ ⎠ 1∈ (0.299,2.561) ⎛ ⎞ 2 2 ⎜ 7.51 7.51 ⎟ 1 1∈ ⎜ ,F 0.005 2 2 ⎟ 16−1,15−1, F 8 . 06 8 . 06 ⎜ 15−1,16−1, 0.05 ⎟ 2 2 ⎝ ⎠ No rechazo, igualdad de varianzas 2. Calcula datos necesarios desconocidos Sd = Sd = (nx − 1)S x2 + (n y − 1)S y2 nx + n y − 2 (15 − 1)7.512 + (16 − 1)8.06 2 15 + 16 − 2 Sd = 7.779 Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales 3. Criterio de región de aceptación: ⎛ 1 1 1 1 ⎞⎟ ⎜ X − Y ∈ − t nx + n y − 2,α / 2 S d + , t nx + n y − 2,α / 2 S d + ⎜ nx n y nx n y ⎟⎠ ⎝ ⎛ 1 1 1 1 ⎞ 0.61 ∈ ⎜⎜ − t15+16−2,0.05 / 2 * 7.779 * + , t15+16−2,0.05 / 2 * 7.779 * + ⎟⎟ 15 16 15 16 ⎠ ⎝ 0.61∈ (− 2.0452* 7.779 * 0.360,2.0452* 7.779 * 0.360) = (−5.727,5.727) No rechazo 4. Calcula por estadístico: tobs X −Y = 1 1 Sd + nx n y tobs = 0.61 = 0.218 1 1 7.779 + 15 16 t 29, 0.025 = 2.0452 tobs = 0.218 < 2.0452 = t29,0.025 No rechazo Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales 5. P-valor: ( p / 2 = P tnx + n y −2 >t obs ) ( ) p / 2 = P tnx +n y −2 > 0.218 ⇒ p / 2 > 0.25 p − valor > 0.5 No rechazo Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas e iguales Ejemplo 2: Se quiere comprobar si entre la zona Norte (x) y Sur (y) del Cabo de Santa Pola existen diferencias en la Litorina punctata. Para ello se han recogido mediante observación dos muestras en cada zona, obteniéndose los siguientes datos: Medx = 2,2 Medy = 1,9 Sx = 0,12 Sy= 0,10 nx= 155 ny = 208 Comprobar si se observan diferencias entre ambas poblaciones Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas y distintas Intervalos de confianza ⎧ X ≡ N ( µ x , σ x ) Sabiendo que ⎨ ⎩Y ≡ N ( µ y , σ y ) y 2 ⎞ 2 ⎛ σ σ y x ⎟ X − Y ≅ N ⎜ µ x − µ y , + ⎜ nx n y ⎟ ⎝ ⎠ Situación sin solución exacta. Utilizaremos método de Welch que sustituye las varianzas por sus estimadores insesgados en el estadístico: t= ( X − Y ) − (µ x − µ y ) 2 S x2 S y + nx n y En este caso, el estadístico se aproxima auna dist. t de Student con m grados de libertad, donde m (como nº natural): Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas y distintas Por tanto: I µ1−xα− µ y ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ ( X − Y ) − (µ x − µ y ) P⎜ a ≤ ≤ b ⎟ = 1 − α Sx S y ⎜ ⎟ + ⎜ ⎟ n n x y ⎝ ⎠ 2 2 ⎞ 2 2 ⎛ S S S S = ⎜ ( X − Y ) − t m,α / 2 x + y , ( X − Y ) + t m,α / 2 x + y ⎟ ⎜ nx n y nx n y ⎟ ⎝ ⎠ Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas y distintas ⎧⎪H 0 : µ x = µ y ⎧⎪H 0 : µ x − µ y = 0 ⇔ ⎨ ⎨ H : µ ≠ µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y ≠ 0 y 1. No se rechaza para un determinado nivel de significación si Contraste de hipótesis 2 2 ⎞ 2 2 ⎛ S S S S X − Y ∈ ⎜ − t m,α / 2 x + y , t m ,α / 2 x + y ⎟ ⎜ nx n y nx n y ⎟ ⎝ ⎠ 2. Que traducido a estadístico queda como No Re chazo ⇒ 3. Recordad que para el p-valor p > α ⇒ No Re chazo ⎛ ⎞ ⎛ ⎜ ⎟ ⎜ ⎜ ⎜ X − Y ⎟ X −Y ⎟ ⇒ p − valor = 2 * P⎜ t m > p / 2 = P⎜ t m > 2 2 ⎜ ⎜ S x2 S y ⎟ S x2 S y + + ⎜⎜ ⎟ ⎜⎜ nx n y ⎟ nx n y ⎝ ⎠ ⎝ X −Y 2 y S S + nx n y 2 x < t m,α / 2 calculado como: ⎞ ⎟ ⎟ ⎟ ⎟ ⎟⎟ ⎠ Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas y distintas ⎧⎪H 0 : µ x ≥ µ y ⎧⎪H 0 : µ x − µ y ≥ 0 ⇔ ⎨ ⎨ H : µ < µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y < 0 y 1. No se rechaza si 2 2 ⎛ ⎞ S S y x ⎜ X − Y ∈ − t m,α + ,+∞ ⎟ ⎜ ⎟ nx n y ⎝ ⎠ 2. Estadístico: No Re chazo ⇒ 3. p-valor: ⎛ ⎜ ⎜ p − valor = P⎜ t m < ⎜ ⎜⎜ ⎝ 2 ⎞ 2 ⎛ S S x X − Y ∈ ⎜ − ∞, t m,α + y ⎟ ⎜ nx n y ⎟ ⎝ ⎠ 2. Estadístico X −Y 2 y S S + nx n y 2 x ⎧⎪H 0 : µ x ≤ µ y ⎧⎪H 0 : µ x − µ y ≤ 0 ⇔ ⎨ ⎨ H : µ > µ ⎪⎩ 1 x ⎪⎩H1 : µ x − µ y > 0 y 1. No se rechaza si > −t m,α ⎞ ⎟ X − Y ⎟ ⎟ 2 2 S x S y ⎟ + nx n y ⎟⎟⎠ No Re chazo ⇒ 3. p-valor: ⎛ ⎜ ⎜ p − valor = P⎜ t m > ⎜ ⎜⎜ ⎝ X −Y 2 y S S + nx n y 2 x < t m,α ⎞ ⎟ X − Y ⎟ ⎟ 2 2 S x S y ⎟ + nx n y ⎟⎟⎠ Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas y distintas Ejemplo Se ha efectuado un estudio por parte de la Comisión de Caza y Pesca para estimar cantidades de residuos químicos en tejidos de pelícanos. En una prueba de DDT para muestras aleatorias de 10 pelícanos jóvenes y 13 polluelos se obtuvieron los siguientes resultados: Jóvenes Adultos Número 10 13 Media 0.041 0.026 S 0.017 0.006 ¿Se puede afirmar que el comportamiento en ambos es igual con una significación del 0.05? ⎧⎪H 0 : µ x = µ y ⎧⎪H 0 : µ x − µ y = 0 ⇔ ⎨ ⎨ ⎪⎩H1 : µ x ≠ µ y ⎪⎩H1 : µ x − µ y ≠ 0 Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas y distintas 1. Comprueba que efectivamente las varianzas son diferentes: ⎛ ⎞ 2 2 ⎟ ⎜ Sx Sx 1 1∈ ⎜ , F α 2 2 ⎟ n y −1, n x −1, S F S y ⎟ ⎜ nx −1,n y −1,α y 2 2 ⎝ ⎠ 1∈ (2.175,29.025) ⎛ ⎞ 2 2 ⎜ 0.017 0.017 ⎟ 1 1∈ ⎜ ,F 0.005 2 2 ⎟ 13−1,10−1, F 0 . 006 0 . 006 ⎜ 10−1,13−1, 0.05 ⎟ 2 2 ⎝ ⎠ Rechazo, varianzas diferentes 2. Calcula m m = 10.85 ⇒ m = 11 Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas y distintas 3. Criterio de región de aceptación: 2 2 ⎞ 2 2 ⎛ S S S S X − Y ∈ ⎜ − t m,α / 2 x + y , t m ,α / 2 x + y ⎟ ⎜ nx n y nx n y ⎟ ⎝ ⎠ 2 2 2 2 ⎛ 0 . 017 0 . 006 0 . 017 0 . 006 0.015 ∈ ⎜ − t11,0.025 + , t11,0.025 + ⎜ 10 13 10 13 ⎝ ⎞ ⎟ ⎟ ⎠ 0.015 ∈ (− 0.0123,0.0123) 4. Criterio de estadístico: tobs = tobs = X −Y 2 S x2 S y + nx n y 0.015 = 2.66 0.0078 t11, 0.025 = 2.201 tobs = 2.66 < 2.201 = t11,0.025 Rechazo Rechazo Estadística Contrastes para dos Poblaciones independientes. Dif. de medias, varianzas desconocidas y distintas 4. p-valor: p / 2 = P(tm > tobs ) 0.01 < p / 2 < 0.025 0.02 < p − valor < 0.05 p − valor < α Rechazo Dado que se demuestra que no son iguales, ¿serías capaz de saber si es mayor o menor? (compara con contrastes unilaterales) Estadística Contrastes para los parámetros de la Normal Contrastes para los parámetros de dos poblaciones normales dependientes Estadística Contrastes para dos Poblaciones Dependientes Supongamos que queremos comprobar si realmente se produce una disminución significativa en la cobertura de Enteromorpha después de constatar un impacto ambiental con residuos de alquitrán. Se tienen medidas de antes y se mide después del impacto. Estadística Contrastes para dos Poblaciones Dependientes - En este tipo de análisis el interés no se centra en la variabilidad que puede haber entre los individuos - Sino en las diferencias que se observan en un mismo sujeto entre un momento y otro Por este motivo, resulta intuitivo trabajar con la diferencia de ambas observaciones (en el ejemplo será la disminución de porcentaje de cobertura), de modo que se quiere contrastar la hipótesis H1:La disminución del porcentaje de cobertura es mayor que cero Estadística Contrastes para dos Poblaciones Dependientes Intervalos de confianza ⎧ X ≡ N ( µ x , σ x ) Sabiendo que ⎨ ⎩Y ≡ N ( µ y , σ y ) y D ≅ N (µD , σ D ) El procedimiento de obtención del intervalo es el mismo que en temas anteriores: 1−α I µD ⎛ S S = ⎜⎜ D − tn−1,α / 2 D , D + tn−1,α / 2 D n n ⎝ ⎞ ⎟ ⎟ ⎠ Donde: n 1 n D = ∑ Di = ∑ ( X i − Yi ) n i =1 i =1 1 n 2 ( ) S = D − D ∑ i n − 1 i =1 2 D Estadística Contrastes para dos Poblaciones Dependientes Contraste de hipótesis texp t = D SD n 1) Definimos la variable D como: D = {Antes - Despues} ó D = {Despues - Antes} ó D = { X - Y} ó D = { Y - X} 2) Proponemos el contraste 3) Calculamos el estadístico en función de la definición de D y del contraste propuesto, siendo D una variable Normal 4) Obtenemos las conclusiones y aportamos el p-valor Estadística Contrastes para dos Poblaciones Dependientes ⎧ H 0 : µ D = 0 ⎨ ⎩ H1 : µ D ≠ 0 1. No se rechaza para un determinado nivel de significación si S S ⎞ ⎛ D ∈ ⎜ − t n −1,α / 2 D , t n −1,α / 2 D ⎟ n n ⎠ ⎝ 2. Que traducido a estadístico queda como No Re chazo ⇒ D Sd n < tn−1,α / 2 3. Recordad que para el p-valor p > α ⇒ No Re chazo calculado como: ⎛ ⎛ D ⎞⎟ D ⎞⎟ ⎜ ⎜ p / 2 = P⎜ tn−1 > ⎟ ⇒ p − valor = 2 * P⎜ tn−1 > S S n n ⎟⎠ d d ⎝ ⎠ ⎝ Estadística Contrastes para dos Poblaciones Dependientes ⎧ H 0 : µ D ≥ 0 ⎨ ⎩ H1 : µ D < 0 1. No se rechaza si ⎧ H 0 : µ D ≤ 0 ⎨ ⎩ H1 : µ D > 0 1. No se rechaza si S ⎛ ⎞ D ∈ ⎜ − t n −1,α D ,+∞ ⎟ n ⎝ ⎠ 2. Estadístico: No Re chazo ⇒ S ⎞ ⎛ D ∈ ⎜ − ∞, t n −1,α D ⎟ n ⎠ ⎝ 2. Estadístico D Sd n > −t n −1,α / 2 3. p-valor: ⎛ D ⎞ ⎟⎟ p − valor = P⎜⎜ tn−1 < S d n ⎠ ⎝ No Re chazo ⇒ D Sd n < t n −1,α / 2 3. p-valor: ⎛ D ⎞ ⎟⎟ p − valor = P⎜⎜ tn−1 > S d n ⎠ ⎝ Estadística Contrastes para dos Poblaciones Dependientes Supongamos que queremos comprobar si realmente se produce una disminución significativa en la cobertura de Enteromorpha después de constatar un impacto ambiental con residuos de alquitrán. Se tienen medidas de antes y se mide después del impacto. ⎧ H 0 : µ D ≥ 0 ⎨ ⎩ H1 : µ D < 0 1. Calculemos los estadísticos X = 90.81 Y = 85.74 S x = 5.081 S y = 5.081 Estadística Contrastes para dos Poblaciones Dependientes 2. Calculemos D media y S de D: n 1 n D = ∑ Di = ∑ ( X i − Yi ) = 5.071 n i =1 i =1 1 n 2 ( ) S = D − D = 2.511 ∑ i n − 1 i =1 2 D 3. Calculemos los criterios de aceptación o rechazo a) Región de aceptación: S ⎛ ⎞ D ∈ ⎜ − t n −1,α D ,+∞ ⎟ n ⎝ ⎠ 1.584 ⎛ ⎞ 5.071∈ ⎜ − t9, 0.05 ,+∞ ⎟ = (− 1.8331 ⋅ 0.501,+∞ ) = (−0.918,+∞) 10 ⎝ ⎠ No rechazo Estadística Contrastes para dos Poblaciones Dependientes b) Estadístico: texp t = D Sd n texp t = 5.071 = 10.12 1.584 10 − texp t > −t9, 0.05 − t n −1,α = −t9, 0.05 = −1.8331 c) p-valor ⎛ D ⎞ ⎜ ⎟⎟ p − valor = P⎜ tn−1 < S d n ⎠ ⎝ p − valor = 1 − P(t9 > 10.12) ⇒ p − valor > 0.995 No rechazo No rechazo Estadística Contrastes para dos Poblaciones Independientes o Dependientes Comandos de R: Dos pob., diferencia de varianzas: var.test(x, y, ratio = 1,alternative = "two.sided“,conf.level = 0.95) Dos pob. independientes, varianzas desconocidas e iguales: t.test(x, y, alternative = c("two.sided", "less", "greater"), mu = 0, var.equal = TRUE, conf.level = 0.95) Dos pob. independientes, varianzas desconocidas y diferentes: t.test(x, y, alternative = c("two.sided", "less", "greater"), mu = 0, var.equal = FALSE, conf.level = 0.95) Dos pob. apareadas (dependientes): t.test(x, y, alternative = c("two.sided", "less", "greater"), mu = 0, paired = TRUE, conf.level = 0.95)