Métodos Estadı́sticos de la Ingenierı́a Tema 11: Contrastes de Hipótesis Grupo B Área de Estadı́stica e Investigación Operativa Licesio J. Rodrı́guez-Aragón Abril 2010 Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Conceptos Generales 3 Contrastes de Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Pruebas relacionadas con la Media de una Población Prueba para µ = µ0 cuando σ es Conocida. . . . . . . . . . . Prueba para µ ≤ µ0 cuando σ es Conocida. . . . . . . . . . . Prueba para µ = µ0 cuando σ es Desconocida . . . . . . . . Ejemplo de contraste de hipótesis con R . . . . . . . . . . . . Prueba para µ ≤ µ0 cuando σ es Desconocida . . . . . . . . Ejemplo de contraste de hipótesis con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pruebas relacionadas con las Medias de dos Poblaciones Independientes Prueba para µ1 = µ2 cuando σ1 y σ2 son Conocidas . . . . . . . . . . . . . . . . . . . . Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Conocidas . . . . . . . . . . . . . . . . . . . . Prueba para µ1 = µ2 cuando σ1 y σ2 son Desconocidas pero Iguales. . . . . . . . . Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Desconocidas pero Iguales. . . . . . . . . Prueba para µ1 = µ2 cuando σ1 y σ2 son Desconocidas y Distintas . . . . . . . . . Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Desconocidas y Distintas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 . 7 . 8 . 9 10 12 13 . . . . . . 15 16 17 18 19 20 21 Pruebas relacionadas con las Medias de dos Poblaciones Relacionadas 22 Prueba para µ1 = µ2 cuando σ1 , σ2 y ρ son Desconocidos . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Prueba para µ1 ≤ µ2 cuando σ1 , σ2 y ρ son Desconocidos . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Pruebas relacionadas con las Varianzas de dos Poblaciones 25 2 2 Prueba para σ1 = σ2 con µ1 y µ2 Desconocidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Prueba para σ12 ≤ σ22 con µ1 y µ2 Desconocidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Pruebas relacionadas con Proporciones 28 Prueba para p = p0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Prueba para p ≤ p0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Contrastes de Hipótesis: p-valor 31 p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 1 Contenidos Conceptos Generales. Pruebas relacionadas con la media de una población. Pruebas relacionadas con la igualdad de medias de dos poblaciones. Pruebas para datos relacionados. Pruebas para las varianzas. Pruebas para proporciones. Los contrastes de hipótesis permitirán decidirnos entre dos hipótesis formuladas previamente con un determinado nivel de error. Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 2 / 32 2 3 / 32 Conceptos Generales Contrastes de Hipótesis Una Hipótesis Estadı́stica es una proposición que se establece acerca de una o más poblaciones: Acerca de los parámetros de una distribución. Acerca de el tipo y forma de la distribución. Los contrastes de hipótesis se basan en la información proporcionada por una muestra. La terminologı́a estadı́stica habla de Aceptar o Rechazar una hipótesis: Rechazar, significa que la hipótesis es falsa. Aceptar, solamente implica que no se tiene suficiente información para rechazarla. Las Hipótesis se plantean sobre los posibles valores que puede tomar un parámetro poblacional. Hipótesis Simples, son aquellas que sólo plantean un valor posible para el parámetro. Hipótesis Compuestas, establecen un rango de valores que puede tomar el parámetro poblacional. Se plantea en el contraste dos Hipótesis excluyentes y complementarias: Hipótesis Nula, H0 : Suele ser la más concreta, la que contenga el signo de igualdad, suele ser simple. Hipótesis Alternativa, H1 : Complementaria a la Nula, suele ser compuesta. El planteamiento de H0 permite elaborar un modelo probabilı́stico a partir del cual podemos llegar a la decisión final. γ 0.2 Densidad 0.3 0.4 El Contraste de Hipótesis conlleva establecer dos zonas disjuntas y complementarias, Zona de Rechazo de H0 (Región Crı́tica) y la Zona de Aceptación de H0 . 1−α α 2 0.1 α 2 0.0 Z((1 − γ) 2) −3 −2 Z((1 + γ) 2) −1 0 1 2 3 Z Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 4 / 32 3 Contrastes de Hipótesis La decisión de aceptar o rechazar H0 se basa en probabilidades, no en certezas, al tomar la decisión podemos cometer dos tipo de errores. Error Tipo I: Rechazar la Hipótesis Nula, H0 siendo verdadera. Error Tipo II: Aceptar la Hipótesis Nula, H0 siendo falsa. Aceptar H0 Rechazar H0 H0 Verdadera Decisión Correcta 1−α Error Tipo I α H0 Falsa Error Tipo II β Decisión Correcta 1−β Las probabilidades de los Errores de tipo I y II son probabilidades condicionadas: Nivel de Significación, α: α = P(Error I) = P(Rechazar H0 |H0 Verdadera) Nivel de Confianza, 1 − α = γ: γ = 1 − P(Error I) = P(Aceptar H0 |H0 Verdadera) β = P(Error II) = P(Aceptar H0 |H0 Falsa) Al valor complementario de β se le denomina Potencia del Contraste, 1 − β 1 − β = P(Rechazar H0 |H0 Falsa) El objetivo serı́a disponer de un contraste que maximicen la Confianza (γ = 1 − α) y la Potencia (1 − β) y minimizen los Errores de tipo I y II, esto se logra aumentando el tamaño de la muestra n, hasta un cierto valor. El nivel de Significación α es normalmente controlado por el experimentador mientras que β es controlado mediante la elección correcta del tamaño de la muestra. Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 5 / 32 4 Pruebas relacionadas con la Media de una Población 6 / 32 Prueba para µ = µ0 cuando σ es Conocida Consideremos el problema de probar la hipótesis de que la media de una población, con varianza σ 2 conocida, sea igual a un valor concreto µ0 , en contra de una hipótesis alternativa bilateral de que la media sea diferente. H 0 : µ = µ0 H1 : µ 6= µ0 Sea X1 , X2 , . . . , Xn una m.a.s., el estadı́stico apropiado para este caso está basado en la media muestral X. √ El Teorema Central del Limite nos asegura que X ≡ N (µ, σ/ n). Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < X < b defina la Región de Aceptación y la Región Crı́tica. Definamos, √ Z = (X − µ0 )/(σ/ n) ≡ N (0, 1) bajo H0 . Los valores crı́ticos se obtienen, √ √ (a − µ0 )/(σ/ n) = z α2 = z 1−γ ⇒ a = µ0 + (σ/ n)z α2 2 √ √ α (b − µ0 )/(σ/ n) = z1− 2 = z 1+γ ⇒ b = µ0 + (σ/ n)z1− α2 γ 0.2 Densidad 0.3 0.4 2 1−α 0.1 α 2 α 2 0.0 Z(α 2) −3 −2 Z(1 − α 2) −1 0 1 2 3 Z Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. √ Si X cae en la Región de Aceptación, a < X < b, entonces, el estadı́stico Z = (X − µ0 )/(σ/ n) caerá en la Región de Aceptación, |Z| < z1− α2 , y se aceptará H0 ; en caso contrario, Región de Rechazo, |Z| ≥ z1− α2 , se rechazará H0 . Los Coeficientes de Confianza o Niveles de Significación más usuales son: γ = 0.95, α = 0.05 ⇒ z 1+γ = z1− α2 = z0.975 = 1.96, 2 γ = 0.99, α = 0.01 ⇒ z 1+γ = z1− α2 = z0.995 = 2.58. 2 Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 7 / 32 5 Prueba para µ ≤ µ0 cuando σ es Conocida En este caso consideremos la hipótesis de que la media de una población, con varianza σ 2 conocida, sea menor o igual a un valor concreto µ0 , en contra de una hipótesis alternativa unilateral de que la media sea mayor. H 0 : µ ≤ µ0 H 1 : µ > µ0 Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo X < a defina la Región de Aceptación y la Región Crı́tica. Definamos, √ Z = (X − µ0 )/(σ/ n) ≡ N (0, 1) bajo H0 . El valor crı́tico se obtiene, γ 0.2 Densidad 0.3 0.4 √ √ (a − µ0 )/(σ/ n) = z1−α = zγ ⇒ a = µ0 + (σ/ n)z1−α 1−α 0.1 α 0.0 Z(1 − α) −3 −2 −1 0 1 2 3 Z Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. √ Si X cae en la Región de Aceptación, X < a, entonces, el estadı́stico Z = (X − µ0 )/(σ/ n) caerá en la Región de Aceptación, Z < z1−α , y se aceptará H0 ; en caso contrario, Región de Rechazo, Z ≥ z1−α , se rechazará H0 . Los Coeficientes de Confianza o Niveles de Significación más usuales son: γ = 0.95, α = 0.05 ⇒ zγ = z1−α = z0.95 = 1.65, γ = 0.99, α = 0.01 ⇒ zγ = z1−α = z0.99 = 2.33. Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 8 / 32 6 Prueba para µ = µ0 cuando σ es Desconocida Consideremos el problema de probar la hipótesis de que la media de una población, con varianza σ 2 desconocida, sea igual a un valor concreto µ0 , en contra de una hipótesis alternativa bilateral de que la media sea diferente. H 0 : µ = µ0 H1 : µ 6= µ0 Sea X1 , X2 , . . . , Xn una m.a.s., el estadı́stico apropiado para este caso está basado en la media muestral X. Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < X < b defina la Región de Aceptación y la Región Crı́tica. Definamos, √ T = (X − µ0 )/(Sc / n) ≡ tn−1 bajo H0 . Los valores crı́ticos se obtienen, γ 0.2 Densidad 0.3 0.4 √ a = µ0 + (Sc / n)tn−1, α2 √ b = µ0 + (Sc / n)tn−1,1− α2 α 2 t(α 2) 0.0 0.1 1−α α 2 −3 −2 t(1 − α 2) −1 0 1 2 3 T Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. √ Si X cae en la Región de Aceptación, a < X < b, entonces, el estadı́stico T = (X − µ0 )/(Sc / n) caerá en la Región de Aceptación, |T | < tn−1,1− α2 , y se aceptará H0 ; en caso contrario, Región de Rechazo, |T | ≥ tn−1,1− α2 , se rechazará H0 . Los Coeficientes de Confianza o Niveles de Significación usuales, eg. n = 20: γ = 0.95, α = 0.05 ⇒ t19, 1+γ = t19,1− α2 = t19,0.975 = 2.09, 2 γ = 0.99, α = 0.01 ⇒ t19, 1+γ = t19,1− α2 = t19,0.995 = 2.86. 2 Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 9 / 32 7 Ejemplo de contraste de hipótesis con R > x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, mu = 15, alt = "two.sided", conf.level = 0.95) One Sample t-test data: x t = 0.6359, df = 9, p-value = 0.5407 alternative hypothesis: true mean is not equal to 15 95 percent confidence interval: 13.56776 17.55224 sample estimates: mean of x 15.56 > pt(0.6359, df = 9) [1] 0.7296637 Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 10 / 32 Ejemplo de contraste de hipótesis con R > x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, mu = 18, alt = "two.sided", conf.level = 0.95) One Sample t-test data: x t = -2.7706, df = 9, p-value = 0.02173 alternative hypothesis: true mean is not equal to 18 95 percent confidence interval: 13.56776 17.55224 sample estimates: mean of x 15.56 > pt(-2.7706, df = 9) [1] 0.01086609 Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 11 / 32 8 Prueba para µ ≤ µ0 cuando σ es Desconocida En este caso consideremos la hipótesis de que la media de una población, con varianza σ 2 desconocida, sea menor o igual a un valor concreto µ0 , en contra de una hipótesis alternativa unilateral de que la media sea mayor. H 0 : µ ≤ µ0 H 1 : µ > µ0 Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo X < a defina la Región de Aceptación y la Región Crı́tica. Definamos, √ T = (X − µ0 )/(Sc / n) ≡ tn−1 bajo H0 . El valor crı́tico se obtiene, γ 0.2 Densidad 0.3 0.4 √ √ (a − µ0 )/(Sc / n) = tn−1,1−α = tn−1,γ ⇒ a = µ0 + (Sc / n)tn−1,1−α 1−α 0.1 α 0.0 t(1 − α) −3 −2 −1 0 1 2 3 T Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. √ Si X cae en la Región de Aceptación, X < a, entonces, el estadı́stico T = (X − µ0 )/(Sc / n) caerá en la Región de Aceptación, T < tn−1,1−α , y se aceptará H0 ; en caso contrario, Región de Rechazo, T ≥ tn−1,1−α , se rechazará H0 . Los Coeficientes de Confianza o Niveles de Significación usuales, eg. n = 20: γ = 0.95, α = 0.05 ⇒ tn−1,γ = tn−1,1−α = t19,0.95 = 1.73, γ = 0.99, α = 0.01 ⇒ tn−1,γ = tn−1,1−α = t19,0.99 = 2.54. Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 12 / 32 9 Ejemplo de contraste de hipótesis con R > x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, mu = 15, alt = "greater", conf.level = 0.95) One Sample t-test data: x t = 0.6359, df = 9, p-value = 0.2703 alternative hypothesis: true mean is greater than 15 95 percent confidence interval: 13.94561 Inf sample estimates: mean of x 15.56 > pt(0.6359, df = 9) [1] 0.7296637 Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 13 / 32 10 Ejemplo de contraste de hipótesis con R > x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, mu = 12, alt = "greater", conf.level = 0.95) One Sample t-test data: x t = 4.0423, df = 9, p-value = 0.001459 alternative hypothesis: true mean is greater than 12 95 percent confidence interval: 13.94561 Inf sample estimates: mean of x 15.56 > pt(4.0423, df = 9) [1] 0.9985408 Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 14 / 32 11 Pruebas relacionadas con las Medias de dos Poblaciones Independientes 15 / 32 Prueba para µ1 = µ2 cuando σ1 y σ2 son Conocidas Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ12 y σ22 conocidas, sean iguales, en contra de una hipótesis alternativa bilateral de que las medias sean diferentes. H 0 : µ1 = µ2 H1 : µ1 6= µ2 El estadı́stico apropiado para este caso está basado en la diferencia de las medias muestrales X 1 − X 2. Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < X 1 − X 2 < b defina la Región de Aceptación y la Región Crı́tica. Definamos, (X 1 − X 2 ) ≡ N (0, 1) bajo H0 . σ12 /n1 + σ22 /n2 γ 0.2 Densidad 0.3 0.4 Z=p 1−α 0.1 α 2 α 2 0.0 Z(α 2) −3 −2 Z(1 − α 2) −1 0 1 2 3 Z Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan las medias muestrales X 1 y X 2 , obteniéndose Z. La Región de Aceptación vendrá definida por, |Z| < z1− α2 , y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, |Z| ≥ z1− α2 , y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 16 / 32 12 Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Conocidas Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ12 y σ22 conocidas, sean µ1 ≤ µ2 , en contra de una hipótesis alternativa unilateral de que sean µ1 > µ2 . H 0 : µ1 ≤ µ2 H 1 : µ1 > µ2 Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo X 1 − X 2 < a defina la Región de Aceptación y la Región Crı́tica. Definamos, (X 1 − X 2 ) ≡ N (0, 1) bajo H0 . σ12 /n1 + σ22 /n2 γ 0.2 Densidad 0.3 0.4 Z=p 1−α 0.1 α 0.0 Z(1 − α) −3 −2 −1 0 1 2 3 Z Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan las medias muestrales X 1 y X 2 , obteniéndose T . La Región de Aceptación vendrá definida por, Z < z1−α , y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, Z ≥ z1−α , y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 17 / 32 13 Prueba para µ1 = µ2 cuando σ1 y σ2 son Desconocidas pero Iguales Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ12 y σ22 desconocidas e iguales, sean iguales, en contra de una hipótesis alternativa bilateral de que las medias sean diferentes. H 0 : µ1 = µ2 H1 : µ1 6= µ2 El estadı́stico apropiado para este caso está basado en la diferencia de las medias muestrales X 1 − X 2. Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < X 1 − X 2 < b defina la Región de Aceptación y la Región Crı́tica. Definamos, (X 1 − X 2 ) n1 S12 +n2 S22 1 n1 +n2 −2 ( n1 + 1 n2 ) ≡ tn1 +n2 −2 bajo H0 . γ 0.2 Densidad 0.3 0.4 T =q α 2 t(α 2) 0.0 0.1 1−α α 2 −3 −2 t(1 − α 2) −1 0 1 2 3 T Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan las medias muestrales X 1 y X 2 , obteniéndose T . La Región de Aceptación vendrá definida por, |T | < tn−1,1− α2 , y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, |T | ≥ tn−1,1− α2 , y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 18 / 32 14 Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Desconocidas pero Iguales Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ12 y σ22 desconocidas e iguales, sean µ1 ≤ µ2 , en contra de una hipótesis alternativa unilateral de que sean µ1 > µ2 . H 0 : µ1 ≤ µ2 H 1 : µ1 > µ2 Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo X 1 − X 2 < a defina la Región de Aceptación y la Región Crı́tica. Definamos, (X 1 − X 2 ) n1 S12 +n2 S22 1 n1 +n2 −2 ( n1 + 1 n2 ) ≡ tn1 +n2 −2 bajo H0 . γ 0.2 Densidad 0.3 0.4 T =q 1−α 0.1 α 0.0 t(1 − α) −3 −2 −1 0 1 2 3 T Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan las medias muestrales X 1 y X 2 , obteniéndose T . La Región de Aceptación vendrá definida por, T < tn1 +n2 −2,1−α , y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, T ≥ tn1 +n2 −2,1−α , y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 19 / 32 15 Prueba para µ1 = µ2 cuando σ1 y σ2 son Desconocidas y Distintas Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ12 y σ22 desconocidas y distintas, sean iguales, en contra de una hipótesis alternativa bilateral de que las medias sean diferentes. H 0 : µ1 = µ2 H1 : µ1 6= µ2 El estadı́stico apropiado para este caso está basado en la diferencia de las medias muestrales X 1 − X 2. Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < X 1 − X 2 < b defina la Región de Aceptación y la Región Crı́tica. Definamos, (X 1 − X 2 ) T =q 2 ≡ tg bajo H0 , con g = Sc 1 Sc22 + n1 n2 Sc21 n1 + 2 (Sc22 /n2 )2 n2 −1 . γ 0.2 Densidad 0.3 0.4 (Sc21 /n1 )2 n1 −1 + Sc22 n2 α 2 t(α 2) 0.0 0.1 1−α α 2 −3 −2 t(1 − α 2) −1 0 1 2 3 T Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan las medias muestrales X 1 y X 2 , obteniéndose T . La Región de Aceptación vendrá definida por, |T | < tg,1− α2 , y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, |T | ≥ tg,1− α2 , y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 20 / 32 16 Prueba para µ1 ≤ µ2 cuando σ1 y σ2 son Desconocidas y Distintas Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con varianzas σ12 y σ22 desconocidas y distintas, sean µ1 ≤ µ2 , en contra de una hipótesis alternativa unilateral de que sean µ1 > µ2 . H 0 : µ1 ≤ µ2 H 1 : µ1 > µ2 Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo X 1 − X 2 < a defina la Región de Aceptación y la Región Crı́tica. Definamos, Sc21 n1 (Sc21 /n1 )2 n1 −1 + + Sc22 n2 2 (Sc22 /n2 )2 n2 −1 . γ 0.2 Densidad 0.3 0.4 (X 1 − X 2 ) T =q 2 ≡ tg bajo H0 , con g = Sc 1 Sc22 + n1 n2 1−α 0.1 α 0.0 t(1 − α) −3 −2 −1 0 1 2 3 T Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan las medias muestrales X 1 y X 2 , obteniéndose T . La Región de Aceptación vendrá definida por, T < tg,1−α , y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, T ≥ tg,1−α , y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 21 / 32 17 Pruebas relacionadas con las Medias de dos Poblaciones Relacionadas 22 / 32 Prueba para µ1 = µ2 cuando σ1 , σ2 y ρ son Desconocidos Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales y apareadas, con σ12 , σ22 y ρ desconocidos, sean iguales, en contra de una hipótesis alternativa bilateral de que las medias sean diferentes. H 0 : µ1 = µ2 H1 : µ1 6= µ2 Sean (X11 , X21 ), (X12 , X22 ), . . . , (X1n , X2n ) n pares de muestras aleatorias simples. El estadı́stico apropiado para este caso está basado en la diferencia de las medias muestrales D = X 1 − X 2 , con Di = X1i − X2i . Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < X 1 − X 2 < b defina la Región de Aceptación y la Región Crı́tica. Definamos, S√cD n ≡ tn−1 bajo H0 , con ScD = Pn i (Di − D)2 . n−1 γ 0.2 Densidad 0.3 0.4 T = (X 1 − X 2 ) α 2 α 2 t(α 2) 0.0 0.1 1−α −3 −2 t(1 − α 2) −1 0 1 2 3 T Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan las medias muestrales X 1 y X 2 , obteniéndose T . La Región de Aceptación vendrá definida por, |T | < tn−1,1− α2 , y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, |T | ≥ tn−1,1− α2 , y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 23 / 32 18 Prueba para µ1 ≤ µ2 cuando σ1 , σ2 y ρ son Desconocidos Consideremos el problema de probar la hipótesis de que las medias de dos poblaciones normales e independientes, con σ12 , σ22 y ρ desconocidos, sean µ1 ≤ µ2 , en contra de una hipótesis alternativa unilateral de que sean µ1 > µ2 . H 0 : µ1 ≤ µ2 H 1 : µ1 > µ2 Sean (X11 , X21 ), (X12 , X22 ), . . . , (X1n , X2n ) n pares de muestras aleatorias simples. El estadı́stico apropiado para este caso está basado en la diferencia de las medias muestrales D = X 1 − X 2 , con Di = X1i − X2i . Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo X 1 − X 2 < a defina la Región de Aceptación y la Región Crı́tica. Definamos, S√cD n ≡ tn−1 bajo H0 , con ScD = Pn i (Di − D)2 . n−1 γ 0.2 Densidad 0.3 0.4 T = (X 1 − X 2 ) 1−α 0.1 α 0.0 t(1 − α) −3 −2 −1 0 1 2 3 T Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calculan las medias muestrales X 1 y X 2 , obteniéndose T . La Región de Aceptación vendrá definida por, T < tn−1,1−α , y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, T ≥ tn−1,1−α , y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 24 / 32 19 Pruebas relacionadas con las Varianzas de dos Poblaciones 25 / 32 Prueba para σ12 = σ22 con µ1 y µ2 Desconocidas Consideremos el problema de probar la hipótesis de la igualdad de las varianzas σ12 y σ22 de dos poblaciones, en contra de una hipótesis alternativa bilateral de que sean diferentes. H 0 : σ1 = σ2 H1 : σ1 6= σ2 El estadı́stico apropiado para este caso está basado en el cociente de las Cuasivarianzas muestrales Sc21 /Sc22 . Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < Sc21 /Sc22 < b defina la Región de Aceptación y la Región Crı́tica. Definamos, Sc21 ≡ Fn1 −1,n2 −1 bajo H0 . Sc22 Densidad 0.6 0.8 F = 0.4 γ 0.2 1−α α 2 0.0 α 2 F(α 2) 0 F ( 1 − α 2) 1 2 3 4 5 6 F Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calcula el estadı́stico de contraste F . La Región de Aceptación vendrá definida por, Fn1 −1,n2 −2, α2 < F < Fn1 −1,n2 −1,1− α2 y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, F ≤ Fn1 −1,n2 −2, α2 o Fn1 −1,n2 −1,1− α2 ≤ F y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 26 / 32 20 Prueba para σ12 ≤ σ22 con µ1 y µ2 Desconocidas Consideremos el problema de probar la hipótesis de que las varianzas de dos poblaciones, sean σ12 ≤ σ22 , en contra de una hipótesis alternativa unilateral de que sean σ12 > σ22 . H0 : σ12 ≤ σ22 H1 : σ12 > σ22 El estadı́stico apropiado para este caso está basado en el cociente de las Cuasivarianzas muestrales Sc21 /Sc22 . Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo Sc21 /Sc22 < a defina la Región de Aceptación y la Región Crı́tica. Definamos, Sc21 ≡ Fn1 −1,n2 −1 bajo H0 . Sc22 Densidad 0.6 0.8 F = 0.4 γ 0.2 1−α α 0.0 F(1 − α) 0 1 2 3 4 5 6 F Ası́ pues, de las poblaciones, se eligen muestras de tamaño n1 y n2 respectivamente y se calcula el estadı́stico de contraste F . La Región de Aceptación vendrá definida por, F < Fn1 −1,n2 −1,1−α y se aceptará H0 . Mientras que en caso contrario, se define la Región de Rechazo, F ≥ Fn1 −1,n2 −1,1−α y se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 27 / 32 21 28 / 32 Pruebas relacionadas con Proporciones Prueba para p = p0 Consideremos el problema de probar la hipótesis de que la proporción de elementos con un atributo en una población, sea igual a un valor concreto p0 , en contra de una hipótesis alternativa bilateral de que sea diferente. H 0 : p = p0 H1 : p 6= p0 El estadı́stico apropiado para este caso está basado en p̂ = X/n, siendo X el número de elementos con el atributo y n el tamaño de la muestra. Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < p̂ < b defina la Región de Aceptación y la Región Crı́tica. Definamos, (p̂ − p0 ) q ≡ N (0, 1) bajo H0 . p̂q̂ n γ 0.2 Densidad 0.3 0.4 Z= 1−α 0.1 α 2 α 2 0.0 Z(α 2) −3 −2 Z(1 − α 2) −1 0 1 2 3 Z Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula p̂ = X/n. Si p̂ cae en la Región de Aceptación, a < p̂ < b, entonces, el estadı́stico Z caerá en la Región de Aceptación, |Z| < z1− α2 , y se aceptará H0 ; en caso contrario, Región de Rechazo, |Z| ≥ z1− α2 , se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 29 / 32 22 Prueba para p ≤ p0 Consideremos el problema de probar la hipótesis de que la proporción de elementos con un atributo en una población, sea menor o igual a un valor concreto p0 , en contra de una hipótesis alternativa unilateral de que sea mayor. H 0 : p ≤ p0 H 1 : p > p0 Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo p̂ < a defina la Región de Aceptación y la Región Crı́tica. Definamos, (p̂ − p0 ) q ≡ N (0, 1) bajo H0 . p̂q̂ n γ 0.2 Densidad 0.3 0.4 Z= 1−α 0.1 α 0.0 Z(1 − α) −3 −2 −1 0 1 2 3 Z Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula p̂ = X/n. Si p̂ cae en la Región de Aceptación, p̂ < a, entonces, el estadı́stico Z caerá en la Región de Aceptación, Z < z1−α , y se aceptará H0 ; en caso contrario, Región de Rechazo, Z ≥ z1−α , se rechazará H0 . Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 30 / 32 23 31 / 32 Contrastes de Hipótesis: p-valor p-valor En contrastes de hipótesis, en Estadı́stica, el p-valor está definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido, suponiendo que la hipótesis nula es cierta. p = P(|Z| > Zobs |H0 ) Si el p-valor es inferior a α lo más probable es que la hipótesis H0 sea falsa. Sin embargo, también es posible que estemos ante una observación atı́pica, por lo que estarı́amos cometiendo el error estadı́stico de rechazar la hipótesis nula cuando ésta es cierta basándonos en que hemos tenido la mala suerte de encontrar una observación atı́pica. Este tipo de errores se puede subsanar rebajando el nivel de significación, un nivel de 0.05 es usado en investigaciones habituales sociológicas mientras que niveles de 0.01 se utilizan en investigaciones médicas, en las que cometer un error puede acarrear consecuencias más graves. También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra obtenida, esto reduce la posibilidad de que el dato obtenido sea casualmente raro. Licesio J. Rodrı́guez-Aragón Tema 11, M.E.I. – 32 / 32 24