1 Introducción al Tema 6 Tema 5. Intervalos de confianza Definición. Ejemplos de intervalos de confianza. Determinación del tamaño muestral. ¿Esta θ en el intervalo de confianza? Tema 6. Contraste de hipótesis Conceptos fundamentales. Contrastes para la media y la varianza en poblaciones normales. Contrastes con muestras grandes. Relación entre los intervalos de confianza y los contrastes de hipótesis. Determinación del tamaño muestral. Estadı́stica I Andrés M. Alonso 2 Distribución temporal del temario Tema 1 Tema 2 Tema 3 Tema 4 Tema 5 Tema 6 Tema 7 1 T T T T T T T 2 T T T T T T T 7 3 T T T T T T T 7 4 P P P P P P P 7 7 T denota una hora de clase de 0teorı́a 7 0 0 5 6 7 8 9 T T T T T T T T T T T T T T T T T T P P P P P P P P P P P P 6 0 6 0 6 0 6 6 6 6 P denota una hora de clase práctica Estadı́stica I Andrés M. Alonso 58 19 3 Tema 6. Contraste de hipótesis Los contenidos a desarrollar en este tema son los siguientes: Conceptos fundamentales: • Hipótesis nula y alternativa. • Errores de tipo I y II. • Función de potencia de un contraste. • Nivel de significación. • Hipótesis unilaterales y bilaterales. Contrastes para la media y la varianza en poblaciones normales: casos de una y dos poblaciones. Contrastes con muestras grandes. Relación entre los intervalos de confianza y los contrastes de hipótesis. Determinación del tamaño muestral. Lecturas recomendadas: Secciones 10.1 a 10.6 del libro de Peña (2005) y el capı́tulo 9 de Newbold (2001). Estadı́stica I Andrés M. Alonso 4 Contrastes de hipótesis contrastar. (Del lat. contrastāre). 1. tr. Ensayar o comprobar y fijar la ley, peso y valor de las monedas o de otros objetos de oro o plata, y sellar estos últimos con la marca del contraste cuando ejecuta la operación el perito oficial. 2. tr. Comprobar la exactitud de pesas y medidas por ministerio público, para que estén ajustadas a la ley, y acreditarlo sellándolas. 3. tr. Comprobar la exactitud o autenticidad de algo. algo Real Academia Española © Todos los derechos reservados En estadı́stica, el contraste de hipótesis tiene la finalidad de decidir si una determinada hipótesis sobre la distribución en estudio es confirmada o invalidada a partir de las observaciones de una muestra. Estadı́stica I Andrés M. Alonso 5 Ejemplos de hipótesis Las próximas elecciones municipales en Getafe otorgará dos escaños al partido “Vientos de Pueblo”. Los partidos polı́ticos quieren contrastar esa afirmación para posibles pactos pre–electorales ¿Cómo? Una compañı́a recibe un gran cargamento de piezas. Sólo acepta el envı́o si no hay más de un 5 % de piezas defectuosa. ¿Cómo tomar una decisión sin verificar todas las piezas? Un investigador quiere saber si una propuesta de reforma fiscal es acogida de igual forma por hombres y mujeres ¿Cómo puede verificar esa conjetura? Estos ejemplos tienen algo en común: a) Se formula la hipótesis sobre la población. b) Las conclusiones sobre la validez de la hipótesis se basarán en la información de una muestra. Estadı́stica I Andrés M. Alonso 6 Ejemplo 1. Se tienen dos monedas, una correcta (es decir la probabilidad de cara/cruz es 1/2) y una trucada (con probabilidad de cara igual a 3/4). Se decide jugar con una de las dos monedas seleccionada al azar, pero antes de empezar a jugar se permite realizar un experimento de dos tiradas. El objetivo es contrastar la hipótesis (H0) de p = 1/2. (a) Escriba el espacio muestral: X = {(c, c), (c, x), (x, c), (x, x)}. (b) ¿Cuál(es) resultado(s) le harı́an pensar que la hipótesis es falsa? R = {(c, c)}. (c) Si decide rechazar H0 si se observa R, ¿qué errores puede cometer? Calcule la probabilidad de cada error. Error Tipo I Tipo II Estadı́stica I Descripción Rechazar H0 cuando es cierta Aceptar H0 cuando es falsa Probabilidad (1/2)2 1 − (3/4)2 Andrés M. Alonso 7 Definición 1. Un contraste de hipótesis es cualquier partición del espacio muestral, X , en dos regiones disjuntas: una región crı́tica o de rechazo, R, y una región de aceptación Rc = X \ R. Ejemplo 1. (d) Teniendo en cuenta el apartado (b). Proponga un contraste de hipótesis para H0 : p = 1/2. X = R ∪ Rc = {(c, c)} ∪ {(c, x), (x, c), (x, x)}. (e) Proponga otro contraste. X = R∗ ∪ R∗c = ∅ ∪ {(c, c), (x, c), (x, c), (x, x)}. (f) Calcule las probabilidades de cada tipo de error para el contraste propuesto en (e). Error Descripción Probabilidad Tipo I Rechazar H0 cuando es cierta 0 Tipo II Aceptar H0 cuando es falsa 1 Estadı́stica I Andrés M. Alonso 8 Metodologı́a del contraste de hipótesis - 1 1. Fijar, en función de las hipótesis y del contexto del problema, una cota para la probabilidad de cometer el error de tipo I, que denominamos nivel de significación del contraste, α. 2. Excluir todos los contrastes cuya región crı́tica, R, no satisfaga la condición: Pr {R|H0} ≤ α 3. Entre los contrastes no excluidos, seleccionar el contraste que minimice la probabilidad del error de tipo II. Neyman–Pearson Ejemplo 1. (g) Obtenga todos los contrastes de nivel α = (1/2)2. (h) ¿Cuál utilizarı́a? Estadı́stica I Andrés M. Alonso 9 Función de potencia Definición 2. Si las hipótesis pueden expresarse en términos de un parámetro, θ ∈ Θ, esto es si H0 : θ ∈ Θ0 y HA : θ ∈ ΘA, se denomina función de potencia del contraste con región crı́tica R, a la probabilidad de rechazar H0 si el valor del parámetro es θ: β(θ) = Pr {R|θ} . Observación 1: Un contraste tiene nivel α si β(θ) ≤ α para θ ∈ Θ0. Observación 2: Cuando θ ∈ ΘA, la probabilidad del error de tipo II es: 1 − β(θ). Ejemplo 1. (i) Suponga que en lugar de dos monedas tenemos un “continuo” de monedas con probabilidad p de cara. Calcule la función de potencia del contraste con región crı́tica R = {(c, c)}. Estadı́stica I Andrés M. Alonso 10 Metodologı́a del contraste de hipótesis - 2 En un problema (paramétrico) donde las hipótesis pueden expresarse en términos de un parámetro, H0 : θ ∈ Θ0 y HA : θ ∈ ΘA: 1. Fijar, en función de las hipótesis y del contexto del problema, el nivel de significación del contraste, α. 2. Excluir todos los contrastes cuya región crı́tica, R, no satisfaga la condición: Pr {R|θ} ≤ α, para todo θ ∈ Θ0. 3. Entre los contrastes no excluidos, seleccionar el contraste que maximice la función de potencia en θ ∈ ΘA. Probabilidad del error de tipo II = 1 − β(θ) Estadı́stica I Andrés M. Alonso 11 H0 cierta Rechazo H0 No rechazo H0 H0 falsa Error de tipo I H0 cierta Rechazo H0 Error de tipo II H0 falsa Pr(R | H0) No rechazo H0 Pr(NR | HA) 1. En el contraste de hipótesis se prima a la hipótesis nula (neutra). 2. Podemos hacer la probabilidad del error de tipo I tan pequeña como queramos, PERO esto hace que aumente la probabilidad del error de tipo II. 3. Un contraste de hipótesis puede rechazar la hipótesis nula. 4. Un contraste de hipótesis NO puede probar la hipótesis nula. 5. Si aceptamos la hipótesis nula, debe interpretarse como que las observaciones no han aportado evidencia para descartarla. 6. Por el contrario, si rechazamos la hipótesis nula es porque se está razonablemente seguro (Pr(R|H0) ≤ α) de que H0 es falsa y estamos aceptando implı́citamente la hipótesis alternativa. Estadı́stica I Andrés M. Alonso 12 Tipos de hipótesis Hipótesis simple: H0 : θ = θ0. Hipótesis compuesta: H0 : θ ∈ Θ0 y Θ0 tiene más de un elemento. • Hipótesis unilaterales: ◦ H0 : θ ≤ θ0 vs HA : θ > θ0 . ◦ H0 : θ ≥ θ0 vs HA : θ < θ0 . • Hipótesis bilaterales: ◦ H0 : θ = θ0 vs HA : θ 6= θ0 . / [θ1, θ2] . ◦ H0 : θ ∈ [θ1, θ2] vs HA : θ ∈ Estadı́stica I Andrés M. Alonso 13 Ejemplo 1. Hipótesis simple vs simple: H0 : p = 1/2 vs HA : p = 3/4. H0 : p ≤ 1/2 vs HA : p > 1/2 Hipótesis unilaterales: . H0 : p ≥ 1/2 vs HA : p < 1/2 Hipótesis bilaterales: H0 : p = 1/2 vs HA : p 6= 1/2 . Ejemplo 2. Las próximas elecciones municipales en Getafe otorgará dos escaños al partido “Vientos de Pueblo”. Los partidos polı́ticos quieren contrastar esa afirmación para posibles pactos pre–electorales. H0 : N E = 2 vs N E 6= 2 . Una compañı́a recibe un gran cargamento de piezas. Sólo acepta el envı́o si no hay más de un 5 % de piezas defectuosas. H0 : p ≤ 0,05 vs HA : p > 0,05 . Un investigador quiere saber si una propuesta de reforma fiscal es acogida de igual forma por hombres y mujeres. H0 : pH = pM Estadı́stica I vs HA : pH 6= pM . Andrés M. Alonso 14 Nivel crı́tico p Definición 3. El nivel crı́tico p (o p–valor) es el nivel de significación más pequeño para el que la muestra obtenida obligarı́a a rechazar la hipótesis nula. El p-valor es la probabilidad (calculada bajo H0) de obtener un resultado que sea menos compatible con H0 que el resultado obtenido con la muestra (x1, x2, . . . , xn). El p-valor depende de la muestra (x1, x2, . . . , xn). Puede considerarse como el apoyo que la hipótesis nula recibe de las observaciones de la muestra: • Si el p-valor es menor que el nivel de significación prefijado, el apoyo a H0 es escaso y por tanto H0 debe rechazarse. • Si el p-valor es mayor que el nivel de significación prefijado, el apoyo a H0 es suficiente y por tanto H0 no debe rechazarse. Estadı́stica I Andrés M. Alonso 15 Cálculo del nivel crı́tico p I Contraste unilateral por la derecha: H0 : θ ≤ θ0 vs HA : θ > θ0 Valor observado del estadı́stico de contraste: T (x1, x2, . . . , xn) = t. Región crı́tica: R = {(x1, x2, . . . , xn) : T (x1, x2, . . . , xn) > k}. p-valor = Pr(T ≥ t |θ = θ0). I Contraste unilateral por la izquierda: H0 : θ ≥ θ0 vs HA : θ < θ0 Valor observado del estadı́stico de contraste: T (x1, x2, . . . , xn) = t. Región crı́tica: R = {(x1, x2, . . . , xn) : T (x1, x2, . . . , xn) < k}. p-valor = Pr(T ≤ t |θ = θ0). I Contraste bilateral: H0 : θ = θ0 vs HA : θ 6= θ0 Valor observado del estadı́stico de contraste: T (x1, x2, . . . , xn) = t. Región crı́tica: R = {(x1, x2, . . . , xn) : T (x1, x2, . . . , xn) < k1} ∪ {(x1, x2, . . . , xn) : T (x1, x2, . . . , xn) > k2}. p-valor = mı́n 2 Pr(T ≤ t |θ = θ0); 2 Pr(T ≥ t |θ = θ0) . Estadı́stica I Andrés M. Alonso 16 Tema 6. Contraste de hipótesis Conceptos fundamentales: X • Hipótesis nula y alternativa. • Errores de tipo I y II. • Función de potencia de un contraste. • Nivel de significación. • Hipótesis unilaterales y bilaterales. Contrastes para la media y la varianza en poblaciones normales: casos de una y dos poblaciones. Contrastes con muestras grandes. Relación entre los intervalos de confianza y los contrastes de hipótesis. Determinación del tamaño muestral. Estadı́stica I Andrés M. Alonso 17 Contrastes de hipótesis en una población normal Contrastes sobre µ: H0 : µ = µ0 (σ conocida); H0 : µ = µ0 (σ desconocida); H0 : µ ≤ µ0 (σ conocida); H0 : µ ≤ µ0 (σ desconocida); H0 : µ ≥ µ0 (σ conocida); H0 : µ ≥ µ0 (σ desconocida); Estadı́stica I n o R = |x̄ − µ0| > zα/2 √σn n o R = |x̄ − µ0| > tn−1;α/2 √sn n o R = x̄ − µ0 > zα √σn n o R = x̄ − µ0 > tn−1;α √sn n o R = x̄ − µ0 < z1−α √σn n o R = x̄ − µ0 < tn−1;1−α √sn Andrés M. Alonso 18 Contrastes de hipótesis en una población normal Contrastes sobre σ: H0 : σ = σ 0 ; R = n H0 : σ ≤ σ 0 ; R = n H0 : σ ≥ σ 0 ; R = n Estadı́stica I n−1 2 s σ02 n−1 2 s σ02 n−1 2 s σ02 ∈ / h χ2n−1;1−α/2 > χ2n−1;α , χ2n−1;α/2 io o < χ2n−1;1−α o Andrés M. Alonso 19 Contrastes de hipótesis en una población normal - Ejemplo Ejemplo 3. Sea X la variable ”rentabilidad de cierto tipo de fondos de inversión tras una apreciación fuerte del marco con respecto al dólar”. Se considera que la media de esta variable es 15. Un economista afirma que dicha rentabilidad media ha variado, por lo que lleva a cabo un estudio en las condiciones reseñadas anteriormente sobre una muestra de 9 fondos cuya media muestral resulta ser de 15,308 y cuya varianza muestral corregida (cuasivarianza) es 0,193. a) Especificando las hipótesis necesarias, contrastar la afirmación del economista al 5 %. b) A partir del resultado de a), razonar si el intervalo de confianza para la media (centrado en x) al 95 % contendrá o no al valor 15. Volveremos a este apartado c) Acotar el p-valor. Si el contraste se hubiera realizado al 10 %, ¿aceptarı́amos la hipótesis de que la media de la rentabilidad es 15 tras una apreciación fuerte del marco con respecto al dólar? Razonar brevemente la respuesta. Estadı́stica I Andrés M. Alonso 20 a) Hipótesis asumidas: X1, ..., Xn es una m.a.s. de una población N (µ, σ 2). H0 : µ = 15 vs H1 : µ 6= 15 x−µ Rechazaremos H0 a nivel del 5 % si √sx 0 > tn−1; α2 n 15,308−15 = 2,1 > t8;0,025 = 2,306. ⇒ ¿? Tenemos que 0,44 √ 9 b) Por la dualidad intervalos de confianza-contrastes de hipótesis, 15 (valor del parámetro apuntado en H0) ha de pertenecer al intervalo de confianza descrito en el enunciado. Volveremos a este apartado c) p-valor = 2P (t8 > 2,1). p-valor ∈ (0,05, 0,1), entonces con α = 0,1 no rechazarı́amos H0. Estadı́stica I Andrés M. Alonso 21 Contrastes en dos poblaciones normales independientes Contrastes sobre µ1 − µ2: H0 : µ1 −µ2 = d0 (σ1, σ2 conocidas); H0 : µ1−µ2 = d0 (σ1 = σ2); H0 : µ1 − µ2 = d0 (σ1 6= σ2); q 2 2 σ σ R = |x̄ − ȳ − d0| > zα/2 n11 + n22 n o q R = |x̄ − ȳ − d0| > tn1+n2−2;α/2 sp n11 + n12 q 2 2 s s R = |x̄ − ȳ − d0| > tf ;α/2 n11 + n22 q 2 2 σ σ H0 : µ1 − µ2 ≤ d0 (σ1, σ2 conocidas); R = x̄ − ȳ − d0 > zα n11 + n22 o n q H0 : µ1 − µ2 ≤ d0 (σ1 = σ2); R = x̄ − ȳ − d0 > tn1+n2−2;α sp n11 + n12 q 2 2 s s H0 : µ1 − µ2 ≤ d0 (σ1 = 6 σ2); R = x̄ − ȳ − d0 > tf ;α n11 + n22 Estadı́stica I Andrés M. Alonso 22 Contrastes en dos poblaciones normales independientes Contrastes sobre µ1 − µ2: (continuación) q 2 σ1 σ22 H0 : µ1 − µ2 ≥ d0 (σ1, σ2 conocidas); R = x̄ − ȳ − d0 < z1−α n1 + n2 n o q 1 1 H0 : µ1−µ2 ≥ d0 (σ1 = σ2); R = x̄ − ȳ − d0 < tn1+n2−2;1−α sp n1 + n2 q 2 2 s s H0 : µ1 − µ2 ≥ d0 (σ1 = 6 σ2); R = x̄ − ȳ − d0 < tf ;1−α n11 + n22 Contrastes sobre σ1/σ2: 2 2 H0 : σ1 = σ2; R = s1/s2 ∈ / Fn1−1;n2−1;1−α/2 , Fn1−1;n2−1;α/2 2 2 H0 : σ1 ≤ σ2; R = s1/s2 > Fn1−1;n2−1;α 2 2 H0 : σ1 ≥ σ2; R = s1/s2 < Fn1−1;n2−1;1−α Estadı́stica I Andrés M. Alonso 23 Contrastes en dos poblaciones normales - Ejemplo Ejemplo 4. Un artı́culo de la revista Consumer Reports de noviembre de 1983 comparó varios tipos de baterı́as. Los promedio de duración de baterı́as AA marca Duracell y de marca Everyday Energizer se denotan como µ1 y µ2, respectivamente. a) Contrastar la hipótesis nula de que el promedio de duración de las baterı́as marca Duracell supera en más de una hora a la duración media de las baterı́as marca Everyday. Para cada tipo de baterı́a se dispone de una muestra de tamaño 100 que proporciona los siguientes datos: x̄1 = 4,3 horas, s1 = 1,5 horas, x̄2 = 4,1 horas y s2 = 1,7 horas. H0 : µ1 − µ2 ≥ 1 vs HA : µ1 − µ2 < 1 Asumimos que las muestras son independientes entre sı́, y m.a.s. de N (µ1, σ12) y N (µ2, σ22), respectivamente. Estadı́stica I Andrés M. Alonso 24 El estadı́stico de contraste es: x̄ − ȳ − d0 H0 t= q 2 ∼ tf , s1 s22 n1 + n 2 donde f = entero más próximo a (s21/n1+s22/n2)2 2 (s2 /n )2 . (s2 /n ) 1 2 2 1 + n1 −1 n2 −1 x̄ − ȳ − (µ1 − µ2) 4,3 − 4,1 − 1 r t = = r 2 2 1,52 1,72 sx sy + + 100 100 n m 194,97. y f es el entero más cercano a t = −3,53 < t195;1−0,05 = −1,6527 y rechazarı́amos H0. Tablas: t120;0,95 = −1,66 y t∞;0,95 = z0,95 = −1,645 Estadı́stica I Andrés M. Alonso 25 Tema 6. Contraste de hipótesis Conceptos fundamentales: X • Hipótesis nula y alternativa. • Errores de tipo I y II. • Función de potencia de un contraste. • Nivel de significación. • Hipótesis unilaterales y bilaterales. Contrastes para la media y la varianza en poblaciones normales: casos de una y dos poblaciones. X Contrastes con muestras grandes. Relación entre los intervalos de confianza y los contrastes de hipótesis. Determinación del tamaño muestral. Estadı́stica I Andrés M. Alonso 26 Contrastes en muestras grandes - Una población X ∼ B(1, p) (muestras grandes): q 0) H0 : p = p0; R = |x̄ − p0| > zα/2 p0(1−p n q 0) H0 : p ≤ p0; R = x̄ − p0 > zα p0(1−p n q 0) H0 : p ≥ p0; R = x̄ − p0 < z1−α p0(1−p n X ∼ P oisson(λ) (muestras grandes): n o p H0 : λ = λ0; R = |x̄ − λ0| > zα/2 λ0/n n o p H0 : λ ≤ λ0; R = x̄ − λ0 > zα λ0/n n o p H0 : λ ≥ λ0; R = x̄ − λ0 < z1−α λ0/n Estadı́stica I Andrés M. Alonso 27 Contrastes en muestras grandes - Dos poblaciones Comparación de proporciones (muestras grandes e independientes): X ∼ B(1, p1); (X1, . . . Xn1 ) m.a.s. de X. Y ∼ B(1, p2); (Y1, . . . Yn2 ) m.a.s. de Y . q ȳ(1−ȳ) H0 : p1 − p2 = d0; R = |x̄ − ȳ − d0| > zα/2 x̄(1−x̄) + n1 n2 q ȳ(1−ȳ) H0 : p1 − p2 ≤ d0; R = x̄ − ȳ − d0 > zα x̄(1−x̄) + n1 n2 q ȳ(1−ȳ) H0 : p1 − p2 ≥ d0; R = x̄ − ȳ − d0 < z1−α x̄(1−x̄) + n1 n2 Estadı́stica I Andrés M. Alonso 28 Contrastes en muestras grandes - Ejemplo Ejemplo 5. La Universidad posee un considerable volumen de ascensores y elevadores en sus tres campus, cuyo mantenimiento realiza una empresa que afirma que al menos el 99 % de los dı́as lectivos se encuentran funcionando todos los ascensores y elevadores. La Universidad ha seleccionado aleatoriamente 41 dı́as lectivos. Sólo en 38 de ellos el funcionamiento de ascensores y elevadores era total. a) ¿Es aceptable la hipótesis que afirma la empresa de mantenimiento? b) La Universidad quiere contrastar si existen diferencias en el porcentaje de dı́as lectivos con total funcionamiento de ascensores y elevadores entre sus dos campus más antiguos (G y L) y el campus más moderno (C). De los 41 dı́as estudiados, en 38 dı́as hubo total funcionamiento en G y L, mientras que en C hubo en 40 dı́as. Estadı́stica I Andrés M. Alonso 29 a) Sea p la proporción de dı́as que funcionan todos los ascensores de la H0 : p ≥ 0,99 universidad. Queremos contrastar H1 : p < 0,99 El estadı́stico de contraste es: Z = b−p0 qp p0 (1−p0 ) n = 38 −0,99 q41 0,99×0,01 41 = −4,06. Utilizando las tablas podemos acotar el p − valor < 0,001 ⇒ ¿? H 0 : p1 = p2 , donde p1 es la proporción de dı́as H1 : p1 6= p2 de total funcionamiento en G y L, y p2 lo es en C. b) Queremos contrastar El estadı́stico de contraste es: Z = x̄−ȳ r x̄(1−x̄) ȳ(1−ȳ) n1 + n2 , donde x̄ = pb1 = 38/41 y ȳ = pb2 = 40/41. Tenemos que |z| = | − 1,03| y el p − valor = 2 Pr(Z > 1,03) = 2 × 0,1515 = 0,3030. No tenemos evidencia en contra de que ambas proporciones sean iguales. Estadı́stica I Andrés M. Alonso 30 Tema 6. Contraste de hipótesis Conceptos fundamentales: X • Hipótesis nula y alternativa. • Errores de tipo I y II. • Función de potencia de un contraste. • Nivel de significación. • Hipótesis unilaterales y bilaterales. Contrastes para la media y la varianza en poblaciones normales: casos de una y dos poblaciones. X Contrastes con muestras grandes. X Relación entre los intervalos de confianza y los contrastes de hipótesis. Determinación del tamaño muestral. Estadı́stica I Andrés M. Alonso 31 Intervalos de confianza y los contrastes de hipótesis I En la deducción de los contrastes: H0 : µ = µ0 (σ conocida); n o σ R = |x̄ − µ0| > zα/2 √n q 2 2 σ σ H0 : µ1 − µ2 ≤ d0 (σ1, σ2 conocidas); R = x̄ − ȳ − d0 > zα n11 + n22 observamos que existı́a una analogı́a con la obtención de los intervalos de confianza para la media, µ y la diferencia de medias, µ1 − µ2, respectivamente: q σ σ IC = x̄ − zα/2 √ , x̄ + zα/2 √ y IC = x̄ − ȳ − zα σ12/n + σ22/m, +∞ . n n I Podemos decir que no rechazamos la hipótesis nula a un nivel de significación α si µ0 y d0 no están en los intervalos de confianza de nivel (1-α) respectivos. Estadı́stica I Andrés M. Alonso 32 I Esa conclusión no es casual: Cuando construimos una región de confianza, RC(x1, x2, . . . , xn), para un parámetro, θ, buscamos que: Prθ (θ ∈ RC(X1, X2, . . . , Xn)) ≥ 1 − α, para cada θ ∈ Θ. Cuando construimos un contraste de hipótesis, H0 : θ = θ0, o equivalentemente cuando obtenemos su región de rechazo, RR(θ0), imponemos que: Prθ0 ((X1, X2, . . . , Xn) ∈ RR(θ0)) ≤ α. I Entonces, Conocidas las regiones RR(θ), entonces RC = {θ ∈ Θ|(x1, x2, . . . , xn) ∈ / RR(θ)} es una región de confianza de nivel (1-α) del parámetro. Recı́procamente, dada la región de confianza RC, entonces RR = {(x1, x2, . . . , xn)|θ0 ∈ / RC(X1, X2, . . . , Xn)} es una región de rechazo de un test con tamaño menor o igual que α. Estadı́stica I Andrés M. Alonso 33 Ejemplo 6. Obtener intervalos de confianza de nivel 1 − α a partir de los siguientes contrastes de hipótesis: o n a) H0 : µ = µ0 (σ conocida); R = |x̄ − µ0| > zα/2 √σn . b) H0 : µ ≤ µ0 (σ conocida); o n R = x̄ − µ0 > zα √σn . c) H0 : µ ≥ µ0 (σ conocida); n o R = x̄ − µ0 < z1−α √σn . Ejemplo 7. Obtener un contraste de hipótesis de nivel α para H0 : σ 2 = σ02, a partir del siguiente intervalo de confianza: 2 2 (n−1)s a) I = χ(n−1)s , . 2 χ2 n−1;α/2 n−1;1−α/2 Ejercicio: Contrastes para H0 : σ 2 ≤ σ02 y H0 : σ 2 ≥ σ02. Estadı́stica I Andrés M. Alonso 34 Tema 6. Contraste de hipótesis Conceptos fundamentales: X • Hipótesis nula y alternativa. • Errores de tipo I y II. • Función de potencia de un contraste. • Nivel de significación. • Hipótesis unilaterales y bilaterales. Contrastes para la media y la varianza en poblaciones normales: casos de una y dos poblaciones. X Contrastes con muestras grandes. X Relación entre los intervalos de confianza y los contrastes de hipótesis. X Determinación del tamaño muestral. Estadı́stica I Andrés M. Alonso 35 Determinación del tamaño muestral H0 : µ = µ0 , donde H1 : µ 6= µ0 µ es la media de una población N (µ, σ 2) con σ conocida. n o Sabemos que R = |x̄ − µ0| > zα/2 √σn define un contraste de tamaño α. Ejemplo 8. Consideremos el contraste de hipótesis a) Obtenga la expresión de la función de potencia. β(µ) = Pr(R|µ) = 1 − Pr − zα/2 + µ0 −µ √ σ/ n < X̄−µ √ σ/ n < zα/2 + µ0 −µ √ σ/ n . b) ¿Cómo es β(µ) como función de n? ¿De σ 2? ¿De |µ0 − µ|? Creciente en n. Decreciente en σ. Creciente en |µ0 − µ|. Estadı́stica I ¿β(µ) cuando |µ0 − µ| → 0? Andrés M. Alonso 36 I Dado σ 2 y prefijado el nivel de significación, queremos tener una potencia mayor o igual que un β % (valores usuales 90 % ó 80 %) cuando las diferencias entre la media verdadera, µ, y la hipotética, µ0 supere un valor prefijado, d. µ0 −µ µ0 −µ √ √ β(µ) = Pr(R|µ) = 1 − Φ zα/2 + σ/ n + Φ − zα/2 + σ/ n . 1 d d d d d 0.9 = = = = = 0.1 0.2 0.3 0.4 0.5 d 0.1 0.2 0.3 0.4 0.5 0.8 0.7 0.6 0.5 0.4 0.3 n 619 157 71 41 27 0.2 0.1 0 50 100 150 200 250 300 350 400 450 500 Statgraphics Estadı́stica I Andrés M. Alonso 37 Determinación del tamaño muestral con Statgraphics I Una población: Estadı́stica I Andrés M. Alonso 38 Determinación del tamaño muestral con Statgraphics I Dos poblaciones independientes: Estadı́stica I Andrés M. Alonso 39 Recapitulación Tema 6. Contraste de hipótesis Conceptos fundamentales: • • • • • Hipótesis nula y alternativa. Errores de tipo I y II. Función de potencia de un contraste. Nivel de significación. Hipótesis unilaterales y bilaterales. W Conceptos clave en inferencia. Contrastes para la media y la varianza en poblaciones normales Contrastes con muestras grandes. W Ejemplos de interés práctico. Determinación del tamaño muestral. W ¿Cuando y por qué? Estadı́stica I Andrés M. Alonso 40 Tema 5. Intervalos de confianza Definición. Ejemplos de intervalos de confianza. Determinación del tamaño muestral. Tema 6. Contraste de hipótesis Conceptos fundamentales. Ejemplos de contrastes de hipótesis. Determinación del tamaño muestral. Su validez depende de las hipótesis asumidas Tema 7. Diagnosis del modelo Contrastes de bondad de ajuste. Transformaciones para conseguir normalidad. Contraste χ2 de independencia y de homogeneidad. Estadı́stica I Andrés M. Alonso