Conceptos básicos de inferencia estadística (II): Contrastes de hipótesis (repaso) Tema 1 (II) Estadística 2 Curso 08/09 Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 1 / 21 Contrastes de hipótesis Objetivo Contrastes de hipótesis Objetivo: Decidir, a partir de la información que proporciona una muestra, entre dos hipótesis sobre alguna característica de la v.a. de interés X : hipótesis nula (H0 ) y hipótesis alternativa (H1 ). (controlando el riesgo de equivocarse al no disponer de toda la información) Hipótesis estadística: enunciado/a…rmación sobre una o varias características de interés de un modelo de probabilidad: Paramétrica: sobre los valores de algún parámetro (desconocido) Simple: especi…ca un único valor (p.e.: µ = 10, µX = µY ,...) Compuesta: especi…ca un conjunto de valores (p.e.: µ 10, µX µY ,...) No Paramétrica: a…rmación sobre otra característica de la población (p.e.: la distribución es normal, las observaciones son independientes, ...) Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 2 / 21 Contrastes de hipótesis Idea Idea: Aceptar la hipótesis nula H0 salvo que exista una "clara evidencia" en contra (en lo observado). Población Muestra Rechazamos H0 Analizamos una muestra SI Suponiendo H0 cierta, ¿es poco probable obtener lo observado? NO •H0 falsa •Ocurrió algo poco probable (asumimos el riesgo) No hay evidencias para rechazar H0 Aceptamos H0 P ("suceso raro" j H0 cierta) = P (rechazar H0 j H0 cierta) = α (nivel de signi…cación riesgo asumible al rechazar H0 siendo cierta). Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 3 / 21 Contrastes de hipótesis Pasos Pasos 1 Formular claramente la hipótesis nula y la alternativa. Ejemplo: H0 : θ 2 Ω 0 H1 : θ 2 Ω1 (= RnΩ0 normalmente) 2 (y …jar el nivel de signi…cación). Elección del estadístico del contraste: medida de discrepancia entre la muestra observada y la hipótesis H0 . Ejemplo: D (X1 , . . . , Xn ; H0 ) = 3 Θ̂n θ 0 σ Θ̂n (estadístico con distribución conocida bajo H0 ). Determinación la región de de rechazo (o región crítica): R.R.=valores que tiende a tomar el estadístico cuando H1 es cierta (normalmente valores ’grandes’de D). Ejemplo: ( ) Θ̂n θ 0 R.R. d (α) σ Θ̂n Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 4 / 21 Contrastes de hipótesis Pasos Esta región se establece de modo que: P (D 2 R.R. j H0 cierta) = α (P (D 2 R.A. j H0 cierta) = 1 (hipotesis nula compuesta): α). Aunque en ciertos casos P (D 2 R.R. j H0 cierta) α 4. Realización del contraste: Se rechaza H0 si el valor observado del estadístico d̂ = D (x1 , . . . , xn ; H0 ) 2 R.R. (si ocurre un suceso poco probable bajo H0 , i.e. gran discrepancia entre lo observado y H0 ), en caso contrario se acepta. Si se rechaza H0 (se acepta H1 ) se dice que el contraste es estadísticamente signi…cativo (no signi…cativo en caso contrario). Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 5 / 21 Contrastes de hipótesis Regiones de aceptación y rechazo Regiones de aceptación y rechazo Las regiones de aceptación y rechazo dependen de H1 . Contraste bilateral: H0 : θ = θ 0 H1 : θ 6 = θ 0 Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 6 / 21 Contrastes de hipótesis Regiones de aceptación y rechazo Contraste unilateral: H0 : θ θ 0 ) H1 : θ < θ 0 NOTA: P (R.R. j H0 cierta) Tema 1 (II) (Estadística 2) H0 : θ = θ 0 H1 : θ < θ 0 α Contrastes de hipótesis Curso 08/09 7 / 21 Contrastes de hipótesis Regiones de aceptación y rechazo Contraste unilateral: H0 : θ θ 0 ) H1 : θ > θ 0 NOTA: P (R.R. j H0 cierta) Tema 1 (II) (Estadística 2) H0 : θ = θ 0 H1 : θ > θ 0 α Contrastes de hipótesis Curso 08/09 8 / 21 Contrastes de hipótesis Relación entre Contrastes de Hipótesis e Intervalos de Con…anza Contrastes de Hipótesis e Intervalos de Con…anza Puede verse que: θ 0 2 IC(1 α) (θ ) () Aceptamos H0 : θ = θ 0 con nivel de signi…cación α Ejemplo: µ0 2 x tn b s n 1,1 α/2 p () tn 1,1 α/2 < x µ0 < tn b s p n 1,1 α/2 NOTA: No realizaremos contrastes de hipótesis a partir de intervalos de con…anza (salvo en los casos que se indique). Con la metodología de contrastes de hipótesis podemos obtener información adicional con el p-valor o nivel crítico. Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 9 / 21 Contrastes de hipótesis p-valor o nivel crítico p-valor o nivel crítico Si d̂ = D (x1 , . . . , xn ; H0 ) es el valor observado del estadístico del contraste, se denomina valor crítico o p-valor a: Menor valor del nivel de signi…cación para el que se rechaza H0 . Probabilidad de obtener una discrepancia mayor o igual que db cuando H0 es cierta. Probabilidad de obtener un resultado tan extraño o más que el observado bajo H0 Regla de decisión: p α ) Aceptamos H1 (con mayor seguridad cuanto más pequeño) p > α ) Aceptamos H0 (con mayor seguridad cuanto más grande) Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 10 / 21 Contrastes de hipótesis p-valor o nivel crítico Cálculo del p-valor El p-valor depende de H1 (de modo análogo a la R.R.): H1 H1 : θ 6 = θ 0 H1 : θ < θ 0 H1 : θ > θ 0 R.R. ( ∞, dα/2 ) [ (d1 ( ∞, dα ) (d1 α , ∞) α/2 , ∞ ) p-valor 2P D d̂ j H0 P D d̂ j H0 P D d̂ j H0 NOTA: Suponiendo distribución simétrica en el caso bilateral H1 : θ 6= θ 0 , si fuese asimétrica: p = 2 min P D Tema 1 (II) (Estadística 2) d̂ j H0 , P D Contrastes de hipótesis d̂ j H0 Curso 08/09 11 / 21 Contrastes de hipótesis Tipos de error Tipos de error Decisión Aceptar H0 Rechazar H0 Situación H0 cierta H0 falsa Correcto Error Tipo II Error Tipo I Correcto Nivel de signi…cación del contraste: α = P (Error Tipo I) = P (rechazar H0 j H0 cierta) P (aceptar H0 j H0 cierta) = 1 Tamaño: α. β (θ ) = P (Error Tipo II) = P (aceptar H0 j H0 falsa) Potencia del contraste: 1 Tema 1 (II) (Estadística 2) β (θ ) = P (rechazar H0 j H0 falsa) Contrastes de hipótesis Curso 08/09 12 / 21 Contrastes de hipótesis Decisión Aceptar H0 Rechazar H0 Tipos de error Situación H0 cierta H0 falsa Correcto Error Tipo II 1 α β (θ ) Error Tipo I Correcto α 1 β (θ ) Lo ideal sería que α y β fuesen lo menores posibles; sin embargo, …jado un tamaño muestral n, si disminuimos la probabilidad de un error aumenta la probabilidad del otro. Aproximación de Neyman-Pearson: Únicamente se controla la probabilidad de error Tipo I; …jado α, se escoge el método que proporcione mayor potencia (aunque no se controla el error tipo II). Aceptar H1 es una decisión …able (controlamos la probabilidad de error): hipótesis de interés. Al aceptar H0 no controlamos la probabilidad de error: hipótesis neutra. Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 13 / 21 Contrastes de hipótesis Potencia de un contraste Potencia de un contraste Se denomina potencia de un contraste a la función que asigna a cada posible valor del parámetro θ la probabilidad de rechazar H0 cuando θ es el verdadero: Potencia : Ω θ ! [0, 1] Pot (θ ) = P (rechazar H0 j θ ) Se utiliza para medir la bondad de un test de hipótesis. Se veri…ca que: Pot (θ ) = 1 Pot (θ ) β ( θ ) , 8 θ 2 H1 α, 8θ 2 H0 Tema 1 (II) (Estadística 2) Contrastes de hipótesis Curso 08/09 14 / 21 Contrastes de hipótesis Potencia de un contraste Ejemplos H1 : µ 6 = 0 H1 : µ > 0 Curva de Potencia Curva de Potencia 1 0.8 Potencia Potencia 1 alpha = 0.05, sigma = 1.0 0.6 0.4 0.2 0 -0.4 alpha = 0.05, sigma = 1.0 0.8 0.6 0.4 0.2 -0.2 0 0.2 0.4 -0.2 0 0.2 0.4 Media Verdadera Media Verdadera Tema 1 (II) (Estadística 2) 0 -0.4 Contrastes de hipótesis Curso 08/09 15 / 21 Contrastes de hipótesis Algunos contrastes paramétricos de interés Algunos contrastes paramétricos de interés Contrastes para la media de una población normal (varianza desconocida) Suponemos que X N µ, σ2 con σ2 desconocida Se pretende realizar alguno de los contrastes: H0 : µ = µ 0 H1 : µ 6 = µ 0 H0 : µ µ 0 H1 : µ > µ 0 H0 : µ µ 0 H1 : µ < µ 0 a partir de una m.a.s. de tamaño n. El estadístico del contraste es: T = Tema 1 (II) (Estadística 2) X µ0 b S p n Sup. µ=µ0 Contrastes de hipótesis tn 1 Curso 08/09 16 / 21 Contrastes de hipótesis Algunos contrastes paramétricos de interés Se rechaza H0 si el valor observado del estadístico: t̂ = x µ0 b s p n 2 R.R Equivalentemente si el p-valor es pequeño p Donde: H1 H1 : µ 6 = µ 0 H1 : µ < µ 0 H1 : µ > µ 0 ( ∞, Tema 1 (II) (Estadística 2) R.R. tn 1,1 α/2 ) [ (tn 1,1 ( ∞, tn 1,1 α ) ( tn 1,1 α , ∞) Contrastes de hipótesis α. α/2 , ∞ ) p-valor 2P (tn 1 jt̂ j) P (tn 1 t̂ ) P (tn 1 t̂ ) Curso 08/09 17 / 21 Contrastes de hipótesis Diferencia de medias de dos poblaciones normales independientes Contrastes para la diferencia de medias de dos poblaciones normales independientes (con varianzas iguales) Suponemos X N µX , σ2X e Y N µY , σ2Y σ2X = σ2Y = σ2 Se pretende realizar alguno de los contrastes: H0 : µ X = µ Y H1 : µ X 6 = µ Y H0 : µ X µY H1 : µ X < µ Y independientes con H0 : µ X µY H1 : µ X > µ Y a partir de dos m.a.s. independientes de tamaños n y m. El estadístico del contraste es: T = b 2 = (n donde S b S X r Y 1 1 + n m Sup. µX =µY b 2 + (m 1) S b2 1) S X Y n+m 2 Tema 1 (II) (Estadística 2) Contrastes de hipótesis tn + m 2 Curso 08/09 18 / 21 Contrastes de hipótesis Diferencia de medias de dos poblaciones normales independientes Se rechaza H0 si el valor observado del estadístico: x y t̂ = r 2 R.R 1 1 b s + n m Equivalentemente si el p-valor es pequeño p Donde: H1 H1 : µ X 6 = µ Y H1 : µ X < µ Y H1 : µ X > µ Y Tema 1 (II) (Estadística 2) R.R. tn + m ( ∞, [(tn +m 2,1 ( ∞, tn +m ( tn +m 2,1 α. p-valor 2,1 α/2 ) α/2 , ∞ ) 2,1 α ) α , ∞) Contrastes de hipótesis 2P (tn +m 2 jt̂ j) P ( tn + m P ( tn + m 2 t̂ ) t̂ ) 2 Curso 08/09 19 / 21 Contrastes de hipótesis Diferencia de medias de dos poblaciones normales apareadas Contrastes para la diferencia de medias de dos poblaciones normales con datos apareados Suponemos X N µX , σ2X e Y N µY , σ2Y apareadas (dos características de un mismo individuo, supuestamente dependientes) Se pretende realizar alguno de los contrastes: H0 : µ X = µ Y H1 : µ X 6 = µ Y H0 : µ X µY H1 : µ X > µ Y H0 : µ X µY H1 : µ X < µ Y a partir de dos m.a.s. (dependientes) apareadas de tamaño n: (X1 , Y1 ), . . . , (Xn , Yn ) Como la variable diferencia es normal: Z =Y NOTA: σ2Z = σ2X + σ2Y Tema 1 (II) (Estadística 2) X N µX µY , σ2Z 2σXY Contrastes de hipótesis Curso 08/09 20 / 21 Contrastes de hipótesis Diferencia de medias de dos poblaciones normales apareadas Los contrastes se pueden expresar en función de: µZ = µX µY y se pueden resolver a partir de la muestra de las diferencias: (Z1 , Z2 , . . . , Zn ) , con Zi = Xi Yi considerando el estadístico del contraste: T = Obteniéndose: H1 H1 : µ X 6 = µ Y H1 : µ X < µ Y H1 : µ X > µ Y ( ∞, tn Tema 1 (II) (Estadística 2) Z b S pZ n Sup. µZ =0 tn R.R. 1,1 α/2 ) [ (tn 1,1 ( ∞, tn 1,1 α ) ( tn 1,1 α , ∞) Contrastes de hipótesis 1 α/2 , ∞ ) p-valor 2P (tn 1 jt̂ j) P (tn 1 t̂ ) P (tn 1 t̂ ) Curso 08/09 21 / 21