Vídeos docentes sobre Probabilidad y Teoría de la Decisión Contraste de hipótesis para una distribución normal F. J. Díez Vegas Dpto. Inteligencia Artificial. UNED [email protected] www.ia.uned.es/~fjdiez Segundo ejemplo: distribución poblacional normal X Objetivo: estudiar la relación entre la vitamina X y el síndrome Y X Hecho: la concentración de X en la sangre de personas sanas es 128 μg/cm3 (desviación estándar 20 μg/cm3) X Datos: análisis de sangre de 25 pacientes con el síndrome Y El promedio de la concentración de X es 117 μg/cm3 X Pregunta: ¿Hay asociación entre el déficit de vitamina X y la presencia del síndrome Y? (Sólo queremos averiguar si hay asociación. No pretendemos demostrar relación causal.) 1 Contraste de hipótesis (para este ejemplo) 1. Hipótesis experimental: HE = “μ < 128” 2. Hipótesis nula: H0 = “μ ≥ 128” 3. Tipo de distribución poblacional: normal (gaussiana) 4. Distribución poblacional, en el límite de la hipótesis nula: − 1 P( x | μ = 128) = e σ 2π ( x −μ )2 2σ 2 − 1 = e 20 2π ( x−128)2 2×202 P(x | μ=128) 0.025 0.02 0.015 0.01 0.005 0 50 100 150 200 250 x Distribución (poblacional) del nivel de X en sangre, X para el valor límite de la hipótesis nula 2 5. Tamaño de la muestra: n = 25 6. Distribución muestral para el estadístico X (promedio del nivel de X): distribución normal (gaussiana), con μ′ = μ = 128 σ′ = σ = n 20 =4 25 es decir, P( x | μ = 128) = − 1 e σ ′ 2π ( x −μ′)2 2σ ′2 = − 1 e 4 2π ( x −128)2 2×42 P(x | μ=128) 0.12 0.10 0.08 0.06 0.04 0.02 0 50 100 150 200 250 x Distribución (muestral) de X, el promedio de X para el valor límite de la hipótesis nula 3 Vista ampliada P(x | μ=128) 0.12 0.10 0.08 0.06 Resultado experimental 0.04 0.02 0 110 115 120 125 130 135 140 145 x Distribución (muestral) de X, el promedio de X para el valor límite de la hipótesis nula 7. Resultado experimental: xexp = 117 8. Valor p 1 p = P( x ≤ 117 | μ = 128) = 4 2π 117 ∫ − e ( x −128)2 2×42 d x = 0'003 −∞ 4 Vista ampliada P(x | μ=128) 0.02 Resultado experimental p = P( x ≤ 117 | μ = 128) 0 x 110 115 117 120 p = área bajo la curva Probabilidad de error tipo I (α) P(x) 0.12 Umbral de decisión 0.10 0.08 significativo Distribución de X según la hipótesis nula no significativo 0.06 0.04 0.02 0 100 Probabilidad de error tipo I 110 120 130 140 x 5 Probabilidad de error tipo II (β) P(x) 0.12 0.10 Distribución de X para personas enfermas Umbral de (muestra n=25) decisión 0.08 significativo Distribución de X para personas sanas (muestra n=25) no significativo 0.06 Probabilidad de error tipo II 0.04 0.02 0 100 110 120 130 140 x Nota: Sólo podríamos calcular la probabilidad de error tipo II si conociéramos la distribución de X para personas enfermas (que es precisamente lo que no conocemos) Ambos tipos de error son posibles P(x) 0.12 0.10 Distribución de X según HE 0.08 significativo Umbral de decisión Distribución de X según H0 no significativo 0.06 Probabilidad de error tipo II 0.04 0.02 0 100 Probabilidad de error tipo I 110 120 130 140 x 6 Compromiso entre ambos tipos de error P(x) 0.12 0.10 Distribución de X para muestras de personas enfermas (n=25) Umbral de decisión significativo Distribución de X para muestras de personas sanas (n=25) no significativo 0.08 0.06 0.04 0.02 0 100 Probabilidad de error tipo II Probabilidad de error tipo I 110 120 130 140 x Al intentar eliminar el error tipo II aumenta la probabilidad de error tipo I Tipos de error Significativo ( p < α): concluimos HE HE cierta (H0 falsa) HE falsa (H0 cierta) Acierto: nuevo conocimiento Error tipo I (α): conclusión errónea Acierto: No significativo ( p > α): Error tipo II (β): no concluimos nada no se concluye nada no se concluye nada ¿Es posible disminuir a la vez la probabilidad de error tipo I y la probabilidad de error tipo II? 7 Solución: aumentar el tamaño de la muestra P(x) 0.16 Distribución de X para muestras de personas enfermas (n=50) Umbral de decisión 0.14 0.12 Distribución de X para muestras de personas sanas (n=50) significativo no significativo 0.10 0.08 0.06 0.04 Probabilidad de error tipo II Probabilidad de error tipo I 0.02 0 100 110 120 130 140 x Así conseguimos dismunuir simultáneamente las probabilidades de los dos tipos de error 8