Objetivos del tema Probabilidad y Estadística Test de Hipótesis Introducción a la Probabilidad y Estadística Probabilidad y Estadística 1 Test de Hipótesis Contrastando una hipótesis Conocer el proceso para contrastar hipótesis y su relación con el método científico. Diferenciar entre hipótesis nula y alternativa Nivel de significación Significación Toma de decisiones, tipos de error y cuantificación del error. Test de Hipótesis Probabilidad y Estadística 2 ¿Qué es una hipótesis? Son demasiados... Creo que el porcentaje de enfermos será el 5% No se si los fumadores pesarán como el resto… unos 70Kg (hipótesis nula)... Una creencia sobre la población, principalmente sus parámetros: Media Varianza ¡Gran diferencia! Proporción/Tasa Rechazo la hipótesis Muestra aleatoria de fumadores X = 85 kg Test de Hipótesis Probabilidad y Estadística 3 OJO: Si queremos contrastarla, debe establecerse antes del análisis. Test de Hipótesis Probabilidad y Estadística 4 Decidir si los fumadores pesan más: Introducción breve: ¿Los fumadores pesan más? Tamaño muestral En la población de no fumadores, el peso medio es 70 kg. ¿Cómo podríamos ‘demostrar’ si los fumadores pesan más… ... unos 5 kg más? 70 ¿Qué puede ocurrir si tomamos muestras de tamaño 30 y calculamos el peso medio? 75 Veamos qué puede ocurrir si tomamos muestras de tamaño 4 y calculamos el peso medio… para cada caso. Probabilidad y Estadística Test de Hipótesis 5 Probabilidad y Estadística 70 75 Test de Hipótesis 6 1 Decidir si los fumadores pesan más: Tipos de error Identificación de hipótesis Tomemos la decisión basándonos en muestras de tamaño 4... Puedo cometer 2 tipos de error. Error de tipo II Se acepta que no hay diferencias 70 Hipótesis nula Ho La que contrastamos Los datos pueden refutarla No debería ser rechazada sin una buena razón. 75 Test de Hipótesis Problema: ¿La osteoporosis está relacionada con el sexo? Solución: No debería ser aceptada sin una gran evidencia a favor. 7 p = 50% = , ≤ , ≥ p ≠ 50 % ≠, <, > Test de Hipótesis Probabilidad y Estadística 8 1- Establecer las hipótesis nula H0 y alternativa H1 2- Elegir un nivel de significancia fijo α Traducir a lenguaje estadístico: p = 50 % Establecer su opuesto: p ≠ 50 % Seleccionar la hipótesis nula 3- Seleccionar un estadístico de prueba adecuado y establecer la región crítica con base a α 4- A partir del estadístico de prueba calculado rechazar H0 y ACEPTAR H1 si el estadístico de prueba está en la región crítica. De otra manera, no rechazar H0 . H 0 : p = 50 % 5- Obtener conclusiones científicas y de ingeniería. Test de Hipótesis Probabilidad y Estadística 9 Test de Hipótesis Probabilidad y Estadística 10 Razonamiento básico ¿Quién es H0? Si supongo que H0 es cierta... Problema: ¿El colesterol medio para la dieta mediterránea es 6 mmol/l? ¿qué hace un científico cuando su teoría no coincide con sus predicciones? Solución: Traducir a lenguaje estadístico: µ=6 Establecer su opuesto: µ≠6 Seleccionar la hipótesis nula µ = 70 X = 85 ... el resultado del experimento sería improbable. Sin embargo ocurrió. H0 :µ = 6 Probabilidad y Estadística Los datos pueden mostrar evidencia a favor Procedimiento Niega a H0 (y creemos que es ‘mejor’). H0 : H1 : ¿Quién es H0? Se acepta que sí hay diferencias Error de tipo I Probabilidad y Estadística Hip. Alternativa H1 Test de Hipótesis 11 Probabilidad y Estadística Test de Hipótesis 12 2 Razonamiento básico Razonamiento básico Si supongo que H0 es cierta... Si supongo que H0 es cierta... • No hay evidencia contra H0 ¿Si una teoría hace predicciones con éxito, queda probado que es cierta? Rechazo que H0 sea cierta. •No se rechaza H0 •El experimento no es concluyente •El contraste no es significativo µ = 70 µ = 70 X = 85 X = 72 ... el resultado del experimento sería improbable. Sin embargo ocurrió. Test de Hipótesis Probabilidad y Estadística ... el resultado del experimento es coherente. 13 14 Contrastes: unilateral y bilateral Región crítica y nivel de significación Nivel de significación: α Número pequeño: 1% , 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H0 cuando es cierta Región crítica Valores ‘improbables’ si... Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 Test de Hipótesis Probabilidad y Estadística La posición de la región crítica depende de la hipótesis alternativa H1: µ≠70 Bilateral α=5% Reg. Crit. Reg. Crit. Unilateral Unilateral No rechazo H0 Η0: µ=70 H1: µ<70 Test de Hipótesis Probabilidad y Estadística 15 H1: µ>70 Probabilidad y Estadística Test de Hipótesis 16 Test de Hipótesis 18 Significación: p Significación: p No se rechaza H0: µ=70 α α H0: µ=70 Probabilidad y Estadística H0: µ=70 Test de Hipótesis 17 Probabilidad y Estadística X = 72 3 Significación: p Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>α P α Se rechaza H0: µ=70 No se rechaza H0: µ=70 Se acepta H1: µ>70 P Probabilidad y Estadística Significación : p α α X = 85 Test de Hipótesis X = 72 Significación : p El contraste es estadísticamente significativo cuando p < 19 Test de Hipótesis Probabilidad y Estadística Resumen: α, p y criterio de rechazo α Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. Sobre α Sobre p número pequeño, preelegido al diseñar el experimento α Es Es α Conocido Conocido p sabemos todo sobre el resultado del experimento P Test de Hipótesis Probabilidad y Estadística Sobre el criterio de rechazo Contraste X = 85 21 Resumen: α, p y criterio de rechazo significativo = p menor que α Test de Hipótesis Probabilidad y Estadística 22 Ejemplo Problema: ¿Está sesgada la moneda? H0 : prob cruz = 50% H1 : prob cruz > 50% Estadísticos de contraste a U de Mann-Whitney W de Wilcoxon Z Sig. asintót. (bilateral) conocido tras realizar el experimento α sabemos todo sobre la región crítica P Se rechaza H0: µ=40 Se acepta H1: µ>40 20 Edad del encuestado 259753,500 462319,500 -2,317 ,021 Experimento: Lanzar la moneda repetidamente: a. Variable de agrupación: Sexo del encuestado Sobre el criterio de rechazo Contraste significativo = p menor que α P=50% Probabilidad y Estadística Test de Hipótesis 23 P=25% Probabilidad y Estadística P=12,5% P=6,25% P=3% Test de Hipótesis P=1,5% 24 4 Riesgos al contrastar hipótesis Riesgos al tomar decisiones Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados resultados Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal Los datos pueden refutarla La que se acepta si las pruebas no indican lo contrario H0: Hipótesis nula Es inocente Rechazarla por error tiene graves consecuencias Es culpable No debería ser aceptada sin una gran evidencia a favor. Test de Hipótesis H1: Hipótesis alternativa Rechazarla por error tiene consecuencias consideradas menos graves que la anterior Probabilidad y Estadística No especulativa (Ej.1) Es inocente (Ej.2) El nuevo tratamiento no tiene efecto (Ej.3) No hay nada que destacar H1: Hipótesis alternativa H0: Hipótesis nula 25 Especulativa (Ej.1) Es culpable (Ej.2) El nuevo tratamiento es útil (Ej. 3) Hay una situación anormal Test de Hipótesis Probabilidad y Estadística 26 Tipos de error al contrastar hipótesis Tipos de error al tomar una decisión Realidad Realidad Inocente Inocente OK H0 cierta Culpable No Rechazo H0 Error Correcto El tratamiento no tiene efecto y así se decide. El tratamiento si tiene efecto pero no lo percibimos. Menos grave veredicto H0 Falsa Error de tipo II Probabilidad Culpable Error Rechazo H0 OK Acepto H1 Muy grave Error de tipo I β Correcto El tratamiento no tiene El tratamiento tiene efecto pero se decide que efecto y el experimento lo sí. confirma. Probabilidad α Test de Hipótesis Probabilidad y Estadística 27 No se puede tener todo β Probabilidad y Estadística Las hipótesis no se plantean después de observar los datos. En ciencia, las hipótesis nula y alternativa no tienen el mismo papel: Para un tamaño muestral fijo, no se pueden reducir a la vez ambos tipos de error. Para reducir β, hay que aumentar el tamaño muestral. Probabilidad y Estadística Test de Hipótesis 28 Conclusiones Recordad lo que pasaba con sensiblidad y especificidad α Test de Hipótesis 29 H0 : Hipótesis científicamente más simple. H1 : El peso de la prueba recae en ella. α debe ser pequeño Rechazar una hipótesis consiste en observar si p < α Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo II Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos. Probabilidad y Estadística Test de Hipótesis 30 5 ¿Qué hemos visto? Hipótesis Nivel de significación α Probabilidad de error de tipo I Significación, p. Nula Alternativa Criterio de aceptación/rechazo. Tipos de error Tipo I Tipo II Probabilidad y Estadística Test de Hipótesis 31 6