Contrastes de hipótesis 1: Ideas generales 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 1 Inferencia Estadística paramétrica población Técnicas de muestreo Muestra de individuos 10/06/2014 X1 X2 X3 . . Xn Inferencia Estadística: métodos y procedimientos que por medio de la inducción determina propiedades de una población. Comprende: •Estimación de parámetros desconocidos de la distribución de la variable observada •Comparación de los parámetros de dos o más poblaciones •…. M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 2 Los problemas de la inferencia. Estimación de parámetros: Suponiendo un cierto modelo probabilístico (una distribución) cuales son los parámetros que mejor se adaptan a la muestra. Contraste de hipótesis: Dada una suposición sobre los parámetros de una o varias distribuciones, por ejemplo: La media de la población es igual a 10? Las medias de dos poblaciones son iguales? En el contraste de hipótesis queremos verificar si la muestra obtenida es compatible con alguna suposición. 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 3 ¿Que es una hipótesis? • Una creencia sobre la población, principalmente sus parámetros: Creo que el porcentaje de enfermos será el 5% – Media – Varianza – Proporción/Tasa • OJO: Una hipótesis debe establecerse antes del análisis. 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 4 Elementos de los tests de hipótesis Un test de hipótesis consta de cuatro elementos: Hipótesis Nula (H0) Hipótesis alternativa (H1) El estadístico del test El valor de rechazo o valor crítico Bioestadística FMCS Reus URV Curs 2012-13 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 10/06/2014 5 5 Elementos de los tests de hipótesis Hipótesis Nula (H0): Una hipótesis que hace referencia a algún parámetro de la población que desconocemos La hipótesis nula será la hipótesis que queremos contrastar Escogeremos la hipótesis nula, siempre que los datos que tenemos no nos indiquen que es falsa Bioestadística FMCS Reus URV Curs 2012-13 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 10/06/2014 6 6 Elementos de los tests de hipótesis Hipótesis alternativa (H1) : La hipótesis alternativa es la contraria (la “complementaria”) de la hipótesis nula Solo se acepta si, con los datos que tenemos, hay una gran evidencia de que la hipótesis nula es falsa. Bioestadística FMCS Reus URV Curs 2012-13 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 10/06/2014 7 7 ¿Qué es H0? Problema: ¿La osteoporosis está relacionada con el sexo? Solución: Traducir a lenguaje estadístico: p 50% Establecer su opuesto: p 50% Seleccionar la hipótesis nula H 0 : p 50% 8 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología ¿Qué es H0? Problema: ¿El colesterol medio para la dieta mediterránea es 6 mmol/l? Solución: Traducir a lenguaje estadístico: 6 Establecer su opuesto: 6 Seleccionar la hipótesis nula H0 : 6 9 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología Elementos de los tests de hipótesis Estadístico del test (= estadístico de la prueba = test): Se calcula a partir de la muestra. Normalmente es una medida de discrepancia entre la hipótesis nula i la muestra • Cuanto mayor sea, más discrepa la muestra de la hipótesis nula i más probable será que rechacemos la hipótesis • Y viceversa: cuanto menor sea, menor discrepancia i más probable es que no la rechacemos. Bioestadística FMCS Reus URV Curs 2012-13 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 10/06/2014 10 10 Razonamiento 40 Ejemplo Si H0 y el valor obtenido en la muestra es de X = 20 Que hace un investigador cuando su teoría no coincide con los resultados que obtiene? Rechazo que H0 sea cierta y concluyo que μ ≠ 40 . μ = 40 X = 20 ... el resultado del experimento era poco probable. i a pesar de ello ha pasado 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 11 Ejemplo: Si H0: 40 y el valor obtenido en la muestra es de X 38 μ = 40 X = 38 ... el resultado del experimento es coherente. 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez • • • • No hay evidencia contra H0 No se puede rechazar H0 El experimento no es concluyente El contraste no es significativo Departamento Estadística, Facultad de Biología 12 Valor crítico o valor de rechazo a H0: =70 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez ta Departamento Estadística, Facultad de Biología 13 Nivel de significación No se rechaza H0: =70 a H0: =70 10/06/2014 X 72 M. Carme Ruiz de Villa, Àlex Sánchez ta Departamento Estadística, Facultad de Biología 14 Significación: p-valor • Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. • Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. • Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. • p solo se conoce después de realizar el experimento aleatorio • •El contraste es no significativo cuando p>a • El contraste es significativo cuando p<a P a P a No se rechaza H0: =70 X 72 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 15 Resumen: a & p como base de rechazo Sobre a • Sobre p Es un número pequeño prefijado previamente a análisis del experimento Una vez fijado obtenemos el valor crítico ta y tomaremos la decisión comparándolo con la texp – Se obtiene después de hacer el experimento – Una vez conocido tomaremos la decisión comparándolo con el nivel de significación Criterio de rechazo Contraste significativo = p menor que a 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 16 Contrastes: unilateral y bilateral La posición del valor crítico depende de como se defina la hipótesis alternativa Bilateral H1: m ≠ Unilateral Unilateral H1: m < 10/06/2014 H1: m > M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 17 Muestras independientes vs apareadas • Las comparaciones de 2 grupos se basan en recoger una muestra aleatoria simple de cada grupo -> los datos son independientes dentro del grupo. • A veces se pueden presentar situaciones de dependencia entre los datos de los 2 grupos. • Ejemplo 1: • Ejemplo 2: – Se quiere comparar la eficacia de 2 fármacos para adelgazar. – Se obtienen 20 individuos y se asignan al azar 10 a cada tratamiento. – A los dos meses se mide la diferencia de peso antes y después del tratamiento: comparación de 2 muestras independientes. – Se obtienen 10 individuos aleatoriamente, se mide el peso, – Se suministra durante 2 meses el mismo tratamiento y se mide finalmente el peso. – Para cada individuo existe una relación (dependencia) entre el peso inicial y el peso al cabo de 2 meses los datos se encuentran apareados: comparación de 2 muestras apareadas. 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 18 Ejemplo bilateral • • • • Parámetro: µ Hipótesis Nula (H0) H0: µ = µ0 Hipótesis alternativa (H1) H1 : µ ≠ µ0 El estadístico de la prueba (σ desconocida) • Bajo la hipótesis H0 (es decir suponiendo que es cierta) T= • X - μX σX = X - μ0 ≈ t( n-1 ) s n Distribución t-student El valor de rechazo o valor crítico Rechazo de H0 si t < -t n-1,α/2 o t > t n-1,α/2 Aceptación de H0 si - t n-1,α/2 <= t <= t n-1,α/2 Si n grande la t-student es equivalente a una N(0,1) 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 19 Ejemplo unilateral • • • • Parámetro: µ Hipótesis Nula (H0) H0: µ = µ0 Hipótesis alternativa (H1) H1 : µ < µ0 El estadístico de la prueba (σ desconocida) • Bajo la hipótesis H0 (es decir suponiendo que es cierta) T= • X - μX σX = X - μ0 ≈ t( n-1 ) s n Distribución t-student El valor de rechazo o valor crítico Rechazo de H0 si t < t n-1,α Aceptación de H0 si t n-1,α/2 >= t n-1,α Si n grande la t-student es equivalente a una N(0,1) 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 20 Riesgos al tomar decisiones Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito Los datos pueden refutarla • H0: Hipótesis nula – Es inocente La que se acepta si las pruebas no indican lo contrario Rechazarla por error tiene graves consecuencias • H1: Hipótesis alternativa – Es culpable No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 21 Riesgos al contrastar hipótesis Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal • H0: Hipótesis nula No especulativa – (Ej.1) Es inocente – (Ej.2) El nuevo tratamiento no tiene efecto – (Ej.3) No hay nada que destacar • H1: Hipótesis alternativa – (Ej.1) Es culpable – (Ej.2) El nuevo tratamiento es útil – (Ej. 3) Hay una situación anormal 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Especulativa Departamento Estadística, Facultad de Biología 22 Tipos de error al tomar una decisión Realidad Inocente veredicto Inocente 10/06/2014 OK Culpable Error Menos grave Culpable Error OK Muy grave M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 23 Errores de tipo I y tipo II Realidad (población) Resultado de la prueba (muestra) Hay diferencia o asociación (H0 falsa) No hay diferencia o asociación (H0 cierta) diferencia o asociación significativa (rechazo de H0) No error error tipo I a diferencia o asociación no significativa (no rechazo de H0) error tipo II No error a = P(cometer un error de tipo I)=P(rechazar H0 |H0 es cierta) = P(cometer un error de tipo II)=P(no rechazar H0 |H0 es falsa) 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 24 Potencia y nivel de confianza Población real Decisión H0 es falsa H0 es cierta Se rechaza H0 Decisión correcta 1- (potencia) Riesgo a (error tipo I) No se rechaza H0 Riesgo (error tipo II) Decisión correcta 1- a (confianza) 1-a = nivel de confianza 1- = Potencia= P(rechazar H0 |H0 es falsa) 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 25 No se puede tener todo a • Para un tamaño muestral fijo, no se pueden reducir a la vez ambos tipos de error. • Para reducir , hay que aumentar el tamaño muestral. 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología 26 Conclusiones Las hipótesis no se plantean después de observar los datos. En ciencia, las hipótesis nula y alternativa no tienen el mismo papel: H0 : Hipótesis científicamente más simple. H1 : El peso de la prueba recae en ella. α debe ser pequeño Rechazar una hipótesis consiste en observar si p<α Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo II Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos. 27 10/06/2014 M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología