Andrés Pichon Rivière – Programa de Efectividad Clínica TEST DE HIPÓTESIS Ejemplo: vamos a analizar los resultados de 5 Servicios de Neonatología de una provincia según un indicador: mortalidad de recién nacidos con peso ≤ 1.000 gr. Supongamos, como ejemplo, un valor de 40% reconocido como aceptable. Se analizan los últimos 20 casos ocurridos en cada Servicio con los siguientes resultados: Servicio Número de casos Número de P* bebés fallecidos A 20 6 B 20 11 C 20 12 D 20 8 E 20 14 *Ayuda: la p de 8 o más muertes es 0.58411 y la de 15 o más es 0.00161 Pregunta: ¿La mortalidad en este Servicio es más alta que el Standard aceptado? Andrés Pichon Rivière – Programa de Efectividad Clínica • Empezamos con una hipótesis nula, que asumía que no hay ningún patrón en especial (mortalidad 40%). H0: p = 0.4 • Miramos el patrón observado en nuestros datos (número de muertes) y lo comparamos con lo que era esperable si la hipótesis nula era cierta. • Calculamos el valor de p P( Que el experimento alcance la magnitud observada o un valor aún más extremo | | | La hipótesis nula es cierta ) Dado que • Interpretamos el resultado ➝➝ Si el valor de p es pequeño, entonces los resultados del experimento son inconsistentes con la hipótesis nula. Por lo tanto descartamos la hipótesis nula. ➝➝ Si el valor de p es grande, entonces los resultados pueden haber ocurrido por azar, incluso si la hipótesis nula es cierta. Por lo tanto, no descartamos la hipótesis nula. Nota: no aceptamos la hipótesis nula, simplemente no hay evidencia suficiente para descartarla. Andrés Pichon Rivière – Programa de Efectividad Clínica Nota 1: también podría haber otras hipótesis que serían descartadas. Nota 2: el valor de p es la probabilidad de un “falso positivo” Elegir el nivel de significancia estadística α = P(descartar la hipótesis nula | la hipótesis nula es cierta) 5% 4.5 • 8 12.2 Para interpretar el resultado del test comparamos la p obtenida con el nivel de significancia (valor α) que habíamos elegido previamente. Población Test µ = µ0 µ ≠ µ0 No descarta la hipótesis nula Descarta la hipótesis nula Correcto Incorrecto Incorrecto Correcto Andrés Pichon Rivière – Programa de Efectividad Clínica En realidad en este ejemplo nuestra pregunta era: ¿la mortalidad en este servicio es mayor que el standard? No es lo mismo que preguntarse: ¿la mortalidad en este servicio es diferente al standard? Para : ¿La mortalidad en este servicio es mayor que el standard? La verdadera hipótesis nula que estamos considerando es H0: p ≤ 0.4 y nuestra hipótesis alternativa es HA: p > 0.4 En esta situación, la chance de afirmar falsamente que la mortalidad de un determinado Servicio es mayor que el Standard es 5%. NOTA: si la mortalidad observada fuese menor al Standard no descartaríamos la hipóteis nula (resultado del test + vs test -) Valor de p A UNA COLA: P( 12 o más muertes en una muestra de 20 pacientes | | | Dado que lo esperado es p = 0.4 ) = 0.056 Andrés Pichon Rivière – Programa de Efectividad Clínica Para : ¿La mortalidad en este servicio es diferente que el standard? Lo que deseamos testear es si el Servicio tiene una mortalidad mayor o menor, queremos un test capaz de detectar diferencias en ambos sentidos. La hipótesis nula que estamos considerando es H0: p = 0.4 y nuestra hipótesis alternativa es HA: p ≠ 0.4 2.5% 2.5% -1.96 -1 0 1 1.96 En esta situación, la chance de afirmar falsamente que la mortalidad de un determinado Servicio es diferente que el Standard es 5%. NOTA: ahora si la mortalidad observada fuese menor al Standard también descartaríamos la hipóteis nula (resultado del test + vs test -). Andrés Pichon Rivière – Programa de Efectividad Clínica Valor de p A DOS COLAS: P( 12 o más muertes o 4 o menos muertes de 20 pacientes | | | p = 0.4 ) = 0.107 Dado que lo esperado es UNA COLA vs DOS COLAS Cualquier test de hipótesis puede ser a una cola o a dos colas. Ejemplo de UNA COLA: Queremos analizar los efectos de la exposición a una sustancia tóxica. Como no hay ningún motivo para pensar que esta exposición pueda ser beneficiosa solo exploraremos la posibilidad de sus efectos negativos. Nivel de hemoglobina en niños menores de 6 años: µ = 12.29 g/100 ml, σ = 0.85 g/100 ml Creemos que la exposición al plomo puede reducir los niveles de hemoglobina, por lo tanto la pregunta que estamos haciendo es: ¿La exposición al plomo reduce el nivel de hemoglobina? Andrés Pichon Rivière – Programa de Efectividad Clínica La Hipótesis nula será: H0: µ ≥ 12.29 g/100 ml, la HA: µ > 12.29 g/100 ml Decidimos que nuestro α será 0.05. Es decir, descartaremos la H0 si la obtenida luego del test es menor o igual a 0.05. 5% -1.65 -1 0 1 1.65 Tomamos una muestra de 50 chicos y medimos sus niveles de hemoglobina. El resultado es x = 12.07. Calcular el valor de Z correspondiente y su probabilidad. Descartamos la hipótesis nula si (nivel de hemoglobina – 12.29 mg/100 ml) > 1.65 ? Variabilidad Andrés Pichon Rivière – Programa de Efectividad Clínica EJEMPLO: A DOS COLAS Quremos testear una nueva droga antitérmica que creemos es efectiva para bajar la temperatura en pacientes con fiebre. Sin embargo, debemos considerar también la posibilidad de que esta droga sea peor que placebo. Hipótesis nula: µ = 38.4°C, σ = 0.7°C Pregunta: es la temperatura observada diferente a 38.4°C Resultado: muestra de 10 pacientes, temperatura = 38.0°C Calcular Z = Calcular p = 2.5% 2.5% -1.96 -1 0 1 1.96 Andrés Pichon Rivière – Programa de Efectividad Clínica TEST A DOS COLAS: Descartar la hipótesis nula: Si Observado – Esperado < -1.96 o Variabilidad Si Observado – Esperado > +1.96 Variabilidad En esta situación, la chance de afirmar falsamente que nuestro tratamiento es diferente que el placebo es 5%. Nota: descartamos la hipótesis nula tanto para tasas muy bajas como para muy altas NOTA: en este caso es más difícil probar eficacia, necesitamos obtener un valor de 1.96 cuando en el test a una cola era suficiente con 1.65 Andrés Pichon Rivière – Programa de Efectividad Clínica ERRORES POSIBLES α = P(descartar la hipótesis nula | la hipótesis nula es cierta) β = P(no descartar la hipótesis nula | la hipótesis nula es falsa) Población Test µ = µ0 µ ≠ µ0 No descarta la hipótesis nula Descarta la hipótesis nula Correcto Incorrecto Incorrecto Correcto Población Test µ = µ0 µ ≠ µ0 No descarta la hipótesis nula Descarta la hipótesis nula Correcto Error tipo II Error tipo I Correcto Ejemplo: Tratamiento para reducir el colesterol. Para simplificar consideremos el testo como a una cola. Población µ = 280 mg de colesterol, σ = 70 mg Tomamos una muestra de 25 pacientes que suspendió el tratamiento con drogas hace 6 meses, media = 299 mg. Si definimos un α = 0.05 sabemos que descartaremos la hipótesis nula con valores Andrés Pichon Rivière – Programa de Efectividad Clínica Z ≥ 1.645 Z = x – 280 mg 70 mg/√25 si decimos que 1.645 = x – 280 mg 70 mg/√25 x = 280 + 1.645 * 70 = 303 mg √25 Por lo tanto, descartaremos la hipótesis nula para cualquier valor de colesterol que sea mayor o igual a 303 mg. Con valores menores no descartamos la hipótesis nula. 5% 280 mg 0 303 mg 1.645 Para una media obtenida de 299 mg no podremos descartar la hipótesis nula. Z= p= Andrés Pichon Rivière – Programa de Efectividad Clínica Si en cambio tomamos una muestra de 150 pacientes Z ≥ 1.645 Z = x – 280 mg 70 mg/√150 si decimos que 1.645 = x – 280 mg 70 mg/√150 x = 280 + 1.645 * 70 = 289 mg √150 Para una media obtenida de 299 mg vamos a descartar la hipótesis nula. Z= p= 280 mg 289 mg 299 mg Andrés Pichon Rivière – Programa de Efectividad Clínica ¿Si la verdadera distribución de los que abandonaron la medicación era 299 mg, cual era el “riesgo” de un error tipo II? Z para un valor 289 mg = P=