2.2.2. Inferencia estadística: estimación y contrastes Dra. Ana Dorado Díaz Consejería de Sanidad Diplomado en Salud Pública Objetivos específicos estadística, mostrándole conceptos básicos de estimación (puntual e intervalos de confianza) y contrastes. 2. Se pretende hacer comprender al alumno la importancia de llevar a cabo un estudio bien diseñado desde su inicio: importancia de los muestreos probabilísticos. Diplomado en Salud Pública - 2 1. Se introducirá al alumno en el mundo de la inferencia Inferencia estadística Muestra (X, S) Diplomado en Salud Pública - 3 Descriptiva Descriptiva Inferencia Población (m, s) Estimación: Trata de determinar los parámetros poblacionales (generalmente desconocidos) sin hacer hipótesis previas sobre los posibles valores de los mismos. Contrastes de hipótesis: Se hacen hipótesis sobre los parámetros desconocidos y se desarrolla un procedimiento para comprobar la veracidad de las hipótesis planteadas. Diplomado en Salud Pública - 4 Inferencia estadística Estimación X 1,75 Puntual ¿m? m 1,75 1,79 1,72 1,68 1,65 1,76 1,87 1,81 1,70 1,75 … Por intervalos [1,71 1,78] 1.71 m 1.78 Diplomado en Salud Pública - 5 Estimación Supongamos que los datos proporcionados en la base de datos Pacientes_infartados.xls han sido extraídos al azar (por un procedimiento de muestreo adecuado) y son una muestra representativa de los pacientes que acuden a urgencias a lo largo del año en un hospital. Queremos realizar unas estimaciones puntuales a cerca de los posibles valores de determinados parámetros de la población: Respuesta 1. Realice una estimación puntual de la edad de los pacientes infartados. 67,2 años 2. Realice una estimación puntual de la variabilidad del peso de los pacientes infartados. 13,2 Kg 3. Realice una estimación puntual para conocer la proporción de hombres infartados. 69,6% 4. Realice una estimación puntual para conocer la proporción de pacientes infartados, con tipo 3 de infarto. 15,2% Diplomado en Salud Pública - 6 Ejercicio 2.1 Nivel de confianza (1-a): Los niveles de confianza más usados son el 95% y el 99%. ¿Cómo se interpreta (1-a)? Diplomado en Salud Pública - 7 Intervalos de confianza Intervalos de confianza Nivel de confianza Tamaño de la muestra Variabilidad de los datos 1a Im s X Za 2 n Diplomado en Salud Pública - 8 Amplitud del intervalo: Ejercicio 2.2 Respuesta 1. Suponga que la desviación típica de la edad de la población es de 12,75 años. Haga una estimación de la edad media de la población, con una confianza del 95%. [64,96-69,44] 2. Si queremos que el intervalo calculado en el punto 1 sea más preciso, trabajaremos con una confianza del 99%. Responda Verdadero o Falso Falso. 3. ¿Cómo afectaría a la amplitud del intervalo que la desviación típica de la población fuera menor? 4. Si en lugar de tomar una muestra de 125 pacientes, tomáramos una muestra de 100, el intervalo de confianza calculado sería menos preciso. Responda Verdadero o Falso. Amplitud Verdadero Diplomado en Salud Pública - 9 Seguimos trabajando en las mismas condiciones que en el Ejercicio 2.1 con la base de datos Pacientes_infartados.xls. Responda a las siguientes preguntas: 1. Hipótesis nula (H0), Hipótesis alternativa (H1) 2. Nivel de significación (a) 3. Estadístico de contraste (Z, t, ...) 4. 5. Región crítica y región de aceptación (RC y RA) Conclusiones (estadísticas y no estadísticas: médicas, biológicas, económicas, etc.) Diplomado en Salud Pública - 10 Contrastes de hipótesis Contrastes de hipótesis Resultado de la prueba estadística Hipótesis cierta H0 H1 Inocente Culpable Rechazo Ho Error tipo I Correcto A la cárcel… (a) Potencia (1-b) Acepto Ho En libertad… Correcto Error tipo II (b) Diplomado en Salud Pública - 11 Nivel de significación (a) Probabilidad de cometer error tipo I, es decir, probabilidad de rechazar la hipótesis nula siendo cierta. Habitualmente 1%, 5%. P-valor Diplomado en Salud Pública - 12 H1 : m>m0 Acepto H0 a RA P-valor 1a P-valor a Za/2 Zexp RC H1 : m>m0 Rechazo H0 P-valor a RA 1a a RC P-valor Za/2 Zexp Diplomado en Salud Pública - 13 P-valor P-valor > a P a P-valor < a P a ACEPTO H0 RECHAZO H0 Diplomado en Salud Pública - 14 P-valor Ejemplo Tensión Sistólica Grupo edad Edad 1 114 17 Menor de 40 M 2 134 18 Menor de 40 H 3 124 19 Menor de 40 M 4 128 19 Menor de 40 M 5 116 20 Menor de 40 M 6 120 21 Menor de 40 M 7 138 21 Menor de 40 H 8 130 22 Menor de 40 M 9 139 23 Menor de 40 M … … … … … 69 180 70 Mayor de 55 H H 0 : m 146 H1 : m 146 Diplomado en Salud Pública - 15 Sexo Ejemplo N Tensión Sist ólica 69 Media 148,72 Des v iac ión tí p. 18, 476 Error t íp. de la media 2, 224 Prueba para una muestra X m Sˆ n Tensión Sist ólica H0 Valor de prueba = 146 t 1, 225 gl 68 Sig. (bilateral) ,225 Dif erencia de medias 2, 725 95% I nterv alo de conf ianza para la dif erencia Inf erior Superior -1,71 7, 16 p > 0,05 Acepto Ho Diplomado en Salud Pública - 16 Estadí sticos para una muestra Errores más frecuentes Considerar como cierta H0 cuando no hemos podido rechazarla. Cuando se realizan varios contrastes en un mismo estudio, cada uno se lleva a cabo con una probabilidad de cometer error tipo I determinada (a). Conclusiones globales del estudio... No distinguir entre resultados estadísticamente significativos y clínicamente importantes. Extrapolar conclusiones a poblaciones distintas de la muestreada. Diplomado en Salud Pública - 17 Realizar contrastes en muestras no aleatorias. Ejercicio 2.3 Respuesta 1. El error tipo I y el error tipo II tienen que ser siempre del 5% o del 1%. Falso 2. Se entiende por “resultado probablemente significativo” cuando rechazamos la H0 al 5% y aceptamos al 1%. Verdadero 3. Con un p-valor de 0,428 concluimos que aceptamos la H0. Verdadero 4. El p-valor sólo puede tomar valores comprendidos entre 0 y 1 (ambos incluidos). Verdadero Diplomado en Salud Pública - 18 Responda a las siguientes preguntas con verdadero o falso: Población y muestra: ideas fundamentales Muestreo aleatorio simple Muestreo sistemático Muestreo estratificado Muestreo por conglomerados . . . . . . Diplomado en Salud Pública - 19 Tipos de muestreo probabilístico más habituales: Población y muestra: ideas fundamentales Estudio de los datos disponibles Se estudian los datos disponibles respecto a pacientes con una determinada enfermedad. Selección por cuotas Se selecciona una muestra que tenga la misma proporción de integrantes con determinada característica, que la población: según sexo, grupo de edad, etc. Voluntarios Los grupos de voluntarios son frecuentes y, en general, los resultados no son representativos... Según criterios basados en la experiencia Los expertos deciden si un elemento es adecuado para formar o no parte de la muestra. Diplomado en Salud Pública - 20 Tipos de muestreo no probabilístico más habituales: Ejercicio 2.4 Responda a las siguientes preguntas con verdadero o falso: 1. Lo importante a la hora de realizar inferencia, es obtener un tamaño de muestra muy grande, da igual cómo se haya obtenido. Falso 2. El muestreo aleatorio simple, es siempre el más adecuado. Falso 3. A medida que bajo el error de estimación que estoy dispuesto a cometer, el tamaño de la muestra será mayor. Verdadero 4. Un muestreo según criterios basados en la experiencia, es un muestreo probabilístico que se basa en la opinión de los expertos. Falso 5. Hemos obtenido un tamaño de muestra n=500 para un nivel de significación del 5%. Si trabajo ahora con un nivel de significación del 1%, obtendré un tamaño de muestra mayor. Verdadero Diplomado en Salud Pública - 21 Respuesta Ejemplo E 2 N 1 Z a2 2 pˆ qˆ Error absoluto 2,50% p=q= 0,5 Nivel confianza 95,0% Z= 1,96 1,962 2.510.849 0,5 0,5 n 1.536 2 2 0,025 2.510.849 1 1,96 0,5 0,5 Diplomado en Salud Pública - 22 n Z a2 2 Npˆ qˆ