Document

Anuncio
2.2.2. Inferencia estadística:
estimación y contrastes
Dra. Ana Dorado Díaz
Consejería de Sanidad
Diplomado en Salud Pública
Objetivos específicos
estadística,
mostrándole
conceptos
básicos
de
estimación (puntual e intervalos de confianza) y
contrastes.
2. Se pretende hacer comprender al alumno la
importancia de llevar a cabo un estudio bien
diseñado desde su inicio: importancia de los
muestreos probabilísticos.
Diplomado en Salud Pública - 2
1. Se introducirá al alumno en el mundo de la inferencia
Inferencia estadística
Muestra (X, S)
Diplomado en Salud Pública - 3
Descriptiva
Descriptiva
Inferencia
Población (m, s)
 Estimación: Trata de determinar los parámetros
poblacionales (generalmente desconocidos) sin hacer
hipótesis previas sobre los posibles valores de los
mismos.
 Contrastes de hipótesis: Se hacen hipótesis sobre los
parámetros desconocidos y se desarrolla un
procedimiento para comprobar la veracidad de las
hipótesis planteadas.
Diplomado en Salud Pública - 4
Inferencia estadística
Estimación
X  1,75
Puntual
¿m?
m  1,75
1,79
1,72 1,68
1,65
1,76
1,87
1,81
1,70
1,75
…
Por intervalos
[1,71  1,78]
1.71  m  1.78
Diplomado en Salud Pública - 5
Estimación
Supongamos que los datos proporcionados en la base de datos
Pacientes_infartados.xls han sido extraídos al azar (por un procedimiento de
muestreo adecuado) y son una muestra representativa de los pacientes
que acuden a urgencias a lo largo del año en un hospital. Queremos
realizar unas estimaciones puntuales a cerca de los posibles
valores de determinados parámetros de la población:
Respuesta
1. Realice una estimación puntual de la edad de los pacientes
infartados.
67,2 años
2. Realice una estimación puntual de la variabilidad del peso de
los pacientes infartados.
13,2 Kg
3. Realice una estimación puntual para conocer la proporción de
hombres infartados.
69,6%
4. Realice una estimación puntual para conocer la proporción de
pacientes infartados, con tipo 3 de infarto.
15,2%
Diplomado en Salud Pública - 6
Ejercicio 2.1
 Nivel de confianza (1-a):
 Los niveles de confianza más
usados son el 95% y el 99%.
 ¿Cómo se interpreta (1-a)?
Diplomado en Salud Pública - 7
Intervalos de confianza
Intervalos de confianza
 Nivel de confianza
 Tamaño de la muestra
 Variabilidad de los datos
1a
Im
s 

  X  Za 2

n

Diplomado en Salud Pública - 8
 Amplitud del intervalo:
Ejercicio 2.2
Respuesta
1. Suponga que la desviación típica de la edad de la población es de
12,75 años. Haga una estimación de la edad media de la población,
con una confianza del 95%.
[64,96-69,44]
2. Si queremos que el intervalo calculado en el punto 1 sea más
preciso, trabajaremos con una confianza del 99%. Responda Verdadero o
Falso
Falso.
3. ¿Cómo afectaría a la amplitud del intervalo que la desviación típica
de la población fuera menor?
4. Si en lugar de tomar una muestra de 125 pacientes, tomáramos una
muestra de 100, el intervalo de confianza calculado sería menos
preciso. Responda Verdadero o Falso.
 Amplitud
Verdadero
Diplomado en Salud Pública - 9
Seguimos trabajando en las mismas condiciones que en el
Ejercicio 2.1 con la base de datos Pacientes_infartados.xls. Responda a
las siguientes preguntas:
1.
Hipótesis nula (H0), Hipótesis alternativa (H1)
2.
Nivel de significación (a)
3.
Estadístico de contraste (Z, t, ...)
4.
5.
Región crítica y región de aceptación (RC y RA)
Conclusiones (estadísticas y no estadísticas: médicas,
biológicas, económicas, etc.)
Diplomado en Salud Pública - 10
Contrastes de hipótesis
Contrastes de hipótesis
Resultado de
la prueba
estadística
Hipótesis cierta
H0
H1
Inocente
Culpable
Rechazo Ho
Error tipo I
Correcto
A la cárcel…
(a)
Potencia (1-b)
Acepto Ho
En libertad…
Correcto
Error tipo II
(b)
Diplomado en Salud Pública - 11
Nivel de significación (a)
Probabilidad de cometer error
tipo I, es decir, probabilidad de
rechazar la hipótesis nula siendo
cierta. Habitualmente 1%, 5%.
P-valor
Diplomado en Salud Pública - 12
H1 : m>m0
Acepto H0
a
RA
P-valor
1a
P-valor
a
Za/2
Zexp
RC
H1 : m>m0
Rechazo H0
P-valor
a
RA
1a
a
RC
P-valor
Za/2
Zexp
Diplomado en Salud Pública - 13
P-valor
P-valor > a
P
a
P-valor < a
P
a
ACEPTO H0
RECHAZO H0
Diplomado en Salud Pública - 14
P-valor
Ejemplo
Tensión
Sistólica
Grupo
edad
Edad
1
114
17
Menor de 40
M
2
134
18
Menor de 40
H
3
124
19
Menor de 40
M
4
128
19
Menor de 40
M
5
116
20
Menor de 40
M
6
120
21
Menor de 40
M
7
138
21
Menor de 40
H
8
130
22
Menor de 40
M
9
139
23
Menor de 40
M
…
…
…
…
…
69
180
70
Mayor de 55
H
H 0 : m  146
H1 : m  146
Diplomado en Salud Pública - 15
Sexo
Ejemplo
N
Tensión Sist ólica
69
Media
148,72
Des v iac ión
tí p.
18, 476
Error t íp. de
la media
2, 224
Prueba para una muestra
X m
Sˆ
n
Tensión Sist ólica
H0 Valor de prueba = 146
t
1, 225
gl
68
Sig. (bilateral)
,225
Dif erencia
de medias
2, 725
95% I nterv alo de
conf ianza para la
dif erencia
Inf erior
Superior
-1,71
7, 16
p > 0,05 Acepto Ho
Diplomado en Salud Pública - 16
Estadí sticos para una muestra
Errores más frecuentes
 Considerar como cierta H0 cuando no hemos podido rechazarla.
 Cuando se realizan varios contrastes en un mismo estudio, cada
uno se lleva a cabo con una probabilidad de cometer error tipo I
determinada (a). Conclusiones globales del estudio...
 No distinguir entre resultados estadísticamente significativos y
clínicamente importantes.
 Extrapolar conclusiones a poblaciones distintas de la muestreada.
Diplomado en Salud Pública - 17
 Realizar contrastes en muestras no aleatorias.
Ejercicio 2.3
Respuesta
1. El error tipo I y el error tipo II tienen que ser siempre del 5% o
del 1%.
Falso
2. Se entiende por “resultado probablemente significativo” cuando
rechazamos la H0 al 5% y aceptamos al 1%.
Verdadero
3. Con un p-valor de 0,428 concluimos que aceptamos la H0.
Verdadero
4. El p-valor sólo puede tomar valores comprendidos entre 0 y 1
(ambos incluidos).
Verdadero
Diplomado en Salud Pública - 18
Responda a las siguientes preguntas con verdadero o falso:
Población y muestra: ideas fundamentales

Muestreo aleatorio simple

Muestreo sistemático

Muestreo estratificado

Muestreo por conglomerados
. . . . . .
Diplomado en Salud Pública - 19
Tipos de muestreo probabilístico más habituales:
Población y muestra: ideas fundamentales
Estudio de los datos disponibles
Se estudian los datos disponibles respecto a pacientes con una determinada
enfermedad.
Selección por cuotas
Se selecciona una muestra que tenga la misma proporción de integrantes con
determinada característica, que la población: según sexo, grupo de edad, etc.
Voluntarios
Los grupos de voluntarios son frecuentes y, en general, los resultados no son
representativos...
Según criterios basados en la experiencia
Los expertos deciden si un elemento es adecuado para formar o no parte de la
muestra.
Diplomado en Salud Pública - 20
Tipos de muestreo no probabilístico más habituales:
Ejercicio 2.4
Responda a las siguientes preguntas con verdadero o falso:
1. Lo importante a la hora de realizar inferencia, es obtener un
tamaño de muestra muy grande, da igual cómo se haya
obtenido.
Falso
2. El muestreo aleatorio simple, es siempre el más adecuado.
Falso
3. A medida que bajo el error de estimación que estoy
dispuesto a cometer, el tamaño de la muestra será mayor.
Verdadero
4. Un muestreo según criterios basados en la experiencia, es
un muestreo probabilístico que se basa en la opinión de los
expertos.
Falso
5. Hemos obtenido un tamaño de muestra n=500 para un nivel
de significación del 5%. Si trabajo ahora con un nivel de
significación del 1%, obtendré un tamaño de muestra mayor.
Verdadero
Diplomado en Salud Pública - 21
Respuesta
Ejemplo
E 2 N  1  Z a2 2 pˆ qˆ
Error absoluto 2,50%
p=q= 0,5
Nivel confianza 95,0%
Z= 1,96
1,962  2.510.849  0,5  0,5
n
 1.536
2
2
0,025  2.510.849  1  1,96  0,5  0,5
Diplomado en Salud Pública - 22
n
Z a2 2 Npˆ qˆ
Descargar