ANÁLISIS ESPECIALES EN CIENCIAS DE LA SALUD Diplomatura de estadística

Anuncio
ANÁLISIS ESPECIALES EN CIENCIAS DE LA SALUD
Diplomatura de estadística
Examen teórico Junio 1998
1. Un estudio sobre la posibilidad de recibir un transplante de riñón tras un diagnóstico
de insuficiencia renal realizado en 30 pacientes dio los siguientes resultados (tiempo
en años):
Survival Analysis for TIEMPO DEL TRANSPLANTE
Time
Status
,10
,10
,10
,20
,20
,30
,60
,80
,80
,90
,90
1,10
1,10
1,20
1,30
1,50
1,70
1,70
2,00
2,10
2,20
2,40
2,80
2,90
3,00
3,80
5,20
5,70
6,40
6,60
Cumulative
Survival
1,00
,00
,00
1,00
1,00
1,00
,00
1,00
,00
1,00
,00
,00
,00
,00
1,00
,00
1,00
1,00
1,00
1,00
1,00
1,00
,00
1,00
1,00
1,00
,00
1,00
1,00
1,00
Number of Cases:
30
Cumulative
Events
Number
Remaining
,9667
,0328
,8951
,8593
,0574
,0653
,8219
,0724
,7828
,0788
,7338
,0878
,6290
,5766
,5242
,4718
,4193
,1018
,1060
,1085
,1096
,1092
,3594
,2995
,2396
,1088
,1059
,1002
,1597
,0799
,0000
,0934
,0733
,0000
1
1
1
2
3
4
4
5
5
6
6
6
6
6
7
7
8
9
10
11
12
13
13
14
15
16
16
17
18
19
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
Censored:
Survival Time
Mean:
Median:
Standard
Error
11
Standard Error
2,87
2,20
,48
,28
( 36,67%)
Events: 19
95% Confidence Interval
(
(
1,93;
1,65;
3,80 )
2,75 )
Percentiles
Value
Standard Error
25,00
50,00
75,00
3,80
1,41
2,20
,28
1,30
,41
a) Estimar la probabilidad de no haber recibido un transplante antes de 4 años con su
intervalo de confianza al 95%
b) Estimar el tiempo que tarda en transplantarse el 70% de los pacientes con
insuficiencia renal, y su intervalo de confianza al 95%
2. En el mismo estudio se quiere evaluar la edad como criterio que afecta la probabilidad
de recibir un transplante.
Funciones de supervivencia
1,2
1,0
,8
Supervivencia acum
,6
ED
,4
<65 años
,2
<65 años-cens urado
0,0
>=65 años
-,2
>=65 años-cens urado
0
1
2
3
4
5
6
7
TIEMPO
Factor ED = >=65 años
Time
Status
,10
1,30
1,70
2,00
2,10
2,20
2,40
2,90
3,80
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
Cumulative
Survival
,9375
,8333
,7292
,6250
,5208
,4167
,3125
,2083
,1042
Standard
Error
,0605
,1120
,1382
,1527
,1589
,1576
,1487
,1306
,0984
Cumulative
Events
1
2
3
4
5
6
7
8
9
Number
Remaining
15
8
7
6
5
4
3
2
1
Cumulative
Survival
Standard
Error
Cumulative
Events
1
2
3
4
5
6
7
8
9
10
Number
Remaining
13
12
11
10
8
5
3
2
1
0
Factor ED = <65 años
Time
Status
,20
,20
,30
,80
,90
1,70
3,00
5,70
6,40
6,60
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
,8571
,7857
,7143
,6349
,5291
,3968
,2646
,1323
,0000
,0935
,1097
,1207
,1308
,1457
,1583
,1510
,1202
,0000
Survival Analysis for TIEMPO
ED
ED
>=65 años
<65 años
Total
Number
Events
16
14
9
10
Number
Censored
Percent
Censored
7
4
43,75
28,57
Overall
30
19
11
Test Statistics for Equality of Survival Distributions for ED
36,67
Statistic
Log Rank
Breslow
Tarone-Ware
,23
,29
,01
df
Significance
1
1
1
,6290
,5921
,9277
A la vista de la gráfica y el listado de análisis, comentar:
a) ¿Qué prueba de hipótesis es más interesante para detectar diferencias en estos
datos?
b) ¿A qué conclusión se llega? Razonar la respuesta.
3. Para evitar el rechazo del transplante se emplea el fármaco ciclosporina. Se cree que
la dosis de ciclosporina está relacionada con el tiempo en el que aparece el rechazo. Se
ajusta un modelo Weibull con el programa SAS y se obtiene el siguiente resultado:
------------------------------------------------------------------------------L I F E R E G P R O C E D U R E
Modelo sin covariables:
Log Likelihood for WEIBULL -362.9524879
Variable
INTERCPT
SCALE
DF
Estimate
Std Err ChiSquare
1 3.86335843 0.044544
1 0.68162451 0.036826
7522.383
Pr>Chi Label/Value
0.0
Intercept
Extreme value scale paramet
Modelo con covariable DOSIS:
Log Likelihood for WEIBULL -359.0018381
Variable
DF
Estimate
Std Err ChiSquare
Pr>Chi Label/Value
INTERCPT
1 4.02804977 0.079216
2585.646
0.0
Intercept
DOSIS
2
1 -0.294531 0.108127
1 -0.2084965 0.109602
0
0
0
7.706824
7.419849
3.61877
.
0.0212
0.0065 Dosis 5 mg
0.0571 Dosis 20 mg
.
Dosis 50 mg
SCALE
1 0.67210673 0.036317
Extreme value scale paramet
-------------------------------------------------------------------------------
Contestar, con argumentos estadísticos, las siguientes cuestiones:
a) ¿Existe algún efecto de la dosis en el tiempo de rechazo? Interpretar los coeficientes.
b) ¿El modelo exponencial sería adecuado para estos datos?
c) ¿Calcular la mediana de supervivencia según el modelo para cada dosis?
4. Se emplean modelos de Cox para evaluar la relación entre la dosis de un analgésico y
el estado crítico del paciente en el momento de la operación respecto al tiempo que tarda
en relajarse el músculo diafragma. Se emplean dos dosis activas de 10 y 50 mg y a un
grupo control no se le administra analgésico.
Indicator Parameter Coding
Value
Freq
(1)
CRITIC
No
302
,000
Si
198
1,000
Indicator Parameter Coding
Value
Freq
(1)
(2)
DOSI
10 mg
50 mg
Nula
227
81
192
1,000
,000
,000
Initial Log Likelihood Function
,000
1,000
,000
-2 Log Likelihood
3732,404
Variable(s) CRITIC
Overall (score)
Change (-2LL) from
Previous Block
Previous Step
Variable
CRITIC
B
1,0622
Variable
DOSI
Chi-Square
85,106
df
1
Sig
,0000
75,426
75,426
1
1
,0000
,0000
S.E.
,1197
Wald
78,7028
df
1
df
2
Sig
,0000
52,511
52,511
2
2
,0000
,0000
B
S.E.
,7331
,9949
,1212
,1626
Wald
51,0311
36,5558
37,4333
df
2
1
1
Sig
,0000
,0000
,0000
-2 Log Likelihood
Chi-Square
134,522
df
3
Sig
,0000
124,627
124,627
3
3
,0000
,0000
B
S.E.
,6608
1,0440
1,0441
,1217
,1637
,1206
Wald
48,9771
29,4704
40,6484
74,9854
Overall (score)
Change (-2LL) from
Previous Block
Previous Step
Sig
,0000
R
,1434
Exp(B)
2,8929
R
,1123
,0962
,0974
Exp(B)
3679,893
Chi-Square
53,455
Variable(s) DOSI+CRITIC
Variable
DOSI
DOSI(1)
DOSI(2)
CRITIC
3656,978
-2 Log Likelihood
Overall (score)
Change (-2LL) from
Previous Block
Previous Step
Variable
DOSI
DOSI(1)
DOSI(2)
-2 Log Likelihood
df
2
1
1
1
2,0815
2,7045
3607,777
Sig
,0000
,0000
,0000
,0000
R
,1098
,0858
,1018
,1398
Exp(B)
1,9363
2,8405
2,8410
Variable(s) Entered at Step Number 2.. (se compara con el modelo anterior)
CRITIC*DOSI
-2 Log Likelihood
3597,996
Overall (score)
Change (-2LL) from
Previous Block
Previous Step
Chi-Square
150,285
df
5
Sig
,0000
9,781
9,781
2
2
,0075
,0075
------------------------ Variables in the Equation -----------------------Variable
DOSI
DOSI(1)
DOSI(2)
CRITIC
CRITIC*DOSI
CRITIC*DOSI(1)
CRITIC*DOSI(2)
B
S.E.
,9397
1,0077
1,3809
,1557
,2196
,1952
-,6697
,0448
,2436
,3256
Wald
41,5868
36,4075
21,0532
50,0392
9,8021
7,5552
,0189
df
2
1
1
1
2
1
1
Sig
,0000
,0000
,0000
,0000
,0074
,0060
,8906
R
,1021
,0977
,0727
,1154
,0401
-,0392
,0000
Exp(B)
2,5592
2,7393
3,9783
,5119
1,0458
a) ¿Es importante la dosis de analgésico? ¿Y el estado crítico? Contestar teniendo en
cuenta todos los modelos ajustados.
b) ¿Existe algún tipo de confusión entre las dos variables?
c) ¿Existe alguna interacción entre las variables?
d) Estimar los riesgos relativos a partir del modelo más adecuado y explicar como se
interpretan.
5. Describir las similitudes y diferencias entre el modelo paramétrico Weibull y el loglogístico., en todos los aspectos relevantes para un análisis de supervivencia.
MÉTODOS ESPECIALES EN CIENCIAS DE LA SALUD
HOJA DE RESPUESTAS A LAS PREGUNTAS DE ELECCIÓN MÚLTIPLE
junio de 1998
Nombre:
DNI:
1.-
2.-
3.-
4.-
5.-
6.-
7.-
8.-
9.-
10.-
Contestar las siguientes preguntas en la hoja de respuestas. Sólo una respuesta es
válida. No descuentan los fallos. Cada pregunta de tipo test vale 0.1 puntos de la nota
final. Cada pregunta corta vale 1.0 puntos de la nota final. El resto de puntos son de
prácticas.
1.
a)
b)
c)
d)
e)
2.
a)
b)
c)
d)
e)
3.
a)
b)
c)
d)
e)
4.
a)
b)
c)
d)
e)
5.
a)
b)
Cuál de las siguientes afirmaciones es cierta sobre las funciones de
supervivencia.
El riesgo acumulado H(t) es el cociente entre la función de supervivencia S(t) y la
función densidad f(t).
El riesgo instantáneo h(t) es la derivada del logaritmo de la función de
distribución F(t) respecto del tiempo.
La función de supervivencia S(t) se puede calcular a partir del cociente entre la
derivada respecto del tiempo la función de distribución F(t) y el riesgo acumulado
h(t).
La función densidad f(t) es una probabilidad condicional.
El riesgo acumulado H(t) se puede calcular como el logaritmo de la función de
distribución F(t).
Cuál de las siguientes afirmaciones es correcta sobre el análisis de la variable
tiempo de supervivencia:
La media es el mejor estadístico descriptivo.
La precisión de la función de supervivencia estimada por el método de KaplanMeier aumenta con el tiempo.
La estimación mediante el método de tablas de vida sólo se puede hacer si el
tiempo se divide en intervalos de tamaño constante.
El método de tablas de vida supone una distribución uniforme en la distribución
de las muertes y las censuras en cada intervalo de tiempo.
El método de tablas de vida no permite estimar la función densidad f(t) a
diferencia del de Kaplan-Meier.
Cuál de las siguientes afirmaciones es correcta sobre la comparación de curvas
de supervivencia.
La prueba log-rank se basa en la distribución exponencial de los tiempos de
supervivencia.
La prueba de Tarone-Ware no se puede calcular si hay más de 2 grupos.
Las pruebas log-rank, Wilcoxon y Tarone-Ware se diferencian en la ponderación
que otorgan a cada observación, de manera que la de Wilcoxon es más potente
para detectar diferencias en la fase final, cuando quedan menos observaciones.
La prueba de log-rank no puede realizarse si no existe proporcionalidad en los
riesgos.
Se puede ajustar el efecto de un factor de confusión mediante la prueba de logrank estratificada por cada categoría del factor.
Cuál de las siguientes afirmaciones es correcta sobre los modelos paramétricos
para el análisis de supervivencia.
La distribución de Weibull permite modelar funciones de riesgo unimodales.
La distribución log-normal tiene más parámetros que la de Weibull.
La distribución exponencial supone que la media y mediana de supervivencia
son inversamente proporcionales al parámetro lambda con la media superior a la
mediana.
En la distribución de Weibull, un valor del parámetro de forma Kappa mayor que
la unidad implica que la función de riesgo disminuye con el tiempo.
El modelo de Weibull siempre supone proporcionalidad en los riesgos.
Cuál de las siguientes afirmaciones es correcta sobre los modelos para el
análisis de supervivencia.
La mejor prueba para valorar si un parámetro es significativo se basa en el
cambio en deviance al añadir el parámetro al modelo.
Los coeficientes de cualquier modelo se interpretan como logaritmos de riesgos
relativos.
c)
d)
e)
6.
a)
b)
c)
d)
e)
7.
a)
b)
c)
d)
e)
8.
a)
b)
c)
d)
e)
9.
a)
b)
c)
d)
e)
10.
a)
b)
c)
d)
e)
La prueba de tendencia de una variable ordinal se basa en la distribución de ji al
cuadrado y tiene como grados de libertad el número de categorías menos uno.
Un modelo con una interacción significativa entre dos variables se interpreta
como que el efecto que esas dos variables ejercen sobre la supervivencia es
independiente.
Una variable que no es significativa nunca debe estar en un modelo final.
Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox.
Es un modelo semiparamétrico, con una estimación paramétrica el riesgo basal y
una no paramétrica de los efectos de las covariables.
La función de riesgo basal nunca puede estimarse.
La función de verosimilitud es condicional, basada en la relación de los valores
de las covariables de los individuos que mueren respecto a los que quedan vivos
en ese momento (conjunto a riesgo).
En este modelo la constante sólo existe si todos los individuos mueren.
Si hay tiempos de muerte empatados no se pueden estimar los coeficientes.
Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox.
El "score" del modelo es equivalente a la prueba log-rank.
Los coeficientes se interpretan como riesgos relativos.
Un coeficiente con signo negativo significa que el factor aumenta la mortalidad.
No se pueden ajustar variables cuantitativas continuas porque los modelos no
convergen.
El modelo con efectos principales es aditivo y si una interacción es significativa
se convierte en multiplicativo.
Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox.
La proporcionalidad en los riesgos implica que las curvas de supervivencia son
paralelas.
A pesar de las limitaciones, el mejor método para valorar la proporcionalidad en
los riesgos es el gráfico.
La gráfica H0(t) en relación a H1(t) tiene siempre pendiente 1 si los riesgos son
proporcionales.
El posible efecto confusor de una covariable que no cumple la proporcionalidad
de riesgos no puede ajustarse.
Siempre que los riesgos no sean proporcionales será significativa una
interacción entre el tiempo y la covariable.
Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox.
Los residuales del modelo de Cox, como en cualquier modelo, siguen una
distribución normal con media 0 y varianza 1.
Los residuales de Cox-Snell se interpretan como tiempos de supervivencia con
distribución exponencial.
Los residuales de martingala tienen una distribución simétrica alrededor del valor
esperado 0.
Los residuales de Schoenfeld sólo se pueden calcular para los casos
censurados.
Los residuales de deviance no pueden tener signo negativo, pues la deviance
sigue una distribución de ji al cuadrado.
Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox con
covariables dependientes del tiempo.
Estos modelos no cumplen la proporcionalidad en los riesgos.
Estos modelos permiten detectar la proporcionalidad en los riesgos.
Estos modelos no se pueden ajustar sin tener en cuenta que la función de
verosimilitud debe acomodar cambios en las covariables a medida que pasa el
tiempo.
La función de supervivencia de estos modelos es difícil de estimar y no se puede
expresar como S0(t)exp(Bx).
Todas las afirmaciones son correctas.
Descargar