ANÁLISIS ESPECIALES EN CIENCIAS DE LA SALUD Diplomatura de estadística Examen teórico Junio 1998 1. Un estudio sobre la posibilidad de recibir un transplante de riñón tras un diagnóstico de insuficiencia renal realizado en 30 pacientes dio los siguientes resultados (tiempo en años): Survival Analysis for TIEMPO DEL TRANSPLANTE Time Status ,10 ,10 ,10 ,20 ,20 ,30 ,60 ,80 ,80 ,90 ,90 1,10 1,10 1,20 1,30 1,50 1,70 1,70 2,00 2,10 2,20 2,40 2,80 2,90 3,00 3,80 5,20 5,70 6,40 6,60 Cumulative Survival 1,00 ,00 ,00 1,00 1,00 1,00 ,00 1,00 ,00 1,00 ,00 ,00 ,00 ,00 1,00 ,00 1,00 1,00 1,00 1,00 1,00 1,00 ,00 1,00 1,00 1,00 ,00 1,00 1,00 1,00 Number of Cases: 30 Cumulative Events Number Remaining ,9667 ,0328 ,8951 ,8593 ,0574 ,0653 ,8219 ,0724 ,7828 ,0788 ,7338 ,0878 ,6290 ,5766 ,5242 ,4718 ,4193 ,1018 ,1060 ,1085 ,1096 ,1092 ,3594 ,2995 ,2396 ,1088 ,1059 ,1002 ,1597 ,0799 ,0000 ,0934 ,0733 ,0000 1 1 1 2 3 4 4 5 5 6 6 6 6 6 7 7 8 9 10 11 12 13 13 14 15 16 16 17 18 19 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Censored: Survival Time Mean: Median: Standard Error 11 Standard Error 2,87 2,20 ,48 ,28 ( 36,67%) Events: 19 95% Confidence Interval ( ( 1,93; 1,65; 3,80 ) 2,75 ) Percentiles Value Standard Error 25,00 50,00 75,00 3,80 1,41 2,20 ,28 1,30 ,41 a) Estimar la probabilidad de no haber recibido un transplante antes de 4 años con su intervalo de confianza al 95% b) Estimar el tiempo que tarda en transplantarse el 70% de los pacientes con insuficiencia renal, y su intervalo de confianza al 95% 2. En el mismo estudio se quiere evaluar la edad como criterio que afecta la probabilidad de recibir un transplante. Funciones de supervivencia 1,2 1,0 ,8 Supervivencia acum ,6 ED ,4 <65 años ,2 <65 años-cens urado 0,0 >=65 años -,2 >=65 años-cens urado 0 1 2 3 4 5 6 7 TIEMPO Factor ED = >=65 años Time Status ,10 1,30 1,70 2,00 2,10 2,20 2,40 2,90 3,80 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 Cumulative Survival ,9375 ,8333 ,7292 ,6250 ,5208 ,4167 ,3125 ,2083 ,1042 Standard Error ,0605 ,1120 ,1382 ,1527 ,1589 ,1576 ,1487 ,1306 ,0984 Cumulative Events 1 2 3 4 5 6 7 8 9 Number Remaining 15 8 7 6 5 4 3 2 1 Cumulative Survival Standard Error Cumulative Events 1 2 3 4 5 6 7 8 9 10 Number Remaining 13 12 11 10 8 5 3 2 1 0 Factor ED = <65 años Time Status ,20 ,20 ,30 ,80 ,90 1,70 3,00 5,70 6,40 6,60 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 ,8571 ,7857 ,7143 ,6349 ,5291 ,3968 ,2646 ,1323 ,0000 ,0935 ,1097 ,1207 ,1308 ,1457 ,1583 ,1510 ,1202 ,0000 Survival Analysis for TIEMPO ED ED >=65 años <65 años Total Number Events 16 14 9 10 Number Censored Percent Censored 7 4 43,75 28,57 Overall 30 19 11 Test Statistics for Equality of Survival Distributions for ED 36,67 Statistic Log Rank Breslow Tarone-Ware ,23 ,29 ,01 df Significance 1 1 1 ,6290 ,5921 ,9277 A la vista de la gráfica y el listado de análisis, comentar: a) ¿Qué prueba de hipótesis es más interesante para detectar diferencias en estos datos? b) ¿A qué conclusión se llega? Razonar la respuesta. 3. Para evitar el rechazo del transplante se emplea el fármaco ciclosporina. Se cree que la dosis de ciclosporina está relacionada con el tiempo en el que aparece el rechazo. Se ajusta un modelo Weibull con el programa SAS y se obtiene el siguiente resultado: ------------------------------------------------------------------------------L I F E R E G P R O C E D U R E Modelo sin covariables: Log Likelihood for WEIBULL -362.9524879 Variable INTERCPT SCALE DF Estimate Std Err ChiSquare 1 3.86335843 0.044544 1 0.68162451 0.036826 7522.383 Pr>Chi Label/Value 0.0 Intercept Extreme value scale paramet Modelo con covariable DOSIS: Log Likelihood for WEIBULL -359.0018381 Variable DF Estimate Std Err ChiSquare Pr>Chi Label/Value INTERCPT 1 4.02804977 0.079216 2585.646 0.0 Intercept DOSIS 2 1 -0.294531 0.108127 1 -0.2084965 0.109602 0 0 0 7.706824 7.419849 3.61877 . 0.0212 0.0065 Dosis 5 mg 0.0571 Dosis 20 mg . Dosis 50 mg SCALE 1 0.67210673 0.036317 Extreme value scale paramet ------------------------------------------------------------------------------- Contestar, con argumentos estadísticos, las siguientes cuestiones: a) ¿Existe algún efecto de la dosis en el tiempo de rechazo? Interpretar los coeficientes. b) ¿El modelo exponencial sería adecuado para estos datos? c) ¿Calcular la mediana de supervivencia según el modelo para cada dosis? 4. Se emplean modelos de Cox para evaluar la relación entre la dosis de un analgésico y el estado crítico del paciente en el momento de la operación respecto al tiempo que tarda en relajarse el músculo diafragma. Se emplean dos dosis activas de 10 y 50 mg y a un grupo control no se le administra analgésico. Indicator Parameter Coding Value Freq (1) CRITIC No 302 ,000 Si 198 1,000 Indicator Parameter Coding Value Freq (1) (2) DOSI 10 mg 50 mg Nula 227 81 192 1,000 ,000 ,000 Initial Log Likelihood Function ,000 1,000 ,000 -2 Log Likelihood 3732,404 Variable(s) CRITIC Overall (score) Change (-2LL) from Previous Block Previous Step Variable CRITIC B 1,0622 Variable DOSI Chi-Square 85,106 df 1 Sig ,0000 75,426 75,426 1 1 ,0000 ,0000 S.E. ,1197 Wald 78,7028 df 1 df 2 Sig ,0000 52,511 52,511 2 2 ,0000 ,0000 B S.E. ,7331 ,9949 ,1212 ,1626 Wald 51,0311 36,5558 37,4333 df 2 1 1 Sig ,0000 ,0000 ,0000 -2 Log Likelihood Chi-Square 134,522 df 3 Sig ,0000 124,627 124,627 3 3 ,0000 ,0000 B S.E. ,6608 1,0440 1,0441 ,1217 ,1637 ,1206 Wald 48,9771 29,4704 40,6484 74,9854 Overall (score) Change (-2LL) from Previous Block Previous Step Sig ,0000 R ,1434 Exp(B) 2,8929 R ,1123 ,0962 ,0974 Exp(B) 3679,893 Chi-Square 53,455 Variable(s) DOSI+CRITIC Variable DOSI DOSI(1) DOSI(2) CRITIC 3656,978 -2 Log Likelihood Overall (score) Change (-2LL) from Previous Block Previous Step Variable DOSI DOSI(1) DOSI(2) -2 Log Likelihood df 2 1 1 1 2,0815 2,7045 3607,777 Sig ,0000 ,0000 ,0000 ,0000 R ,1098 ,0858 ,1018 ,1398 Exp(B) 1,9363 2,8405 2,8410 Variable(s) Entered at Step Number 2.. (se compara con el modelo anterior) CRITIC*DOSI -2 Log Likelihood 3597,996 Overall (score) Change (-2LL) from Previous Block Previous Step Chi-Square 150,285 df 5 Sig ,0000 9,781 9,781 2 2 ,0075 ,0075 ------------------------ Variables in the Equation -----------------------Variable DOSI DOSI(1) DOSI(2) CRITIC CRITIC*DOSI CRITIC*DOSI(1) CRITIC*DOSI(2) B S.E. ,9397 1,0077 1,3809 ,1557 ,2196 ,1952 -,6697 ,0448 ,2436 ,3256 Wald 41,5868 36,4075 21,0532 50,0392 9,8021 7,5552 ,0189 df 2 1 1 1 2 1 1 Sig ,0000 ,0000 ,0000 ,0000 ,0074 ,0060 ,8906 R ,1021 ,0977 ,0727 ,1154 ,0401 -,0392 ,0000 Exp(B) 2,5592 2,7393 3,9783 ,5119 1,0458 a) ¿Es importante la dosis de analgésico? ¿Y el estado crítico? Contestar teniendo en cuenta todos los modelos ajustados. b) ¿Existe algún tipo de confusión entre las dos variables? c) ¿Existe alguna interacción entre las variables? d) Estimar los riesgos relativos a partir del modelo más adecuado y explicar como se interpretan. 5. Describir las similitudes y diferencias entre el modelo paramétrico Weibull y el loglogístico., en todos los aspectos relevantes para un análisis de supervivencia. MÉTODOS ESPECIALES EN CIENCIAS DE LA SALUD HOJA DE RESPUESTAS A LAS PREGUNTAS DE ELECCIÓN MÚLTIPLE junio de 1998 Nombre: DNI: 1.- 2.- 3.- 4.- 5.- 6.- 7.- 8.- 9.- 10.- Contestar las siguientes preguntas en la hoja de respuestas. Sólo una respuesta es válida. No descuentan los fallos. Cada pregunta de tipo test vale 0.1 puntos de la nota final. Cada pregunta corta vale 1.0 puntos de la nota final. El resto de puntos son de prácticas. 1. a) b) c) d) e) 2. a) b) c) d) e) 3. a) b) c) d) e) 4. a) b) c) d) e) 5. a) b) Cuál de las siguientes afirmaciones es cierta sobre las funciones de supervivencia. El riesgo acumulado H(t) es el cociente entre la función de supervivencia S(t) y la función densidad f(t). El riesgo instantáneo h(t) es la derivada del logaritmo de la función de distribución F(t) respecto del tiempo. La función de supervivencia S(t) se puede calcular a partir del cociente entre la derivada respecto del tiempo la función de distribución F(t) y el riesgo acumulado h(t). La función densidad f(t) es una probabilidad condicional. El riesgo acumulado H(t) se puede calcular como el logaritmo de la función de distribución F(t). Cuál de las siguientes afirmaciones es correcta sobre el análisis de la variable tiempo de supervivencia: La media es el mejor estadístico descriptivo. La precisión de la función de supervivencia estimada por el método de KaplanMeier aumenta con el tiempo. La estimación mediante el método de tablas de vida sólo se puede hacer si el tiempo se divide en intervalos de tamaño constante. El método de tablas de vida supone una distribución uniforme en la distribución de las muertes y las censuras en cada intervalo de tiempo. El método de tablas de vida no permite estimar la función densidad f(t) a diferencia del de Kaplan-Meier. Cuál de las siguientes afirmaciones es correcta sobre la comparación de curvas de supervivencia. La prueba log-rank se basa en la distribución exponencial de los tiempos de supervivencia. La prueba de Tarone-Ware no se puede calcular si hay más de 2 grupos. Las pruebas log-rank, Wilcoxon y Tarone-Ware se diferencian en la ponderación que otorgan a cada observación, de manera que la de Wilcoxon es más potente para detectar diferencias en la fase final, cuando quedan menos observaciones. La prueba de log-rank no puede realizarse si no existe proporcionalidad en los riesgos. Se puede ajustar el efecto de un factor de confusión mediante la prueba de logrank estratificada por cada categoría del factor. Cuál de las siguientes afirmaciones es correcta sobre los modelos paramétricos para el análisis de supervivencia. La distribución de Weibull permite modelar funciones de riesgo unimodales. La distribución log-normal tiene más parámetros que la de Weibull. La distribución exponencial supone que la media y mediana de supervivencia son inversamente proporcionales al parámetro lambda con la media superior a la mediana. En la distribución de Weibull, un valor del parámetro de forma Kappa mayor que la unidad implica que la función de riesgo disminuye con el tiempo. El modelo de Weibull siempre supone proporcionalidad en los riesgos. Cuál de las siguientes afirmaciones es correcta sobre los modelos para el análisis de supervivencia. La mejor prueba para valorar si un parámetro es significativo se basa en el cambio en deviance al añadir el parámetro al modelo. Los coeficientes de cualquier modelo se interpretan como logaritmos de riesgos relativos. c) d) e) 6. a) b) c) d) e) 7. a) b) c) d) e) 8. a) b) c) d) e) 9. a) b) c) d) e) 10. a) b) c) d) e) La prueba de tendencia de una variable ordinal se basa en la distribución de ji al cuadrado y tiene como grados de libertad el número de categorías menos uno. Un modelo con una interacción significativa entre dos variables se interpreta como que el efecto que esas dos variables ejercen sobre la supervivencia es independiente. Una variable que no es significativa nunca debe estar en un modelo final. Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox. Es un modelo semiparamétrico, con una estimación paramétrica el riesgo basal y una no paramétrica de los efectos de las covariables. La función de riesgo basal nunca puede estimarse. La función de verosimilitud es condicional, basada en la relación de los valores de las covariables de los individuos que mueren respecto a los que quedan vivos en ese momento (conjunto a riesgo). En este modelo la constante sólo existe si todos los individuos mueren. Si hay tiempos de muerte empatados no se pueden estimar los coeficientes. Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox. El "score" del modelo es equivalente a la prueba log-rank. Los coeficientes se interpretan como riesgos relativos. Un coeficiente con signo negativo significa que el factor aumenta la mortalidad. No se pueden ajustar variables cuantitativas continuas porque los modelos no convergen. El modelo con efectos principales es aditivo y si una interacción es significativa se convierte en multiplicativo. Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox. La proporcionalidad en los riesgos implica que las curvas de supervivencia son paralelas. A pesar de las limitaciones, el mejor método para valorar la proporcionalidad en los riesgos es el gráfico. La gráfica H0(t) en relación a H1(t) tiene siempre pendiente 1 si los riesgos son proporcionales. El posible efecto confusor de una covariable que no cumple la proporcionalidad de riesgos no puede ajustarse. Siempre que los riesgos no sean proporcionales será significativa una interacción entre el tiempo y la covariable. Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox. Los residuales del modelo de Cox, como en cualquier modelo, siguen una distribución normal con media 0 y varianza 1. Los residuales de Cox-Snell se interpretan como tiempos de supervivencia con distribución exponencial. Los residuales de martingala tienen una distribución simétrica alrededor del valor esperado 0. Los residuales de Schoenfeld sólo se pueden calcular para los casos censurados. Los residuales de deviance no pueden tener signo negativo, pues la deviance sigue una distribución de ji al cuadrado. Cuál de las siguientes afirmaciones es correcta sobre los modelos de Cox con covariables dependientes del tiempo. Estos modelos no cumplen la proporcionalidad en los riesgos. Estos modelos permiten detectar la proporcionalidad en los riesgos. Estos modelos no se pueden ajustar sin tener en cuenta que la función de verosimilitud debe acomodar cambios en las covariables a medida que pasa el tiempo. La función de supervivencia de estos modelos es difícil de estimar y no se puede expresar como S0(t)exp(Bx). Todas las afirmaciones son correctas.