DOCUWEB FABIS Dot. Núm 0702006 Cómo hacer “paso a paso” un Análisis de Supervivencia con SPSS para Windows. Aguayo Canela M, Lora Monge E Servicio de Medicina Interna. Hospital Universitario Virgen Macarena. Sevilla Resumen Se describe, en el programa SPSS para Windows, los procedimientos para llevar a cabo un análisis de supervivencia con el método de Kaplan-Meier, construir gráficas de supervivencia y compararlas mediante el test del Log-Rank. 0. Introducción teórica. Para realizar un estudio de este tipo es necesario definir la fecha de comienzo y la fecha de finalización del seguimiento, con la que se calcularán posteriormente los tiempos de supervivencia de los pacientes. Así, dependiendo del tipo de estudio y diseño, la fecha de comienzo del seguimiento suele ser la del diagnóstico de enfermedad, ingreso en el hospital, inicio de tratamiento, etc. La fecha de finalización está predeterminada por el investigador dependiendo del tipo de datos analizados. Durante este período de tiempo, el seguimiento de los pacientes es individual, pudiendo ocurrir que éste fallezca, continúe con vida en la fecha de finalización del estudio o se pierda el contacto con él en un instante determinado. Las dos últimas situaciones representan lo que se denominan datos censurados. El tiempo de supervivencia se define entonces como el transcurrido desde la fecha de comienzo del seguimiento hasta la fecha de último contacto con el paciente, bien por haber fallecido bien por haber sido censurado. Existen distintos procedimientos que permiten estimar curvas de supervivencia, aunque quizás uno de los más populares en la investigación clínica sea el método de Kaplan-Meier. Es un método no paramétrico, con muy pocas restricciones; de hecho, lo único que supone es que los sujetos censurados se habrían comportado del mismo modo que los seguidos hasta que se produjo el evento (lo que se conoce por “censura no informativa”). Para aplicar este método se ordenan de menor a mayor todos los tiempos de supervivencia observados, anotando para cada uno de ellos el número de muertes y censuras producidas. Para cada periodo de tiempo se calcula la probabilidad de sobrevivir, y la función de Kaplan-Meier es “la probabilidad de supervivencia individual acumulada a lo largo del tiempo”. Como veremos enseguida, estos pasos los hace automáticamente el programa estadístico. Correspondencia: [email protected] 1 de 11 Aguayo Canela, Mariano DocuWeb fabis.org Trabajaremos con una base de datos (Anexo 1) que recoge información sobre 56 pacientes con cáncer colorectal, incluidos en el seguimiento (fecha de entrada o inicial) en el momento de ser sometidos a radioterapia pre-operatoria, y seguidos hasta su fallecimiento. 1. Pasos a dar para obtener una curva de supervivencia por el método de Kaplan-Meier. 1.1. En la tabla de datos es necesario disponer, al menos, de dos variables: • • El tiempo de seguimiento (que puede ser a su vez una variable calculada como la diferencia entre dos fechas, la de ingreso y la de finalización, que serán diferentes en cada individuo). Es una variable cuantitativa y estará expresada en días, meses, años, etc. El estado del paciente al final del seguimiento. Es una variable categórica dicotómica, soliendo asignarse la categoría “1” a quienes tuvieron el evento evaluado (muerte, recaída, etc.) y la categoría “0” a los llamados casos censurados, ya sea porque se perdieron durante el seguimiento o porque no habían tenido el evento final al culminar el estudio. Por tanto, lo primero que haremos será comprobar que estas dos variables con sus correspondientes escalas (“escala” y “nominal” en el programa SPSS) están así definidas en la base de datos. Es también muy importante comprobar cómo está codificada la variable “estado del paciente” y confirmar con qué código se identifica a los sujetos que tuvieron el desenlace final evaluado, puesto que el programa nos lo va a pedir. 1.2. Para llevar a cabo el procedimiento, en la opción Analizar elegimos Supervivencia y luego Kaplan-Meier… Cuando se abre la nueva ventana de diálogo, debemos seleccionar la variable que mide el tiempo de seguimiento y colocarla en la casilla correspondiente (Tiempo). Y en la celdilla Estado debe colocarse la variable categórica dicotómica que establece el estado individual durante el seguimiento; esta variable tiene dos opciones: valor censurado / valor muerte (o evento que se evalúa). De hecho el programa nos pide Definir evento (mientras tanto aparece un paréntesis con un signo de interrogación tras el nombre de la variable) y debe pulsarse dicha pestaña y especificar el valor que tiene asignado el resultado que se evalúa (en nuestro caso el valor 1 = muerte). Antes de continuar debemos especificar algunas cosas en el análisis de supervivencia, oprimiendo la pestaña de la parte inferior de esta ventana Opciones… DocuWeb fabis.org 2 de 11 Cómo hacer “paso a paso” un Análisis de Supervivencia con SPSS para Windows. fabis.org, 2007 Podemos señalar “Tablas de supervivencia” y otros estadísticos, como la “Media y mediana de supervivencia” y los “Cuartiles”. También podemos obtener diferentes gráficas, como puede verse en la imagen, siendo lo habitual señalar “Supervivencia”. El resultado que se obtiene -en nuestro ejemplo- es la siguiente salida de SPSS: Kaplan-Meier Survival Analysis for TSuperviv (Tiempo de supervivencia en meses) Time Status 7 9 9 12 12 12 12 13 14 16 18 19 19 23 23 24 24 24 24 24 25 26 27 29 29 30 32 33 33 34 35 35 35 35 35 36 38 41 51 54 54 57 60 67 70 72 78 80 83 87 89 muerte muerte muerte muerte muerte muerte censura censura censura muerte censura muerte muerte muerte censura muerte muerte muerte muerte censura censura censura muerte censura censura censura censura censura censura muerte muerte muerte censura censura censura muerte censura muerte censura muerte censura muerte censura muerte muerte censura muerte censura censura censura censura DocuWeb fabis.org Cumulative Survival ,9821 Standard Error ,0177 ,9464 ,0301 ,8929 ,0413 ,8739 ,0446 ,8350 ,8156 ,0504 ,0528 ,7360 ,0608 ,7144 ,0628 ,6879 ,0658 ,6350 ,0706 ,6048 ,0734 ,5729 ,0761 ,5392 ,0788 ,5033 ,0813 ,4646 ,4259 ,0838 ,0853 ,3833 ,0867 Cumulative Events 1 2 3 4 5 6 6 6 6 7 7 8 9 10 10 11 12 13 14 14 14 14 15 15 15 15 15 15 15 16 17 18 18 18 18 19 19 20 20 21 21 22 22 23 24 24 25 25 25 25 25 Number Remaining 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 3 de 11 Aguayo Canela, Mariano 92 98 120 139 139 DocuWeb fabis.org censura censura censura censura censura 25 25 25 25 25 4 3 2 1 0 En esta primera tabla la columna de la izquierda (Time) es el tiempo durante el cual los diferentes individuos están en seguimiento, ordenados por tiempos crecientes. La segunda columna (Status) nos indica si se ha producido el efecto o desenlace evaluado o no, en nuestro caso etiquetados como “muerte” (en caso contrario aparece el valor “censura”, que corresponde a los perdidos o retirados durante el seguimiento y a los que al final del periodo de estudio seguía sin tener el evento, esto es, estaban vivos). La siguiente columna (Cumulative survival) es la supervivencia acumulada, o proporción de casos para los que no ha tenido lugar el evento en cada tiempo. La siguiente columna (Estándar error) es el error estándar correspondiente a la estimación puntual de Kaplan-Meier en cada tiempo. La quinta columna (Cumulative events) son los desenlaces acumulados, esto es, los que han muerto hasta ese tiempo. La última columna (Number remaining) es el número de sujetos que quedan en cada momento sin que haya ocurrido en ellos el evento final o desenlace evaluado, y representan los individuos que “están a riesgo en el siguiente periodo”. Seguidamente el programa SPSS nos informa del número total de sujetos evaluados (Number of cases), del número de censurados (Censored) y el número de desenlaces (Events). Si se lo hemos marcado nos dará los valores del tiempo medio de supervivencia y de la mediana de supervivencia (el tiempo en el que el 50% de los sujetos siguen sin haber desarrollado el evento), con sus correspondientes errores estándar y los intervalos de confianza al 95%, señalándonos que el estudio está limitado por el periodo máximo de seguimiento (en nuestro ejemplo 139 meses). Number of Cases: 56 Survival Time Mean: 76 (Limited to 139) Median: 67 Value Standard Error 25,00 . . Censored: Events: 31 25 Standard Error 9 (55,36%) 95% Confidence Interval (59 ; 93) 17 Percentiles 50,00 67,00 16,51 (35 ; 99) 75,00 24,00 5,24 Y luego nos muestra la Curva de Supervivencia, un gráfico que puede modificarse situándonos sobre el con el botón izquierdo del ratón (editar). En él se sitúa en la ordenada la supervivencia acumulada en términos de probabilidad (entre 0 y 1), y el tiempo de supervivencia en el eje de abscisas, permitiéndonos responder a preguntas como… - ¿Cuántos sujetos con cáncer colorectal sobreviven más de dos años? Trazaríamos una línea vertical desde el tiempo 24 meses y en el punto donde DocuWeb fabis.org 4 de 11 Cómo hacer “paso a paso” un Análisis de Supervivencia con SPSS para Windows. fabis.org, 2007 corte a la curva leeríamos en horizontal el valor que le corresponde en el eje de ordenadas (daría aproximadamente el 74%). Función de supervivencia 1,0 Supervivencia acum 0,8 0,6 0,4 Función de supervivencia 0,2 Censurado 0,0 0 20 40 60 80 100 120 140 Tiempo de supervivencia en meses 2. Pasos a dar para comparar dos o más curvas de supervivencia. Para comparar dos o más curvas de supervivencia se emplean diversos test de hipótesis que plantean como hipótesis nula que los grupos que se comparan tienen igual supervivencia, siendo la más empleada la del Log-Rank, que tiene en cuenta las diferencias de supervivencia entre los grupos en todos los puntos que dura el seguimiento. Para mostrar el procedimiento en el programa SPSS emplearemos la misma base de datos anterior y usaremos la variable categórica “Dosis radioterapia pre-operatoria” para definir dos grupos (los pacientes que recibieron menos de 5.000 rads y los que recibieron 5.000 ó más rads, codificados con “0” y “1” respectivamente). Intentaremos responder a la pregunta ¿fueron diferentes las supervivencias de ambos grupos? O lo que es lo mismo: ¿influyó significativamente la dosis de radioterapia pre-operatoria en la supervivencia de los sujetos con cáncer colorectal? Igual que en el paso anterior, se activa la secuencia Analizar > Supervivencia > Kaplan-Meier… y se colocan las dos variables fundamentales en sus respectivas ventanas de selección (“Tiempo” y “Estado”). Ahora hay que seleccionar la variable que separará dos grupos de pacientes y colocarla en la ventana “Factor”. En nuestro ejemplo la variable “Dosis de radioterapia pre-operatoria”. DocuWeb fabis.org 5 de 11 Aguayo Canela, Mariano DocuWeb fabis.org Debemos asegurarnos de que la variable que hemos establecido como factor de comparación es categórica. En la pestaña Comparar factor… seleccionamos el estadístico de contraste “Log rango” (y por defecto se activará la opción “Combinada sobre los estratos”. La salida del programa es la siguiente: Survival Analysis for TSuperviv Tiempo de supervivencia en meses Factor DosisRadiot = Menos de 5.000 rads Time Remaining 7 20 9 19 12 18 12 17 19 16 23 15 24 14 24 13 24 12 24 11 29 10 34 9 41 8 54 7 72 6 78 5 Status Cumulative Survival Standard Error Cumulative Events muerte ,9524 ,0465 1 muerte ,9048 ,0641 2 muerte 3 muerte ,8095 ,0857 4 muerte ,7619 ,0929 5 muerte ,7143 ,0986 6 muerte 7 muerte 8 muerte 9 muerte ,5238 ,1090 censura 10 10 muerte ,4714 ,1100 11 muerte ,4190 ,1095 12 muerte ,3667 ,1076 13 censura muerte DocuWeb fabis.org Number 13 ,3056 ,1056 14 6 de 11 Cómo hacer “paso a paso” un Análisis de Supervivencia con SPSS para Windows. fabis.org, 2007 80 censura 14 83 censura 14 92 censura 14 139 censura 14 139 censura 14 4 3 2 1 0 Number of Cases: 21 Survival Time Mean: 62 (Limited to 139) Median: 34 Censored: 7 Standard Error 12 (33,33%) Events: 14 95% Confidence Interval (39 ; 86) 7 (21 ; 47) Primero aporta datos del grupo establecido por la categoría “0” de la variable “Dosis de Radioterapia Pre-operatoria”, y enseguida los del grupo definido por la categoría “1”. Survival Analysis for TSuperviv Tiempo de supervivencia en meses Factor DosisRadiot = Igual o superior a 5.000 rads Time Remaining 9 34 12 33 12 32 13 31 14 30 16 29 18 28 19 27 23 26 24 25 25 24 26 23 Status Cumulative Survival Standard Error Cumulative Events muerte ,9714 ,0282 1 muerte ,9429 ,0392 2 censura 2 censura 2 censura 2 muerte ,9114 ,0489 censura muerte 3 3 ,8789 ,0570 4 censura 4 censura 4 censura 4 censura 4 DocuWeb fabis.org Number 7 de 11 Aguayo Canela, Mariano DocuWeb fabis.org 27 muerte ,8407 ,0661 5 29 censura 5 30 censura 5 32 censura 5 33 censura 5 33 censura 5 35 muerte 6 35 muerte 35 censura 7 35 censura 7 35 censura 7 36 muerte 38 censura 8 51 censura 8 54 censura 8 57 muerte 60 censura 67 muerte ,4958 ,1338 10 70 muerte ,3966 ,1390 11 87 censura 11 89 censura 11 98 censura 11 120 censura 11 22 21 20 19 18 17 16 ,7418 ,0878 7 15 14 13 12 ,6800 ,0999 8 11 10 9 8 ,5950 ,1182 9 7 9 6 5 4 3 2 1 0 Number of Cases: 35 Survival Time Mean: (Limited to Median: 74 120) 67 Censored: 24 Standard Error 10 9 (68,57%) Events: 11 95% Confidence Interval (55 ; 94) (50; 84) A continuación, el programa ofrece el resultado del contraste de hipótesis Log Rank: DocuWeb fabis.org 8 de 11 Cómo hacer “paso a paso” un Análisis de Supervivencia con SPSS para Windows. fabis.org, 2007 Survival Analysis for TSuperviv Tiempo de supervivencia en meses Total Number Number Percent Events Censored Censored DosisRad 33,33 DosisRad 68,57 Menos de 5.000 rads 21 14 7 Igual o superior a 5.000 rads 35 11 24 56 25 31 Overall 55,36 Test Statistics for Equality of Survival Distributions for DosisRadiot Statistic 2,68 Log Rank df 1 Funciones de supervivencia Dosis de radioterapia preoperatoria 1,0 Igual o superior a 5.000 rads Supervivencia acum 0,8 Menos de 5.000 rads Igual o superior a 5.000 radscensurado 0,6 Menos de 5.000 radscensurado 0,4 0,2 0,0 0 20 40 60 80 100 120 Tiempo de supervivencia en meses DocuWeb fabis.org 140 Significance 0,1018 Como podemos ver, el programa nos ofrece primero una tabla de distribución con el número total de sujetos, fallecidos (eventos), censurados y su correspondiente porcentaje respecto al total en cada grupo de “DosisRad” y en la muestra total, para seguidamente aportar el contraste estadístico Log Rank, con el valor del estadístico (2,68), los grados de libertad (1, en nuestro caso, al ser dos grupos los que se comparan) y el valor “p” asociado al contraste (0,1018), que corresponde a una 9 de 11 Aguayo Canela, Mariano DocuWeb fabis.org probabilidad que no nos permite rechazar la hipótesis nula, esto es, concluiríamos diciendo que no hay diferencias estadísticamente significativas en la supervivencia de ambos grupos. A continuación el programa nos ofrece el gráfico con las curvas de supervivencia de ambos grupos. Como puede apreciarse hay una separación entre ambas curvas de supervivencia, a favor del grupo de mayor dosis de radioterapia (“parecen sobrevivir más”), pero el test estadístico Log Rank ya hemos visto que no alcanza el valor crítico para rechazar la H0 de “no hay diferencias” en la supervivencia globalmente considerada. Si miramos con más detalle el gráfico, comprobaremos como al principio (entre el primero y el quinto año) si parecen separarse las curvas de supervivencia, pero no hay demasiada diferencia a partir de los 60 meses de seguimiento. Anexo 1. Tabla de datos de pacientes “ca colorectal” Nº paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 T Supervivencia (meses) 9 12 12 13 14 16 18 19 23 24 25 26 27 29 30 32 33 33 35 35 35 35 35 36 38 51 54 57 60 67 70 DocuWeb fabis.org Estado 1 1 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 0 0 1 0 1 1 Dosis Radioterapia preoperatoria 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 10 de 11 Cómo hacer “paso a paso” un Análisis de Supervivencia con SPSS para Windows. 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 DocuWeb fabis.org 87 89 98 120 7 9 12 12 19 23 24 24 24 24 29 34 41 54 72 78 80 83 92 139 139 fabis.org, 2007 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0 1 0 0 0 0 0 0 = censura 0 = menos de 5000 rads 1 = muerte 1 = 5000 rads ó más 11 de 11