“ANÁLISIS DE SUPERVIVIENCIA El análisis de supervivencia se utiliza cuando la variable dependiente representa un periodo de tiempo entre un suceso inicial y el evento final. El análisis de supervivencia (survival análysis) tiene por objeto conocer el efecto de una variable independiente cuando la variable dependiente puede expresarse en términos de tiempo hasta que se 'dá determinado suceso'. Es decir, dada una variable cuyos valores corresponden al tiempo que transcurre hasta que ocurre un determinado suceso final, el objetivo del análisis es estimar, en función del tiempo, la probabilidad de que ocurra dicho suceso. Origen y breve historia El análisis de supervivencia originalmente se aplicó en Medicina con tablas de mortalidad, de ahí proviene la denominación y terminología que vamos a utilizar. Posteriormente se aplicó al estudio de la resistencia de materiales de ingeniería militar. Otros ejemplos de aplicación pueden ser el estudio del tiempo que se permanece empleado en la misma empresa, el tiempo de permanencia en la Universidad, el tiempo desde la boda al primer hijo, etc. Conceptos fundamentales Para poder realizar un análisis de supervivencia es encesario: 1.- Que se dé un evento inicial (origen) 2.- Que el evento final ocurra después del inicial 3.- Que el evento final sólo pueda ocurrir una vez Uno de los problemas del análisis de supervivencia es que las observaciones pueden no comenzar en el mismo momento para todas las unidades de análisis y así mismo puede que el final del periodo de observación no se disponga tampoco, de información completa de otras por abandonos, etc... De este modo el análisis de supervivencia debe de trabajar con datos incompletos, esto da lugar a que en un mismo análisis encontremos diferentes tipos de observaciones 1.- Datos censados (censored observations) son aquellos en los que se ha producido el suceso inicial 1.1.- Supervivientes el evento final no se ha dado mientras ha durado la observación 1.2.- Abandonos (withdrawn) o mortalidad experimental, producida por causas ajenas a la investigación (cambio de domicilio o hospital, fallecimiento accidental, pérdida de contacto, etc. 2.- Fallecimiento (death) evento final Así el Análisis de Supervivencia se estructura en tres periodos: 1.- Origen: momento en que un individuo es incluido en el análisis 2.- Última observación: momento en que un individuo abandona, o se pierde su pista por causas ajenas a la investigación 3.- Evento final: fallecimiento 4.- Cierre del estudio: momento en que finaliza el periodo de observación para proceder al análisis de datos 5.- Tiempo de participación: intervalo comprendido entre desde el origen hasta la última observación Fases en el Análisis de Supervivencia 1.- Construcción y análisis de la Tabla de Supervivencia En esta tabla se exponen diversas informaciones descriptivas sobre la evolución de las observaciones 1.- Tiempo inicial de cada intervalo: aparece el límite inferior de cada intervalo de tiempo 2.- Número de entradas en cada intervalo: cantidad de observaciones en cada intervalo 3.- Abandonos: casos que no han llegado al final del periodo debido al abandono (mortalidad experimental) y no a causa de producirse el evento terminal (fallecimiento) 4.- Número de observaciones expuestas a riesgo: número de entradas menos la mitad de abandonos 5.- Número de eventos terminales: es decir, fallecimientos 6.- Proporción de eventos terminales: proporción de supervivencia 7.- Proporción de supervivencia 8.- Funciones de supervivencia y sus errores típicos 9.- Mediana del tiempo de supervivencia Funciones de supervivencia 1.- Proporción de supervivencia acumulada al final del intervalo: ésta se obtiene al multiplicar la proporción de supervivencia del intervalo anterior por la proporción terminal del intervalo en cuestión 2.- Probabilidad de densidad: es la probabilidad estimada por unidad de tiempo del evento terminal que ocurre en el intervalo 3.- Proporción de azares la estimación de la probabilidad por unidad de tiempo de que los casos que entran en el intervalo experimentarán el evento terminal en este intervalo Existen fundamentalmente dos técnicas para el cálculo de las funciones de supervivencia 1.- Método actuarial de Berkson y Gage éste es más adecuado cuando el número de observaciones es grande ya que la función de supervivencia se estima dividiendo el rango del tiempo de observación en intervalos. Si el número de observaciones fuera pequeño, al agrupar los teimpos de observación en intervalos, algunos de ellos podrían quedar vacíos; en dicho caso el método adecuado sería el de Kaplan y Maier, que estima la función de supervivencia para cada uno de los tiempos de observación 2.- Método del producto de Kaplan y Meyer Puntuación de supervivencia La puntuación de supervivencia (survival score) se calcula para cada individuo comparando su tiempo de supervivencia con todas las demás observaciones. La puntuación se inicia con el cero y se incrementa en uno para cada observación cuyo tiempo de supervivencia es inferior; y se disminuye en uno para cada observación cuyo tiempo sea superior. Los abandonos se consideran superiores. Las observaciones con el mismo tiempo de supervivencia no producen cambio en la puntuación. Las puntuaciones de supervivencia se utilizan en comparaciones para determinar si existen diferencias significativas entre grupos en términos de supervivencia. En el siguiente apartado se expone un ejemplo de comparación de grupos en base a la puntuación de supervivencia Comparación de grupos A veces interesa comparar el índice de supervivencia de los diferentes grupos que pueden formarse al estar las unidades de análisis sujetas a diferentes circunstancias, (ej. diferentes tipos de tratamiento de pacientes de una determinada enfermedad, etc...) La prueba de significación que se utiliza en este caso se utiliza el estadístico D, que se calcula a partir de las puntuaciones de supervivencia utilizando el algoritmo de Lee y Desu (1972). La D se distribuye asintóticamente como una ji-cuadrado con K-1 grados de libertad, siendo k el número de grupos. La hipótesis nula sostiene que los grupos proceden de la misma población. Si la jicuadrado, derivada de la D, supera el intervalo de confianza se rechaza la hipótesis nula, con un grado de significación p. Un ejemplo mediante el procedimiento actuarial y Kaplan-Meier Formulación del problema Dada una muestra de N individuos se conoce: 1.- Si se ha producido o no un suceso final en un periodo de tiempo 2.- objetivo del análisis: obtener una función de t cuyos valores proporcionen la probabilidad de que el suceso final no ocurra hasta un periodo de tiempo superior o igual a t o, equivalente, si denominamos fallecer a la ocurrencia del suceso final y sobrevivir a la no ocurrencia, se trata de obtener una función cuyos valores proporcionen la probabilidad de sobrevivir, el menos, hasta el instante t. 3.- Variables: • T Tiempo de observación • Z variable dicotómica cuyos valores indican ocurrencia o no del suceso final • REAPARICI: Reaparición de la sintomatología ulcerosa. Valores: Si y No codificados numéricamente como 1 y 2, respectivamente • RESPUEST: Tiempo de respuesta al tratamiento de la sintomatología ulcerosa • TABACO: El paciente ha dejado de fumar. Valores Si y No, codificados respectivamente, como 1 y 2. • TIEMPO: Tiempo transcurrido desde la respuesta al tratamiento y la última revisión antes del cierre del estudio ( en semanas, con el método Actuarial, y en días, con el Kaplan-Meier) Las diferentes situaciones con las que podemos encontrarnos: • Que en la última sesión antes del cierre del estudio la sintomatología ulcerosa hubiera aparecido, siendo el tiempo transcurrido desde la respuesta al tratamiento yla reaparición igual a ti. En dicho caso, el valor de Reaparic sería = 1y el tiempo de observación coincidiría con el tiempo de reaparición TIEMPO =t. • Que en la última revisión antes del cierre del estudio la sintomatología ulcerosa no hubiera a parecido, siendo el tiempo observacional = t. En dicho caso el valor REAPARIC será igual a 2 y el de TIEMPO igual a t. En esta situación, se desconoce si la sintomatología habría reaparecido con el supuesto caso de que el tiempo de observación hubiera sido mayor A partir de esta información, el objeto es estimar, para cada uno de los distintos tiempos de observación t y en cada uno de los ocho grupos, la probabilidad de que la sintomatología ulcerosa no aparezca hasta transcurrido un periodo de tiempo como mínimo igual a t desde la respuesta al tratamiento. Método actuarial Al solicitar el análisis y dado que existen dos variables independientes las posibles combinaciones de sus respectivas categorías dan como resultado ocho tablas. El tiempo de observación se encuentra dividido en 8 intervalos de 8 semanas días Interpretación (Tabla primera tiempo de respuesta 4 a 8 semanas y no ha dejado de fumar): Obsérvese que en esta tabla, correspondiente al conjunto de pacientes que han dejado de fumar y cuyo tiempo de respuesta al argumento coincide con el mínimo obtenido, la probabilidad estimada de que la sintomatología ulcerosa no reaparezca hasta pasadas, al menos, 40 semanas desde la respuesta al tratamiento es igual a 1. A partir de las 48 semanas dicha probabilidad se reduce prácticamente a la mitad. Sin embargo, en la última tabla correspondiente al conjunto de pacientes que no han dejado de fumar y cuyo tiempo de respuesta coincide con el máximo obtenido, aunque la probabilidad estimada de la sintomatología ulcerosa no aparezca, hasta al menos, 16 semanas es alta, a partir de las 24 semanas dicha probabilidad disminuye significativamente. Además la mediana del tiempo de reaparición de la sintomatología, es decir, del tiempo en el que se espera que la sintomatología haya reaparecido al menos para la mitad de los pacientes es igual a 49,5 y a 19,47 semanas, en el primer y en el segundo grupo de pacientes, respectivamente. Luego parece que, tal y como se sospecha, el tiempo de respuesta al tratamiento y el abandono o no del hábito de fumar influyen en el tiempo de reaparición de la sintomatología ulcerosa. Junto con la función de supervivencia, la tabla de cálculo proporciona dos funciones más: la función de densidad de probabilidad y la función de riesgo. Las tres funciones son matemáticamente equivalentes, en el sentido de que, conocido el valor de una cualquiera de las tres, el de las dos restantes puede ser calculado mediante una expresión matemática. Los errores estándar de los valores estimados se disponen a continuación de la mediana, si consideramos que éstos son una medida del error cometido en la estimación, cuanto menor sea su valor más precisa será la estimación del valor de la función correspondiente. Concretamente, dado que el error estándar de los valores estimados de la función de supervivencia son pequeños, podemos concluir que las estimaciones son bastante precisas. Comparación de la supervivencia en distintos grupos de individuos Interpretación Representación gráfica” Este tema corresponde al capítulo del mismo título que encontrareis en el texto de FERRÁN ARANAZ MAGDALENA SPSS para Windows Programación y Análisis Estadístico McGraw-Hill Madrid 1996 También podiís completarlo con R. BISQUERRA ALZINA Introducción Conceptual al Análisis Conceptual Multivariable. Un enfoque informático con los paquetes SPSS_X, BMDP, LISREL, y SPAD. Vol II. Barcelona, 1989