ANÁLISIS DE SUPERVIVENCIA
TEMA VI
Análisis de Supervivencia. En Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias de la Salud. Coruña:
Netbiblo. Páginas 247-273.
LECTURA OBLIGATORIA
TÉRMINOS QUE DEBES DOMINAR
Estudios de mortalidad/seguimiento
Período de Seguimiento
Tablas Kaplan-Meier
Probabilidad de Supervivencia
Media y Mediana de Supervivencia
Curva de Supervivencia
Función de Supervivencia
Test Log Rank
Regresión de Cox
Hazard
Hazard Ratio
Modelos Multivariantes 4
Orígenes en el ámbito médico, en los llamados estudios de mortalidad, cuyo objetivo era predecir el tiempo que un paciente con una enfermedad terminal podría mantenerse con vida, pudiendo estudiarse también el posible efecto de distintos tratamientos.
Hoy en día se utiliza en contextos tan variados como el militar, la ingeniería, la industria, la psicología o la economía.
Gracias a su utilización los investigadores pueden estimar para intervalos de tiempo determinados la probabilidad que tiene un paciente de recaer de una determinada patología, de que se produzca el alta médica o el tiempo que va a tardar en ser eficaz un tratamiento…; cualquier evento que nos interese modelizar y/o pronosticar.
pon EJEMPLOS
¿En qué consiste?
Modelos Multivariantes 5
La supervivencia viene a ser una medida del tiempo que transcurre hasta una respuesta de interés: recaída, alta médica, manifestación de los primeros síntomas de una determinada enfermedad, etc.
Cuando se trata de enfermedades graves, el análisis de supervivencia deriva en la estimación de probabilidades de mantenerse con vida durante determinados períodos de tiempo, informando así del grado de severidad de la enfermedad, algo que menudo se desconoce.
ESTUDIOS DE SEGUIMIENTO. Muchas veces el investigador no puede manipular, ni controlar las variables objeto de estudio, ni tampoco a los sujetos que participan en él, sino que dispone de información relativa a sus
“pacientes” a lo largo de un determinado período de tiempo, que ni siquiera es el mismo para todos.
¿En qué consiste?
Trabajamos en una UAD y a lo largo de dos años hemos seguido a 100 sujetos, de los cuales sabemos que algunos han llegado a abandonar su adicción, mientras que otros no lo han hecho o bien desconocemos qué ha sucedido con ellos realmente, bien porque han traslado su residencia o porque han dejado de venir a la consulta.
Si el período de registro comprende un total de 24 meses, es probable que dispongamos de datos “incompletos” para alguno de los sujetos, bien porque causan baja o bien se incorporan más tarde. Como consecuencia, cada sujeto posee un tiempo de registro o seguimiento particular y una información específica respecto a la variable de interés (si ha abandonado su adicción o no, o si ni siquiera lo sabemos.
Durante el período de registro es probable que algunos sujetos no hayan sufrido el evento de interés, mientras que otros sí, y es probable también que a algunos sujetos le hayamos perdido la pista.
EJEMPLO
ESQUEMA GENERAL
El análisis trabaja con información parcial (casos “censurados”)
1 2 ..
.
n
Período de estudio
evento
evento evento
sale (censurado)
muere por otra causa (censurado)
evento
Fin
ESQUEMA GENERAL
Paciente
Inicio
VARIABLES
EXPLICATIVAS
TiTieemmppoo hasta que ocurre un evento
RESPUESTA DE CENSURA
Para indicar si se ha producido o no el evento (incluidos aquellos casos que han salido del estudio en el transcurso de éste)
Cuya influencia sobre la Respuesta se desea estudiar
• Tiempo desde la
intervención hasta la muerte
• Tiempo libre de enfermedad o hasta recaída
• Sesiones de terapia hasta el alta
• Tiempo hasta acción del fármaco, rehabilitación, etc.
• Tiempo hasta desarrollo de una enfermedad
•Incumplimiento terapéutico
•Pérdida del seguimiento
•Efectos secundarios
•Violaciones al protocolo
•Diagnóstico al inicio
•Tipo de tratamiento
•Dosis
•Sexo
•Edad
•Nivel de deterioro
•Adherencia
•Apoyo familiar
VARIABLES IMPLICADAS
Lo verdaderamente interesante es que podemos aprovechar la información disponible de cada sujeto para estimar una función de supervivencia global que se derive en la elaboración de:
1. Tablas de Supervivencia, en las que se recoja la probabilidad de supervivencia para diferentes momentos.
2. Gráficos o Curvas de Supervivencia, donde se puede ver cómo evoluciona la probabilidad de supervivencia a lo largo del tiempo
3. Descriptivos de supervivencia (media, mediana y cuartiles).
4. Contrastes de supervivencia, para probar el posible efecto modulador de una VI.
5. Modelos de supervivencia, poniendo a prueba el efecto conjunto de varias VI o variables explicativas, identificando factores de riesgo y de protección.
POTENCIAL
Se trata más bien de supuestos teóricos y no tanto estadísticos.
SUPUESTOS de partida
DOS SUPUESTOS FUNDAMENTALES:
1. La censura debe tener un carácter aleatorio; no debe ser una censura informativa. Los datos censurados deben ser representativos de los datos no censurados. No debe existir relación entre las posibles fuentes de censura y las diferentes VI a considerar en el análisis.
2. Proporcionalidad. Los efectos de las VI deben ser constantes a lo largo del tiempo, sin mediar interacción alguna. Ello se traduce en que a nivel gráfico las funciones deben transcurrir paralelas.
Una vez garantizado el cumplimiento de dichas supuestos se procede al análisis, que comienzan por la elaboración de las denominadas tablas de supervivencia y las correspondientes curvas de supervivencia, junto con el cálculo de descriptivos.
La función de supervivencia estimada para dos grupos (p.ej.: con y sin tratamiento) puede ser comparada a través de un contraste estadístico (Log-Rank)
También puede ser modelizada, poniendo a prueba el posible efecto de distintas VI (Regresión de Cox).
La interpretación de los resultados consiste en conocer la probabilidad de supervivencia de un paciente en un momento o intervalo determinado, su tiempo de supervivencia medio, así como la ventaja o desventaja de poseer una
ANÁLISIS de datos
Para elaborar las tablas de supervivencia y las curvas de supervivencia se suele recurrir al MÉTODO DE KAPLAN-MEIER.
Dicho método calcula la supervivencia cada vez que un paciente experimenta el evento, generando las probabilidades en cada momento.
Las probabilidades de supervivencia se calculan a partir del número de pacientes en riesgo justo en el momento de producirse el evento.
P7, por ejemplo, sería la probabilidad condicional de supervivencia en el séptimo mes, habiendo sobrevivido los 6 anteriores.
TABLAS DE SUPERVIVENCIA
Tenemos que:
Pk es la probabilidad de sobrevivir el k-ésimo mes
rk es el número de casos en riesgo, es decir, que aun no han recaído justo antes del k-ésimo mes
fk es el número de eventos registrados el día k
Por lo que se podría estimar Pk a partir de la siguiente FÓRMULA:
Pk = Pk-1 [(rk - fk)/ rk]
EL CÁLCULO DE PROBABILIDADES
Para cada momento la Prob. de supervivencia se calcula multiplicando la supervivencia en el momento anterior por la tasa de supervivencia en dicho momento.
En el denominador tendríamos el nº de pacientes que continuaban en el estudio en el momento anterior (casos expuestos a riesgo) y en el numerador ese mismo valor menos el nº de pacientes que sufren el evento en ese momento.
Los valores de supervivencia se calculan
sólo
para aquellos momentos en los que algún sujeto sufre el evento. En el resto de momentos se asume que la Prob. de supervivencia es la misma que en el momento inmediatamente anterior.EL CÁLCULO DE PROBABILIDADES
EJEMPLO
Nº SUJETO TIEMPO DE SUPERVIVENCIA (MESES) RECAÍDA (0: NO - 1: SÍ)
1 8 1
2 5 0
3 10 1
4 7 1
5 24 0
6 8 1
7 24 0
8 24 0
9 8 1
10 12 0
11 22 1
12 14 1
13 2 1
14 3 1
15 24 1
16 7 0
17 14 1
18 2 1
19 3 1
20 16 1
21 9 1
22 12 1
23 9 0
SE ORDENAN LOS DATOS SEGÚN EL TIEMPO
TIEMPO DE SUPERVIVENCIA
(MESES) RECAÍDA
(0: NO - 1: SÍ) PROB SUPERVIVENCIA
2 1 0.916
2 1 0.916
3 1 0.833
3 1 0.833
5 0 0.833
6 1 0.789
7 0 0.745
7 1 0.745
8 1 0.605
8 1 0.605
8 1 0.605
9 1 0.559
9 0 0.559
10 1 0.508
12 0 0.457
12 1 0.457
14 1 0.343
14 1 0.343
16 1 0.286
22 1 0.228
24 1 0.171
24 0 0.171
24 0 0.171
24 0 0.171
PRIMERO: ordenar los sujetos en función del tiempo de supervivencia de cada uno.
SEGUNDO: calcular la probabilidad de supervivencia utilizando la fórmula Pk = Pk-1 [(rk - fk)/ rk]
Los dos primeros sujetos que sufren el evento (recaída), lo hacen a los dos meses, por lo que la probabilidad de supervivencia para el segundo mes se puede calcular de manera muy sencilla:
P2 = 1 (24 - 2)/ 24 = 0.916
EL CÁLCULO DE PROBABILIDADES
El cálculo del siguiente valor se hará de forma condicional, calculando una nueva proporción y multiplicándola por la probabilidad del momento anterior.
El cálculo de probabilidades para 3 y 6 meses sería:
P3 = 0.916 (22 - 2)/ 22 = 0.833 P6 = 0.833 (19 - 1)/ 19 = 0.789
NOTA: sólo es posible realizar los cálculos para aquellos momentos en los que se ha registrado la presencia del evento (2, 3, 6, 7 meses…). En aquellos momentos en los que no se haya registrado (5, 11 meses,…) se asume que la Prob. de supervivencia es la misma que en el momento anterior.
EL CÁLCULO DE PROBABILIDADES
Lo que se calcula de este modo es una función de probabilidad, que se materializa en una probabilidad condicional en diferentes momentos o períodos de tiempo.
La información puede recogerse en una Tabla Kaplan-Meier e ilustrarse en un gráfico o Curva de Supervivencia.
Se puede calcular también la Media, la Mediana y los cuartiles de Supervivencia .
EL CÁLCULO DE PROBABILIDADES
TABLA KAPLAN-MEIER
CURVA DE SUPERVIVENCIA
Más que los valores concretos de probabilidad, lo que debe centrar el interés del investigador a la hora de interpretar los resultados es la TENDENCIA OBSERVADA EN LA CURVA Y SU INCLINACIÓN, que informa de la aceleración que experimenta el tiempo con relación a la probabilidad de supervivencia del paciente.
EVOLUCIÓN de una enfermedad
¡El tiempo corre demasiado de prisa en algunas enfermedades!
CURVA DE SUPERVIVENCIA
También es posible realizar los cálculos para diferentes grupos, explorando así el efecto de una VI. Tendríamos tantas tablas y curvas de supervivencia como grupos se estableciesen en la VI.
Las media y medianas de supervivencia de cada uno de ellos podrían ser comparadas, al igual que las pendientes de las curvas, evaluando con ello su comportamiento diferencial.
A nivel estadístico, podríamos acudir a la prueba Log-Rank, para contrastar la hipótesis de igualdad de las funciones.
Si no se cumple el supuesto de PROPORCIONALIDAD: Breslow o Tarone-Ware
ANÁLISIS POR GRUPOS
ANÁLISIS POR GRUPOS
Tiem po Pro babilidad de Superviv encia 1
2 ....
5 6
0,70 0,50 ....
0,34 0,27
5 6 .... 7 12
0,66 0,89 0,78 ....
0,16 A
B
Permite com parar las curvas de supervivencia para distintos grupos
Tiem po (t)
Prob. supervivencia, S(t)
1
T ab las y G ráfic o s K ap lan -M eie r
0
ANÁLISIS POR GRUPOS
ANÁLISIS POR GRUPOS
Sin Cirugía (1) Con Cirugía (0)
EL TEST LOG-RANK
En la Regresión de Cox se intenta modelizar una Función de Riesgo o (Hazard) que se suele representar como t y que vendría a ser el riesgo de fallecer (recaer, …) en el momento “t”, obtenida a partir del seguimiento de un grupo de sujetos.
El modelo general podría ser expresado del siguiente modo:
REGRESIÓN DE COX
tX X
nX
nLn
1 1
2 2 ...
donde,
t es la función de riesgo o Hazard
es el valor de una constante que especifica el riesgo basal, en ausencia de cualquier factor o variable explicativa
Xn son las diferentes variables explicativas cuyo efecto pretende probarse
n son los pesos o coeficientes de regresión estimados para cada variable explicativa
REGRESIÓN DE COX
VIs
MÁXIMA VEROSIMILITUD CHI-CUADRADO
CONTRASTE DE WALD MÉTODO DE PASOS -2LL
No hay R
2¿SIMILAR A LA REGRESIÓN LOGÍSTICA?
El signo de los “B”
¿Aumenta ó disminuye el riesgo de que se produzca el evento (muerte, recaída, alta, etc.) bajo determinadas condiciones o niveles de la VI?.
Hazard Ratio (HR). SPSS los designa como Exp (B). Es un cociente (ODD) entre la Tasa de Riesgo (o Riesgo Relativo) para un sujeto bajo una
determinada condición (tratamiento “A”), frente a otra (tratamiento “B”), con el que se intenta representar el efecto de cada VI.
Interpretación del HR: Valores próximos a “1” indican que dicha VI no implica un cambio en la Tasa de Riesgo (numerador y denominador serían iguales).
Valores inferiores a “1” implican una disminución del riesgo y, por lo tanto, un aumento de la probabilidad de supervivencia, correspondiéndose con factores de protección y coeficientes B negativos. Valores superiores a “1”
se corresponderían con factores de riesgo y coeficientes B positivos.