• No se han encontrado resultados

Análisis de datos

In document CÁNCER DE MAMA Y METÁSTASIS ÓSEAS (página 94-99)

B. Criterios de exclusión

3. Análisis de datos

El estudio descriptivo de las variables, dependientes e independientes, se realizó mediante un análisis de distribución de frecuencias (%) para las variables categóricas, y medidas de tendencia central (media y mediana) y de dispersión (mínimo, máximo y desviación estándar) para las variables cuantitativas. También se ha realizado el análisis de normalidad en la distribución de los valores de las variables continuas (Kolmogorov-Smirnov y Shapiro-Wilk).

Para el análisis bivariante entre variables categóricas se usaron la prueba exacta de Fisher, el test U-Mann Whitney y regresión logística simple.

72

Análisis de supervivencia

Para el estudio de los factores que determinan la supervivencia de las pacientes incluidas en nuestra serie se consideraron tres variables dependientes:

1. Tiempo de supervivencia global (SG), o tiempo desde el diagnóstico del cáncer de mama hasta la muerte de la paciente

2. Tiempo de supervivencia libre de enfermedad (SLE), que incluye el tiempo comprendido desde el diagnóstico inicial hasta la aparición de metástasis y/o recidiva locorregional.

3. Tiempo de supervivencia post-recaída (SPR), que incluye el tiempo desde el diagnóstico de la primera recaída en evolución hasta el fallecimiento de la paciente

Con el propósito de estudiar el tiempo transcurrido desde el diagnóstico del tumor hasta el evento de interés que, en este caso, es la muerte de pacientes con cáncer de mama, se utilizan distintos métodos estadísticos de estimación de la supervivencia.

En primer lugar, se ha usado el método de Kaplan-Meier que consiste en el cálculo de la probabilidad de sobrevivir un tiempo determinado y se representa mostrando la curva de supervivencia de Kaplan-Meier, que no es creciente, sino que decrece cuando se producen eventos o se mantiene constante cuando no los hay.

Para estudiar la supervivencia en dos o más grupos de pacientes, además de ajustar el modelo de Kaplan-Meier por la variable en cuestión, se puede efectuar un test estadístico que compare los grupos o categorías de dicha variable. En este caso, para ver la supervivencia en los distintos grupos de edad establecidos, se ha utilizado el test log-rank, cuya hipótesis nula establece la igualdad en la supervivencia de los diferentes grupos etarios. A partir de dicha hipótesis, y en cada momento en que se produce al menos un evento, se calculan los eventos esperados en cada uno de los grupos, de forma que, para cada momento de fallo, se tienen los eventos observados y esperados en cada uno de los grupos. Sumando ambos, para cada momento del tiempo, se obtiene una suma de eventos observados y esperados en cada grupo de comparación y, a partir de ellos, se construye el estadístico de contraste

73

k 2 k k 1

2 1 1

E ) E O ... ( E

) E O

( 

 

donde O y i E representan las sumas de los valores observados y esperados, i respectivamente, de cualquier grupo, y k es el número de grupos a comparar. Este estadístico sigue una chi-cuadrado con k1 grados de libertad.

También se ha empleado el modelo de Cox o modelo de riesgos proporcionales, que es un método de regresión para análisis de supervivencia que permite no sólo la comparación entre grupos, función ya efectuada mediante el test log-rank, sino el cálculo de las razones de riesgos instantáneos entre cualquier pareja de grupos y/o individuos. Dicho modelo se formula como:

) t ( e

) t

( 

1X1 ... pXp

0

donde (t) es el riesgo instantáneo (hazard) de ocurrencia del evento.

El modelo de Cox tiene dos componentes: la función 0(t), llamada función de riesgo base (baseline hazard function), que depende del tiempo y no contiene ningún parámetro a estimar, y el componente eX donde están los parámetros  a estimar. Por tanto, este modelo es semi-paramétrico.

Los parámetros del modelo se estiman por un método de verosimilitud parcial y los coeficientes se interpretan en términos de logaritmo de cociente de riesgos instantáneos, por lo que las exponenciales de las estimaciones de los parámetros serán estimaciones de los cocientes de riesgos instantáneos.

La supervivencia tratada hasta ahora se denomina supervivencia absoluta, puesto que estudia el periodo de tiempo desde el diagnóstico hasta la muerte de la paciente, sea cual sea el motivo de ésta. Ante el desconocimiento de la causa de muerte y con el objetivo de estimar la mortalidad debida exclusivamente al cáncer de mama, se ha

74 llevado a cabo la denominada supervivencia relativa que no es más que la supervivencia absoluta corregida por la mortalidad en la población de la que provienen las pacientes.

Para ello, previamente se han construido las tablas de vida necesarias, a partir de las poblaciones y defunciones de la región geográfica correspondiente en los años que abarca el estudio, es decir, desde el primer diagnóstico hasta la última fecha de seguimiento (muerte o último contacto). Una vez construidas y transformadas, se ha usado el modelo de Pohar-Perme, que calcula, para cada momento del tiempo en el que se produce al menos un evento, la probabilidad de sobrevivir a ese tiempo, de forma equivalente al modelo de Kaplan-Meier con la supervivencia absoluta.

Para comparar la supervivencia relativa en dos o más grupos de pacientes y calcular las razones de riesgos instantáneos entre cualquier pareja de grupos, se ha utilizado un modelo aditivo que nos proporciona ambas informaciones, como hiciera el modelo de Cox para la supervivencia absoluta.

En todos los casos se considera que existen diferencias estadísticamente significativas cuando se obtienen valores de p<0,05 y tendencia a la significación estadística para p≤0,1, como propone Greenland (Greenland, 1989).

El análisis y tratamiento estadístico de los datos se realizó mediante el paquete informático SPSS (Statistical Package for the Social Sciences Inc., Chicago, Illinois, USA) versión 20.0 para Windows, aunque también se efectuaron cálculos con el programa estadístico R, versión 2.15.1. Para el estudio de la supervivencia relativa, se ha utilizado el paquete relsurv.

Análisis de regresión logística

Se realizó un análisis multivariante de regresión logística binaria para estimar las variables predictoras tanto de la presencia de metástasis en el momento del diagnóstico inicial del cáncer de mama como del desarrollo de recaídas a lo largo de la evolución.

El modelo matemático de regresión logística se construye en base a probabilidades, que se obtienen considerando la probabilidad de que ocurra un suceso determinado p(y) en relación con la dependencia de que dicha probabilidad no ocurra 1-p(y).

75 La probabilidad proporciona predicciones consistentes de los resultados en términos de “Odds” del evento y=1.

p (y) Odds (y=1)= ---

1- p(y)

El modelo de regresión logística múltiple relaciona la probabilidad de que ocurra un determinado suceso en función de k variables independientes. Como los coeficientes del modelo logístico no tienen restricciones éstos son fácilmente interpretables en términos de independencia o asociación entre variables.

Una vez estimados los coeficientes del modelo, se tiene que verificar si éste predice de manera adecuada la variable dependiente. Para evaluar la bondad del modelo se utiliza el logaritmo del cociente de verosimilitud y la prueba de Hosmer-Lemeshow.

La interpretación de los resultados obtenidos se realiza a partir de los coeficientes del modelo. Para ello basta tener en cuenta que si el modelo es significativo, pero además se debe analizar el grado de asociación estadística que existen en sus parámetros. Si:

- β1 > 0 el factor de riesgo será mayor que 1 y p (X1, X2…, Xk; β) aumentará - β1 < 0 el factor de riesgo será menor que 1 y p (X1, X2…, Xk; β) disminuirá - β1 = 0 la variable X1 no ejerce ningún efecto sobre la probabilidad de riesgo Si el modelo de regresión logística es significativo y una de las variables independientes es dicotómica con valores 0 y 1, el número eβi es el número de veces que aumenta la probabilidad de que ocurra el suceso por cada unidad de aumento de la variable independiente.

Para controlar potenciales efectos confusores, los modelos fueron secuencialmente ajustados por edad, tamaño tumoral y afectación ganglionar.

76

In document CÁNCER DE MAMA Y METÁSTASIS ÓSEAS (página 94-99)