4. Material y Método
4.4 Metodología estadística aplicada
Las variables cualitativas se describen como cantidades exactas y porcentaje. Las cuantitativas como media y desviación estándar (DE).
La asociación o independencia entre variables cualitativas se ha realizado con el test de la ji al cuadrado, agrupando filas y columnas si los efectivos esperados eran menores de 5 en las casillas de la tabla ó el test exacto de Fisher.
La comparación entre medias se realizó con la prueba t de Student para grupos independientes ó la prueba U de Mann-Whitney si las condiciones de normalidad (aplicación del test de Kolmogorov-Smirnoff o de Shapiro Wilks) no se cumplían. Si la comparación entre medias eran más de dos, se utilizó el análisis de la varianza de una vía ó la prueba no paramétrica de Kruskal-Wallis si la variable no seguía una distribución normal. A continuación, si resultaba significativa la diferencias de medias, se aplicó el contraste a posteriori de Bonferroni para determinar entre qué pares de medias se mostraba la relación significativa.
Con el fin de determinar que variables pudieran influir en la aparición de DM al año de seguimiento (variable dependiente), en vez de análisis de supervivencia, ya que se analizaron 60 expuestos (a HGST) y 60 no expuestos que completaron los criterios de inclusión, en los cuales no se pudo determinar la fecha exacta de aparición del principal evento (diagnóstico de DM) y sin incluir en el análisis pérdidas de ningún tipo, elaboramos tres modelos de regresión logística 90 con fines predictivos, en el que las variables independientes incluidas en cada uno de ellos corresponderían a aquellas variables relevantes que fueran potenciales factores de riesgo y que tuvieran una buena justificación teórica, así como que no superaran el número de 11, ya que con un número superior las estimaciones podrían resultar inestables e imprecisas (cuando el número de participantes en el estudio es relativamente pequeño, como es nuestro caso, es recomendable que este número “n” sea >10q, siendo “q” el número de variables a introducir) (91). Cuando alguna variable presentaba tres o más categorías, se creaban variables ficticias (variables dummy) que se comparaban respecto a una categoría de referencia. En todos los modelos se han incluido el sexo, la edad y la presencia de HGST en UCI.
Así las variables introducidas en los diferentes modelos considerados han sido:
1.- Modelo con variables relacionadas con el tratamiento seguido durante su estancia en UCI: edad, sexo, HGST, respiración espontánea, tipo de ventilación, soporte hemodinámico, puntuación Apache II, administración de dobutamina y noradrenalina, días que precisó ventilación y días de estancia en UCI.
2.- Modelo relacionado con el diagnóstico y evolución: edad, sexo, HGST, diagnóstico por el que el paciente ingresó en UCI, administración de transfusión, tipo de nutrición, complicaciones sobrevenidas en UCI, insuficiencia renal, días de estancia en planta y días de estancia total en el hospital.
3.- Modelo relacionado con los factores de riesgo cardiovascular (FRCV) del paciente a su ingreso en UCI: edad, sexo, HGST, presencia de FRCV, dislipidemia, hipertensión arterial, estado de fumador, índice de masa corporal, número de FRCV asociados y antecedentes familiares de 1º grado de diabetes.
En todos los modelos, los criterios de inclusión y exclusión (por pasos) de las variables en cada modelo se realizó con la prueba de razón de verosimilitud, estableciendo en la inclusión un valor de P < ó = 0,05 y de exclusión P > ó = 0,10. El proceso iterativo para el cálculo de los parámetros B, obtenidas por el método de la máxima verosimilitud, se detiene cuando dos estimaciones sucesivas de los parámetros B (BCON) presentaron cambios inferiores a 0,0001. Se ha desactivado dos estimaciones sucesivas del logaritmo de la función de verosimilitud (LCON [0]).
Los modelos se han fijado después de explorar las variables dependientes con los métodos de inclusión secuencial y exclusión secuencial, con el procedimiento de exclusión secuencial (backward elimination). Las variables seleccionadas en los modelos finales no obedecían exclusivamente a criterios de P sino que permanecían en el modelo si producía un cambio importante en el resto de coeficientes91.
Una vez aplicados los modelos, se elegiría aquel que presentara una mejor calibración y una mejor discriminación. La calibración de los modelos se ha realizado con la prueba de Hosmer y Lemeshow y la discriminación, la cual evalua la capacidad del modelo para distinguir los sujetos que presentarán DM al año de los que no, valorando la sensibilidad, especificidad y la medida global del poder de discriminación del modelo mediante la valoración del área contenida bajo la curva ROC (Receiver Operating Characteristic)92. Una vez obtenido este modelo, con las variables incluidas en él se pueden realizar predicciones y clasificar a los pacientes en aquellos que desarrollarán DM y los que no mediante la elaboración de una ecuación de predicción.
La ecuación de regresión obtenida permite estimar la probabilidad de observar el diagnóstico de DM según las variables predictoras incluidas en cada uno de los modelos y se interpretan como incidencias acumuladas. La razón de odds en nuestro caso se llama razón de odds de riesgo y podría interpretarse como una estimación del riesgo relativo si la incidencia DM tuviera una baja frecuencia.
La proporción de incertidumbre de los datos que es explicada por los modelos se ha valorado con el índice de Nagelkerke.
Dado que el supuesto básico del modelo es la linealidad, ya que la presencia de colinealidad (alta correlación múltiple entre las variables independientes incluidas en el modelo) provoca coeficientes inestables, valoramos este supuesto en el análisis de residuales mediante la medida de la tolerancia (aparece colinealidad si su valor es inferior a 0,01) y del factor del incremento de la varianza o VIF (Variance inflation factor), cuyo valor debe ser igual o inferior a 1093.
De cada modelo se exponen las variables que resultaron significativas o aquellas que mejoran el poder predictivo del modelo, los coeficientes B, la odds ratio, su intervalo de confianza y el grado de significación.
En los contrastes de hipótesis, el nivel máximo de error alfa (aceptar como cierta la hipótesis alternativa cuando en realidad lo es la hipótesis nula) se fijó en igual ó menos del 5%. El análisis de los datos se ha realizado con el software SPSS (SPSS para Windows, (7), SPSS Inc. Chicago, IL).