Modelaci ´ on Bayesiana de datos multinivel en enfermedad

One-level ordinary regression models assume independence of the observations that make up a group, but this is almost always not the case. The increase in the type 1 error rate results from not taking into account the units of the highest level and only taking into account the measurements of the lowest level where the response variable is measured (there is an underestimation of the standard errors that make the parameters significant make when in reality it is not).

Indice de Cuadros

Cap´ıtulo 1

Planteamiento del problema

Enfermedad periodontal
Descripci ´ on del problema
Objetivos
Antecedentes

Por el contrario, la bolsa periodontal produce destrucción del tejido periodontal subyacente. Se ajustaron cuatro modelos multinivel, dos modelos donde la variable dependiente fue la reducción de la profundidad de sondaje (PD) y dos modelos donde la variable dependiente fue la reducción de la evaluación clínica de la pérdida de inserción (CAL). Las estimaciones del modelo de reducción de la EP mostraron que SURG + amoxicilina (AMOX) + metronidazol (MET) + tetraciclina (TET) tuvieron estimaciones de valor absoluto significativas mayores a los 6 meses, lo que sugiere que esta terapia produce una mayor reducción de la EP durante todo el período de estudio en comparación con raspado y alisado radicular (SRP).

La prueba de razón de verosimilitud para este modelo y el modelo de intersección aleatoria (con dos grados de libertad) fue igual a 40,18 (p < 0,001).

Cap´ıtulo 2

Material y m ´etodos

Modelos multinivel

Modelos multinivel de dos niveles
Modelos multinivel de tres niveles
Supuestos de los modelos multinivel
Estimaci ´ on de modelos multinivel
Modelos lineales generalizados multinivel (MLGM)

Ahora se considera un modelo de dos niveles con dos variables independientes en el nivel uno, x1 con un efecto fijo α1, que no difiere entre grupos, y x2 con un efecto aleatorio. En la ecuación anterior, tanto β0j como β2j dependen de una variable independiente de nivel dos, w1, y uqj es la desviación del efecto de la variable w1 sobre yij en el grupo j con respecto al efecto medioγq0,q= 0,1. Sustituir los efectos aleatorios βqj en yij produce el modelo de ecuación única.

En la primera ecuación, β0jk es la intersección aleatoria de nivel 1 que varía entre los grupos de nivel 2, es decir es la media de y del grupoj y es la varianza residual en el nivel 1 con respecto a β0jk. En la segunda ecuación, γ00 es la intersección aleatoria de nivel 2 que varía entre las unidades de nivel 3, y u0jk es la variación residual del grupo j con respecto a γ. Nuevamente, Y es el vector de mediciones de la variable dependiente, ˜ninguno de los efectos aleatorios dados por el vector, Z es la matriz de diseño de los efectos aleatorios dada por el vector ν, y e es el vector de errores residuales de nivel 1.

La dimensión del vector depende del número de coeficientes aleatorios en la ecuación de nivel uno; por ejemplo, en la ecuación 2.7 la dimensión es dos. De manera similar, la dimensión del vector v depende del número de coeficientes aleatorios en la ecuación de nivel dos; por ejemplo, en la ecuación 2.8 la dimensión es cuatro. Considerando el modelo de dos niveles de la ecuación 2.4, la probabilidad se define como:

Inferencia Bayesiana

Estimaci ´ on Bayesiana
Cadenas de Markov Monte Carlo
Evaluaci ´ on y comparaci ´ on de modelos

Definición 2.2.1 La distribución de probabilidad conjunta del parámetro θ y datos de la forma sí. Dado que la distribución previa es un factor en la distribución posterior, una distribución previa informativa tendrá una mayor influencia en la estimación de la distribución posterior. Cualquier característica de la distribución posterior (momentos, cuantiles, regiones de alta densidad posterior, etc.) se puede escribir en términos de una expectativa posterior.

El método más utilizado para obtener medias, medianas y cuantiles de la distribución posterior es utilizar la cadena de Markov Monte Carlo. Definición 2.2.4 La integración de Monte Carlo es un método de simulación que consiste en obtener muestras aleatorias θs de la distribución deseada p(θ|y) y estimar la expectativa de cualquier función onh(θ) as. El burn-in de un MCMC es el número de iteraciones a eliminar, de modo que el residual exhiba un comportamiento de muestras que depende de la distribución estacionaria ϕ(·) [7].

Es decir, el subvectorj en la iteración ont, denotado como θtj, se toma como muestra de la distribución condicional p(θj|θ−jt−1, y), donde θt−1−j representa todos los componentes de θ, excepto θj en sus valores. . 23],. Cualquier análisis bayesiano debe incluir una verificación de la adecuación del ajuste del modelo postulado a los datos. La estimación bayesiana LOO-CV del ajuste predictivo fuera de muestra es lppdloo−cv=.

Metodolog´ıa de los modelos multinivel

Estrategia de construcci ´ on de modelos multinivel

Si las variables zl explican la variabilidad de y, el modelo 2.30 debería ser mejor que el modelo 2.29. Nuevamente, se asumiría que todas las variables independientes de tercer nivel son estadísticamente significativas. Las variables independientes de primer nivel que no tienen una pendiente significativa pueden tener una pendiente aleatoria significativa.

Este paso y el siguiente deben realizarse con cuidado, ya que el modelo puede fácilmente sobreparametrizarse y/o tener problemas como falta de convergencia o cálculos extremadamente lentos. Si el Modelo 2.31 no es mejor que el Modelo 2.30, se detiene el procedimiento para especificar un modelo multinivel de tres niveles. La estimación de las pendientes aleatorias de las variables de segundo nivel debe realizarse variable por variable, y luego todas las variables con una pendiente aleatoria significativa deben incluirse en el modelo para estimar la mejora relativa al Modelo 2.31.

Agregue interacciones entre las variables independientes de nivel tres y las variables independientes de nivel uno y nivel dos que tuvieron una varianza de pendiente significativa en los Pasos 5 y 6. Al explicar las varianzas de las pendientes aleatorias en términos de variables contextuales, el modelo incluye automáticamente términos de interacción entre niveles que componen la parte fija del modelo. Cuando se trata de un MLGM, la metodología cambia ligeramente, es decir, en lugar de definir modelos en términos de y, los modelos se definen en términos de g(μijk) = g(E[Yijk|ν , u ]), y residual Los errores a nivel individual ya no se especifican.

Cap´ıtulo 3

Resultados

Estimaci ´ on Bayesiana

Distribución a priori: Se define como el producto de distribuciones marginales a priori para cada componente de β en el Modelo 2.17. β se compone de la media general, los efectos principales y las interacciones: ξ000, ξq00, ξ0m0, ξ00l, ξ0ml, ξq0l. , ξqm0, ξqmly todos tenían a priori N(0,102). Modelo estudiado: Se estudió un modelo lineal generalizado multinivel de tres niveles, donde i representó las unidades del nivel uno, j las unidades del nivel dos y k las unidades del nivel tres. La comparación de los modelos 3.1 y 3.2, utilizando LOO-CV, muestra que el modelo que incluye variables de nivel uno es mejor (penúltima fila y columna 5 en la Tabla 3.2).

Hay siete variables contextuales de nivel tres (Tabla 3.1). Antes de especificar el modelo que contiene solo las variables significativas de nivel tres, se realizó una selección directa de variables para evitar un modelo sobreparametrizado. La Tabla 3.3 muestra el procedimiento de selección de variables donde cada modelo contiene la variable de nivel 1, sangrado, y la variable de nivel 2, movilidad. La comparación de modelos LOO-CV indica que el modelo que incluye las variables de cálculo y humo es el mejor.

Nuevamente, este modelo se comparó con el Modelo 3.4 usando el criterio LOO-CV, y el mejor modelo es el Modelo 3.5 con pendientes aleatorias (penúltima fila y columna 11 en la Tabla 3.2). La ecuación 3.6 tiene una interacción entre el cálculo de la variable de tercer nivel y la sangría de la variable de nivel uno. Las columnas 12 y 13 del Cuadro 3.2 muestran que la interacción no es significativa (su intervalo de credibilidad contiene cero).

Discusi ´ on

La Figura 3.3 muestra la distribución posterior de los parámetros y las trazas de MCMC para el Modelo 3.5. Se muestra que las cadenas se mezclan bien, lo que indica convergencia a la distribución posterior. Los datos replicados se representan en un color claro y los datos observados se representan en negro.

Debido a que ambas curvas coinciden muy bien, la densidad posterior predictiva se ajusta muy bien a la distribución de profundidad de sondaje. La distribución normal no era en absoluto una suposición apropiada para examinar la profundidad. De manera similar, los pacientes fumadores tenían, en promedio, una profundidad de sondaje 0,98 mm mayor que la de los pacientes no fumadores.

Se pueden obtener resultados e interpretaciones diferentes midiendo las variables independientes en niveles diferentes a los dados en este análisis. Todos los modelos tienen la estructura: log(μij|k) =ξ000+α1bleeding1ijk+ξ010mobility1jk+var1 +var2+var3+ (ν00k+u0jk) donde var1 es la variable independiente que produce el mejor ajuste entre los siete modelos con una variable independiente. De manera similar, var2 es la segunda variable independiente que produce el mejor ajuste entre los seis modelos que tienen var1.

Cap´ıtulo 4

Conclusiones

Una propuesta fue utilizar LOO-CV bayesiano entre diferentes pasos para comparar modelos. También se podría utilizar el criterio de información de desviación (DIC) en lugar del LOO-CV bayesiano.

Bibliograf´ıa

Multilevel analysis of clinical parameters in chronic periodontitis after root planing/scaling, surgery, and systemic and local antibiotics: 2-year results. Individual and contextual determinants of periodontal health in 12-year-old students in a Brazilian capital city. A multilevel analysis of factors influencing pocket probing depth in patients who respond differently to periodontal treatment.

1. An ´alisis univariado

2. Glosario de periodoncia