Modelos de
regresión multinivel
Víctor
Abraira
Unidad
de
Bioestadística
Clínica
Marzo
2014
Objetivos
•
Conocer
los
fundamentos
y
posibilidades
de
aplicación
de los modelos de regresión multinivel en estudios de
de
los
modelos
de
regresión
multinivel
en
estudios
de
epidemiología
clínica
•
Aprender
a
aplicar,
con
Stata13,
los
modelos
de
regresión
multinivel
de
variable
dependiente
continua
y
dicotómica
e
interpretar
las
salidas
•
Revisar
algunas
publicaciones
seleccionadas
como
modelos
de
presentación
de
resultados
Programa
1ª
sesión
Introducción.
é
i
l
d l
l i i l?
¿en
qué
consisten
los
modelos
multinivel?
¿qué
problemas
resuelven?
Efectos
de
grupo.
Efectos
composicionales
y
contextuales
Modelo
básico
(“modelo
vacío”)
de
componentes
de
la
varianza
Estimación
con
Stata.
Modelo
de
dos
niveles
con
variable
dependiente
continua
y
pendientes
comunes
entre
grupos
Planteamiento.
Especificación
de
varios
tipos
de
modelos
Pull de datos
Pull
de
datos
Efectos
fijos
de
grupo
Efectos
aleatorios
en
el
término
independiente
Predicción
de
los
efectos
del
grupo
Ejercicios
con
Stata
V. Abraira - Bioestadística Clínica
3
Programa
2ª
sesión
Modelo
de
dos
niveles
con
variable
dependiente
continua
y
coeficientes
aleatorios
en
las
pendientes
Especificación e interpretación
Especificación
e
interpretación
Estrategia
de
especificación
del
modelo
Ejercicios
con
Stata
Discusión
de
casos
(artículos
publicados)
3ª
sesión
Modelo
de
regresión
logística
de
dos
niveles
El
Median
odds
ratio
(MOR).
Estimación
con
Stata
Interpretación.
Ejemplo
AUDIPOC
Generalizaciones:
Tres y más niveles
Tres
y
más
niveles
Clasificaciones
mixtas.
SMR
con
multinivel
Ejercicios
con
Stata
4ª
Sesión
Ejercicios
con
Stata
y
Discusión
de
casos
(artículos
publicados)
Sinónimos
•
Modelos
lineales
jerárquicos
d
t
t
d l
i
•
de
estructuras
de
la
covarianza
•
mixtos
(Stata)
•
para
datos
longitudinales
o
de
panel
•
de
componentes
de
error
•
de parámetros aleatorios
de
parámetros
aleatorios
•
…
es
un
caso
particular
de
los
modelos
lineales
generalizados
V. Abraira - Bioestadística Clínica
5
¿Para
qué?
•
Estructura
de
datos
jerárquica;
muestreo
lti tá i
multietápico
•
Los
individuos
pertenecen
a
grupos
y
los
de
un
mismo
grupo
comparten
características
–
pacientes,
médicos
–
medidas repetidas de un mismo paciente
medidas
repetidas
de
un
mismo
paciente
•
Estimar
los
efectos
de
los
diferentes
niveles
6
¿Qué
problemas
resuelven?
•
Manejan
la
falta
de
independencia
–
Estimación MCO ineficiente
–
Estimación
MCO
ineficiente
–
Significaciones
espurias
(ej.
10
pacientes,
a
cada
uno
le
medimos
mensualmente
durante
12
meses)
•
Evitan
falacias
por
interpretar
efectos
a
nivel
equivocado
–
Ecológica
(interpretar
datos
agregados
a
nivel
individual)
–
Atomística
(interpretar
datos
individuales
a
nivel
agregado)
V. Abraira - Bioestadística Clínica
7
Journal
of
Epidemiology
and
Community
Health
.
2001;
55:791
‐
798
.
¿Qué
problemas
resuelven?
•
Estiman
el
efecto
de
las
variables
“explicativas”
(
efectos fijos
) de ambos niveles incluyendo
(
efectos
fijos
)
de
ambos
niveles,
incluyendo
interacciones
entre
niveles
•
Estiman
qué
parte
de
la
variabilidad
no
“explicada”
(
efectos
aleatorios
)
es
imputable
a
cada
nivel
•
Manejan
eficientemente
datos
faltantes,
sin
imputación (diseños longitudinales)
imputación
(diseños
longitudinales)
V. Abraira – Bioestadística Clínica
8
Chakraborty
H,
Gu
H.
A
Mixed
Model
Approach
for
Intent
‐
to
‐
Treat
Analysis
in
Longitudinal
Clinical
Trials
with
Missing
Values.
Research
Triangle
Park,
NC:
RTI
Press
Efectos
del
grupo
•
Efectos
composicionales:
–
La
composición
de
los
grupos
no
es
aleatoria,
está
en
parte
condicionada
por
factores
asociados
con
el
outcome
(los
grupos
no
son
intercambiables)
•
Efectos
contextuales:
–
El
pertenecer
a
un
grupo
establece
diferencias
V. Abraira - Bioestadística Clínica
9
Efectos
de
grupo
•
¿Información
o
ruido?
–
A
veces,
el
muestreo
multietápico
se
hace
por
motivos
de
coste,
o
por
factibilidad
•
La
correlación
entre
observaciones
es
ruido
que
dificulta
el
análisis
–
Otras,
se
diseña
para
estudiar
el
fenómeno
multinivel
multinivel
•
La
correlación
es
información
Modelo
lineal
Modelo
multinivel
de
“efectos
aleatorios
de
grupo
0
1
2
0
ij
ij
j
j
ij
Y
x
z
u
en
la
constante
(
intercept
)”
efecto
aleatorio
del
grupo
j
en la constante
N
0
2
Efectos
fijos
0
j
0
u
0
j
ij
m
V. Abraira - Bioestadística Clínica
11
en
la
constante
N
0,
0
efecto
aleatorio
del
individuo
i
del
grupo
j
2
0,
N
2
0
2
2
0
Modelo
nulo
Modelo
multinivel
de
efectos
aleatorios
de
grupo
0
0
ij
j
ij
Y
u
en
la
constante,
sin
variables
explicativas
efecto
aleatorio
del
grupo
j
2
0
N
Anova de
1
vía
efectos
aleatorios
V. Abraira - Bioestadística Clínica
12
2
0
0,
N
efecto
aleatorio
del
individuo
i
del
grupo
j
2
0,
N
Ejemplo
1
Rendimiento
en
matemáticas
de
niños
ingleses
(nivel
1),
en
distintos colegios (nivel 2)
distintos
colegios
(nivel
2)
sector 7185 4931106 4999873 0 1 size 7185 1056.862 604.1725 100 2713 mathach 7185 12.74785 6.878246 -2.832 24.993 cses 7185 -5.75e-17 .660588 -3.650741 2.856078 ses 7185 -9.80e-18 .7793552 -3.758143 2.691857 female 7185 .5281837 .4992398 0 1 minority 7185 .274739 .4464137 0 1 cons 7185 1 0 1 1 student 7185 24.50814 15.20242 1 67 school 7185 5277.898 2499.578 1224 9586 Variable Obs Mean Std. Dev. Min Max
V. Abraira - Bioestadistica Clínica
13
u0_M1 7185 .1108788 2.71679 -7.40282 6.477807 meanses 7185 4.55e-17 .4135432 -1.194089 .8248391 cole 7185 79.96298 45.4351 1 160 alumno 7185 3593 2074.275 1 7185 himinty 7185 .2800278 .4490438 0 1 disclim 7185 -.1318694 .9439882 -2.416 2.756 pracad 7185 .5344871 .2511861 0 1 sector 7185 .4931106 .4999873 0 1Ejemplo
1:
¿Hay
efecto
colegio?
oneway mathach cole, tab
154 11 178552 6 923074 29 153 10.279632 7.2143938 19 Total 339876.934 7184 47.3102637 Within groups 274969.977 7025 39.1416338 Between groups 64906.9571 159 408.219856 10.43 0.0000 Source SS df MS F Prob > F Analysis of Variance Total 12.747853 6.8782457 7185 160 14.863695 6.4159995 59 159 11.089138 7.8779978 29 158 13.574657 6.4640023 35 157 10.355468 6.523218 47 156 15.270623 7.0669376 53 155 13.538754 5.8539039 57 154 11.178552 6.923074 292
0
2
2
0
j
j
n
Componente añadida
V. Abraira - Bioestadística Clínica
14
(evaluated at n=44.89)
Est. reliability of a cole mean 0.90412 Estimated SD within cole 6.256327 Estimated SD of cole effect 2.86748 0.17360 0.01849 0.13737 0.20983 correlation S.E. [95% Conf. Interval] Intraclass Asy.
loneway mathach cole
0
j
M S B
M S W
n
p
Modelo
multinivel
V. Abraira - Bioestadística Clínica
15
Modelo
multinivel
Salida
de
multinivel
vacio
mixed mathach || cole:, stddeviations
Mixed-effects ML regression Number of obs = 7185 Mixed effects ML regression Number of obs 7185 Group variable: cole Number of groups = 160 Obs per group: min = 14 avg = 44.9 max = 67
Wald chi2(0) = . Log likelihood = -23557.905 Prob > chi2 = . ---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---_cons | 12.63707 .2436178 51.87 0.000 12.15959 13.11455 --- Total 12.747853 6.8782457 160 14.863695 6.4159995 159 11.089138 7.8779978 158 13.574657 6.4640023 157 10.355468 6.523218 156 15.270623 7.0669376 155 13.538754 5.8539039 154 11.178552 6.923074 153 10.279632 7.2143938
0
0
ij
j
ij
Y
u
V. Abraira - Bioestadística Clínica
17
---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | sd(_cons) | 2.92464 .1826963 2.587615 3.305562 ---+---sd(Residual) | 6.256868 .0527937 6.154245 6.361202 ---LR test vs. linear regression: chibar2(01) = 983.92 Prob >= chibar2 = 0.0000
ated at n=44.89)
ility of a cole mean 0.90412 D within cole 6.256327 D of cole effect 2.86748 0.01849 0.13737 0.20983 S.E. [95% Conf. Interval] Asy.
Con
términos
fijos
P.e. del
niño:
sexo
y
ses y
del
colegio:
sector
y
tamaño
mixed mathach female ses size sector || cole:
Con
términos
fijos
0
1
2
0
ij
ij
j
j
ij
Y
x
z
u
Mixed-effects ML regression Number of obs = 7185 G i bl l N b f 160 Group variable: cole Number of groups = 160 Obs per group: min = 14 avg = 44.9 max = 67 Wald chi2(4) = 651.61 Log likelihood = -23275.08 Prob > chi2 = 0.0000 ---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---female | -1.201091 .1641199 -7.32 0.000 -1.52276 -.8794216 ses | 2.345177 .1050492 22.32 0.000 2.139284 2.55107 size | .0004972 .0002894 1.72 0.086 -.00007 .0010645 t | 2 37775 3633391 6 54 0 000 1 665619 3 089882
V. Abraira - Bioestadística Clínica
19
3 , 2 7 8 , 2 % 3 , 2 7 3 6 , 8 1 sector | 2.37775 .3633391 6.54 0.000 1.665619 3.089882 _cons | 11.67948 .4543243 25.71 0.000 10.78902 12.56994 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | var(_cons) | 3.270243 .4811775 2.450957 4.363392 ---+---var(Residual) | 36.80649 .6215722 35.60817 38.04513 ---LR test vs. linear regression: chibar2(01) = 292.62 Prob >= chibar2 = 0.0000
Cálculo
del
CCI
Cálculo
del
CCI
. estat icc
Residual intraclass correlation Residual intraclass correlation
---Level | ICC Std. Err. [95% Conf. Interval] ---+---cole | .0815995 .0111515 .0622422 .1062947
---V. Abraira - Bioestadística Clínica
21
0,347 0, 258 0,347
Práctica
con
Stata
V. Abraira - Bioestadistica Clínica
23
Programa
1ª
sesión
Introducción.
é
i
l
d l
l i i l?
¿en
qué
consisten
los
modelos
multinivel?
¿qué
problemas
resuelven?
Efectos
de
grupo.
Efectos
composicionales
y
contextuales
Modelo
básico
(“modelo
vacío”)
de
componentes
de
la
varianza
Estimación
con
Stata.
Modelo
de
dos
niveles
con
variable
dependiente
continua
y
pendientes
comunes
entre
grupos
Planteamiento.
Especificación
de
varios
tipos
de
modelos
Pull de datos
Pull de
datos
Efectos
fijos
de
grupo
Efectos
aleatorios
en
el
término
independiente
Predicción
de
los
efectos
del
grupo
Ejercicios
con
Stata.
Repasemos
el
modelo
•
Modelo
“pull
de
datos”:
Y
(asume
idéntica
estructura
entre
grupos)
•
Modelo
de
efectos
fijos
en
la
constante
(con
dummy
para
los
grupos)
•
Modelo multinivel
0
1
2
ij
ij
j
ij
Y
x
z
0
1
2
1 1
...
1
1
ij
j
ij
j
k
k
ij
Y
x
z
d
d
Modelo
multinivel
(asume
grupos
extraídos
al
azar
de
una
población
de
grupos)
V. Abraira - Bioestadistica Clínica
25
0
1
2
0
ij
ij
j
j
ij
Y
x
z
u
Pull,
multinivel
Adj R-squared = 0.1592 Residual 285651.407 7181 39.7787783 R-squared = 0.1595 Model 54225.5272 3 18075.1757 Prob > F = 0.0000 F( 3, 7181) = 454.39 Source SS df MS Number of obs = 7185regress
_cons 12.52113 .1308468 95.69 0.000 12.26463 12.77763 sector 1.96315 .1516053 12.95 0.000 1.665959 2.260341 ses 2.88413 .0974835 29.59 0.000 2.693034 3.075226 female -1.403538 .149424 -9.39 0.000 -1.696452 -1.110623 mathach Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 339876.934 7184 47.3102637 Root MSE = 6.307Adj R squared 0.1592
regress
---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---female | -1.204518 .1641914 -7.34 0.000 -1.526327 -.8827087 ses | 2.343935 .1050997 22.30 0.000 2.137943 2.549927 sector | 2.09957 .3275687 6.41 0.000 1.457547 2.741593
V. Abraira - Bioestadistica Clínica
26
mixed
_cons | 12.34793 .2352288 52.49 0.000 11.88689 12.80897 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | var(_cons) | 3.334901 .4897675 2.500775 4.447249 ---+---var(Residual) | 36.80888 .6216452 35.61042 38.04767 ---LR test vs. linear regression: chibar2(01) = 297.80 Prob >= chibar2 = 0.0000
Efectos
fijos
en
la
constante
. regres mathach female ses sector i.cole note: 160.cole omitted because of collinearity
Source | SS df MS Number of obs = 7185 + F(161 7023) = 13 77 ---+--- F(161, 7023) = 13.77 Model | 81558.568 161 506.574956 Prob > F = 0.0000 Residual | 258318.366 7023 36.7817694 R-squared = 0.2400 ---+--- Adj R-squared = 0.2225 Total | 339876.934 7184 47.3102637 Root MSE = 6.0648 ---mathach | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---+---female | -1.120932 .1699514 -6.60 0.000 -1.454088 -.7877759 ses | 2.154587 .1084604 19.87 0.000 1.941971 2.367202 sector | 3.327148 1.193584 2.79 0.005 .9873639 5.666932 | cole | 2 | 2.422861 1.502676 1.61 0.107 -.522838 5.368559 3 | 2 042482 1 244569 1 64 0 101 4 482213 3972492
V. Abraira - Bioestadística Clínica
27
3 | -2.042482 1.244569 -1.64 0.101 -4.482213 .3972492 4 | .4715783 1.578502 0.30 0.765 -2.622763 3.565919 5 | -1.091731 1.179238 -0.93 0.355 -3.403393 1.219931 156 | -.1385636 1.16088 -0.12 0.905 -2.414238 2.137111 157 | -.6087337 1.252587 -0.49 0.627 -3.064182 1.846715 158 | -.7743099 1.308213 -0.59 0.554 -3.338803 1.790183 159 | .3901225 1.433136 0.27 0.785 -2.419257 3.199502 160 | 0 (omitted) | _cons | 11.31946 .8913894 12.70 0.000 9.572068 13.06685
---……….
Multinivel,
GEE
---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---female | -1.204518 .1641914 -7.34 0.000 -1.526327 -.8827087 ses | 2.343935 .1050997 22.30 0.000 2.137943 2.549927 sector | 2.09957 .3275687 6.41 0.000 1.457547 2.741593Li k id tit Ob i 14 Group variable: cole Number of groups = 160 GEE population-averaged model Number of obs = 7185
mixed
|
_cons | 12.34793 .2352288 52.49 0.000 11.88689 12.80897 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | var(_cons) | 3.334901 .4897675 2.500775 4.447249 ---+---var(Residual) | 36.80888 .6216452 35.61042 38.04767 ---LR test vs. linear regression: chibar2(01) = 297.80 Prob >= chibar2 = 0.0000
V. Abraira - Bioestadistica Clínica
28
. _cons 12.35648 .223881 55.19 0.000 11.91768 12.79528 sector 2.092795 .3089145 6.77 0.000 1.487333 2.698256 ses 2.36694 .1050337 22.54 0.000 2.161078 2.572803 female -1.214257 .1640118 -7.40 0.000 -1.535715 -.8928001 mathach Coef. Std. Err. z P>|z| [95% Conf. Interval] Scale parameter: 39.92755 Prob > chi2 = 0.0000 Wald chi2(3) = 666.92 Correlation: exchangeable max = 67 Family: Gaussian avg = 44.9 Link: identity Obs per group: min = 14
Multinivel,
panel
---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---female | -1.204518 .1641914 -7.34 0.000 -1.526327 -.8827087 ses | 2.343935 .1050997 22.30 0.000 2.137943 2.549927 sector | 2.09957 .3275687 6.41 0.000 1.457547 2.741593| _cons | 12.34793 .2352288 52.49 0.000 11.88689 12.80897 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | sd(_cons) | 1.826171 .1340968 1.581384 2.10885 ---+---sd(Residual) | 6.067032 .0512314 5.967447 6.168279 ---LR test vs. linear regression: chibar2(01) = 297.80 Prob >= chibar2 = 0.0000
mixed, stddev
---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval]
+
V. Abraira - Bioestadística Clínica
29
---+---female | -1.204518 .164427 -7.33 0.000 -1.526789 -.882247 ses | 2.343935 .1071159 21.88 0.000 2.133992 2.553878 sector | 2.09957 .3276265 6.41 0.000 1.457434 2.741706 _cons | 12.34793 .2353565 52.46 0.000 11.88664 12.80922 ---+---/sigma_u | 1.826171 .1340967 1.581384 2.108849 /sigma_e | 6.067032 .0512314 5.967447 6.168279 rho | .0830739 .0113139 .0630497 .1075412 ---Likelihood-ratio test of sigma_u=0: chibar2(01)= 297.80 Prob>=chibar2 = 0.000
xtreg, mle
Y
…
•
Variables
agregadas
de
grupo,
p.e.
ses
medio
de
los niños del colegio
los
niños
del
colegio
•
Cuando
en
el
modelo
introducimos
una
variable
a
nivel
individual
y
también
el
promedio
del
grupo,
conviene
centrar
la
individual,
para
que
el
coeficiente
de
la
media
del
grupo
sea
el
efecto
de
la media del grupo sobre el rendimiento medio de
la
media
del
grupo
sobre
el
rendimiento
medio
de
los
individuos
(
coeficiente
de
regresión
entre
grupos
)
También
•
A
veces,
el
tamaño
del
grupo
es
una
variable
li ti
explicativa
•
Si
hay
missing,
el
%
de
missing.
Si
fuera
significativo
indicaría
que
los
missing
no
son
al
azar
V. Abraira - Bioestadistica Clínica
31
Ejemplo
Mixed-effects ML regression Number of obs = 7185 Group variable: cole Number of groups = 160 Obs per group: min = 14 avg = 44.9 67 max = 67
Wald chi2(5) = 805.65 Log likelihood = -23245.631 Prob > chi2 = 0.0000 ---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---cses | 2.152197 .1084602 19.84 0.000 1.939618 2.364775 meanses | 5.19679 .3503994 14.83 0.000 4.510019 5.88356 female | -1.194158 .1617788 -7.38 0.000 -1.511238 -.8770771 size | .0004089 .0002434 1.68 0.093 -.0000682 .000886 sector | 1.48491 .3216624 4.62 0.000 .8544635 2.115357 _cons | 12.19069 .3884165 31.39 0.000 11.42941 12.95197
V. Abraira - Bioestadística Clínica
32
---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | var(_cons) | 2.049609 .3304243 1.494329 2.811228 ---+---var(Residual) | 36.79069 .6209387 35.59358 38.02806 ---LR test vs. linear regression: chibar2(01) = 181.89 Prob >= chibar2 = 0.0000
Estimación
de
efectos
de
grupos
•
Una
vez
estimado
el
modelo,
se
pueden
d i l
f t
d
d
predecir
los
efectos
de
cada
grupo:
u
0j
•
A
partir
del
estimador
empírico
de
Bayes,
o
de
shrinkage,
para
la
media
del
grupo
que,
en
el
modelo
vacio,
es
la
media
de
las
medias
del
grupo
y
la
total,
ponderadas
por
la
“reliability”
g p y
, p
p
y
de
la
media
del
grupo
V. Abraira - Bioestadística Clínica
33
(
)
.
1
..
EB
j
j
j
j
Y
=
l
Y
+ -
l
Y
ˆ
0
..
EB
j
j
u
=
Y
-
Y
34
Con
Stata
twoway
(dropline
res_bay
cole)
0 2 4 P r. e . f o r co le : _ c o n s
V. Abraira - Bioestadística Clínica
35
-4 -2 BL U 0 50 100 150 cole
O
…
5 -1 0 -5 0
V. Abraira - Bioestadística Clínica
36
twoway
(scatter
res_bas
cole)
(rbar
ls_res_bay
li_res__bay
cole)
0 50 100 150
cole
Práctica
con
Stata
V. Abraira - Bioestadistica Clínica
37
Programa
2ª
sesión
Modelo
de
dos
niveles
con
variable
dependiente
continua
y
coeficientes
aleatorios
en
las
pendientes
Especificación e interpretación
Especificación
e
interpretación
Estrategia
de
especificación
del
modelo
Ejercicios
con
Stata
Discusión
de
casos
(artículos
publicados)
3ª
sesión
Modelo
de
regresión
logística
de
dos
niveles
El
Median
odds
ratio
(MOR).
Estimación
con
Stata
Interpretación.
Ejemplo
AUDIPOC
Generalizaciones:
Tres y más niveles
Tres
y
más
niveles
Clasificaciones
mixtas.
SMR
con
multinivel
Ejercicios
con
Stata
4ª
Sesión
Ejercicios
con
Stata
y
Discusión
de
casos
(artículos
publicados)
Efectos
aleatorios
en
las
pendientes
0
1
2
0
1
ij
ij
j
j
j
ij
ij
Y
x
z
u
u x
0
j
0
u
0
j
1
j
1
u
1
j
10 15 20 e d v a lu e s2
0
Var u
( )
0
V. Abraira - Bioestadística Clínica
39
0 5 Fi tt e -2 -1 0 1 2
Estatus socioeconomico del alumno (media cero global)
2
(
ij
)
Var
2
1
Var u
( )
1
01
Cov u u
( , )
0
1
Efectos
aleatorios
en
las
pendientes
•
Ahora
la
varianza
de
Y
condicionada
a
x
d
d d
l t t
í
t
depende
de
x,
y
por
lo
tanto,
varía
entre
individuos
•
Por
tanto,
la
correlación
intragrupo
depende
de
los
valores
de
las
x
y
es
diferente
entre
individuos
•
Como
el
modelo
supone
que
los
efectos
del
grupo,
(u
0j
+u
1j
x
j
)
dependen
de
x,
es
conveniente centrar
las
X
Ejemplo
•
El
efecto
de
la
condición
socioeconómica
del
iñ ¿i fl
b
l
di i
t
l
niño
¿influye
sobre
el
rendimiento
escolar
igual
en
todos
los
colegios?
•
Incluyamos
efecto
aleatorio
en
la
pendiente
01
ind:
s
=
0
0
1
...
0
1
ij
j
j
ij
Y
cses
u
u cses
V. Abraira - Bioestadística Clínica
41
01
2
2
0
1
ind:
0
exc:
ide:
am bos
s
s
=
s
mixed mathach cses || cole: cses, covariance(unstructured)
Salida
max = 67 avg = 44.9 Obs per group: min = 14
_cons 12.11705 .392702 30.86 0.000 11.34737 12.88673 sector 1.649098 .3251591 5.07 0.000 1.011798 2.286398 size .000405 .000246 1.65 0.100 -.0000772 .0008871 meanses 5.094703 .3542385 14.38 0.000 4.400408 5.788998 cses 2.155203 .1269245 16.98 0.000 1.906435 2.40397 female -1.183367 .161815 -7.31 0.000 -1.500519 -.8662157 mathach Coef. Std. Err. z P>|z| [95% Conf. Interval] Log restricted-likelihood = -23251.964 Prob > chi2 = 0.0000 Wald chi2(5) = 691.96 max 67
V. Abraira - Bioestadistica Clínica
42
LR test vs. linear regression: chi2(3) = 196.62 Prob > chi2 = 0.0000 var(Residual) 36.50946 .62255 35.30945 37.75026 cov(cses,_cons) .2612122 .2524898 -.2336587 .7560831 var(_cons) 2.145803 .3461413 1.564162 2.943729 var(cses) .6491731 .2739385 .283903 1.4844 cole: Unstructured Random-effects Parameters Estimate Std. Err. [95% Conf. Interval]
Pregunta
capciosa
•
¿Cuál
es
el
CCI
del
colegio?
–
Hay
uno
para
cada
valor
del
cses
–
Bien,
¿cuál
es
el
CCI
para
cses
=2?
2
2
2
0
j
j
1
j
var(
)
0
j
1
2
j
01
Eag
u
x u
Eag
x
x
2
LR test vs. linear regression: chi2(3) = 196.62 Prob > chi2 = 0.0000 var(Residual) 36.50946 .62255 35.30945 37.75026 cov(cses,_cons) .2612122 .2524898 -.2336587 .7560831 var(_cons) 2.145803 .3461413 1.564162 2.943729 var(cses) .6491731 .2739385 .283903 1.4844 cole: Unstructured
V. Abraira - Bioestadística Clínica
43
2
var("
col cses
"
2)
2,15 2
0, 65 2 2 0, 26
5, 79
5 , 7 9
1 3 , 7 %
5 , 7 9
3 6 , 5 1
Visualización:
Ejemplo
simulado
presión
arterial
y
diurético
2 0 14 0 40 60 80 10 0 1 2 0 1 diuretico pad 241 81.36483 15.06054 47.97024 118.1932 Variable Obs Mean Std. Dev. Min Max -> diuretico = 1
pad 259 91.91502 15.31825 56.84752 130.3824 Variable Obs Mean Std. Dev. Min Max -> diuretico = 0
0
1
i
i
i
Y
x
_cons 91.91502 .9441463 97.35 0.000 90.06001 93.77002 diuretico -10.55018 1.359928 -7.76 0.000 -13.22209 -7.878282 pad Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 128871.39 499 258.259299 Root MSE = 15.195 Adj R-squared = 0.1060 Residual 114976.123 498 230.875749 R-squared = 0.1078 Model 13895.2673 1 13895.2673 Prob > F = 0.0000 F( 1, 498) = 60.19 Source SS df MS Number of obs = 500Hay
distintos
médicos
12 0 14 00
1
0
ij
ij
j
ij
Y
x
u
pad Coef Std Err z P>|z| [95% Conf Interval] 40 60 80 10 0 0 1 diuretico
LR test vs. linear regression: chibar2(01) = 407.24 Prob >= chibar2 = 0.0000 sd(Residual) 9.888966 .3146099 9.291173 10.52522 sd(_cons) 12.91875 4.594445 6.434247 25.9384 medico: Identity Random-effects Parameters Estimate Std. Err. [95% Conf. Interval] _cons 90.97059 5.810326 15.66 0.000 79.58256 102.3586 diuretico -8.590804 .893535 -9.61 0.000 -10.3421 -6.839508 pad Coef. Std. Err. z P>|z| [95% Conf. Interval]
V. Abraira - Bioestadística Clínica
45
Efecto
aleatorio
en
la
pendiente
12 0 14 0
0
1
0
1
ij
ij
j
j
ij
ij
Y
x
u
u x
60 80 10 0 0 1 diureticoCorr>0
Corr<0
j
j
j
j
j
j
LR test vs. linear regression: chi2(3) = 402.48 Prob > chi2 = 0.0000 sd(Residual) 10.13664 .3224896 9.523876 10.78883 corr(diuret~o,_cons) .9999992 .0003431 -1 1 sd(_cons) 11.32102 4.062396 5.603293 22.87325 sd(diuret~o) 3.732735 1.673439 1.55032 8.987378 medico: Unstructured Random-effects Parameters Estimate Std. Err. [95% Conf. Interval] _cons 91.14343 5.100366 17.87 0.000 81.1469 101.14 diuretico -6.330363 1.906372 -3.32 0.001 -10.06678 -2.593943 pad Coef. Std. Err. z P>|z| [95% Conf. Interval]
V. Abraira - Bioestadística Clínica
46
LR test vs. linear regression: chi2(3) = 163.85 Prob > chi2 = 0.0000 sd(Residual) 10.11895 .3232188 9.504872 10.77269 corr(diuret~o,_cons) -.9831189 .0267974 -.9992617 -.6719174 sd(_cons) 10.70564 3.863978 5.277027 21.71882 sd(diuret~o) 7.707722 2.916992 3.671033 16.18318 medico: Unstructured Random-effects Parameters Estimate Std. Err. [95% Conf. Interval] _cons 92.07354 4.835521 19.04 0.000 82.59609 101.551 diuretico -11.99255 3.566427 -3.36 0.001 -18.98262 -5.002477 pad Coef. Std. Err. z P>|z| [95% Conf. Interval]
Efecto
aleatorio
en
la
pendiente
12 0 14 0 12 0 14 0 40 60 80 10 0 0 1 diuretico 60 80 10 0 0 1 diuretico 12 0 ---pad | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---diuretico | -10.02766 2.524844 -3.97 0.000 -14.97626 -5.079059Corr>0
Corr<0
V. Abraira - Bioestadística Clínica
47
40 60 80 10 0 No Sí diuretico diuretico | 10.02766 2.524844 3.97 0.000 14.97626 5.079059 _cons | 88.77174 3.118113 28.47 0.000 82.66035 94.88313 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---medico: Unstructured | sd(diuret~o) | 5.309061 1.897168 2.63539 10.69524 sd(_cons) | 6.839591 2.253758 3.585463 13.04713 corr(diuret~o,_cons) | .1714171 .4772095 -.6586935 .8133184 ---+---sd(Residual) | 9.540705 .3047652 8.961691 10.15713 ---LR test vs. linear regression: chi2(3) = 226.30 Prob > chi2 = 0.0000
Corr
0
48
Efectos
aleatorios
49
Contrastes
•
Cada
coeficiente
de
la
parte
fija,
con
la
t
con
l
1
g.l=n
niv
‐
nvar
niv
‐
1.
•
Un
subconjunto
o
todo
el
modelo,
con
test
LR
(en
las
salidas
tenemos
los
LR
test
para
las
partes
fija
y
aleatoria).
•
Stata permite guardar parámetros de modelos
Stata
permite
guardar
parámetros
de
modelos
(estimates
store
B
)
para
luego
hacer
el
test
(lrtest
A
B
).
Métodos
de
estimación
•
Asumiendo
normalidad
de
todas
las
variables
aleatorias
u
u
•
Hay
dos
métodos
de
estimación:
máxima
verosimilitud
(ML)
y
máxima
verosimilitud
restringida
(REML).
•
ML
da
estimadores
sesgados
porque
no
ajusta
por
los
g.l.
perdidos
al
estimar
los
coeficientes
fijos.
•
REML
da
estimaciones
insesgadas
pero
no
permite
comparar
u
0
j
,
u
1
j
,...,
ij
modelos
con
distintas
partes
fijas
con
test
basados
en
la
deviance
V. Abraira - Bioestadistica Clínica
51
Especificación
de
los
modelos
•
La
especificacion
del
modelo
es
más
compleja
l
d l
i i l
que
en
los
modelos
uninivel
•
Hay
que
decidir
las
variables
fijas
y
sus
interacciones
•
Qué
variables
tienen
pendiente
aleatoria
•
La estructura de var cov
•
La
estructura
de
var
‐
cov
•
No
hay
receta
Consejos
•
Parsimonia
•
Buscar
apoyo
en
la
teoría.
•
No
hacer
demasiada
“minería”
de
datos
•
Pensar
en
qué
efectos
queremos
contrastar
(nuestra
hipótesis)
V. Abraira - Bioestadistica Clínica
53
Lecturas
•
J
Antimicrob
Chemother
2011;
66
:
210–215.
–
¿qué
se
entiende
del
apartado
de
análisis?
–
Estructura
del
“data
set”
y
especificación
del
modelo
–
¿cómo
se
estimó
el
efecto?
–
Relación
entre
fig
g y
2
y
tabla
2
Lectura
•
J
Epidemiol
Community
He
alth
2001;
55
:791
‐
798
798.
–
¿qué
se
entiende
del
apartado
de
análisis?
–
¿cuántos
modelos
se
estiman?
especificación
de
los
modelos
–
¿qué
se
estima/compara?
–
¿cómo?
V. Abraira - Bioestadistica Clínica
55
Programa
2ª
sesión
Modelo
de
dos
niveles
con
variable
dependiente
continua
y
coeficientes
aleatorios
en
las
pendientes
Especificación e interpretación
Especificación
e
interpretación
Estrategia
de
especificación
del
modelo
Ejercicios
con
Stata
Discusión
de
casos
(artículos
publicados)
3ª
sesión
Modelo
de
regresión
logística
de
dos
niveles
El
Median
odds ratio
(MOR).
Estimación
con
Stata
Interpretación.
Ejemplo
AUDIPOC
Generalizaciones:
Tres y más niveles
Tres
y
más
niveles
Clasificaciones
mixtas.
SMR
con
multinivel
Ejercicios
con
Stata
4ª
Sesión
Ejercicios
con
Stata
y
Discusión
de
casos
(artículos
publicados)
Modelo
de
regresión
logística
•
Generalizamos
el
modelo
lineal,
mediante
l f
ió
l
i
li k
la
función
logit
como
link
.
•
En
lugar
de:
•
El
modelo
vacio:
•
Ahora
no
hay
varianza
residual
(
ij
)
porque
l
i
d l bi
i l l fij l
j
0
0
j
logit P
u
0
0
ij
j
ij
Y
u
la
varianza
de
la
binomial
la
fija
la
probabilidad
(
pq
).
V. Abraira - Bioestadistica Clínica
57
Ejemplo
•
Prescripción
de
estatinas
en
Suecia:
datos
de
32345
personas
en
274
centros
de
salud.
Variable
|
Obs
Mean
Std.
Dev.
Min
Max
‐‐‐‐‐‐‐‐‐‐‐‐‐
+
‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
estatina
|
32345
.756964
.4289233
0
1
idpaciente
|
32345
16173
9337.342
1
32345
idcentrosa~d
|
32345
128.3587
77.01913
1
274
Modelo
nulo
Integration method: mvaghermite Integration points = 7 Wald chi2(0) = . Log likelihood = -16931.104 Prob > chi2 = .
---estatina | Coef. Std. Err. z P>|z| [95% Conf. Interval]
V. Abraira - Bioestadística Clínica
59
melogit estatina || idcentrosalud:
---+---_cons | 1.110215 .0535458 20.73 0.000 1.005267 1.215162 ---+---idcentrosalud | var(_cons)| .6485884 .0700788 .5248055 .8015672 ---LR test vs. logistic regression: chibar2(01) = 2011.91 Prob>=chibar2 = 0.0000
Con
más
efectos
fijos
Integration method: mvaghermite Integration points = 7 Wald chi2(5) = 55.10 Log likelihood = -16905.755 Prob > chi2 = 0.0000
---estatina | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---hombre | .0157781 .0331935 0.48 0.635 -.04928 .0808363
| i |
V. Abraira - Bioestadistica Clínica
60
pais | Low-income economies | .0588525 .2153503 0.27 0.785 -.3632263 .4809314 Lower_middle_income_economies | .0991961 .0689634 1.44 0.150 -.0359696 .2343619 Higher_middle_income_economies | -.2040344 .0747628 -2.73 0.006 -.3505668 -.057502 | privado | -.6593854 .0989402 -6.66 0.000 -.8533047 -.4654661 _cons | 1.399551 .0687291 20.36 0.000 1.264844 1.534258 ---+---idcentrosalud | var(_cons)| .5204259 .058917 .4168647 .6497147 ---LR test vs. logistic regression: chibar2(01) = 1436.49 Prob>=chibar2 = 0.0000