• No se han encontrado resultados

Modelos de regresión multinivel

N/A
N/A
Protected

Academic year: 2021

Share "Modelos de regresión multinivel"

Copied!
39
0
0

Texto completo

(1)

Modelos de

regresión multinivel

Víctor

 

Abraira

Unidad

 

de

 

Bioestadística

 

Clínica

Marzo

 

2014

Objetivos

Conocer

 

los

 

fundamentos

 

y

 

posibilidades

 

de

 

aplicación

 

de los modelos de regresión multinivel en estudios de

de

 

los

 

modelos

 

de

 

regresión

 

multinivel

 

en

 

estudios

 

de

 

epidemiología

 

clínica

Aprender

 

a

 

aplicar,

 

con

 

Stata13,

 

los

 

modelos

 

de

 

regresión

 

multinivel

 

de

 

variable

 

dependiente

 

continua

 

y

 

dicotómica

 

e

 

interpretar

 

las

 

salidas

Revisar

 

algunas

 

publicaciones

 

seleccionadas

 

como

 

modelos

 

de

 

presentación

 

de

 

resultados

(2)

Programa

 

sesión

Introducción.

é

i

l

d l

l i i l?

¿en

 

qué

 

consisten

 

los

 

modelos

 

multinivel?

¿qué

 

problemas

 

resuelven?

Efectos

 

de

 

grupo.

 

Efectos

 

composicionales

 

y

 

contextuales

Modelo

 

básico

 

(“modelo

 

vacío”)

 

de

 

componentes

 

de

 

la

 

varianza

Estimación

 

con

 

Stata.

 

Modelo

 

de

 

dos

 

niveles

 

con

 

variable

 

dependiente

 

continua

 

y

 

pendientes

 

comunes

 

entre

 

grupos

Planteamiento.

 

Especificación

 

de

 

varios

 

tipos

 

de

 

modelos

Pull de datos

Pull

 

de

 

datos

Efectos

 

fijos

 

de

 

grupo

Efectos

 

aleatorios

 

en

 

el

 

término

 

independiente

Predicción

 

de

 

los

 

efectos

 

del

 

grupo

Ejercicios

 

con

 

Stata

V. Abraira - Bioestadística Clínica

3

Programa

 

sesión

Modelo

 

de

 

dos

 

niveles

 

con

 

variable

 

dependiente

 

continua

 

y

 

coeficientes

 

aleatorios

 

en

 

las

 

pendientes

Especificación e interpretación

Especificación

 

e

 

interpretación

Estrategia

 

de

 

especificación

 

del

 

modelo

Ejercicios

 

con

 

Stata

Discusión

 

de

 

casos

 

(artículos

 

publicados)

 

sesión

Modelo

 

de

 

regresión

 

logística

 

de

 

dos

 

niveles

El

 

Median

 

odds

 

ratio

 

(MOR).

 

Estimación

 

con

 

Stata

Interpretación.

 

Ejemplo

 

AUDIPOC

Generalizaciones:

 

Tres y más niveles

Tres

 

y

 

más

 

niveles

Clasificaciones

 

mixtas.

SMR

 

con

 

multinivel

Ejercicios

 

con

 

Stata

 

Sesión

Ejercicios

 

con

 

Stata

 

y

 

Discusión

 

de

 

casos

 

(artículos

 

publicados)

(3)

Sinónimos

Modelos

 

lineales

 

jerárquicos

d

t

t

d l

i

de

 

estructuras

 

de

 

la

 

covarianza

mixtos

 

(Stata)

para

 

datos

 

longitudinales

 

o

 

de

 

panel

de

 

componentes

 

de

 

error

de parámetros aleatorios

de

 

parámetros

 

aleatorios

 

es

 

un

 

caso

 

particular

 

de

 

los

 

modelos

 

lineales

 

generalizados

V. Abraira - Bioestadística Clínica

5

¿Para

 

qué?

Estructura

 

de

 

datos

 

jerárquica;

 

muestreo

 

lti tá i

multietápico

Los

 

individuos

 

pertenecen

 

a

 

grupos

 

y

 

los

 

de

 

un

 

mismo

 

grupo

 

comparten

 

características

pacientes,

 

médicos

medidas repetidas de un mismo paciente

medidas

 

repetidas

 

de

 

un

 

mismo

 

paciente

Estimar

 

los

 

efectos

 

de

 

los

 

diferentes

 

niveles

6

(4)

¿Qué

 

problemas

 

resuelven?

Manejan

 

la

 

falta

 

de

 

independencia

Estimación MCO ineficiente

Estimación

 

MCO

 

ineficiente

Significaciones

 

espurias

 

(ej.

 

10

 

pacientes,

 

a

 

cada

 

uno

 

le

 

medimos

 

mensualmente

 

durante

 

12

 

meses)

Evitan

 

falacias

 

por

 

interpretar

 

efectos

 

a

 

nivel

 

equivocado

 

Ecológica

 

(interpretar

 

datos

 

agregados

 

a

 

nivel

 

individual)

Atomística

 

(interpretar

 

datos

 

individuales

 

a

 

nivel

 

agregado)

V. Abraira - Bioestadística Clínica

7

Journal

 

of

 

Epidemiology

 

and

 

Community

 

Health

.

 

2001;

 

55:791

798

.

¿Qué

 

problemas

 

resuelven?

Estiman

 

el

 

efecto

 

de

 

las

 

variables

 

“explicativas”

 

(

efectos fijos

) de ambos niveles incluyendo

(

efectos

 

fijos

)

 

de

 

ambos

 

niveles,

 

incluyendo

 

interacciones

 

entre

 

niveles

Estiman

 

qué

 

parte

 

de

 

la

 

variabilidad

 

no

 

“explicada”

 

(

efectos

 

aleatorios

)

 

es

 

imputable

 

a

 

cada

 

nivel

Manejan

 

eficientemente

 

datos

 

faltantes,

 

sin

 

imputación (diseños longitudinales)

imputación

 

(diseños

 

longitudinales)

V. Abraira – Bioestadística Clínica

8

Chakraborty

 

H,

 

Gu

 

H.

 

A

 

Mixed

 

Model

 

Approach

 

for

 

Intent

to

Treat

 

Analysis

 

in

 

Longitudinal

 

Clinical

 

Trials

 

with

 

Missing

 

Values.

 

Research

 

Triangle

 

Park,

 

NC:

 RTI

 

Press

 

(5)

Efectos

 

del

 

grupo

Efectos

 

composicionales:

La

 

composición

 

de

 

los

 

grupos

 

no

 

es

 

aleatoria,

 

está

 

en

 

parte

 

condicionada

 

por

 

factores

 

asociados

 

con

 

el

 

outcome

 

(los

 

grupos

 

no

 

son

 

intercambiables)

Efectos

 

contextuales:

El

 

pertenecer

 

a

 

un

 

grupo

 

establece

 

diferencias

V. Abraira - Bioestadística Clínica

9

Efectos

 

de

 

grupo

¿Información

 

o

 

ruido?

A

 

veces,

 

el

 

muestreo

 

multietápico

 

se

 

hace

 

por

 

motivos

 

de

 

coste,

 

o

 

por

 

factibilidad

La

 

correlación

 

entre

 

observaciones

 

es

 

ruido

 

que

 

dificulta

 

el

 

análisis

Otras,

 

se

 

diseña

 

para

 

estudiar

 

el

 

fenómeno

 

multinivel

multinivel

La

 

correlación

 

es

 

información

(6)

Modelo

 

lineal

Modelo

 

multinivel

 

de

 

“efectos

 

aleatorios

 

de

 

grupo

 

0

1

2

0

ij

ij

j

j

ij

Y

x

z

u

en

 

la

 

constante

 

(

intercept

)”

efecto

 

aleatorio

 

del

 

grupo

 

j

en la constante

N

0

2

Efectos

 

fijos

0

j

0

u

0

j

ij

m

V. Abraira - Bioestadística Clínica

11

en

 

la

 

constante

 

N

0,

0

efecto

 

aleatorio

 

del

 

individuo

 

i

 

del

 

grupo

 

j

2

0,

N

2

0

2

2

0

Modelo

 

nulo

 

Modelo

 

multinivel

 

de

 

efectos

 

aleatorios

 

de

 

grupo

 

0

0

ij

j

ij

Y

u

en

 

la

 

constante,

 

sin

 

variables

 

explicativas

efecto

 

aleatorio

 

del

 

grupo

 

j

2

0

N

Anova de

 

1

 

vía

 

efectos

 

aleatorios

V. Abraira - Bioestadística Clínica

12

2

0

0,

N

efecto

 

aleatorio

 

del

 

individuo

 

i

 

del

 

grupo

 

j

2

0,

N

(7)

Ejemplo

 

1

Rendimiento

 

en

 

matemáticas

 

de

 

niños

 

ingleses

 

(nivel

 

1),

 

en

 

distintos colegios (nivel 2)

distintos

 

colegios

 

(nivel

 

2)

sector 7185 4931106 4999873 0 1 size 7185 1056.862 604.1725 100 2713 mathach 7185 12.74785 6.878246 -2.832 24.993 cses 7185 -5.75e-17 .660588 -3.650741 2.856078 ses 7185 -9.80e-18 .7793552 -3.758143 2.691857 female 7185 .5281837 .4992398 0 1 minority 7185 .274739 .4464137 0 1 cons 7185 1 0 1 1 student 7185 24.50814 15.20242 1 67 school 7185 5277.898 2499.578 1224 9586 Variable Obs Mean Std. Dev. Min Max

V. Abraira - Bioestadistica Clínica

13

u0_M1 7185 .1108788 2.71679 -7.40282 6.477807 meanses 7185 4.55e-17 .4135432 -1.194089 .8248391 cole 7185 79.96298 45.4351 1 160 alumno 7185 3593 2074.275 1 7185 himinty 7185 .2800278 .4490438 0 1 disclim 7185 -.1318694 .9439882 -2.416 2.756 pracad 7185 .5344871 .2511861 0 1 sector 7185 .4931106 .4999873 0 1

Ejemplo

 

1:

 

¿Hay

 

efecto

 

colegio?

 

oneway mathach cole, tab

154 11 178552 6 923074 29 153 10.279632 7.2143938 19 Total 339876.934 7184 47.3102637 Within groups 274969.977 7025 39.1416338 Between groups 64906.9571 159 408.219856 10.43 0.0000 Source SS df MS F Prob > F Analysis of Variance Total 12.747853 6.8782457 7185 160 14.863695 6.4159995 59 159 11.089138 7.8779978 29 158 13.574657 6.4640023 35 157 10.355468 6.523218 47 156 15.270623 7.0669376 53 155 13.538754 5.8539039 57 154 11.178552 6.923074 29

2

0

2

2

0

j

j

n

Componente añadida

V. Abraira - Bioestadística Clínica

14

(evaluated at n=44.89)

Est. reliability of a cole mean 0.90412 Estimated SD within cole 6.256327 Estimated SD of cole effect 2.86748 0.17360 0.01849 0.13737 0.20983 correlation S.E. [95% Conf. Interval] Intraclass Asy.

loneway mathach cole

0

j

M S B

M S W

n

p

(8)

Modelo

 

multinivel

V. Abraira - Bioestadística Clínica

15

Modelo

 

multinivel

(9)

Salida

 

de

 

multinivel

 

vacio

mixed mathach || cole:, stddeviations

Mixed-effects ML regression Number of obs = 7185 Mixed effects ML regression Number of obs 7185 Group variable: cole Number of groups = 160 Obs per group: min = 14 avg = 44.9 max = 67

Wald chi2(0) = . Log likelihood = -23557.905 Prob > chi2 = . ---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---_cons | 12.63707 .2436178 51.87 0.000 12.15959 13.11455 --- Total 12.747853 6.8782457 160 14.863695 6.4159995 159 11.089138 7.8779978 158 13.574657 6.4640023 157 10.355468 6.523218 156 15.270623 7.0669376 155 13.538754 5.8539039 154 11.178552 6.923074 153 10.279632 7.2143938

0

0

ij

j

ij

Y

u

V. Abraira - Bioestadística Clínica

17

---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | sd(_cons) | 2.92464 .1826963 2.587615 3.305562 ---+---sd(Residual) | 6.256868 .0527937 6.154245 6.361202 ---LR test vs. linear regression: chibar2(01) = 983.92 Prob >= chibar2 = 0.0000

ated at n=44.89)

ility of a cole mean 0.90412 D within cole 6.256327 D of cole effect 2.86748 0.01849 0.13737 0.20983 S.E. [95% Conf. Interval] Asy.

Con

 

términos

 

fijos

P.e. del

 

niño:

 

sexo

 

y

 

ses y

 

del

 

colegio:

 

sector

 

y

 

tamaño

mixed mathach female ses size sector || cole:

(10)

Con

 

términos

 

fijos

0

1

2

0

ij

ij

j

j

ij

Y

x

z

u

Mixed-effects ML regression Number of obs = 7185 G i bl l N b f 160 Group variable: cole Number of groups = 160 Obs per group: min = 14 avg = 44.9 max = 67 Wald chi2(4) = 651.61 Log likelihood = -23275.08 Prob > chi2 = 0.0000 ---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---female | -1.201091 .1641199 -7.32 0.000 -1.52276 -.8794216 ses | 2.345177 .1050492 22.32 0.000 2.139284 2.55107 size | .0004972 .0002894 1.72 0.086 -.00007 .0010645 t | 2 37775 3633391 6 54 0 000 1 665619 3 089882

V. Abraira - Bioestadística Clínica

19

3 , 2 7 8 , 2 % 3 , 2 7 3 6 , 8 1    sector | 2.37775 .3633391 6.54 0.000 1.665619 3.089882 _cons | 11.67948 .4543243 25.71 0.000 10.78902 12.56994 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | var(_cons) | 3.270243 .4811775 2.450957 4.363392 ---+---var(Residual) | 36.80649 .6215722 35.60817 38.04513 ---LR test vs. linear regression: chibar2(01) = 292.62 Prob >= chibar2 = 0.0000

Cálculo

 

del

 

CCI

(11)

Cálculo

 

del

 

CCI

. estat icc

Residual intraclass correlation Residual intraclass correlation

---Level | ICC Std. Err. [95% Conf. Interval] ---+---cole | .0815995 .0111515 .0622422 .1062947

---V. Abraira - Bioestadística Clínica

21

0,347 0, 258 0,347

(12)

Práctica

 

con

 

Stata

V. Abraira - Bioestadistica Clínica

23

Programa

 

sesión

Introducción.

é

i

l

d l

l i i l?

¿en

 

qué

 

consisten

 

los

 

modelos

 

multinivel?

¿qué

 

problemas

 

resuelven?

Efectos

 

de

 

grupo.

 

Efectos

 

composicionales

 

y

 

contextuales

Modelo

 

básico

 

(“modelo

 

vacío”)

 

de

 

componentes

 

de

 

la

 

varianza

Estimación

 

con

 

Stata.

 

Modelo

 

de

 

dos

 

niveles

 

con

 

variable

 

dependiente

 

continua

 

y

 

pendientes

 

comunes

 

entre

 

grupos

Planteamiento.

 

Especificación

 

de

 

varios

 

tipos

 

de

 

modelos

Pull de datos

Pull de

 

datos

Efectos

 

fijos

 

de

 

grupo

Efectos

 

aleatorios

 

en

 

el

 

término

 

independiente

Predicción

 

de

 

los

 

efectos

 

del

 

grupo

Ejercicios

 

con

 

Stata.

(13)

Repasemos

 

el

 

modelo

Modelo

 

“pull

 

de

 

datos”:

Y

(asume

 

idéntica

 

estructura

 

entre

 

grupos)

Modelo

 

de

 

efectos

 

fijos

 

en

 

la

 

constante

(con

 

dummy

 

para

 

los

 

grupos)

Modelo multinivel

0

1

2

ij

ij

j

ij

Y

x

z

0

1

2

1 1

...

1

1

ij

j

ij

j

k

k

ij

Y

x

z

d

 

d

Modelo

 

multinivel

 

(asume

 

grupos

 

extraídos

 

al

 

azar

 

de

 

una

 

población

 

de

 

grupos)

V. Abraira - Bioestadistica Clínica

25

0

1

2

0

ij

ij

j

j

ij

Y

x

z

u

Pull,

 

multinivel

Adj R-squared = 0.1592 Residual 285651.407 7181 39.7787783 R-squared = 0.1595 Model 54225.5272 3 18075.1757 Prob > F = 0.0000 F( 3, 7181) = 454.39 Source SS df MS Number of obs = 7185

regress

_cons 12.52113 .1308468 95.69 0.000 12.26463 12.77763 sector 1.96315 .1516053 12.95 0.000 1.665959 2.260341 ses 2.88413 .0974835 29.59 0.000 2.693034 3.075226 female -1.403538 .149424 -9.39 0.000 -1.696452 -1.110623 mathach Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 339876.934 7184 47.3102637 Root MSE = 6.307

Adj R squared 0.1592

regress

---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---female | -1.204518 .1641914 -7.34 0.000 -1.526327 -.8827087 ses | 2.343935 .1050997 22.30 0.000 2.137943 2.549927 sector | 2.09957 .3275687 6.41 0.000 1.457547 2.741593

V. Abraira - Bioestadistica Clínica

26

mixed

_cons | 12.34793 .2352288 52.49 0.000 11.88689 12.80897 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | var(_cons) | 3.334901 .4897675 2.500775 4.447249 ---+---var(Residual) | 36.80888 .6216452 35.61042 38.04767 ---LR test vs. linear regression: chibar2(01) = 297.80 Prob >= chibar2 = 0.0000

(14)

Efectos

 

fijos

 

en

 

la

 

constante

. regres mathach female ses sector i.cole note: 160.cole omitted because of collinearity

Source | SS df MS Number of obs = 7185 + F(161 7023) = 13 77 ---+--- F(161, 7023) = 13.77 Model | 81558.568 161 506.574956 Prob > F = 0.0000 Residual | 258318.366 7023 36.7817694 R-squared = 0.2400 ---+--- Adj R-squared = 0.2225 Total | 339876.934 7184 47.3102637 Root MSE = 6.0648 ---mathach | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---+---female | -1.120932 .1699514 -6.60 0.000 -1.454088 -.7877759 ses | 2.154587 .1084604 19.87 0.000 1.941971 2.367202 sector | 3.327148 1.193584 2.79 0.005 .9873639 5.666932 | cole | 2 | 2.422861 1.502676 1.61 0.107 -.522838 5.368559 3 | 2 042482 1 244569 1 64 0 101 4 482213 3972492

V. Abraira - Bioestadística Clínica

27

3 | -2.042482 1.244569 -1.64 0.101 -4.482213 .3972492 4 | .4715783 1.578502 0.30 0.765 -2.622763 3.565919 5 | -1.091731 1.179238 -0.93 0.355 -3.403393 1.219931 156 | -.1385636 1.16088 -0.12 0.905 -2.414238 2.137111 157 | -.6087337 1.252587 -0.49 0.627 -3.064182 1.846715 158 | -.7743099 1.308213 -0.59 0.554 -3.338803 1.790183 159 | .3901225 1.433136 0.27 0.785 -2.419257 3.199502 160 | 0 (omitted) | _cons | 11.31946 .8913894 12.70 0.000 9.572068 13.06685

---……….

Multinivel,

 

GEE

---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---female | -1.204518 .1641914 -7.34 0.000 -1.526327 -.8827087 ses | 2.343935 .1050997 22.30 0.000 2.137943 2.549927 sector | 2.09957 .3275687 6.41 0.000 1.457547 2.741593

Li k id tit Ob i 14 Group variable: cole Number of groups = 160 GEE population-averaged model Number of obs = 7185

mixed

|

_cons | 12.34793 .2352288 52.49 0.000 11.88689 12.80897 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | var(_cons) | 3.334901 .4897675 2.500775 4.447249 ---+---var(Residual) | 36.80888 .6216452 35.61042 38.04767 ---LR test vs. linear regression: chibar2(01) = 297.80 Prob >= chibar2 = 0.0000

V. Abraira - Bioestadistica Clínica

28

. _cons 12.35648 .223881 55.19 0.000 11.91768 12.79528 sector 2.092795 .3089145 6.77 0.000 1.487333 2.698256 ses 2.36694 .1050337 22.54 0.000 2.161078 2.572803 female -1.214257 .1640118 -7.40 0.000 -1.535715 -.8928001 mathach Coef. Std. Err. z P>|z| [95% Conf. Interval] Scale parameter: 39.92755 Prob > chi2 = 0.0000 Wald chi2(3) = 666.92 Correlation: exchangeable max = 67 Family: Gaussian avg = 44.9 Link: identity Obs per group: min = 14

(15)

Multinivel,

 

panel

---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---female | -1.204518 .1641914 -7.34 0.000 -1.526327 -.8827087 ses | 2.343935 .1050997 22.30 0.000 2.137943 2.549927 sector | 2.09957 .3275687 6.41 0.000 1.457547 2.741593| _cons | 12.34793 .2352288 52.49 0.000 11.88689 12.80897 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | sd(_cons) | 1.826171 .1340968 1.581384 2.10885 ---+---sd(Residual) | 6.067032 .0512314 5.967447 6.168279 ---LR test vs. linear regression: chibar2(01) = 297.80 Prob >= chibar2 = 0.0000

mixed, stddev

---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval]

+

V. Abraira - Bioestadística Clínica

29

---+---female | -1.204518 .164427 -7.33 0.000 -1.526789 -.882247 ses | 2.343935 .1071159 21.88 0.000 2.133992 2.553878 sector | 2.09957 .3276265 6.41 0.000 1.457434 2.741706 _cons | 12.34793 .2353565 52.46 0.000 11.88664 12.80922 ---+---/sigma_u | 1.826171 .1340967 1.581384 2.108849 /sigma_e | 6.067032 .0512314 5.967447 6.168279 rho | .0830739 .0113139 .0630497 .1075412 ---Likelihood-ratio test of sigma_u=0: chibar2(01)= 297.80 Prob>=chibar2 = 0.000

xtreg, mle

Y

 

Variables

 

agregadas

 

de

 

grupo,

 

p.e.

 

ses

 

medio

 

de

 

los niños del colegio

los

 

niños

 

del

 

colegio

Cuando

 

en

 

el

 

modelo

 

introducimos

 

una

 

variable

 

a

 

nivel

 

individual

 

y

 

también

 

el

 

promedio

 

del

 

grupo,

 

conviene

 

centrar

 

la

 

individual,

 

para

 

que

 

el

 

coeficiente

 

de

 

la

 

media

 

del

 

grupo

 

sea

 

el

 

efecto

 

de

 

la media del grupo sobre el rendimiento medio de

la

 

media

 

del

 

grupo

 

sobre

 

el

 

rendimiento

 

medio

 

de

 

los

 

individuos

 

(

coeficiente

 

de

 

regresión

 

entre

 

grupos

)

(16)

También

A

 

veces,

 

el

 

tamaño

 

del

 

grupo

 

es

 

una

 

variable

 

li ti

explicativa

Si

 

hay

 

missing,

 

el

 

%

 

de

 

missing.

 

Si

 

fuera

 

significativo

 

indicaría

 

que

 

los

 

missing

 

no

 

son

 

al

 

azar

V. Abraira - Bioestadistica Clínica

31

Ejemplo

Mixed-effects ML regression Number of obs = 7185 Group variable: cole Number of groups = 160 Obs per group: min = 14 avg = 44.9 67 max = 67

Wald chi2(5) = 805.65 Log likelihood = -23245.631 Prob > chi2 = 0.0000 ---mathach | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---cses | 2.152197 .1084602 19.84 0.000 1.939618 2.364775 meanses | 5.19679 .3503994 14.83 0.000 4.510019 5.88356 female | -1.194158 .1617788 -7.38 0.000 -1.511238 -.8770771 size | .0004089 .0002434 1.68 0.093 -.0000682 .000886 sector | 1.48491 .3216624 4.62 0.000 .8544635 2.115357 _cons | 12.19069 .3884165 31.39 0.000 11.42941 12.95197

V. Abraira - Bioestadística Clínica

32

---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---cole: Identity | var(_cons) | 2.049609 .3304243 1.494329 2.811228 ---+---var(Residual) | 36.79069 .6209387 35.59358 38.02806 ---LR test vs. linear regression: chibar2(01) = 181.89 Prob >= chibar2 = 0.0000

(17)

Estimación

 

de

 

efectos

 

de

 

grupos

Una

 

vez

 

estimado

 

el

 

modelo,

 

se

 

pueden

 

d i l

f t

d

d

predecir

 

los

 

efectos

 

de

 

cada

 

grupo:

 

u

0j

A

 

partir

 

del

 

estimador

 

empírico

 

de

 

Bayes,

 

o

 

de

 

shrinkage,

para

 

la

 

media

 

del

 

grupo

 

que,

 

en

 

el

 

modelo

 

vacio,

 

es

 

la

 

media

 

de

 

las

 

medias

 

del

 

grupo

 

y

 

la

 

total,

 

ponderadas

 

por

 

la

 

“reliability”

 

g p y

, p

p

y

de

 

la

 

media

 

del

 

grupo

V. Abraira - Bioestadística Clínica

33

(

)

.

1

..

EB

j

j

j

j

Y

=

l

Y

+ -

l

Y

ˆ

0

..

EB

j

j

u

=

Y

-

Y

34

(18)

Con

 

Stata

twoway

 

(dropline

 

res_bay

 

cole)

0 2 4 P r. e . f o r co le : _ c o n s

V. Abraira - Bioestadística Clínica

35

-4 -2 BL U 0 50 100 150 cole

O

 

 

5 -1 0 -5 0

V. Abraira - Bioestadística Clínica

36

twoway

 

(scatter

 

res_bas

 

cole)

 

(rbar

 

ls_res_bay

 

li_res__bay

 

cole)

0 50 100 150

cole

(19)

Práctica

 

con

 

Stata

V. Abraira - Bioestadistica Clínica

37

Programa

 

sesión

Modelo

 

de

 

dos

 

niveles

 

con

 

variable

 

dependiente

 

continua

 

y

 

coeficientes

 

aleatorios

 

en

 

las

 

pendientes

Especificación e interpretación

Especificación

 

e

 

interpretación

Estrategia

 

de

 

especificación

 

del

 

modelo

Ejercicios

 

con

 

Stata

Discusión

 

de

 

casos

 

(artículos

 

publicados)

 

sesión

Modelo

 

de

 

regresión

 

logística

 

de

 

dos

 

niveles

El

 

Median

 

odds

 

ratio

 

(MOR).

 

Estimación

 

con

 

Stata

Interpretación.

 

Ejemplo

 

AUDIPOC

Generalizaciones:

 

Tres y más niveles

Tres

 

y

 

más

 

niveles

Clasificaciones

 

mixtas.

SMR

 

con

 

multinivel

Ejercicios

 

con

 

Stata

 

Sesión

Ejercicios

 

con

 

Stata

 

y

 

Discusión

 

de

 

casos

 

(artículos

 

publicados)

(20)

Efectos

 

aleatorios

 

en

 

las

 

pendientes

0

1

2

0

1

ij

ij

j

j

j

ij

ij

Y

x

z

u

u x

0

j

0

u

0

j

1

j

1

u

1

j

 

10 15 20 e d v a lu e s

2

0

Var u

( )

0

V. Abraira - Bioestadística Clínica

39

0 5 Fi tt e -2 -1 0 1 2

Estatus socioeconomico del alumno (media cero global)

2

(

ij

)

Var

2

1

Var u

( )

1

01

Cov u u

( , )

0

1

Efectos

 

aleatorios

 

en

 

las

 

pendientes

Ahora

 

la

 

varianza

 

de

 

Y

 

condicionada

 

a

 

x

d

d d

l t t

í

t

depende

 

de

 

x,

y

 

por

 

lo

 

tanto,

 

varía

 

entre

 

individuos

Por

 

tanto,

 

la

 

correlación

 

intragrupo

 

depende

 

de

 

los

 

valores

 

de

 

las

 

x

y

 

es

 

diferente

 

entre

 

individuos

Como

 

el

 

modelo

 

supone

 

que

 

los

 

efectos

 

del

 

grupo,

 

(u

0j

+u

1j

 

x

j

)

 

dependen

 

de

 

x,

 

es

 

conveniente centrar

las

 

X

(21)

Ejemplo

El

 

efecto

 

de

 

la

 

condición

 

socioeconómica

 

del

 

iñ ¿i fl

b

l

di i

t

l

niño

 

¿influye

 

sobre

 

el

 

rendimiento

 

escolar

 

igual

en

 

todos

 

los

 

colegios?

Incluyamos

 

efecto

 

aleatorio

 

en

 

la

 

pendiente

01

ind:

s

=

0

0

1

...

0

1

ij

j

j

ij

Y

cses

 

u

u cses

V. Abraira - Bioestadística Clínica

41

01

2

2

0

1

ind:

 

0

exc:

 

ide:

  

am bos

s

s

=

s

mixed mathach cses || cole: cses, covariance(unstructured)

Salida

max = 67 avg = 44.9 Obs per group: min = 14

_cons 12.11705 .392702 30.86 0.000 11.34737 12.88673 sector 1.649098 .3251591 5.07 0.000 1.011798 2.286398 size .000405 .000246 1.65 0.100 -.0000772 .0008871 meanses 5.094703 .3542385 14.38 0.000 4.400408 5.788998 cses 2.155203 .1269245 16.98 0.000 1.906435 2.40397 female -1.183367 .161815 -7.31 0.000 -1.500519 -.8662157 mathach Coef. Std. Err. z P>|z| [95% Conf. Interval] Log restricted-likelihood = -23251.964 Prob > chi2 = 0.0000 Wald chi2(5) = 691.96 max 67

V. Abraira - Bioestadistica Clínica

42

LR test vs. linear regression: chi2(3) = 196.62 Prob > chi2 = 0.0000 var(Residual) 36.50946 .62255 35.30945 37.75026 cov(cses,_cons) .2612122 .2524898 -.2336587 .7560831 var(_cons) 2.145803 .3461413 1.564162 2.943729 var(cses) .6491731 .2739385 .283903 1.4844 cole: Unstructured Random-effects Parameters Estimate Std. Err. [95% Conf. Interval]

(22)

Pregunta

 

capciosa

¿Cuál

 

es

 

el

 

CCI

 

del

 

colegio?

Hay

 

uno

 

para

 

cada

 

valor

 

del

 

cses

Bien,

 

¿cuál

 

es

 

el

 

CCI

 

para

 

cses

=2?

2

2

2

0

j

j

1

j

var(

)

0

j

1

2

j

01

Eag

u

x u

Eag

x

x

2

LR test vs. linear regression: chi2(3) = 196.62 Prob > chi2 = 0.0000 var(Residual) 36.50946 .62255 35.30945 37.75026 cov(cses,_cons) .2612122 .2524898 -.2336587 .7560831 var(_cons) 2.145803 .3461413 1.564162 2.943729 var(cses) .6491731 .2739385 .283903 1.4844 cole: Unstructured

V. Abraira - Bioestadística Clínica

43

2

var("

col cses

"

2)

2,15 2

 

0, 65 2 2 0, 26

  

5, 79

5 , 7 9

1 3 , 7 %

5 , 7 9

3 6 , 5 1

Visualización:

 

Ejemplo

 

simulado

 

presión

 

arterial

 

y

 

diurético

2 0 14 0 40 60 80 10 0 1 2 0 1 diuretico pad 241 81.36483 15.06054 47.97024 118.1932 Variable Obs Mean Std. Dev. Min Max -> diuretico = 1

pad 259 91.91502 15.31825 56.84752 130.3824 Variable Obs Mean Std. Dev. Min Max -> diuretico = 0

0

1

i

i

i

Y

x

_cons 91.91502 .9441463 97.35 0.000 90.06001 93.77002 diuretico -10.55018 1.359928 -7.76 0.000 -13.22209 -7.878282 pad Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 128871.39 499 258.259299 Root MSE = 15.195 Adj R-squared = 0.1060 Residual 114976.123 498 230.875749 R-squared = 0.1078 Model 13895.2673 1 13895.2673 Prob > F = 0.0000 F( 1, 498) = 60.19 Source SS df MS Number of obs = 500

(23)

Hay

 

distintos

 

médicos

12 0 14 0

0

1

0

ij

ij

j

ij

Y

x

u

pad Coef Std Err z P>|z| [95% Conf Interval] 40 60 80 10 0 0 1 diuretico

LR test vs. linear regression: chibar2(01) = 407.24 Prob >= chibar2 = 0.0000 sd(Residual) 9.888966 .3146099 9.291173 10.52522 sd(_cons) 12.91875 4.594445 6.434247 25.9384 medico: Identity Random-effects Parameters Estimate Std. Err. [95% Conf. Interval] _cons 90.97059 5.810326 15.66 0.000 79.58256 102.3586 diuretico -8.590804 .893535 -9.61 0.000 -10.3421 -6.839508 pad Coef. Std. Err. z P>|z| [95% Conf. Interval]

V. Abraira - Bioestadística Clínica

45

Efecto

 

aleatorio

 

en

 

la

 

pendiente

12 0 14 0

0

1

0

1

ij

ij

j

j

ij

ij

Y

x

u

u x

60 80 10 0 0 1 diuretico

Corr>0

Corr<0

j

j

j

j

j

j

LR test vs. linear regression: chi2(3) = 402.48 Prob > chi2 = 0.0000 sd(Residual) 10.13664 .3224896 9.523876 10.78883 corr(diuret~o,_cons) .9999992 .0003431 -1 1 sd(_cons) 11.32102 4.062396 5.603293 22.87325 sd(diuret~o) 3.732735 1.673439 1.55032 8.987378 medico: Unstructured Random-effects Parameters Estimate Std. Err. [95% Conf. Interval] _cons 91.14343 5.100366 17.87 0.000 81.1469 101.14 diuretico -6.330363 1.906372 -3.32 0.001 -10.06678 -2.593943 pad Coef. Std. Err. z P>|z| [95% Conf. Interval]

V. Abraira - Bioestadística Clínica

46

LR test vs. linear regression: chi2(3) = 163.85 Prob > chi2 = 0.0000 sd(Residual) 10.11895 .3232188 9.504872 10.77269 corr(diuret~o,_cons) -.9831189 .0267974 -.9992617 -.6719174 sd(_cons) 10.70564 3.863978 5.277027 21.71882 sd(diuret~o) 7.707722 2.916992 3.671033 16.18318 medico: Unstructured Random-effects Parameters Estimate Std. Err. [95% Conf. Interval] _cons 92.07354 4.835521 19.04 0.000 82.59609 101.551 diuretico -11.99255 3.566427 -3.36 0.001 -18.98262 -5.002477 pad Coef. Std. Err. z P>|z| [95% Conf. Interval]

(24)

Efecto

 

aleatorio

 

en

 

la

 

pendiente

12 0 14 0 12 0 14 0 40 60 80 10 0 0 1 diuretico 60 80 10 0 0 1 diuretico 12 0 ---pad | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---diuretico | -10.02766 2.524844 -3.97 0.000 -14.97626 -5.079059

Corr>0

Corr<0

V. Abraira - Bioestadística Clínica

47

40 60 80 10 0 No Sí diuretico diuretico | 10.02766 2.524844 3.97 0.000 14.97626 5.079059 _cons | 88.77174 3.118113 28.47 0.000 82.66035 94.88313 ---Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval] ---+---medico: Unstructured | sd(diuret~o) | 5.309061 1.897168 2.63539 10.69524 sd(_cons) | 6.839591 2.253758 3.585463 13.04713 corr(diuret~o,_cons) | .1714171 .4772095 -.6586935 .8133184 ---+---sd(Residual) | 9.540705 .3047652 8.961691 10.15713 ---LR test vs. linear regression: chi2(3) = 226.30 Prob > chi2 = 0.0000

Corr

0

48

(25)

Efectos

 

aleatorios

49

Contrastes

Cada

 

coeficiente

 

de

 

la

 

parte

 

fija,

 

con

 

la

 

t

 

con

 

l

1

g.l=n

niv

nvar

niv

1.

Un

 

subconjunto

 

o

 

todo

 

el

 

modelo,

 

con

 

test

 

LR

 

(en

 

las

 

salidas

 

tenemos

 

los

 

LR

 

test

 

para

 

las

 

partes

 

fija

 

y

 

aleatoria).

Stata permite guardar parámetros de modelos

Stata

 

permite

 

guardar

 

parámetros

 

de

 

modelos

 

(estimates

 

store

 

B

)

 

para

 

luego

 

hacer

 

el

 

test

 

(lrtest

 

A

 

B

).

(26)

Métodos

 

de

 

estimación

Asumiendo

 

normalidad

 

de

 

todas

 

las

 

variables

 

aleatorias

 

u

u

Hay

 

dos

 

métodos

 

de

 

estimación:

 

máxima

 

verosimilitud

 

(ML)

 

y

 

máxima

 

verosimilitud

 

restringida

 

(REML).

ML

 

da

 

estimadores

 

sesgados

 

porque

 

no

 

ajusta

 

por

 

los

 

g.l.

 

perdidos

 

al

 

estimar

 

los

 

coeficientes

 

fijos.

REML

 

da

 

estimaciones

 

insesgadas

 

pero

 

no

 

permite

 

comparar

 

u

0

j

,

u

1

j

,...,

ij

modelos

 

con

 

distintas

 

partes

 

fijas

 

con

 

test

 

basados

 

en

 

la

 

deviance

V. Abraira - Bioestadistica Clínica

51

Especificación

 

de

 

los

 

modelos

La

 

especificacion

 

del

 

modelo

 

es

 

más

 

compleja

 

l

d l

i i l

que

 

en

 

los

 

modelos

 

uninivel

Hay

 

que

 

decidir

 

las

 

variables

 

fijas

 

y

 

sus

 

interacciones

Qué

 

variables

 

tienen

 

pendiente

 

aleatoria

La estructura de var cov

La

 

estructura

 

de

 

var

cov

No

 

hay

 

receta

(27)

Consejos

Parsimonia

Buscar

 

apoyo

 

en

 

la

 

teoría.

 

No

 

hacer

 

demasiada

 

“minería”

 

de

 

datos

Pensar

 

en

 

qué

 

efectos

 

queremos

 

contrastar

 

(nuestra

 

hipótesis)

V. Abraira - Bioestadistica Clínica

53

Lecturas

J

 

Antimicrob

 

Chemother

 

2011;

 

66

:

 

210–215.

¿qué

 

se

 

entiende

 

del

 

apartado

 

de

 

análisis?

Estructura

 

del

  

“data

 

set”

 

y

 

especificación

 

del

 

modelo

 

¿cómo

 

se

 

estimó

 

el

 

efecto?

 

Relación

 

entre

 

fig

g y

 

2

 

y

 

tabla

 

2

(28)

Lectura

J

 

Epidemiol

 

Community

 

He

alth

 

2001;

 

55

:791

798

798.

¿qué

 

se

 

entiende

 

del

 

apartado

 

de

 

análisis?

¿cuántos

 

modelos

 

se

 

estiman?

 

especificación

 

de

 

los

 

modelos

¿qué

 

se

 

estima/compara?

¿cómo?

V. Abraira - Bioestadistica Clínica

55

Programa

 

sesión

Modelo

 

de

 

dos

 

niveles

 

con

 

variable

 

dependiente

 

continua

 

y

 

coeficientes

 

aleatorios

 

en

 

las

 

pendientes

Especificación e interpretación

Especificación

 

e

 

interpretación

Estrategia

 

de

 

especificación

 

del

 

modelo

Ejercicios

 

con

 

Stata

Discusión

 

de

 

casos

 

(artículos

 

publicados)

 

sesión

Modelo

 

de

 

regresión

 

logística

 

de

 

dos

 

niveles

El

 

Median

 

odds ratio

 

(MOR).

 

Estimación

 

con

 

Stata

Interpretación.

 

Ejemplo

 

AUDIPOC

Generalizaciones:

 

Tres y más niveles

Tres

 

y

 

más

 

niveles

Clasificaciones

 

mixtas.

SMR

 

con

 

multinivel

Ejercicios

 

con

 

Stata

 

Sesión

Ejercicios

 

con

 

Stata

 

y

 

Discusión

 

de

 

casos

 

(artículos

 

publicados)

(29)

Modelo

 

de

 

regresión

 

logística

Generalizamos

 

el

 

modelo

 

lineal,

 

mediante

 

l f

l

i

li k

la

 

función

 

logit

como

 

link

.

En

 

lugar

 

de:

El

 

modelo

 

vacio:

 

Ahora

 

no

 

hay

 

varianza

 

residual

 

(

ij

)

 

porque

 

l

i

d l bi

i l l fij l

 

j

0

0

j

logit P

u

0

0

ij

j

ij

Y

u

la

 

varianza

 

de

 

la

 

binomial

 

la

 

fija

 

la

 

probabilidad

 

(

pq

).

 

V. Abraira - Bioestadistica Clínica

57

Ejemplo

Prescripción

 

de

 

estatinas

 

en

 

Suecia:

 

datos

 

de

 

32345

 

personas

 

en

 

274

 

centros

 

de

 

salud.

Variable

 

|

       

Obs

        

Mean

    

Std.

 

Dev.

       

Min

        

Max

‐‐‐‐‐‐‐‐‐‐‐‐‐

+

‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐

estatina

 

|

     

32345

     

.756964

    

.4289233

      

0

      

1

idpaciente

 

|

     

32345

       

16173

    

9337.342

      

1

      

32345

idcentrosa~d

 

|

     

32345

    

128.3587

    

77.01913

      

1

        

274

(30)

Modelo

 

nulo

Integration method: mvaghermite Integration points = 7 Wald chi2(0) = . Log likelihood = -16931.104 Prob > chi2 = .

---estatina | Coef. Std. Err. z P>|z| [95% Conf. Interval]

V. Abraira - Bioestadística Clínica

59

melogit estatina || idcentrosalud:

---+---_cons | 1.110215 .0535458 20.73 0.000 1.005267 1.215162 ---+---idcentrosalud | var(_cons)| .6485884 .0700788 .5248055 .8015672 ---LR test vs. logistic regression: chibar2(01) = 2011.91 Prob>=chibar2 = 0.0000

Con

 

más

 

efectos

 

fijos

Integration method: mvaghermite Integration points = 7 Wald chi2(5) = 55.10 Log likelihood = -16905.755 Prob > chi2 = 0.0000

---estatina | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+---hombre | .0157781 .0331935 0.48 0.635 -.04928 .0808363

| i |

V. Abraira - Bioestadistica Clínica

60

pais | Low-income economies | .0588525 .2153503 0.27 0.785 -.3632263 .4809314 Lower_middle_income_economies | .0991961 .0689634 1.44 0.150 -.0359696 .2343619 Higher_middle_income_economies | -.2040344 .0747628 -2.73 0.006 -.3505668 -.057502 | privado | -.6593854 .0989402 -6.66 0.000 -.8533047 -.4654661 _cons | 1.399551 .0687291 20.36 0.000 1.264844 1.534258 ---+---idcentrosalud | var(_cons)| .5204259 .058917 .4168647 .6497147 ---LR test vs. logistic regression: chibar2(01) = 1436.49 Prob>=chibar2 = 0.0000

Referencias

Documento similar

Si desea obtener más información sobre los productos de software de SPSS ® , visite nuestra página Web en http://www.spss.com o póngase en contacto con..

El an´ alisis de regresi´ on se usa para explicar o modelar la relaci´ on entre una variable continua Y, llamada variable respuesta o variable dependiente, y una o m´ as

- Las variables importantes deben estar en el modelo - No existen valores atípicos. - No existen

Este tipo de sumas de cuadrados calculan la reducci´ on en la suma de cuadrados residual para un efecto tras haber ajustado todos los dem´ as efectos en el modelo. Para estimar la

aglutinadas en grupos que comparten alguna o varias características en común, surgen preguntas en torno a diferencias que ocultan las proposicio- nes generales, activadas

Los parámetros de la regresión logística se distribuyen asintóticamente entonces siguiendo una distribución normal de media (el parámetro obtenido) y desviación estándar

ESTRUCTURA FINITA DE RETARDOS: PROPUESTA DE ALMON Como se especificó anteriormente, estos modelos se caracterizan porque los efectos que causan las variables explicativas sobre

La rotación de personal, considerada como la desvinculación del personal de una empresa por diferentes motivos, tiene un gran impacto en las organizaciones debido a que