(1)Estad´ıstica II, grado en Matemáticas Resumen del modelo de regresión lineal múltiple Curso

(1)

Estad´ıstica II, grado en Matem´aticas

Resumen del modelo de regresi´on lineal m´ultiple Curso 2019-2020

1. Ingredientes y datos

k≥1 variables explicativasX1, . . . , Xk. Variable respuestaY.

Serie dendatos (cada uno de longitudk+ 1).

X1 X2 · · · Xk Y x_1,1 x_1,2 · · · x_1,k y₁ x2,1 x2,2 · · · x2,k y2

... ... . .. ... ... xn,1 xn,2 · · · xn,k yn

n≥k+ 2.

No colinealidad (columnasX1a Xk).

2. Modelo

El vectory= (y1, . . . , yn)^T es una realizaci´on del vector aleatorioY= (Y1, . . . , Yn)^T dado por Y=X·β+ε,

donde

X =







1 x1,1 x1,2 · · · x1,k

1 x2,1 x2,2 · · · x2,k

... ... ... . .. ... 1 xn1,1 xn,2 · · · xn,k







es la matriz de dise˜no (de rangok+ 1), y donde β= (β₀, β₁, . . . , β_k)^T es el vector de par´ametros,

ε= (ε1, . . . , εn)^T ∼ N(0, σ²In), dondeσ²es otro par´ametro eInes la matriz identidadn×n.

Es decir, las variablesεi son normales independientes de media 0 y varianzaσ². El vectorYse distribuye como unaN(X·β, σ²I_n).

3. Estimaci´on de par´ametros

a) Dada la muestray= (y1, . . . , yn)^T, la estimación (m´ınimo error cuadrático/máxima verosi- militud) de los parámetros es

βb = (X^TX)⁻¹X^Ty.

Para el caso de la regresi´on lineal simple (k = 1), llamando x = (x1, . . . , xn)^T a la (´unica) columna de observaciones,

βb1=covx,y

V_x , βb0=y−covx,y

V_x x, donde

x= 1 n

∑n i=1

x_i, y= 1 n

∑n i=1

y_i, V_x= 1 n

∑n i=1

(x_i−x)², cov_x,y= 1 n

∑n i=1

(x_i−x)(y_i−y).

b) Valores pronosticados y residuos. Dada la muestra y = (y₁, . . . , y_n)^T, los pron´osticos by = (yb₁, . . .yb_n)^T y los residuose= (e₁, . . . , e_n)^T son

b

y=Xβb =X(X^TX)⁻¹X^Ty:=Hy, e=y−yb= (In−H)y.

La matrizH esn×n, sim´etrica, definida positiva e idempotente de rango k+ 1.

1

(2)

c) Sumas de cuadrados:tss=mss+rss, con

(total) tss=

∑n i=1

(yi−y)²=nVy =y^T(In−_n¹Jn)y, (explicada por modelo) mss=

∑n i=1

(ybi−y)²=y^T(H−_n¹Jn)y, (residual) rss=

∑n i=1

(y_i−yb_i)²=

∑n i=1

e²_i =y^T(I_n−H)y,

dondeJ_n denota la matrizn×ncon unos.

d) Estimaci´on paraσ²:

cσ²=s²_R= 1 n−k−1

∑n i=1

e²_i = rss n−k−1· e) CoeficienteR²:

R²=mss

tss = 1−rss tss. Obs´ervese quemss/rss=R²/(1−R²).

4. Distribuci´on de estimadores

Consideramos los estimadores (estad´ısticos asociados aY= (Y1, . . . , Yn)^T) βb = (X^TX)⁻¹X^TY y s²_R= 1

n−k−1Y^T(In−H)Y. En el casok= 1,

βb1= 1 V_x

1 n

∑n i=1

(xi−x)(Yi−Y), βb0=Y − x V_x

1 n

∑n i=1

(xi−x)(Yi−Y), dondeY =_n¹∑n

i=1Yi. Se tiene que

βb∼ N(β, σ²(X^TX)⁻¹), (n−k−1)s²_R/σ²∼χ²_n₋_k₋₁, ys²_R es independiente deβ.b

En particular, paraj= 0, . . . , k, y llamandoq_j,j al elementoj de la diagonal de (X^TX)⁻¹, βbj−βj

s_R√q_j+1,j+1 ∼tn−k−1. En el casok= 1,

V(βb0) =σ² [1

n+ x² nVx

]

, V(βb1) =σ² 1 nVx

, cov(βb0,βb1) =−σ² x nVx

.

2

(3)

5. Intervalos de confianza para los par´ametros

Dadoα, y paraj = 0, . . . , k,

IC1−α(βj) =βbj±t_{_n₋_k₋_1;α/2_}sR√qj+1,j+1. Para el casok= 1,

IC₁₋_α(β₀) =βb₀± t_{_n₋_2;α/2_}s_R

√ 1 n+ x²

n Vx

, IC₁₋_α(β₁) =βb₁±t_{_n₋_2;α/2_}s_R

√ 1 n Vx

.

Paraσ²,

IC1−α(σ²) =

((n−k−1)s²_R

χ²_{_n₋_k₋_1;α/2_} , (n−k−1)s²_R χ²_{_n₋_k₋_1;1₋_α/2_}

) .

6. Contrastes de hip´otesis

a) Hipótesis individuales H₀ : β_j = 0, con j ∈ {1, . . . , k}. Región de rechazo con nivel de significaciónα:

Rj={ βb_j sR√qj+1,j+1

> t_{n−k−1;α/2}

} .

b) Hip´otesis globalH0:β1=· · ·=βk = 0. BajoH0, se tiene que mss/k

rss/(n−k−1) ∼Fk,n−k−1. Regi´on de rechazo con nivel de significaci´onα:

R=

{ mss/k

rss/(n−k−1) > F_{_k,n₋_k₋_1;α_} }

.

Tabla ANOVA:

Fuente suma cuadrados g.l. varianza estad´ısticoF

explicada por regresi´on mss k mss/k (mss/k)/s²_R

residual rss n−k−1 rss/(n−k−1) =s²_R

total tss n−1

7. Predicciones

Condicionando sobre una observaci´onx0= (x0,1, . . . , x0,k), y si llamamosex0= (1, x0,1, . . . , x0,k), la predicci´on, tanto sobre la media deY como sobre el valor deY, es

b

y0=ex^T₀·β.b Intervalos de confianza:

IC1−α(media deY |x0) =by0±t_{_n₋_k₋_1;α/2_}·sR·√ e

x^T₀(X^TX)⁻¹xe0

IC1−α(valor deY |x0) =by0±t_{n−k−1;α/2}·sR·√

1 +xe^T₀(X^TX)⁻¹ex0

En el casok= 1, dada la observaci´onx0,

IC1−α(media deY|x0) =yb0± t_{n−2;α/2}·sR·

√ 1

n+(x₀−x)² n Vx

,

IC1−α(valor deY|x0) =yb0± t_{_n₋_2;α/2_}·sR·

√ 1 + 1

n+(x0−x)² n V_x .

3

(4)

Espacio para tus anotaciones adicionales.