El modelo Lineal General
Rom ´an Salmer ´on G ´omez
Universidad de Granada
Contenidos
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Especificaci ´on del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Especificaci ´ on del modelo
Contenidos Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Modelo lineal uniecuacional m ´ ultiple
Contenidos Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
El modelo lineal uniecuacional m ´ultiple analiza la relaci ´on lineal entre una variable dependiente,
Y
, y m ´as de una variable independiente,X
i,i = 1, . . . , k
,k > 1
,m ´as un t ´ermino aleatorio,
u
.As´ı, a partir de
n
observaciones para cada variable, el modelo puede ser expresado como:Y
t= β
1+ β
2X
t2+ β
3X
t3+ · · · + β
kX
tk+ u
t, t = 1, . . . , n,
(1)donde se ha considerado que hay t ´ermino constante, es decir,
X
1t= 1
,∀t
.El objetivo ser ´a estimar (es decir, obtener una aproximaci ´on num ´erica) aque- llas cantidades constantes presentes en el modelo (1), as´ı como la bondad de la estimaci ´on realizada. En primer lugar, se escribe dicho modelo para todas y cada una de las observaciones:
Y
1= β
1+ β
2X
12+ β
3X
13+ · · · + β
kX
1k+ u
1Y
2= β
1+ β
2X
22+ β
3X
23+ · · · + β
kX
2k+ u
2.. .
.. .
Modelo lineal uniecuacional m ´ ultiple
Contenidos Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Que nos conduce a la siguiente forma matricial:
y
n×1= X
n×k· β
k×1+ u
n×1,
(2)donde:
y
n×1=
Y
1Y
2.. .
Y
n
, β
k×1=
β
1β
2.. .
β
k
, u
n×1=
u
1u
2.. .
u
n
,
X
n×k=
1 X
12. . . X
1k1 X
22. . . X
2k..
. ... . .. ...
1 X
n2. . . X
nk
.
Hip ´ otesis del modelo
Contenidos Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Consideraremos las siguientes hip ´otesis b ´asicas en el modelo lineal uniecuacional m ´ultiple:
El vector
y
se puede expresar como combinaci ´on lineal de las variables explicativas m ´as un vector de perturbaci ´on.La perturbaci ´on aleatoria est ´a centrada
(E[u
t] = 0, t = 1, . . . , n)
, eshomoced ´astica
V ar(u
t) = E[u
2t] = σ
2, t = 1, . . . , n
e incorrelada
(Cov(u
t, u
s) = E[u
t· u
s] = 0, ∀t 6= s, t, s = 1, . . . , n)
. En tal caso se dice que las perturbaciones son esf ´ericas y se verifica queE[u] = 0
n×1 yV ar(u) = E[u · u
t] = σ
2· I
n×n.
La matriz
X
es no estoc ´astica y de rango completo por columnas, es decir,rg(X) = k
(como consecuencian > k
y las columnas deX
, es decir,X
i,i = 1, . . . , n
, son linealmente independientes).No hay relaci ´on entre variables independientes y la perturbaci ´on aleatoria:
Cov(un×1, Xi) = E
(u − E[u]) · (Xi − E[Xi])t
= E
u · (X )t
= E[u ] = 0 .
Estimaci ´ on del modelo
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Estimaci ´ on m´ınimo cuadr ´atica de los coeficientes del modelo
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Definiendo los errores o residuos,
e
, del modelo lineal uniecuacional m ´ultiple como la diferencia entre los verdaderos valores de la variable dependiente y su esti- maci ´on, esto ese = y − b y,
donde
y = X b b β
, y siguiendo la premisa de minimizar la suma de los cuadrados de los residuose
te = (y − X b β)
t· (y − X b β) = y
ty − 2b β
tX
ty + b β
tX
tX b β,
se obtiene la estimaci ´on del par ´ametro
β
comoβ = X b
tX
−1· X
ty.
Dicho m ´etodo recibe el nombre de m´ınimos cuadrados ordinarios, MCO, por lo que los estimadores obtenidos a partir de dicho m ´etodo reciben el nombre de estimadores de m´ınimos cuadrados ordinarios, EMCO.
Como consecuencias de dicha estimaci ´on se verifica que
X
t· e = 0
k×1,t t t t t
Estimaci ´ on m´ınimo cuadr ´atica de los coeficientes del modelo
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Advi ´ertase que:
X
tX =
n
P
n t=1X
t2· · ·
P
n t=1X
tkP
n t=1X
t2P
n t=1X
t22· · ·
P
n t=1X
t2X
tk.. .
..
. . .. ...
P
n t=1X
tkP
n t=1X
tkX
t2· · ·
P
n t=1X
tk2
,
y
X
ty =
P
n t=1Y
tP
n t=1X
t2Y
t.. .
P
n
.
Teorema de Gauss-Markov
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Teorema 1 (Teorema de Gauss-Markov) Los estimadores de m´ınimos cuadra- dos ordinarios son lineales, insesgados y ´optimos (ELIO), es decir, tienen varianza m´ınima entre la clase de los estimadores lineales e insesgados.
En efecto, por la forma de escribirse el estimador es evidente que es lineal.
As´ı, llamando:
C
k×n= X
tX
−1k×k
· X
k×nt=
c
11c
12. . . c
1nc
21c
22. . . c
2n.. .
..
. . .. ...
c
k1c
k2. . . c
kn
,
se tiene que
β b
se expresa como combinaci ´on lineal del vectory
:β b
k×1= C
k×n· y
n×1=
c
11Y
1+ c
12Y
2+ . . . + c
1nY
nc
21Y
1+ c
22Y
2+ . . . + c
2nY
n.. .
.
Teorema de Gauss-Markov
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Para que el estimador
β b
deβ
sea insesgado se ha de cumplir queE[ b β] = β
. Enefecto, sustituyendo
y = Xβ + u
enβ b
:β b = X
tX
−1· X
ty = X
tX
−1· X
t(Xβ + u)
= β + X
tX
−1· X
tu −→ b β = β + X
tX
−1· X
tu.
Entonces, teniendo en cuenta que
E[u] = 0
:E[ b β] = E h
β + X
tX
−1· X
tu i
= β + X
tX
−1· X
t· E[u] = β.
Por otro lado, la matriz de varianzas-covarianzas de
β b
:V ar βb
= E
β − E[ bb β]
·
β − E[ bb β]t
= E
β − βb
·
β − βb t
= E h
XtX−1
Xtu · utX XtX−1i
1 1
Teorema de Gauss-Markov
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
donde se ha tenido en cuenta que
β b
es insesgado,β − β = (X b
tX)
−1X
tu
yV ar(u) = E[u · u
t] = σ
2· I
n×n.Para demostrar que
β b
es de m´ınima varianza consideraremos otro estimador,β
∗, deβ
lineal e insesgado de forma queV ar β b
< V ar (β
∗)
.En efecto,
β
∗= D
k×n· y
n×1 tal queD · X = I
k×k es lineal e insesgado.Adem ´as,
V ar (β
∗) = σ
2· DD
t.En tal caso, puesto que podemos escribir
D = (X
tX)
−1X
t+ W
conW 6= 0
k×n, se tiene queDD
t= (X
tX)
−1+ W W
t, y en tal caso:V ar (β
∗) = σ
2·DD
t= σ
2· X
tX
−1+σ
2·W W
t= V ar β b
+σ
2·W W
t,
esto es,
V ar (β
∗) − V ar β b
= σ
2· W W
t.
Y como
W W
t es definida positiva:V ar (β
∗) − V ar β b
> 0
, y en talcaso:
V ar (β
∗) > V ar β b
.
Estimaci ´ on de la varianza de la perturbaci ´ on aleatoria
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria
Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Adem ´as de los coeficientes de las variables independientes, hay en el modelo otra cantidad constante que habr ´a que estimar: la varianza de la perturbaci ´on aleatoria,
σ
2.Un estimador insesgado de
σ
2 es:σ b
2= e
te n − k ,
ya que
E[e
te] = (n − k) · σ
2.Para calcular dicho estimador se dispone de la expresi ´on:
σ b
2= y
ty − b β
tX
ty n − k .
En consecuencia, la estimaci ´on de la matriz de varianzas-covarianzas de
β b
es:V ar \ β b
= b σ
2· X
tX
−1.
Validaci ´ on del modelo
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo
Validaci ´on del modelo Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Ejemplos
Bondad de ajuste: Coeficiente de determinaci ´ on
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo
Una vez estimado el modelo lineal uniecuacional multiple, es decir, una vez ob- tenidas las estimaciones de
β
yσ
2, el siguiente paso ser ´a estudiar la calidad de dichas estimaciones.As´ı, a continuaci ´on, obtendremos el coeficiente de determinaci ´on, que no es m ´as que una medida para estudiar la bondad del ajuste lineal determinado por los estimadores por m´ınimos cuadrados ordinarios.
Dicho coeficiente de determinaci ´on, que se denota por
R
2, se define como el porcentaje de variabilidad explicada por el modelo. Por tanto, ´este se obtendr ´a como el cociente entre la varianza explicada por la estimaci ´on y la total:R
2=
1 T
·
P
n i=1Y b
i− Y
21 T
·
P
n i=1Y
i− Y
2= P
n i=1Y b
i− Y
2P
n i=1Y
i− Y
2.
Como se observa, el coeficiente de determinaci ´on queda expresado en funci ´on de la suma de cuadrados explicados (SCE) y los totales (SCT).
Bondad de ajuste: Coeficiente de determinaci ´ on
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Ejemplos
Luego, teniendo en cuenta la descomposici ´on
SCT = SCE + SCR,
se tiene que
R
2= SCE
SCT = 1 − SCR SCT .
Entonces, para calcular dicho coeficiente se dispone de la expresi ´on:
R
2= β b
tX
ty − n · Y
2y
ty − n · Y
2= 1 − y
ty − b β
tX
ty y
ty − n · Y
2.
Advi ´ertase que, siempre que el modelo lineal tenga t ´ermino independiente, el coeficiente de determinaci ´on var´ıa entre 0 y 1. El valor 0 lo toma cuando la SCE es nula y, por tanto, el modelo no es adecuado; mientras que toma el valor 1 cuando la SCR es nula y, por tanto, el modelo es adecuado.
Coeficiente de determinaci ´ on corregido
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo
Puesto que a medida que vamos incluyendo variables en el modelo el coeficiente de determinaci ´on aumenta aunque las variables que incluyamos no sean signifi- cativas, esto supone un problema.
El coeficiente de determinaci ´on corregido,
R
2, viene a resolver este problema del coeficiente de determinaci ´on. Dicho coeficiente mide el porcentaje de va- riaci ´on de la variable dependiente (al igual que el coeficiente de determinaci ´on) pero teniendo en cuenta el n ´umero de variables incluidas en el modelo. Se define como:R
2= 1 − (1 − R
2) · n − 1 n − k .
En cualquier caso, estas medidas de bondad del ajuste no deben de ser sobrevaloradas. Obtener un
R
2 oR
2 cercano a 1 no indica que los resultados sean fiables, ya que, por ejemplo, puede ser que no se cumpla alguna de las hip ´otesis b ´asicas y los resultados no ser v ´alidos. Por tanto, estos indicadores han de ser considerados como una herramienta m ´as a tener en cuenta dentro del an ´alisis.Criterios de selecci ´ on de modelos
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Ejemplos
Por otro lado, se podr´ıa pensar en usar el coeficiente de determinaci ´on para com- parar distintos modelos. En tal caso, estos deben de tener la misma variable dependiente ya que as´ı tendr ´an la misma suma de cuadrados totales. Y a ´un as´ı, habr´ıa que tener cuidado con el problema ya comentado: aumenta su valor al a ˜nadir una nueva variable explicativa, sea cual sea su aportaci ´on al modelo.
Para evitar tales problemas, a la hora de comparar modelos para elegir uno de ellos se usan los criterios de selecci ´on de modelos. M ´as concretamente, es- tudiaremos los criterios de informaci ´on de Akaike (AIC), el bayesiano de Schwarz (BIC) y el de Hannan-Quinn (HQC).
Estos criterios se obtienen a partir de la suma de cuadrados de los resi- duos y de un factor que penaliza la inclusi ´on de par ´ametros. As´ı, un modelo m ´as complejo (con m ´as variables explicativas) reducir ´a la suma de cuadrados de los residuos pero aumentar ´a el factor de penalizaci ´on.
Utilizando estos criterios se escoger´ıa aquel modelo con un menor valor de AIC, BIC o HQC.
Criterios de selecci ´ on de modelos: AIC, BIC y HQC
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo
Teniendo en cuenta que:
L = − n
2 · (1 + ln(2 · π) − ln(n)) − n
2 · ln(SCR),
el criterio de informaci ´on de Akaike responde a la expresi ´on:
AIC = −2 · L + 2 · k,
el de Schwarz a:
BIC = −2 · L + k · ln(n),
y el de Hannan-Qinn:
HQC = −2 · L + 2 · k · ln (ln(n)) .
Distribuci ´ on en el muestreo de los estimadores MCO
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Ejemplos
Introduciendo la hip ´otesis de que la perturbaci ´on aleatoria sigue una distribuci ´on normal, esto es:
u
n×1∼ N(0
n×1, σ
2· I
n×n).
En consecuencia,
β b
k×1∼ N(β, σ
2· (X
tX)
−1)
, ya que:
β b
sigue una distribuci ´on normal ya que se puede expresar en funci ´on de una normal:β = β + (X b
tX)
−1· X
tu
.se tienen calculados el vector de medias,
E h β b i
= β
, y matriz de varianzas-covarianzas,V ar
β b
= σ
2· (X
tX)
−1.Por otro lado, ya que
e
te = u
tM u
siendoM
n×n= I − X (X
tX)
−1X
tsim ´etrica, idempotente y con
rg(M ) = n − k < k
se tiene que utσM u2∼ χ
2n−k,
lo que se traduce en que
(n − k) · b σ
2σ
2∼ χ
2n−k.
Contraste de un conjunto de hip ´ otesis lineales
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo
A continuaci ´on abordaremos la especificaci ´on de contrastes sobre un conjunto de hip ´otesis lineales sobre los coeficientes del modelo. Concretamente, suponiendo
q
restricciones lineales independientes entre s´ı:a
11β
1+ a
12β
2+ · · · + a
1kβ
k= b
1a
21β
1+ a
22β
2+ · · · + a
2kβ
k= b
2.. .
..
.
=
...a
q1β
1+ a
q2β
2+ · · · + a
qkβ
k= b
qPlantearemos contrastar la hip ´otesis nula
H
0: Rβ = r
dondeR
q×k=
a
11a
12. . . a
1ka
21a
22. . . a
2k.. .
..
. . .. ...
a
q1a
q2. . . a
qk
, r
q×1=
b
1b
2.. .
b
q
.
Contraste de un conjunto de hip ´ otesis lineales
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Ejemplos
Usando la distribuci ´on
R b β − Rβ
t· h
R (X
tX)
−1R
ti
−1q · b σ
2·
R b β − Rβ
∼ F
q,n−k,
rechazaremos la hip ´otesis nula al nivel de significaci ´on
α
siR b β − r
t·
h R (X
tX)
−1R
ti
−1q · b σ
2·
R b β − r
> F
q,n−k(1 − α),
donde
F
q,n−k(1 − α)
es el punto de unaF
de Senedecor deq
yn − k
gradosde libertad que deja por debajo suyo una probabilidad
1 − α
.Casos particulares
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo
Un caso particular de suma importancia ser ´a aquel en el que se desee contrastar la hip ´otesis nula
H
0: β
i= b
i,i = 1, . . . , k
.En tal caso,
q = 1
,R = (0 0 . . . 1
i). . . 0)
yr = b
i, por lo que la distribuci ´on anterior queda simplificada comoβ b
i− b
i2b σ
2· w
i∼ F
1,n−k,
donde
w
i es el elemento (i,i) de la matriz(X
tX)
−1, o lo que es lo mismo,σ b
2· w
ies el elemento (i,i) de
σ b
2· (X
tX)
−1= \ V ar
β b
, esto es, la varianza estimada de
β b
i.Teniendo en cuenta que la ra´ız cuadrada de una F-Snedecor con 1 y
n
gradosde libertad es una t-Student con
n
grados de libertad se tiene queβ b
i− b
i√ ∼ t
n−k,
Casos particulares
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Ejemplos
y en tal caso rechazaremos
H
0: β
i= b
i al nivel de significaci ´onα
siβ b
i− b
ib σ · √ w
i> t
n−k1 − α 2
,
donde
t
n−k1 −
α2es el punto de una distribuci ´on
t
de student conn − k
grados de libertad que deja por debajo suya una probabilidad
1 −
α2.Este caso particular es de vital importancia cuando
b
i= 0
, ya que entonces estaremos contrastando si el coeficiente de la variable independienteX
i es o no nulo. De forma que al rechazar dicha hip ´otesis tenemos garantizado que la variableX
i ha de estar en el modelo, por lo que sus variaciones influyen en la variable dependiente. En tal caso se dice que dicha variable es significativa y que el contraste es un contraste de significaci ´on individual.M´ınimos Cuadrados Restringidos
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo
En el caso en el que no se rechace la hip ´otesis nula
H
0: Rβ = r
, ser´ıa deseable incorporar dicha informaci ´on al modelo. En tal caso, se obtiene un nuevo estima- dor:β b
R= b β + X
tX
−1R
th
R X
tX
−1R
ti
−1·
r − R b β ,
que recibe el nombre de m´ınimos cuadrados restringidos ya que se ha obtenido con la restricci ´on de que ha de verificar que
R b β
R= r
.Dicho estimador es lineal, insesgado siempre que la hip ´otesis nula
H
0: Rβ = r
sea cierta y ´optimo. Es decir, el estimador por m´ınimos cuadrados restringidos tiene menor varianza que el estimador m´ınimo cuadr ´atico ordinario siempre y cuando la restricci ´on (hip ´otesis nula) sea cierta.Luego, cuando una restricci ´on lineal sobre los coeficientes de las variables independientes es cierta, el estimador por m´ınimos cuadrados ordinarios deja de ser ´optimo y habr ´a que usar el estimador por m´ınimos cuadrados restringidos.
Adem ´as se verifica que:
SCR
R≥ SCR, R
2R≤ R
2.
An ´alisis de la varianza
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Ejemplos
El an ´alisis de la varianza aborda el contraste que tiene por hip ´otesis nula que todos los coeficientes de las variables independientes son nulos simult ´aneamente, esto es,
H
0: β
2= β
3= · · · = β
k= 0
.Salta a la vista que estamos ante un caso particular de un contraste sobre
k − 1
restricciones lineales de los coeficientes de las variables independientes.En este caso, rechazaremos la hip ´otesis nula al nivel de significaci ´on
α
siF
exp=
SCE k−1 SCR
n−k
> F
k−1,n−k(1 − α).
Para calcular dicho estad´ıstico se suele resumir la informaci ´on anterior en una tabla, conocida como tabla de an ´alisis de la varianza (tabla ANOVA) ya que en ella se recogen las fuentes de variaci ´on de la varianza:
Fuente de variaci ´on Suma de Cuadrados Grados de Libertad Medias Explicada SCE = bβtXty − nY 2 k − 1 SCEk−1
Residuos SCR = yty − bβtXty n − k SCRn−k
Total SCT = yty − nY 2 n − 1
An ´alisis de la varianza
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo
Advi ´ertase que rechazar
H
0 implica que hay al menos un coeficiente no nulo, por lo que la relaci ´on existente entre las variables independientes y la dependiente no se debe al azar, lo cual valida el modelo en su conjunto.Por otro lado, sin m ´as que dividir la regi ´on de rechazo por SCT tanto en el numerador como en el denominador se obtiene la expresi ´on equivalente:
R2 k−1 1−R2
n−k
> F
k−1,n−k(1 − α).
La importancia de esta nueva expresi ´on para la regi ´on de rechazo es que permite calcular una cota, sin m ´as que despejar
R
2, a partir de la cual el coeficiente de determinaci ´on es significativo. Esto es, el coefciente de determinaci ´on es signifi- cativo al nivel de significaci ´onα
siR
2>
k−1
n−k
· F
k−1,n−k(1 − α)
1 +
n−kk−1· F
k−1,n−k(1 − α) .
Intervalos de confianza
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste:
Coeficiente de determinaci ´on Criterios de selecci ´on de modelos
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza
Explotaci ´on del modelo Ejemplos
A partir de las distribuciones en el muestreo para los estimadores estudiados es inmediato obtener los siguientes intervalos de confianza al nivel
1 − α
:Intervalo de confianza para
β
iβ b
i± t
n−k1 − α 2
· b σ · √
w
i, i = 1, . . . , k.
Intervalo de confianza para
σ
2"
(n − k) · b σ
2χ
2n−k1 −
α2, (n − k) · b σ
2χ
2n−k α2# ,
donde
χ
2n−k1 −
α2y
χ
2n−k α2son los puntos de una distribuci ´on chi- cuadrado con
n−k
grados de libertad que dejan a su izquierda, respectivamente, una probabilidad1 −
α2 y α2.Una forma alternativa de contrastar hip ´otesis es usando los intervalos de confianza. De manera que para contrastar
H
0: Rβ = r
se calcular ´a la regi ´on de confianza paraRβ
y sir
pertenece a dicha regi ´on, no se rechazar ´a la hip ´otesis nula.Explotaci ´ on del modelo
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual Optima´
Predicci ´on por intervalo Contraste de Permanencia Estructural Ejemplos
Predicci ´ on Puntual ´ Optima
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual Optima´
Predicci ´on por intervalo Contraste de Permanencia Estructural Ejemplos
Una vez validado el modelo, la siguiente fase de un modelo econom ´etrico es la explotaci ´on, siendo entonces la predicci ´on o la permanencia estructural algunos de sus objetivos.
La predicci ´on se realiza desde dos puntos de vista: a) por un lado realizare- mos una predicci ´on puntual dando un ´unico valor de predicci ´on para un instante en concreto; b) por otra parte, puesto que
Y
es una variable aleatoria, podemos calcular su esperanza dado un valor en concreto de las variables independientes.Siguiendo las directrices anteriores se llega a la misma expresi ´on algebr ´aica en ambos casos:
p
0= x
t0· b β,
donde
x
t0= (1 X
02X
03. . . X
0k)
contiene los valores de las variables inde- pendientes para los que se quiere obtener la predicci ´on.Este predictor,
p
0, m´ınimo cuadr ´atico (ya que se obtiene a partir del estima- dor por m´ınimos cuadrados ordinarios deβ
) es lineal, insesgado y ´optimo (en el sentido de m´ınima varianza).Predicci ´ on por intervalo
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual Optima´
Predicci ´on por intervalo Contraste de Permanencia Estructural Ejemplos
En este apartado calcularemos el intervalo de confianza para el valor esperado de
Y
dadox
0, es decir, paraE[Y
0/x
0] = x
t0· β
.Como
x
t0· b β
se distribuye seg ´un una normal (ya que est ´a en funci ´on deβ b
) y
E[x
t0· b β] = x
t0β
, ya que es insesgado.
V ar
x
t0· b β
= E h
x
t0· b β − x
t0· β
·
x
t0· b β − x
t0· β i
= x
t0· E
β − β b
·
β − β b
t· x
0= x
t0· V ar β b
· x
0= σ
2· x
t0(X
tX)
−1x
0.
se tiene que
x
t0· b β ∼ N
x
t0· β, σ
2· x
t0X
tX
−1x
0.
Ahora bien, esta distribuci ´on no es apta para hacer inferencia puesto que depende de la cantidad desconocida
σ
2. Para resolver este problema, tipificare- mos la anterior distribuci ´on normal y la dividiremos entre la ra´ız cuadrada de laPredicci ´ on por intervalo
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual Optima´
Predicci ´on por intervalo Contraste de Permanencia Estructural Ejemplos
(n − k) · b σ
2σ
2∼ χ
2n−k,
dividida a su vez entre sus grados de libertad, obteniendo la siguiente distribuci ´on t-Student:
x
t0· b β − x
t0· β σ · b
q
x
t0(X
tX)
−1x
0∼ t
n−k.
A partir de esta distribuci ´on, el intervalo de confianza al nivel
1 − α
paraE[Y
0/x
0] = x
t0· β
es:x
t0· b β ± t
n−k1 − α 2
· b σ · q
x
t0(X
tX)
−1x
0,
donde
t
n−k1 −
α2es el punto de una distribuci ´on
t
de Student conn − k
grados de libertad que deja a su izquierda una probabilidad
1 −
α2.Contraste de Permanencia Estructural
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual Optima´
Predicci ´on por intervalo Contraste de Permanencia Estructural Ejemplos
Al explotar el modelo mediante la predicci ´on se est ´a presuponiendo que la relaci ´on estimada se mantiene para la informaci ´on no presente en la muestra observada.
Para confirmar este aspecto, calcularemos el intervalo de confianza para
Y
dadox
0, de forma que si la nueva informaci ´on pertenece a dicho intervalo, la estructura del modelo estimado permanecer ´a.Partiendo de que
Y
0− b Y
0= u
0− x
t0β − β b
∼ N
0, σ
2·
1 + x
t0X
tX
−1x
0,
se llega de forma an ´aloga a la anterior a la distribuci ´on
Y
0− b Y
0σ · b
q
1 + x
t0(X
tX)
−1x
0∼ t
n−k,
donde
Y b
0= x
t0· b β
. Por tanto, el intervalo de confianza al nivel1 − α
paraY
0 es:α q
Ejemplos
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Ejemplo 1 Ejemplo 2 Ejemplo 3
Ejemplo 1
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Ejemplo 1 Ejemplo 2 Ejemplo 3
A continuaci ´on vamos a realizar un an ´alisis exhaustivo del modelo
Y
t= β
1+ β
2· X
t2+ β
3· X
t3+ u
t,
a partir de las siguiente informaci ´on muestral:
Observaci ´on
Y
tX
t2X
t31 16 1 1
2 26 3 2
3 30 5 -1
4 44 7 3
5 56 8 -2
6 64 10 0
7 68 10 1
8 72 12 4
En primer lugar calcularemos la estimaci ´on por m´ınimos cuadrados ordinarios de los coeficientes de las variables a partir de la expresi ´on
Ejemplo 1
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Ejemplo 1 Ejemplo 2 Ejemplo 3
A partir de la informaci ´on muestral anterior es claro que:
y =
16 26 30 44 56 64 68 72
, X =
1 1 1
1 3 2
1 5 −1
1 7 3
1 8 −2 1 10 0 1 10 1 1 12 4
,
de forma que:
X
tX =
8 56 8 56 492 65
8 65 36
, X
ty =
376 3184
414
,
y entonces a partir de la f ´ormula (3):
Ejemplo 1
Contenidos Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Ejemplos
Ejemplo 1 Ejemplo 2 Ejemplo 3
β b =
8 56 8 56 492 65
8 65 36
−1
·
376 3184
414
=
0
′62 −0
′0688 −0
′0136
−0
′0688 0
′0103 −0
′0033
−0
′0136 −0
′0033 0
′0368
·
376 3184
414
=
8
′5189 5
′5587
−0
′4296
.
Es decir,