Introducci ´ on a la Econometr´ıa El modelo de regresi ´ on lineal m ´ ultiple Incumplimiento de las hip ´ otesis b ´asicas
Rom ´an Salmer ´on G ´omez
Universidad de Granada
Contenidos
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Introducci ´on
Especificaci ´on del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad
Heteroscedasticidad Autocorrelaci ´on
Introducci ´ on
Contenidos
Introducci ´on Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Econometr´ıa
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
La Estad´ıstica juega un papel importante en cualquier ciencia emp´ırica a la hora de estimular la formulaci ´on de modelos y contrastarlos. En la ciencia econ ´omica este papel se hace especialmente importante hasta el punto de que la necesidad de extender la Estad´ıstica ha dado lugar al nacimiento de una disciplina nueva que hoy goza de una gran vitalidad: la Econometr´ıa.
La Econometr´ıa es una rama de la Econom´ıa que aglutina a la Teor´ıa Econ ´omica, las Matem ´aticas, la Estad´ıstica y la Inform ´atica para estudiar y ana- lizar fen ´omenos econ ´omicos. Puede decirse que constituye en s´ı misma una dis- ciplina dentro de la Econom´ıa y a la vez una potente herramienta que tanto los economistas como otros muchos investigadores sociales utilizan para el estudio de sus problemas concretos. El principal prop ´osito de la Econometr´ıa es propor- cionar un sustrato emp´ırico a la Teor´ıa Econ ´omica.
Una breve descripci ´on de la historia econom ´etrica la puedes encontrar en las lecturas recomendadas.
Definici ´ on de Econometr´ıa
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
De entre las muchas definiciones existentes sobre la Econometr´ıa destacar´ıa la siguiente:
“La Econometr´ıa, usando la Teor´ıa Econ ´omica, las Matem ´aticas y la Inferencia Estad´ıstica como fundamentos anal´ıticos, y los datos econ ´omicos como la base informativa, proporciona una base para:
1. Modificar, refinar o posiblemente refutar las conclusiones en el cuerpo de conocimientos conocido como Teor´ıa Econ ´omica.
2. Conseguir signos, magnitudes y afirmaciones de calidad para los coeficientes de las variables en las relaciones econ ´omicas, de modo que esta informaci ´on puede usarse como base para la elecci ´on y toma de decisiones.”
Judge y otros (1985)
Modelo econ ´ omico y econom ´etrico
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Modelo econ ´omico: Un modelo econ ´omico es una representaci ´on simplificada de la realidad econ ´omica mediante la expresi ´on matem ´atica de una determina- da teor´ıa econ ´omica.
Modelo econom ´etrico: Un modelo econom ´etrico es aquel modelo econ ´omico que contiene todos los elementos necesarios para ser estudiado desde un pun- to de vista emp´ırico. Es decir, un modelo econ ´omico en el que se ha especi- ficado el tipo de relaci ´on entre variables (en este curso lineal), el n ´umero de variables, introducci ´on de la perturbaci ´on aleatoria (para recoger el efecto de las variables no incluidas fundamentalmente), etc.
As´ı, por ejemplo, un modelo econ ´omico es aquel en el que se especifica que el consumo es una funci ´on de la renta:
Consumo = f (Renta)
.Mientras el modelo econom ´etrico ser ´a aquel en el que se establece que la relaci ´on es lineal y se introduce la perturbaci ´on aleatoria
u
t:Consumo
t= β
1+ β
2· Renta
t+ u
t.
Fases del m ´etodo econom ´etrico
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
La elaboraci ´on de un modelo econom ´etrico se puede dividir en las siguientes fases:
Especificaci ´on: En esta fase se propone la forma matem ´atica de la relaci ´on que liga las variables presentes en el modelo y la perturbaci ´on aleatoria. Tambi ´en debe decidirse el n ´umero de ecuaciones y variables que forman el modelo. Todo ello se realizar ´a partiendo de la Teor´ıa Econ ´omica.
Estimaci ´on: Esta fase consiste en la obtenci ´on de valores num ´ericos de las cantidades constantes del modelo econom ´etrico. Por tanto, ser ´a necesario dis- poner de informaci ´on emp´ırica sobre el fen ´omeno (datos) y haber decidido el m ´etodo de estimaci ´on a usar.
Validaci ´on: En esta fase se eval ´uan los resultados obtenidos en la etapa ante- rior para decidir si los mismos son o no aceptables tanto desde el punto de vista de la teor´ıa econ ´omica (magnitudes, signos, etc) como desde el punto de vista estad´ıstico (validez del modelo).
Explotaci ´on: Si el modelo es aceptado, este puede ser usado para la predicci ´on y contrastar la permanencia de la estructura estimada.
Componentes de un modelo econom ´etrico
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Las principales componentes de un modelo econom ´etrico son:
Variables: Dentro de las variables podemos distinguir entre las variables obser- vables (aquellas de las que se disponen datos) y no observables (la perturba- ci ´on aleatoria). Y dentro de las primeras tenemos a las variables dependientes, explicadas o end ´ogenas (aquellas que est ´an influidas por otras variables) y va- riables independientes, explicativas o ex ´ogenas (aquellas que no est ´an influidas por otras).
Par ´ametros: Los par ´ametros son las cantidades fijas o constantes del mode- lo econom ´etrico que se desean estimar (los coeficientes de las variables y la varianza de la perturbaci ´on aleatoria).
Ecuaciones: Las relaciones entre las distintas variables se explicitar ´a mediante una o m ´as ecuaciones.
Naturaleza de la informaci ´ on utilizada en Econometr´ıa
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Los datos econ ´omicos suelen ser de clases muy variadas, siendo los tipos m ´as importantes los siguientes:
Datos de corte transversal: son un conjunto de datos formada por unidades (individuos, empresas, regiones, etc) observadas en un momento determinado (d´ıa, mes, trimestre, a ˜no, etc). Por ejemplo, el consumo de varias familias en un mes en concreto.
Datos de series temporales: son un conjunto de datos formado por observa- ciones de una misma variable a lo largo del tiempo. Por ejemplo, el consumo mensual de una familia a lo largo de todo un a ˜no.
Datos de panel o longitudinales: son un conjunto de datos que combinan una dimensi ´on temporal con otra transversal. Por ejemplo, el consumo mensual de un conjunto de familias a lo largo de todo un a ˜no.
Habr ´a que atender al tipo de datos que se analicen ya que dependiendo de su naturaleza se podr ´an aplicar unos u otros m ´etodos econom ´etricos.
Especificaci ´ on del modelo
Contenidos
Introducci ´on Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Modelo lineal uniecuacional m ´ ultiple
Contenidos
Introducci ´on Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
El modelo lineal uniecuacional m ´ultiple analiza la relaci ´on lineal entre una variable dependiente,
Y
, y m ´as de una variable independiente,X
i,i = 1, . . . , k
,k > 1
,m ´as un t ´ermino aleatorio,
u
.As´ı, a partir de
n
observaciones para cada variable, el modelo puede ser expresado como:Y
t= β
1+ β
2X
t2+ β
3X
t3+ · · · + β
kX
tk+ u
t, t = 1, . . . , n,
(1)donde se ha considerado que hay t ´ermino constante, es decir,
X
1t= 1
,∀t
.El objetivo ser ´a estimar (es decir, obtener una aproximaci ´on num ´erica) aque- llas cantidades constantes presentes en el modelo (1), as´ı como la bondad de la estimaci ´on realizada. En primer lugar, se escribe dicho modelo para todas y cada una de las observaciones:
Y
1= β
1+ β
2X
12+ β
3X
13+ · · · + β
kX
1k+ u
1Y
2= β
1+ β
2X
22+ β
3X
23+ · · · + β
kX
2k+ u
2.. .
.. .
Y
n= β
1+ β
2X
n2+ β
3X
n3+ · · · + β
kX
nk+ u
nModelo lineal uniecuacional m ´ ultiple
Contenidos
Introducci ´on Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Que nos conduce a la siguiente forma matricial:
y
n×1= X
n×k· β
k×1+ u
n×1,
(2)donde:
y
n×1=
Y
1Y
2.. .
Y
n
, β
k×1=
β
1β
2.. .
β
k
, u
n×1=
u
1u
2.. .
u
n
,
X
n×k=
1 X
12. . . X
1k1 X
22. . . X
2k..
. ... . .. ...
1 X
n2. . . X
nk
.
Hip ´ otesis del modelo
Contenidos
Introducci ´on Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Consideraremos las siguientes hip ´otesis b ´asicas en el modelo lineal uniecuacional m ´ultiple:
El vector
y
se puede expresar como combinaci ´on lineal de las variables expli- cativas m ´as un vector de perturbaci ´on.La perturbaci ´on aleatoria est ´a centrada
(E[u
t] = 0, t = 1, . . . , n)
, eshomoced ´astica
V ar(u
t) = E[u
2t] = σ
2, t = 1, . . . , n
e incorrelada
(Cov(u
t, u
s) = E[u
t· u
s] = 0, ∀t 6= s, t, s = 1, . . . , n)
. En tal caso se dice que las perturbaciones son esf ´ericas y se verifica queE[u] = 0
n×1 yV ar(u) = E[u · u
t] = σ
2· I
n×n.
La matriz
X
es no estoc ´astica y de rango completo por columnas, es decir,rg(X) = k
(como consecuencian > k
y las columnas deX
, es decir,X
i,i = 1, . . . , n
, son linealmente independientes).No hay relaci ´on entre variables independientes y la perturbaci ´on aleatoria:
Cov(un×1, Xi) = E
(u − E[u]) · (Xi − E[Xi])t
= E
u · (Xi − Xi)t
= E[un×1 · 01×n] = 0n×n.
Estimaci ´ on del modelo
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Estimaci ´ on m´ınimo cuadr ´atica de los coeficientes del modelo
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Definiendo los errores o residuos,
e
, del modelo lineal uniecuacional m ´ultiple como la diferencia entre los verdaderos valores de la variable dependiente y su estima- ci ´on, esto ese = y − b y,
donde
y = X b b β
, y siguiendo la premisa de minimizar la suma de los cuadrados de los residuose
te = (y − X b β)
t· (y − X b β) = y
ty − 2b β
tX
ty + b β
tX
tX b β,
se obtiene la estimaci ´on del par ´ametro
β
comoβ = X b
tX
−1· X
ty.
Dicho m ´etodo recibe el nombre de m´ınimos cuadrados ordinarios, MCO, por lo que los estimadores obtenidos a partir de dicho m ´etodo reciben el nombre de estimadores de m´ınimos cuadrados ordinarios, EMCO.
Como consecuencias de dicha estimaci ´on se verifica que
X
t· e = 0
k×1,i
t· e = 0
1×1,i
t· b y = i
t· y
yy b
t· e = 0
1×1 dondei
t= (1 1 . . . 1)
1×n.Estimaci ´ on m´ınimo cuadr ´atica de los coeficientes del modelo
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Advi ´ertase que:
X
tX =
n
P
n t=1X
t2· · ·
P
n t=1X
tkP
n t=1X
t2P
n t=1X
t22· · ·
P
n t=1X
t2X
tk.. .
..
. . .. ...
P
n t=1X
tkP
n t=1X
tkX
t2· · ·
P
n t=1X
tk2
,
y
X
ty =
P
n t=1Y
tP
n t=1X
t2Y
t.. .
P
n t=1X
tkY
t
.
Teorema de Gauss-Markov
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Teorema 1 (Teorema de Gauss-Markov) Los estimadores de m´ınimos cuadra- dos ordinarios son lineales, insesgados y ´optimos (ELIO), es decir, tienen varianza m´ınima entre la clase de los estimadores lineales e insesgados.
En efecto, por la forma de escribirse el estimador es evidente que es lineal.
As´ı, llamando:
C
k×n= X
tX
−1k×k
· X
k×nt=
c
11c
12. . . c
1nc
21c
22. . . c
2n.. .
..
. . .. ...
c
k1c
k2. . . c
kn
,
se tiene que
β b
se expresa como combinaci ´on lineal del vectory
:β b
k×1= C
k×n· y
n×1=
c
11Y
1+ c
12Y
2+ . . . + c
1nY
nc
21Y
1+ c
22Y
2+ . . . + c
2nY
n.. .
c
k1Y
1+ c
k2Y
2+ . . . + c
knY
n
.
Teorema de Gauss-Markov
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Para que el estimador
β b
deβ
sea insesgado se ha de cumplir queE[ b β] = β
. Enefecto, sustituyendo
y = Xβ + u
enβ b
:β b = X
tX
−1· X
ty = X
tX
−1· X
t(Xβ + u)
= β + X
tX
−1· X
tu −→ b β = β + X
tX
−1· X
tu.
Entonces, teniendo en cuenta que
E[u] = 0
:E[ b β] = E h
β + X
tX
−1· X
tu i
= β + X
tX
−1· X
t· E[u] = β.
Por otro lado, la matriz de varianzas-covarianzas de
β b
:V ar βb
= E
βb− E[ bβ]
·
βb− E[ bβ]t
= E
βb− β
·
βb− βt
= E h
XtX−1
Xtu · utX XtX−1i
= XtX−1
Xt · E[u · ut] · X XtX−1
= σ2 · XtX−1
XtX XtX−1
= σ2 · XtX−1
,
Teorema de Gauss-Markov
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
donde se ha tenido en cuenta que
β b
es insesgado,β − β = (X b
tX)
−1X
tu
yV ar(u) = E[u · u
t] = σ
2· I
n×n.Para demostrar que
β b
es de m´ınima varianza consideraremos otro estimador,β
∗, deβ
lineal e insesgado de forma queV ar β b
< V ar (β
∗)
.En efecto,
β
∗= D
k×n· y
n×1 tal queD · X = I
k×k es lineal e insesgado.Adem ´as,
V ar (β
∗) = σ
2· DD
t.En tal caso, puesto que podemos escribir
D = (X
tX)
−1X
t+ W
conW 6= 0
k×n, se tiene queDD
t= (X
tX)
−1+ W W
t, y en tal caso:V ar (β
∗) = σ
2·DD
t= σ
2· X
tX
−1+σ
2·W W
t= V ar β b
+σ
2·W W
t,
esto es,
V ar (β
∗) − V ar β b
= σ
2· W W
t.
Y como
W W
t es definida positiva:V ar (β
∗) − V ar β b
> 0
, y en talcaso:
V ar (β
∗) > V ar β b
.
Estimaci ´ on de la varianza de la perturbaci ´ on aleatoria
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo
Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria
Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Adem ´as de los coeficientes de las variables independientes, hay en el modelo otra cantidad constante que habr ´a que estimar: la varianza de la perturbaci ´on aleatoria,
σ
2.Un estimador insesgado de
σ
2 es:b
σ
2= e
te n − k ,
ya que
E[e
te] = (n − k) · σ
2.Para calcular dicho estimador se dispone de la expresi ´on:
b
σ
2= y
ty − b β
tX
ty n − k .
En consecuencia, la estimaci ´on de la matriz de varianzas-covarianzas de
β b
es:V ar \ β b
= b σ
2· X
tX
−1.
Validaci ´ on del modelo
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Bondad de ajuste: Coeficiente de determinaci ´ on
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Una vez estimado el modelo lineal uniecuacional multiple, es decir, una vez ob- tenidas las estimaciones de
β
yσ
2, el siguiente paso ser ´a estudiar la calidad de dichas estimaciones.As´ı, a continuaci ´on, obtendremos el coeficiente de determinaci ´on, que no es m ´as que una medida para estudiar la bondad del ajuste lineal determinado por los estimadores por m´ınimos cuadrados ordinarios.
Dicho coeficiente de determinaci ´on, que se denota por
R
2, se define como el porcentaje de variabilidad explicada por el modelo. Por tanto, ´este se obtendr ´a co- mo el cociente entre la varianza explicada por la estimaci ´on y la total:R
2=
1 T
·
P
n i=1Y b
i− Y
21 T
·
P
n i=1Y
i− Y
2= P
n i=1Y b
i− Y
2P
n i=1Y
i− Y
2.
Como se observa, el coeficiente de determinaci ´on queda expresado en funci ´on de la suma de cuadrados explicados (SCE) y los totales (SCT).
Bondad de ajuste: Coeficiente de determinaci ´ on
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Luego, teniendo en cuenta la descomposici ´on
SCT = SCE + SCR,
se tiene que
R
2= SCE
SCT = 1 − SCR SCT .
Entonces, para calcular dicho coeficiente se dispone de la expresi ´on:
R
2= β b
tX
ty − n · Y
2y
ty − n · Y
2= 1 − y
ty − b β
tX
ty y
ty − n · Y
2.
Advi ´ertase que, siempre que el modelo lineal tenga t ´ermino independiente, el coeficiente de determinaci ´on var´ıa entre 0 y 1. El valor 0 lo toma cuando la SCE es nula y, por tanto, el modelo no es adecuado; mientras que toma el valor 1 cuando la SCR es nula y, por tanto, el modelo es adecuado.
Coeficiente de determinaci ´ on corregido
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Puesto que a medida que vamos incluyendo variables en el modelo el coeficiente de determinaci ´on aumenta aunque las variables que incluyamos no sean signifi- cativas, esto supone un problema.
El coeficiente de determinaci ´on corregido,
R
2, viene a resolver este proble- ma del coeficiente de determinaci ´on. Dicho coeficiente mide el porcentaje de va- riaci ´on de la variable dependiente (al igual que el coeficiente de determinaci ´on) pero teniendo en cuenta el n ´umero de variables incluidas en el modelo. Se define como:R
2= 1 − (1 − R
2) · n − 1 n − k .
En cualquier caso, estas medidas de bondad del ajuste no deben de ser sobrevaloradas. Obtener un
R
2 oR
2 cercano a 1 no indica que los resultados sean fiables, ya que, por ejemplo, puede ser que no se cumpla alguna de las hip ´otesis b ´asicas y los resultados no ser v ´alidos. Por tanto, estos indicadores han de ser considerados como una herramienta m ´as a tener en cuenta dentro del an ´alisis.Distribuci ´ on en el muestreo de los estimadores MCO
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Introduciendo la hip ´otesis de que la perturbaci ´on aleatoria sigue una distribuci ´on normal, esto es:
u
n×1∼ N(0
n×1, σ
2· I
n×n).
En consecuencia,
β b
k×1∼ N(β, σ
2· (X
tX)
−1)
, ya que:β b
sigue una distribuci ´on normal ya que se puede expresar en funci ´on de una normal:β = β + (X b
tX)
−1· X
tu
.se tienen calculados el vector de medias,
E h β b i
= β
, y matriz de varianzas- covarianzas,V ar
β b
= σ
2· (X
tX)
−1.Por otro lado, ya que
e
te = u
tM u
siendoM
n×n= I − X (X
tX)
−1X
tsim ´etrica, idempotente y con
rg(M ) = n − k < k
se tiene que utM u
σ2
∼ χ
2n−k,
lo que se traduce en que
(n − k) · b σ
2σ
2∼ χ
2n−k.
Contraste de un conjunto de hip ´ otesis lineales
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
A continuaci ´on abordaremos la especificaci ´on de contrastes sobre un conjunto de hip ´otesis lineales sobre los coeficientes del modelo. Concretamente, suponiendo
q
restricciones lineales independientes entre s´ı:a
11β
1+ a
12β
2+ · · · + a
1kβ
k= b
1a
21β
1+ a
22β
2+ · · · + a
2kβ
k= b
2.. .
..
.
=
...a
q1β
1+ a
q2β
2+ · · · + a
qkβ
k= b
qPlantearemos contrastar la hip ´otesis nula
H
0: Rβ = r
dondeR
q×k=
a
11a
12. . . a
1ka
21a
22. . . a
2k.. .
..
. . .. ...
a
q1a
q2. . . a
qk
, r
q×1=
b
1b
2.. .
b
q
.
Contraste de un conjunto de hip ´ otesis lineales
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Usando la distribuci ´on
R b β − Rβ
t·
h R (X
tX)
−1R
ti
−1q · b σ
2·
R b β − Rβ
∼ F
q,n−k,
rechazaremos la hip ´otesis nula al nivel de significaci ´on
α
siR b β − r
t·
h R (X
tX)
−1R
ti
−1q · b σ
2·
R b β − r
> F
q,n−k(1 − α),
donde
F
q,n−k(1 − α)
es el punto de unaF
de Senedecor deq
yn − k
gradosde libertad que deja por debajo suyo una probabilidad
1 − α
.Casos particulares
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Un caso particular de suma importancia ser ´a aquel en el que se desee contrastar la hip ´otesis nula
H
0: β
i= b
i,i = 1, . . . , k
.En tal caso,
q = 1
,R = (0 0 . . . 1
i). . . 0)
yr = b
i, por lo que la distribuci ´on anterior queda simplificada comoβ b
i− b
i2b
σ
2· w
i∼ F
1,n−k,
donde
w
i es el elemento (i,i) de la matriz(X
tX)
−1, o lo que es lo mismo,σ b
2·w
ies el elemento (i,i) de
σ b
2· (X
tX)
−1= \ V ar
β b
, esto es, la varianza estimada de
β b
i.Teniendo en cuenta que la ra´ız cuadrada de una F-Snedecor con 1 y
n
gradosde libertad es una t-Student con
n
grados de libertad se tiene queβ b
i− b
ib
σ · √ w
i∼ t
n−k,
Casos particulares
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
y en tal caso rechazaremos
H
0: β
i= b
i al nivel de significaci ´onα
siβ b
i− b
ib
σ · √ w
i> t
n−k1 − α 2
,
donde
t
n−k1 −
α2es el punto de una distribuci ´on
t
de student conn − k
grados de libertad que deja por debajo suya una probabilidad
1 −
α2.Este caso particular es de vital importancia cuando
b
i= 0
, ya que entonces estaremos contrastando si el coeficiente de la variable independienteX
i es o no nulo. De forma que al rechazar dicha hip ´otesis tenemos garantizado que la variableX
i ha de estar en el modelo, por lo que sus variaciones influyen en la variable dependiente. En tal caso se dice que dicha variable es significativa y que el contraste es un contraste de significaci ´on individual.M´ınimos Cuadrados Restringidos
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
En el caso en el que no se rechace la hip ´otesis nula
H
0: Rβ = r
, ser´ıa deseable incorporar dicha informaci ´on al modelo. En tal caso, se obtiene un nuevo estima- dor:β b
R= b β + X
tX
−1R
th
R X
tX
−1R
ti
−1·
r − R b β ,
que recibe el nombre de m´ınimos cuadrados restringidos ya que se ha obtenido con la restricci ´on de que ha de verificar que
R b β
R= r
.Dicho estimador es lineal, insesgado siempre que la hip ´otesis nula
H
0: Rβ = r
sea cierta y ´optimo. Es decir, el estimador por m´ınimos cuadrados restrin- gidos tiene menor varianza que el estimador m´ınimo cuadr ´atico ordinario siempre y cuando la restricci ´on (hip ´otesis nula) sea cierta.Luego, cuando una restricci ´on lineal sobre los coeficientes de las variables independientes es cierta, el estimador por m´ınimos cuadrados ordinarios deja de ser ´optimo y habr ´a que usar el estimador por m´ınimos cuadrados restringidos.
Adem ´as se verifica que:
SCR
R≥ SCR, R
2R≤ R
2.
An ´alisis de la varianza
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
El an ´alisis de la varianza aborda el contraste que tiene por hip ´otesis nula que todos los coeficientes de las variables independientes son nulos simult ´aneamente, esto es,
H
0: β
2= β
3= · · · = β
k= 0
.Salta a la vista que estamos ante un caso particular de un contraste sobre
k − 1
restricciones lineales de los coeficientes de las variables independientes.En este caso, rechazaremos la hip ´otesis nula al nivel de significaci ´on
α
siF
exp=
SCE k−1 SCR
n−k
> F
k−1,n−k(1 − α).
Para calcular dicho estad´ıstico se suele resumir la informaci ´on anterior en una tabla, conocida como tabla de an ´alisis de la varianza (tabla ANOVA) ya que en ella se recogen las fuentes de variaci ´on de la varianza:
Fuente de variaci ´on Suma de Cuadrados Grados de Libertad Medias Explicada SCE = bβtXty − nY 2 k − 1 SCEk−1
Residuos SCR = yty − bβtXty n − k SCRn−k
Total SCT = yty − nY 2 n − 1
An ´alisis de la varianza
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Advi ´ertase que rechazar
H
0 implica que hay al menos un coeficiente no nulo, por lo que la relaci ´on existente entre las variables independientes y la dependiente no se debe al azar, lo cual valida el modelo en su conjunto.Por otro lado, sin m ´as que dividir la regi ´on de rechazo por SCT tanto en el numerador como en el denominador se obtiene la expresi ´on equivalente:
R2 k−1 1−R2
n−k
> F
k−1,n−k(1 − α).
La importancia de esta nueva expresi ´on para la regi ´on de rechazo es que permite calcular una cota, sin m ´as que despejar
R
2, a partir de la cual el coeficiente de determinaci ´on es significativo. Esto es, el coefciente de determinaci ´on es signifi- cativo al nivel de significaci ´onα
siR
2>
n−kk−1
· F
k−1,n−k(1 − α)
1 +
n−kk−1· F
k−1,n−k(1 − α) .
Intervalos de confianza
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares
M´ınimos Cuadrados Restringidos
An ´alisis de la varianza Intervalos de confianza
Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
A partir de las distribuciones en el muestreo para los estimadores estudiados es inmediato obtener los siguientes intervalos de confianza al nivel
1 − α
:Intervalo de confianza para
β
iβ b
i± t
n−k1 − α 2
· b σ · √
w
i, i = 1, . . . , k.
Intervalo de confianza para
σ
2"
(n − k) · b σ
2χ
2n−k1 −
α2, (n − k) · b σ
2χ
2n−k α2# ,
donde
χ
2n−k1 −
α2y
χ
2n−k α2son los puntos de una distribuci ´on chi- cuadrado con
n−k
grados de libertad que dejan a su izquierda, respectivamente, una probabilidad1 −
α2 y α2.Una forma alternativa de contrastar hip ´otesis es usando los intervalos de confianza. De manera que para contrastar
H
0: Rβ = r
se calcular ´a la regi ´on de confianza paraRβ
y sir
pertenece a dicha regi ´on, no se rechazar ´a la hip ´otesis nula.Explotaci ´ on del modelo
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual Optima´
Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Predicci ´ on Puntual ´ Optima
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual Optima´
Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Una vez validado el modelo, la siguiente fase de un modelo econom ´etrico es la explotaci ´on, siendo entonces la predicci ´on o la permanencia estructural algunos de sus objetivos.
La predicci ´on se realiza desde dos puntos de vista: a) por un lado realizare- mos una predicci ´on puntual dando un ´unico valor de predicci ´on para un instante en concreto; b) por otra parte, puesto que
Y
es una variable aleatoria, podemos calcular su esperanza dado un valor en concreto de las variables independientes.Siguiendo las directrices anteriores se llega a la misma expresi ´on algebr ´aica en ambos casos:
p
0= x
t0· b β,
donde
x
t0= (1 X
02X
03. . . X
0k)
contiene los valores de las variables inde- pendientes para los que se quiere obtener la predicci ´on.Este predictor,
p
0, m´ınimo cuadr ´atico (ya que se obtiene a partir del estima- dor por m´ınimos cuadrados ordinarios deβ
) es lineal, insesgado y ´optimo (en el sentido de m´ınima varianza).Predicci ´ on por intervalo
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual Optima´
Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
En este apartado calcularemos el intervalo de confianza para el valor esperado de
Y
dadox
0, es decir, paraE[Y
0/x
0] = x
t0· β
.Como
x
t0· b β
se distribuye seg ´un una normal (ya que est ´a en funci ´on deβ b
) yE[x
t0· b β] = x
t0β
, ya que es insesgado.V ar
x
t0· b β
= E h
x
t0· b β − x
t0· β
·
x
t0· b β − x
t0· β i
= x
t0· E
β − β b
·
β − β b
t·x
0= x
t0·V ar β b
·x
0= σ
2·x
t0(X
tX)
−1x
0.
se tiene que
x
t0· b β ∼ N
x
t0· β, σ
2· x
t0X
tX
−1x
0.
Ahora bien, esta distribuci ´on no es apta para hacer inferencia puesto que depende de la cantidad desconocida