Introducci ´
on a la Econometr´ıa
El modelo de regresi ´
on lineal m ´
ultiple
Incumplimiento de las hip ´
otesis b ´asicas
Rom ´an Salmer ´on G ´omez
Contenidos
Contenidos
Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Introducci ´on
Especificaci ´on del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad
Heteroscedasticidad Autocorrelaci ´on
Introducci ´
on
Contenidos
Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Econometr´ıa
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
La Estad´ıstica juega un papel importante en cualquier ciencia emp´ırica a la hora de estimular la formulaci ´on de modelos y contrastarlos. En la ciencia econ ´omica este papel se hace especialmente importante hasta el punto de que la necesidad de extender la Estad´ıstica ha dado lugar al nacimiento de una disciplina nueva que hoy goza de una gran vitalidad: la Econometr´ıa.
La Econometr´ıa es una rama de la Econom´ıa que aglutina a la Teor´ıa Econ ´omica, las Matem ´aticas, la Estad´ıstica y la Inform ´atica para estudiar y ana-lizar fen ´omenos econ ´omicos. Puede decirse que constituye en s´ı misma una dis-ciplina dentro de la Econom´ıa y a la vez una potente herramienta que tanto los economistas como otros muchos investigadores sociales utilizan para el estudio de sus problemas concretos. El principal prop ´osito de la Econometr´ıa es propor-cionar un sustrato emp´ırico a la Teor´ıa Econ ´omica.
Una breve descripci ´on de la historia econom ´etrica la puedes encontrar en las lecturas recomendadas.
Definici ´
on de Econometr´ıa
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
De entre las muchas definiciones existentes sobre la Econometr´ıa destacar´ıa la siguiente:
“La Econometr´ıa, usando la Teor´ıa Econ ´omica, las Matem ´aticas y
la Inferencia Estad´ıstica como fundamentos anal´ıticos, y los datos econ ´omicos como la base informativa, proporciona una base para: 1. Modificar, refinar o posiblemente refutar las conclusiones en el
cuerpo de conocimientos conocido como Teor´ıa Econ ´omica. 2. Conseguir signos, magnitudes y afirmaciones de calidad para
los coeficientes de las variables en las relaciones econ ´omicas, de modo que esta informaci ´on puede usarse como base para la elecci ´on y toma de decisiones.”
Modelo econ ´
omico y econom ´etrico
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico
Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Modelo econ ´omico: Un modelo econ ´omico es una representaci ´on simplificada de la realidad econ ´omica mediante la expresi ´on matem ´atica de una determina-da teor´ıa econ ´omica.
Modelo econom ´etrico: Un modelo econom ´etrico es aquel modelo econ ´omico que contiene todos los elementos necesarios para ser estudiado desde un pun-to de vista emp´ırico. Es decir, un modelo econ ´omico en el que se ha especi-ficado el tipo de relaci ´on entre variables (en este curso lineal), el n ´umero de variables, introducci ´on de la perturbaci ´on aleatoria (para recoger el efecto de las variables no incluidas fundamentalmente), etc.
As´ı, por ejemplo, un modelo econ ´omico es aquel en el que se especifica que el consumo es una funci ´on de la renta:
Consumo
=
f
(
Renta
)
.Mientras el modelo econom ´etrico ser ´a aquel en el que se establece que la relaci ´on es lineal y se introduce la perturbaci ´on aleatoria
u
t:Fases del m ´etodo econom ´etrico
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico
Fases del m ´etodo econom ´etrico
Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
La elaboraci ´on de un modelo econom ´etrico se puede dividir en las siguientes fases:
Especificaci ´on: En esta fase se propone la forma matem ´atica de la relaci ´on que liga las variables presentes en el modelo y la perturbaci ´on aleatoria. Tambi ´en debe decidirse el n ´umero de ecuaciones y variables que forman el modelo. Todo ello se realizar ´a partiendo de la Teor´ıa Econ ´omica.
Estimaci ´on: Esta fase consiste en la obtenci ´on de valores num ´ericos de las cantidades constantes del modelo econom ´etrico. Por tanto, ser ´a necesario dis-poner de informaci ´on emp´ırica sobre el fen ´omeno (datos) y haber decidido el m ´etodo de estimaci ´on a usar.
Validaci ´on: En esta fase se eval ´uan los resultados obtenidos en la etapa ante-rior para decidir si los mismos son o no aceptables tanto desde el punto de vista de la teor´ıa econ ´omica (magnitudes, signos, etc) como desde el punto de vista estad´ıstico (validez del modelo).
Explotaci ´on: Si el modelo es aceptado, este puede ser usado para la predicci ´on y contrastar la permanencia de la estructura estimada.
Componentes de un modelo econom ´etrico
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico
Componentes de un modelo econom ´etrico
Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Las principales componentes de un modelo econom ´etrico son:
Variables: Dentro de las variables podemos distinguir entre las variables obser-vables (aquellas de las que se disponen datos) y no obserobser-vables (la perturba-ci ´on aleatoria). Y dentro de las primeras tenemos a las variables dependientes, explicadas o end ´ogenas (aquellas que est ´an influidas por otras variables) y va-riables independientes, explicativas o ex ´ogenas (aquellas que no est ´an influidas por otras).
Par ´ametros: Los par ´ametros son las cantidades fijas o constantes del mode-lo econom ´etrico que se desean estimar (mode-los coeficientes de las variables y la varianza de la perturbaci ´on aleatoria).
Ecuaciones: Las relaciones entre las distintas variables se explicitar ´a mediante una o m ´as ecuaciones.
Naturaleza de la informaci ´
on utilizada en Econometr´ıa
Contenidos Introducci ´on
Definici ´on de Econometr´ıa
Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico
Naturaleza de la informaci ´on utilizada en Econometr´ıa
Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Los datos econ ´omicos suelen ser de clases muy variadas, siendo los tipos m ´as importantes los siguientes:
Datos de corte transversal: son un conjunto de datos formada por unidades (individuos, empresas, regiones, etc) observadas en un momento determinado (d´ıa, mes, trimestre, a ˜no, etc). Por ejemplo, el consumo de varias familias en un mes en concreto.
Datos de series temporales: son un conjunto de datos formado por observa-ciones de una misma variable a lo largo del tiempo. Por ejemplo, el consumo mensual de una familia a lo largo de todo un a ˜no.
Datos de panel o longitudinales: son un conjunto de datos que combinan una dimensi ´on temporal con otra transversal. Por ejemplo, el consumo mensual de un conjunto de familias a lo largo de todo un a ˜no.
Habr ´a que atender al tipo de datos que se analicen ya que dependiendo de su naturaleza se podr ´an aplicar unos u otros m ´etodos econom ´etricos.
Especificaci ´
on del modelo
Contenidos Introducci ´on
Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Modelo lineal uniecuacional m ´
ultiple
Contenidos Introducci ´on Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple
Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
El modelo lineal uniecuacional m ´ultiple analiza la relaci ´on lineal entre una variable dependiente,
Y
, y m ´as de una variable independiente,X
i,i
= 1
, . . . , k
,k >
1
, m ´as un t ´ermino aleatorio,u
.As´ı, a partir de
n
observaciones para cada variable, el modelo puede ser expresado como:Y
t=
β
1+
β
2X
t2+
β
3X
t3+
· · ·
+
β
kX
tk+
u
t,
t
= 1
, . . . , n,
(1)donde se ha considerado que hay t ´ermino constante, es decir,
X
1t= 1
,∀
t
.El objetivo ser ´a estimar (es decir, obtener una aproximaci ´on num ´erica) aque-llas cantidades constantes presentes en el modelo (1), as´ı como la bondad de la estimaci ´on realizada. En primer lugar, se escribe dicho modelo para todas y cada una de las observaciones:
Y
1=
β
1+
β
2X
12+
β
3X
13+
· · ·
+
β
kX
1k+
u
1Y
2=
β
1+
β
2X
22+
β
3X
23+
· · ·
+
β
kX
2k+
u
2 . . . . . .Y
n=
β
1+
β
2X
n2+
β
3X
n3+
· · ·
+
β
kX
nk+
u
nModelo lineal uniecuacional m ´
ultiple
Contenidos Introducci ´on Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple
Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Que nos conduce a la siguiente forma matricial:
y
n×1=
X
n×k·
β
k×1+
u
n×1,
(2) donde:y
n×1=
Y
1Y
2 . . .Y
n
,
β
k×1=
β
1β
2 . . .β
k
,
u
n×1=
u
1u
2 . . .u
n
,
X
n×k=
1
X
12. . .
X
1k1
X
22. . .
X
2k . . . ... . .. ...1
X
n2. . . X
nk
.
Hip ´
otesis del modelo
Contenidos Introducci ´on Especificaci ´on del modelo
Modelo lineal
uniecuacional m ´ultiple
Hip ´otesis del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Consideraremos las siguientes hip ´otesis b ´asicas en el modelo lineal uniecuacional m ´ultiple:
El vector
y
se puede expresar como combinaci ´on lineal de las variables expli-cativas m ´as un vector de perturbaci ´on.La perturbaci ´on aleatoria est ´a centrada
(
E
[
u
t] = 0
, t
= 1
, . . . , n
)
, es homoced ´asticaV ar
(
u
t) =
E
[
u
t2] =
σ
2, t
= 1
, . . . , n
e incorrelada(
Cov
(
u
t, u
s) =
E
[
u
t·
u
s] = 0
,
∀
t
6
=
s, t, s
= 1
, . . . , n
)
. En tal caso sedice que las perturbaciones son esf ´ericas y se verifica que
E
[
u
] = 0
n×1 yV ar
(
u
) =
E
[
u
·
u
t] =
σ
2·
I
n×n.
La matriz
X
es no estoc ´astica y de rango completo por columnas, es decir,rg
(
X
) =
k
(como consecuencian > k
y las columnas deX
, es decir,X
i,i
= 1
, . . . , n
, son linealmente independientes).No hay relaci ´on entre variables independientes y la perturbaci ´on aleatoria:
Cov(un×1, Xi) = E (u − E[u]) · (Xi − E[Xi])t = E u · (Xi − Xi)t = E[un×1 ·01×n] = 0n×n.
Estimaci ´
on del modelo
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo
Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Estimaci ´
on m´ınimo cuadr ´atica de los coeficientes del modelo
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo
Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Definiendo los errores o residuos,
e
, del modelo lineal uniecuacional m ´ultiple como la diferencia entre los verdaderos valores de la variable dependiente y su estima-ci ´on, esto ese
=
y
−
y,
b
donde
y
b
=
X
β
b
, y siguiendo la premisa de minimizar la suma de los cuadrados de los residuose
te
= (
y
−
X
β
b
)
t·
(
y
−
X
β
b
) =
y
ty
−
2
β
b
tX
ty
+
β
b
tX
tX
β,
b
se obtiene la estimaci ´on del par ´ametro
β
comob
β
=
X
tX
−1·
X
ty.
Dicho m ´etodo recibe el nombre de m´ınimos cuadrados ordinarios, MCO, por lo que los estimadores obtenidos a partir de dicho m ´etodo reciben el nombre de estimadores de m´ınimos cuadrados ordinarios, EMCO.
Como consecuencias de dicha estimaci ´on se verifica que
X
t·
e
= 0
k×1,Estimaci ´
on m´ınimo cuadr ´atica de los coeficientes del modelo
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo
Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Advi ´ertase que:
X
tX
=
n
nP
t=1X
t2· · ·
nP
t=1X
tk nP
t=1X
t2 nP
t=1X
t22· · ·
nP
t=1X
t2X
tk . . . . . . . .. . . . nP
t=1X
tk nP
t=1X
tkX
t2· · ·
nP
t=1X
tk2
,
yX
ty
=
nP
t=1Y
t nP
t=1X
t2Y
t . . . nP
t=1X
tkY
t
.
Teorema de Gauss-Markov
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Teorema 1 (Teorema de Gauss-Markov) Los estimadores de m´ınimos
cuadra-dos ordinarios son lineales, insesgacuadra-dos y ´optimos (ELIO), es decir, tienen varianza m´ınima entre la clase de los estimadores lineales e insesgados.
En efecto, por la forma de escribirse el estimador es evidente que es lineal. As´ı, llamando:
C
k×n=
X
tX
−1 k×k·
X
t k×n=
c
11c
12. . .
c
1nc
21c
22. . .
c
2n . . . . . . . .. . . .c
k1c
k2. . . c
kn
,
se tiene que
β
b
se expresa como combinaci ´on lineal del vectory
:b
β
k×1=
C
k×n·
y
n×1=
c
11Y
1+
c
12Y
2+
. . .
+
c
1nY
nc
21Y
1+
c
22Y
2+
. . .
+
c
2nY
n . . .c
k1Y
1+
c
k2Y
2+
. . .
+
c
knY
n
.
Teorema de Gauss-Markov
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Para que el estimador
β
b
deβ
sea insesgado se ha de cumplir queE
[
β
b
] =
β
. En efecto, sustituyendoy
=
Xβ
+
u
enβ
b
:b
β
=
X
tX
−1·
X
ty
=
X
tX
−1·
X
t(
Xβ
+
u
)
=
β
+
X
tX
−1·
X
tu
−→
β
b
=
β
+
X
tX
−1·
X
tu.
Entonces, teniendo en cuenta que
E
[
u
] = 0
:E
[
β
b
] =
E
h
β
+
X
tX
−1·
X
tu
i
=
β
+
X
tX
−1·
X
t·
E
[
u
] =
β.
Por otro lado, la matriz de varianzas-covarianzas de
β
b
:V ar βb = E b β − E[βb] · βb− E[βb]t = E b β − β · βb− β t = E h XtX−1 Xtu · utX XtX−1i = XtX−1 Xt ·E[u · ut] ·X XtX−1 = σ2 · XtX−1 XtX XtX−1 = σ2 · XtX−1 ,
Teorema de Gauss-Markov
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
donde se ha tenido en cuenta que
β
b
es insesgado,β
b
−
β
= (
X
tX
)
−1X
tu
yV ar
(
u
) =
E
[
u
·
u
t] =
σ
2·
I
n×n.Para demostrar que
β
b
es de m´ınima varianza consideraremos otro estimador,β
∗, deβ
lineal e insesgado de forma queV ar
β
b
< V ar
(
β
∗)
.En efecto,
β
∗=
D
k×n·
y
n×1 tal queD
·
X
=
I
k×k es lineal e insesgado. Adem ´as,V ar
(
β
∗) =
σ
2·
DD
t.En tal caso, puesto que podemos escribir
D
= (
X
tX
)
−1X
t+
W
conW
6
= 0
k×n, se tiene queDD
t= (
X
tX
)
− 1+
W W
t, y en tal caso:V ar
(
β
∗) =
σ
2·
DD
t=
σ
2·
X
tX
−1+
σ
2·
W W
t=
V ar
β
b
+
σ
2·
W W
t,
esto es,V ar
(
β
∗)
−
V ar
b
β
=
σ
2·
W W
t.
Y como
W W
t es definida positiva:V ar
(
β
∗)
−
V ar
b
β
>
0
, y en tal caso:Estimaci ´
on de la varianza de la perturbaci ´
on aleatoria
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la
perturbaci ´on aleatoria
Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Adem ´as de los coeficientes de las variables independientes, hay en el modelo otra cantidad constante que habr ´a que estimar: la varianza de la perturbaci ´on aleatoria,
σ
2.Un estimador insesgado de
σ
2 es:b
σ
2=
e
t
e
n
−
k
,
ya que
E
[
e
te
] = (
n
−
k
)
·
σ
2.Para calcular dicho estimador se dispone de la expresi ´on:
b
σ
2=
y
t
y
−
β
b
tX
ty
n
−
k
.
En consecuencia, la estimaci ´on de la matriz de varianzas-covarianzas de
β
b
es:\
Validaci ´
on del modelo
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo
Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Bondad de ajuste: Coeficiente de determinaci ´
on
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Una vez estimado el modelo lineal uniecuacional multiple, es decir, una vez ob-tenidas las estimaciones de
β
yσ
2, el siguiente paso ser ´a estudiar la calidad de dichas estimaciones.As´ı, a continuaci ´on, obtendremos el coeficiente de determinaci ´on, que no es m ´as que una medida para estudiar la bondad del ajuste lineal determinado por los estimadores por m´ınimos cuadrados ordinarios.
Dicho coeficiente de determinaci ´on, que se denota por
R
2, se define como el porcentaje de variabilidad explicada por el modelo. Por tanto, ´este se obtendr ´a co-mo el cociente entre la varianza explicada por la estimaci ´on y la total:R
2=
1 T·
nP
i=1b
Y
i−
Y
2 1 T·
nP
i=1Y
i−
Y
2=
nP
i=1b
Y
i−
Y
2 nP
i=1Y
i−
Y
2.
Como se observa, el coeficiente de determinaci ´on queda expresado en funci ´on de la suma de cuadrados explicados (SCE) y los totales (SCT).
Bondad de ajuste: Coeficiente de determinaci ´
on
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Luego, teniendo en cuenta la descomposici ´on
SCT
=
SCE
+
SCR,
se tiene queR
2=
SCE
SCT
= 1
−
SCR
SCT
.
Entonces, para calcular dicho coeficiente se dispone de la expresi ´on:
R
2=
β
b
tX
ty
−
n
·
Y
2y
ty
−
n
·
Y
2= 1
−
y
ty
−
β
b
tX
ty
y
ty
−
n
·
Y
2.
Advi ´ertase que, siempre que el modelo lineal tenga t ´ermino independiente, el coeficiente de determinaci ´on var´ıa entre 0 y 1. El valor 0 lo toma cuando la SCE es nula y, por tanto, el modelo no es adecuado; mientras que toma el valor 1 cuando la SCR es nula y, por tanto, el modelo es adecuado.
Coeficiente de determinaci ´
on corregido
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste
Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Puesto que a medida que vamos incluyendo variables en el modelo el coeficiente de determinaci ´on aumenta aunque las variables que incluyamos no sean signifi-cativas, esto supone un problema.
El coeficiente de determinaci ´on corregido,
R
2, viene a resolver este proble-ma del coeficiente de determinaci ´on. Dicho coeficiente mide el porcentaje de va-riaci ´on de la variable dependiente (al igual que el coeficiente de determinaci ´on) pero teniendo en cuenta el n ´umero de variables incluidas en el modelo. Se define como:R
2= 1
−
(1
−
R
2)
·
n
−
1
n
−
k
.
En cualquier caso, estas medidas de bondad del ajuste no deben de ser sobrevaloradas. Obtener un
R
2 oR
2 cercano a 1 no indica que los resultados sean fiables, ya que, por ejemplo, puede ser que no se cumpla alguna de las hip ´otesis b ´asicas y los resultados no ser v ´alidos. Por tanto, estos indicadores han de ser considerados como una herramienta m ´as a tener en cuenta dentro del an ´alisis.Distribuci ´
on en el muestreo de los estimadores MCO
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste
Distribuci ´on en el muestreo de los estimadores MCO
Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Introduciendo la hip ´otesis de que la perturbaci ´on aleatoria sigue una distribuci ´on normal, esto es:
u
n×1∼
N
(0
n×1, σ
2·
I
n×n)
.
En consecuencia,
β
b
k×1∼
N
(
β, σ
2·
(
X
tX
)
−1)
, ya que:b
β
sigue una distribuci ´on normal ya que se puede expresar en funci ´on de una normal:β
b
=
β
+ (
X
tX
)
−1·
X
tu
.se tienen calculados el vector de medias,
E
h
b
β
i
=
β
, y matriz de varianzas-covarianzas,V ar
b
β
=
σ
2·
(
X
tX
)
−1.Por otro lado, ya que
e
te
=
u
tM u
siendoM
n×n=
I
−
X
(
X
tX
)
−1X
t sim ´etrica, idempotente y conrg
(
M
) =
n
−
k < k
se tiene que ut
M u
σ2
∼
χ
2n−k,
lo que se traduce en que
(
n
−
k
)
·
b
σ
2σ
2∼
χ
2
Contraste de un conjunto de hip ´
otesis lineales
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO
Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
A continuaci ´on abordaremos la especificaci ´on de contrastes sobre un conjunto de hip ´otesis lineales sobre los coeficientes del modelo. Concretamente, suponiendo
q
restricciones lineales independientes entre s´ı:a
11β
1+
a
12β
2+
· · ·
+
a
1kβ
k=
b
1a
21β
1+
a
22β
2+
· · ·
+
a
2kβ
k=
b
2 . . . . . .=
. . .a
q1β
1+
a
q2β
2+
· · ·
+
a
qkβ
k=
b
qPlantearemos contrastar la hip ´otesis nula
H
0:
Rβ
=
r
dondeR
q×k=
a
11a
12. . . a
1ka
21a
22. . . a
2k . . . . . . . .. . . .a
q1a
q2. . . a
qk
,
r
q×1=
b
1b
2 . . .b
q
.
Contraste de un conjunto de hip ´
otesis lineales
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO
Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Usando la distribuci ´on
R
β
b
−
Rβ
t·
h
R
(
X
tX
)
−1R
ti
−1q
·
σ
b
2·
R
β
b
−
Rβ
∼
F
q,n−k,
rechazaremos la hip ´otesis nula al nivel de significaci ´on
α
siR
β
b
−
r
t·
h
R
(
X
tX
)
−1R
ti
−1q
·
σ
b
2·
R
β
b
−
r
> F
q,n−k(1
−
α
)
,
donde
F
q,n−k(1
−
α
)
es el punto de unaF
de Senedecor deq
yn
−
k
grados de libertad que deja por debajo suyo una probabilidad1
−
α
.Casos particulares
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO
Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Un caso particular de suma importancia ser ´a aquel en el que se desee contrastar la hip ´otesis nula
H
0:
β
i=
b
i,i
= 1
, . . . , k
.En tal caso,
q
= 1
,R
= (0 0
. . .
1
i). . .
0)
yr
=
b
i, por lo que la distribuci ´on anterior queda simplificada comob
β
i−
b
i 2b
σ
2·
w
i∼
F
1,n−k,
donde
w
i es el elemento (i,i) de la matriz(
X
tX
)
−1, o lo que es lo mismo,σ
b
2·
w
i es el elemento (i,i) deσ
b
2·
(
X
tX
)
−1=
V ar
\
b
β
, esto es, la varianza estimada deβ
b
i.Teniendo en cuenta que la ra´ız cuadrada de una F-Snedecor con 1 y
n
grados de libertad es una t-Student conn
grados de libertad se tiene queb
β
i−
b
ib
σ
·
√
w
i∼
Casos particulares
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO
Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
y en tal caso rechazaremos
H
0:
β
i=
b
i al nivel de significaci ´onα
sib
β
i−
b
ib
σ
·
√
w
i> t
n−k1
−
α
2
,
donde
t
n−k1
−
α2 es el punto de una distribuci ´ont
de student conn
−
k
grados de libertad que deja por debajo suya una probabilidad1
−
α2.Este caso particular es de vital importancia cuando
b
i= 0
, ya que entonces estaremos contrastando si el coeficiente de la variable independienteX
i es o no nulo. De forma que al rechazar dicha hip ´otesis tenemos garantizado que la variableX
i ha de estar en el modelo, por lo que sus variaciones influyen en la variable dependiente. En tal caso se dice que dicha variable es significativa y que el contraste es un contraste de significaci ´on individual.M´ınimos Cuadrados Restringidos
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
En el caso en el que no se rechace la hip ´otesis nula
H
0:
Rβ
=
r
, ser´ıa deseable incorporar dicha informaci ´on al modelo. En tal caso, se obtiene un nuevo estima-dor:b
β
R=
β
b
+
X
tX
−1R
th
R X
tX
−1R
ti
−1·
r
−
R
β
b
,
que recibe el nombre de m´ınimos cuadrados restringidos ya que se ha obtenido con la restricci ´on de que ha de verificar que
R
β
b
R=
r
.Dicho estimador es lineal, insesgado siempre que la hip ´otesis nula
H
0:
Rβ
=
r
sea cierta y ´optimo. Es decir, el estimador por m´ınimos cuadrados restrin-gidos tiene menor varianza que el estimador m´ınimo cuadr ´atico ordinario siempre y cuando la restricci ´on (hip ´otesis nula) sea cierta.Luego, cuando una restricci ´on lineal sobre los coeficientes de las variables independientes es cierta, el estimador por m´ınimos cuadrados ordinarios deja de ser ´optimo y habr ´a que usar el estimador por m´ınimos cuadrados restringidos.
Adem ´as se verifica que:
An ´alisis de la varianza
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
El an ´alisis de la varianza aborda el contraste que tiene por hip ´otesis nula que todos los coeficientes de las variables independientes son nulos simult ´aneamente, esto es,
H
0:
β
2=
β
3=
· · ·
=
β
k= 0
.Salta a la vista que estamos ante un caso particular de un contraste sobre
k
−
1
restricciones lineales de los coeficientes de las variables independientes. En este caso, rechazaremos la hip ´otesis nula al nivel de significaci ´onα
siF
exp=
SCE k−1 SCR n−k> F
k−1,n−k(1
−
α
)
.
Para calcular dicho estad´ıstico se suele resumir la informaci ´on anterior en una tabla, conocida como tabla de an ´alisis de la varianza (tabla ANOVA) ya que en ella se recogen las fuentes de variaci ´on de la varianza:
Fuente de variaci ´on Suma de Cuadrados Grados de Libertad Medias Explicada SCE = βbtXty − nY 2 k − 1 SCEk−
1
Residuos SCR = yty − βbtXty n − k SCRn−k Total SCT = yty − nY 2 n − 1
An ´alisis de la varianza
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Advi ´ertase que rechazar
H
0 implica que hay al menos un coeficiente no nulo, por lo que la relaci ´on existente entre las variables independientes y la dependiente no se debe al azar, lo cual valida el modelo en su conjunto.Por otro lado, sin m ´as que dividir la regi ´on de rechazo por SCT tanto en el numerador como en el denominador se obtiene la expresi ´on equivalente:
R2 k−1 1−R2
n−k
> F
k−1,n−k(1
−
α
)
.
La importancia de esta nueva expresi ´on para la regi ´on de rechazo es que permite calcular una cota, sin m ´as que despejar
R
2, a partir de la cual el coeficiente de determinaci ´on es significativo. Esto es, el coefciente de determinaci ´on es signifi-cativo al nivel de significaci ´onα
siR
2>
k−1 n−k·
F
k−1,n−k(1
−
α
)
1 +
k−1 n−k·
F
k−1,n−k(1
−
α
)
.
Intervalos de confianza
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza
Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
A partir de las distribuciones en el muestreo para los estimadores estudiados es inmediato obtener los siguientes intervalos de confianza al nivel
1
−
α
:Intervalo de confianza para
β
ib
β
i±
t
n−k1
−
α
2
·
b
σ
·
√
w
i,
i
= 1
, . . . , k.
Intervalo de confianza para
σ
2"
(
n
−
k
)
·
σ
b
2χ
2n−k1
−
α2,
(
n
−
k
)
·
σ
b
2χ
2n−k α2#
,
dondeχ
2n −k1
−
α 2 yχ
2n −k α 2son los puntos de una distribuci ´on chi-cuadrado con
n
−
k
grados de libertad que dejan a su izquierda, respectivamente, una probabilidad1
−
α2 y α2.Una forma alternativa de contrastar hip ´otesis es usando los intervalos de confianza. De manera que para contrastar
H
0:
Rβ
=
r
se calcular ´a la regi ´on de confianza paraRβ
y sir
pertenece a dicha regi ´on, no se rechazar ´a la hip ´otesis nula.Explotaci ´
on del modelo
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo
Explotaci ´on del modelo
Predicci ´on Puntual ´
Optima Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Predicci ´
on Puntual ´
Optima
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual ´
Optima
Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Una vez validado el modelo, la siguiente fase de un modelo econom ´etrico es la explotaci ´on, siendo entonces la predicci ´on o la permanencia estructural algunos de sus objetivos.
La predicci ´on se realiza desde dos puntos de vista: a) por un lado realizare-mos una predicci ´on puntual dando un ´unico valor de predicci ´on para un instante en concreto; b) por otra parte, puesto que
Y
es una variable aleatoria, podemos calcular su esperanza dado un valor en concreto de las variables independientes. Siguiendo las directrices anteriores se llega a la misma expresi ´on algebr ´aica en ambos casos:p
0=
x
t0·
β,
b
donde
x
t0= (1
X
02X
03. . . X
0k)
contiene los valores de las variables inde-pendientes para los que se quiere obtener la predicci ´on.Este predictor,
p
0, m´ınimo cuadr ´atico (ya que se obtiene a partir del estima-dor por m´ınimos cuadrados ordinarios deβ
) es lineal, insesgado y ´optimo (en el sentido de m´ınima varianza).Predicci ´
on por intervalo
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual ´
Optima
Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
En este apartado calcularemos el intervalo de confianza para el valor esperado de
Y
dadox
0, es decir, paraE
[
Y
0/x
0] =
x
t0·
β
.Como
x
t0·
β
b
se distribuye seg ´un una normal (ya que est ´a en funci ´on deβ
b
) yE
[
x
t0·
β
b
] =
x
t0β
, ya que es insesgado.V ar
x
t0·
β
b
=
E
h
x
t0·
β
b
−
x
t0·
β
·
x
t0·
β
b
−
x
t0·
β
i
=
x
t0·
E
β
b
−
β
·
β
b
−
β
t·
x
0=
x
t0·
V ar
b
β
·
x
0=
σ
2·
x
0t(
X
tX
)
−1x
0.
se tiene quex
t0·
β
b
∼
N
x
t0·
β, σ
2·
x
t0X
tX
−1x
0.
Ahora bien, esta distribuci ´on no es apta para hacer inferencia puesto que depende de la cantidad desconocida
σ
2. Para resolver este problema, tipificare-mos la anterior distribuci ´on normal y la dividiretipificare-mos entre la ra´ız cuadrada de la siguiente distribuci ´on chi-cuadradoPredicci ´
on por intervalo
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual ´
Optima
Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
(
n
−
k
)
·
b
σ
2σ
2∼
χ
2 n−k,
dividida a su vez entre sus grados de libertad, obteniendo la siguiente distribuci ´on t-Student:
x
t0·
β
b
−
x
t0·
β
b
σ
·
q
x
t 0(
X
tX
)
− 1x
0∼
t
n−k.
A partir de esta distribuci ´on, el intervalo de confianza al nivel
1
−
α
paraE
[
Y
0/x
0] =
x
t0·
β
es:x
t0·
β
b
±
t
n−k1
−
α
2
·
b
σ
·
q
x
t0(
X
tX
)
−1x
0,
donde
t
n−k1
−
α2 es el punto de una distribuci ´ont
de Student conn
−
k
grados de libertad que deja a su izquierda una probabilidad1
−
α2.Contraste de Permanencia Estructural
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Predicci ´on Puntual ´
Optima Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on
Al explotar el modelo mediante la predicci ´on se est ´a presuponiendo que la relaci ´on estimada se mantiene para la informaci ´on no presente en la muestra observada. Para confirmar este aspecto, calcularemos el intervalo de confianza para
Y
dadox
0, de forma que si la nueva informaci ´on pertenece a dicho intervalo, la estructura del modelo estimado permanecer ´a.Partiendo de que
Y
0−
Y
b
0=
u
0−
x
t0b
β
−
β
∼
N
0
, σ
2·
1 +
x
t0X
tX
−1x
0,
se llega de forma an ´aloga a la anterior a la distribuci ´on
Y
0−
Y
b
0b
σ
·
q
1 +
x
t0(
X
tX
)
−1x
0∼
t
n−k,
donde
Y
b
0=
x
t0·
β
b
. Por tanto, el intervalo de confianza al nivel1
−
α
paraY
0 es:x
t0·
β
b
±
t
n−k1
−
α
2
·
σ
b
·
q
1 +
x
t0(
X
tX
)
−1x
0.
Incumplimiento de las hip ´
otesis
b ´asicas: Multicolinealidad
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo
Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on
Concepto y causas
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on
El problema de multicolinealidad consiste en la existencia de relaciones lineales entre dos o m ´as variables independientes del modelo lineal uniecuacional multiple. Dependiendo de c ´omo sea dicha relaci ´on lineal hablaremos de multicolineali-dad perfecta o aproximada.
Las principales causas que producen multicolinealidad en un modelo son: relaci ´on causal entre variables explicativas del modelo.
escasa variabilidad en las observaciones de las variables independientes. reducido tama ˜no de la muestra.
En definitiva, la multicolinealidad suele ser un problema muestral que se presenta normalmente en datos con el perfil de series temporales.
As´ı, por ejemplo, la edad y la experiencia suelen presentar una alta relaci ´on ya que ambas evolucionan conjuntamente: a mayor edad se presupone mayor experiencia. Por tal motivo ser ´a dif´ıcil separar el efecto de cada una sobre la va-riable dependiente y que se produzca multicolinealidad debido a la relaci ´on causal existente entre dichas variables (series temporales).
Multicolinealidad exacta o perfecta
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on
La multicolinealidad exacta o perfecta hace referencia a la existencia de una rela-ci ´on lineal exacta entre dos o m ´as variables independientes.
Dicho tipo de multicolinealidad se traduce en el incumplimiento de una de las hip ´otesis b ´asicas del modelo uniecuacional m ´ultiple: la matriz
X
no es de rango completo por columnas, esto es,rg
(
X
)
< k
.El incumplimiento de dicha hip ´otesis no permite invertir la matriz
X
tX
, por lo que el sistema normalX
tX
·
β
=
X
ty,
es compatible indeterminado, es decir, es imposible obtener una soluci ´on ´unica para
β
b
(hay infinitas).¿Qu ´e hacer ante esta situaci ´on? Evidentemente no se podr ´an estimar los coeficientes de las varaibles independientes, sin embargo, si se podr ´a estimar una combinaci ´on lineal de los mismos. Y en tal caso no tenemos garantizado que se puedan recuperar a partir de ´estas las estimaciones de los par ´ametros originales.
Multicolinealidad aproximada
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on
La multicolinealidad aproximada hace referencia a la existencia de una relaci ´on lineal aproximada entre dos o m ´as variables independientes.
En este caso, no se incumplir ´a la hip ´otesis b ´asica de que la matriz
X
sea completa por columnas(
rg
(
X
) =
k
)
, por lo que se podr ´a invertirX
tX
y obtener los estimadores por m´ınimos cuadrados ordinarios. Sin embargo, el determinante deX
tX
ser ´a muy pr ´oximo a cero, por lo que(
X
tX
)
−1 tender ´a a tener valores altos.En consecuencia, cuando existe un problema de multicolinealidad no perfecta se presentan los siguientes problemas:
las varianzas de los estimadores son muy grandes.
al efectuar contrastes de significaci ´on individual no se rechazar ´a la hip ´otesis nula, mientras que al realizar contrastes conjuntos si.
los coeficientes estimados ser ´an muy sensibles ante peque ˜nos cambios en los datos.
Detecci ´
on de la multicolinealidad
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on
Basarse en los sintomas enumerados anteriormente para la detecci ´on de la mul-ticolinealidad no es un procedimiento fiable ya que es subjetivo.
Por tal motivo, para la detecci ´on de la multicolinealidad usaremos los m ´eto-dos:
N ´umero de condici ´on.
Factor de agrandamiento de la varianza.
El n ´umero de condici ´on,
k
(
X
)
, se define como la ra´ız cuadrada del cociente entre el autovalor m ´as grande deX
tX
,λ
max, y el m ´as peque ˜no,λ
min. Esto es:k
(
X
) =
r
λ
maxλ
min.
Si dicho n ´umero de condici ´on toma un valor entre 20 y 30 estamos ante un pro-blema de multicolinealidad probable y se considera seguro si supera 30.
Detecci ´
on de la multicolinealidad
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on
El factor de agrandamiento de la varianza,
F AV
, se define para cada uno de los coeficientes como:F AV
(
β
b
i) =
1
1
−
R
2i,
i
= 2
, . . . , k,
donde
R
i2 es el coeficiente de determinaci ´on obtenido al efectuar la regresi ´on deX
i sobre el resto de las variables independientes del modelo.El FAV se interpreta como la raz ´on entre la varianza observada y la que habr´ıa sido en caso de que
X
i estuviera incorrelacionada con el resto de variables inde-pendientes del modelo, es decir, muestra en qu ´e medida se agranda la varianza del estimador como consecuencia de la relaci ´on de los regresores.Valores del FAV superiores a 10 hacen pensar en la posible existencia de multicolinealidad en el modelo.
Soluciones al problema de multicolinealidad
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on
Algunas de las posibles soluciones al problema de multicolinealidad son las si-guientes:
mejora del dise ˜no muestral estrayendo la informaci ´on m ´axima de la variables observadas.
eliminaci ´on de las variables que se sospechan son causantes de la multicoli-nealidad.
en caso de disponer de pocas observaciones, aumentar el tama ˜no de la mues-tra.
utilizar la relaci ´on extramuestral que permita realizar relaciones entre los par ´ametros (informaci ´on a priori) que permita estimar el modelo por m´ınimos cuadrados restringidos.
Por otro lado, algunos autores sugieren tratar el problema de la multicolineali-dad de forma mec ´anica y puramente num ´erica proponiendo una t ´ecnica conocida como regresi ´on alomada. Sin embargo, esta t ´ecnica tiene dos problemas impor-tantes: es arbitraria y los estimadores obtenidos no son interpretables.
Incumplimiento de las hip ´
otesis
b ´asicas: Heterocedasticidad
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Naturaleza del problema Causas de la heteroscedasticidad Consecuencias de la heteroscedasticidad Procedimientos de Detecci ´on M´ınimos Cuadrados Ponderados Autocorrelaci ´on
Naturaleza del problema
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Naturaleza del problema Causas de la heteroscedasticidad Consecuencias de la heteroscedasticidad Procedimientos de Detecci ´on M´ınimos Cuadrados Ponderados Autocorrelaci ´on
En el modelo lineal general,
y
=
Xβ
+
u
, se supone que la perturbaci ´on aleatoria es tal queE
[
u
] = 0
n×1 yV ar
(
u
) =
E
[
u
·
u
t] =
σ
2I
n×n, lo cual implica que:E
[
u
t] = 0
,
∀
t
∈ {
1
, . . . , n
}
.E
[
u
2t] =
V ar
(
u
t) =
σ
2,
∀
t
∈ {
1
, . . . , n
}
(varianza constante =homoce-dasticidad).
E
[
u
i·
u
j] =
Cov
(
u
i, u
j) = 0
,
∀
i
6
=
j
∈ {
1
, . . . , n
}
(incorrelaci ´on).Cuando se incumple el supuesto de homocedasticidad, es decir, la varianza no es constante sino que var´ıa con la observaci ´on (
E
[
u
2t] =
σ
t2,
∀
t
), se dice que hay heteroscedasticidad.Consideramos entonces el modelo lineal general
y
n×1=
X
n×k·
β
k×1+
u
n×1,
tal queE
[
u
] = 0
n×1 yV ar
(
u
) =
σ
2·
Ω
n×n dondeΩ
es una matrizdiagonal con diagonal no constante.
Advi ´ertase que en este caso se dice que el modelo tiene una matriz de varianzas-covarianzas no escalar o con perturbaciones no esf ´ericas (ya que la matriz de varianzas-covarianzas de la perturbaci ´on aleatoria ya no es igual al pro-ducto de una constante por la matriz identidad).
Causas de la heteroscedasticidad
Contenidos Introducci ´on Especificaci ´on del modelo
Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Naturaleza del problema Causas de la heteroscedasticidad Consecuencias de la heteroscedasticidad Procedimientos de Detecci ´on M´ınimos Cuadrados Ponderados Autocorrelaci ´on
Las principales causas de la presencia de heteroscedasticidad en un modelo lineal m ´ultiple son:
Naturaleza del fen ´omeno: en situaciones en las que se disponen de datos de secci ´on cruzada (como las del ejemplo anterior: consumo de bienes de lujo e ingresos familiares, pol´ıtica de dividendos y ganancias empresariales o pol´ıtica de inversi ´on y ganancias empresariales) es factible la presencia de heteroscedasticidad.
Usar datos agregados: cuando las observaciones de la variable dependiente pueden dividirse en grupos (por ejemplo, una persona que reside en una pro-vincia, un grupo de empresas que pertenecen a un mismo sector, etc.) y se usan como datos los promedios proporcionados por tales grupos es factible la presencia de heteroscedasticidad.
Si se omite una variable relevante en el modelo, es esperable que la pertur-baci ´on aleatoria dependa de dicha variable omitida, por lo que su varianza dif´ıcilmente ser ´a constante.