• No se han encontrado resultados

Introducción a la Econometría El modelo de regresión lineal múltiple Incumplimiento de las hipótesis básicas

N/A
N/A
Protected

Academic year: 2021

Share "Introducción a la Econometría El modelo de regresión lineal múltiple Incumplimiento de las hipótesis básicas"

Copied!
70
0
0

Texto completo

(1)

Introducci ´

on a la Econometr´ıa

El modelo de regresi ´

on lineal m ´

ultiple

Incumplimiento de las hip ´

otesis b ´asicas

Rom ´an Salmer ´on G ´omez

(2)

Contenidos

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Introducci ´on

Especificaci ´on del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad

Heteroscedasticidad Autocorrelaci ´on

(3)

Introducci ´

on

Contenidos

Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(4)

Econometr´ıa

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

La Estad´ıstica juega un papel importante en cualquier ciencia emp´ırica a la hora de estimular la formulaci ´on de modelos y contrastarlos. En la ciencia econ ´omica este papel se hace especialmente importante hasta el punto de que la necesidad de extender la Estad´ıstica ha dado lugar al nacimiento de una disciplina nueva que hoy goza de una gran vitalidad: la Econometr´ıa.

La Econometr´ıa es una rama de la Econom´ıa que aglutina a la Teor´ıa Econ ´omica, las Matem ´aticas, la Estad´ıstica y la Inform ´atica para estudiar y ana-lizar fen ´omenos econ ´omicos. Puede decirse que constituye en s´ı misma una dis-ciplina dentro de la Econom´ıa y a la vez una potente herramienta que tanto los economistas como otros muchos investigadores sociales utilizan para el estudio de sus problemas concretos. El principal prop ´osito de la Econometr´ıa es propor-cionar un sustrato emp´ırico a la Teor´ıa Econ ´omica.

Una breve descripci ´on de la historia econom ´etrica la puedes encontrar en las lecturas recomendadas.

(5)

Definici ´

on de Econometr´ıa

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

De entre las muchas definiciones existentes sobre la Econometr´ıa destacar´ıa la siguiente:

“La Econometr´ıa, usando la Teor´ıa Econ ´omica, las Matem ´aticas y

la Inferencia Estad´ıstica como fundamentos anal´ıticos, y los datos econ ´omicos como la base informativa, proporciona una base para: 1. Modificar, refinar o posiblemente refutar las conclusiones en el

cuerpo de conocimientos conocido como Teor´ıa Econ ´omica. 2. Conseguir signos, magnitudes y afirmaciones de calidad para

los coeficientes de las variables en las relaciones econ ´omicas, de modo que esta informaci ´on puede usarse como base para la elecci ´on y toma de decisiones.”

(6)

Modelo econ ´

omico y econom ´etrico

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico

Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Modelo econ ´omico: Un modelo econ ´omico es una representaci ´on simplificada de la realidad econ ´omica mediante la expresi ´on matem ´atica de una determina-da teor´ıa econ ´omica.

Modelo econom ´etrico: Un modelo econom ´etrico es aquel modelo econ ´omico que contiene todos los elementos necesarios para ser estudiado desde un pun-to de vista emp´ırico. Es decir, un modelo econ ´omico en el que se ha especi-ficado el tipo de relaci ´on entre variables (en este curso lineal), el n ´umero de variables, introducci ´on de la perturbaci ´on aleatoria (para recoger el efecto de las variables no incluidas fundamentalmente), etc.

As´ı, por ejemplo, un modelo econ ´omico es aquel en el que se especifica que el consumo es una funci ´on de la renta:

Consumo

=

f

(

Renta

)

.

Mientras el modelo econom ´etrico ser ´a aquel en el que se establece que la relaci ´on es lineal y se introduce la perturbaci ´on aleatoria

u

t:

(7)

Fases del m ´etodo econom ´etrico

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico

Fases del m ´etodo econom ´etrico

Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

La elaboraci ´on de un modelo econom ´etrico se puede dividir en las siguientes fases:

Especificaci ´on: En esta fase se propone la forma matem ´atica de la relaci ´on que liga las variables presentes en el modelo y la perturbaci ´on aleatoria. Tambi ´en debe decidirse el n ´umero de ecuaciones y variables que forman el modelo. Todo ello se realizar ´a partiendo de la Teor´ıa Econ ´omica.

Estimaci ´on: Esta fase consiste en la obtenci ´on de valores num ´ericos de las cantidades constantes del modelo econom ´etrico. Por tanto, ser ´a necesario dis-poner de informaci ´on emp´ırica sobre el fen ´omeno (datos) y haber decidido el m ´etodo de estimaci ´on a usar.

Validaci ´on: En esta fase se eval ´uan los resultados obtenidos en la etapa ante-rior para decidir si los mismos son o no aceptables tanto desde el punto de vista de la teor´ıa econ ´omica (magnitudes, signos, etc) como desde el punto de vista estad´ıstico (validez del modelo).

Explotaci ´on: Si el modelo es aceptado, este puede ser usado para la predicci ´on y contrastar la permanencia de la estructura estimada.

(8)

Componentes de un modelo econom ´etrico

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico

Componentes de un modelo econom ´etrico

Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Las principales componentes de un modelo econom ´etrico son:

Variables: Dentro de las variables podemos distinguir entre las variables obser-vables (aquellas de las que se disponen datos) y no obserobser-vables (la perturba-ci ´on aleatoria). Y dentro de las primeras tenemos a las variables dependientes, explicadas o end ´ogenas (aquellas que est ´an influidas por otras variables) y va-riables independientes, explicativas o ex ´ogenas (aquellas que no est ´an influidas por otras).

Par ´ametros: Los par ´ametros son las cantidades fijas o constantes del mode-lo econom ´etrico que se desean estimar (mode-los coeficientes de las variables y la varianza de la perturbaci ´on aleatoria).

Ecuaciones: Las relaciones entre las distintas variables se explicitar ´a mediante una o m ´as ecuaciones.

(9)

Naturaleza de la informaci ´

on utilizada en Econometr´ıa

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico

Naturaleza de la informaci ´on utilizada en Econometr´ıa

Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Los datos econ ´omicos suelen ser de clases muy variadas, siendo los tipos m ´as importantes los siguientes:

Datos de corte transversal: son un conjunto de datos formada por unidades (individuos, empresas, regiones, etc) observadas en un momento determinado (d´ıa, mes, trimestre, a ˜no, etc). Por ejemplo, el consumo de varias familias en un mes en concreto.

Datos de series temporales: son un conjunto de datos formado por observa-ciones de una misma variable a lo largo del tiempo. Por ejemplo, el consumo mensual de una familia a lo largo de todo un a ˜no.

Datos de panel o longitudinales: son un conjunto de datos que combinan una dimensi ´on temporal con otra transversal. Por ejemplo, el consumo mensual de un conjunto de familias a lo largo de todo un a ˜no.

Habr ´a que atender al tipo de datos que se analicen ya que dependiendo de su naturaleza se podr ´an aplicar unos u otros m ´etodos econom ´etricos.

(10)

Especificaci ´

on del modelo

Contenidos Introducci ´on

Especificaci ´on del modelo

Modelo lineal

uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(11)

Modelo lineal uniecuacional m ´

ultiple

Contenidos Introducci ´on Especificaci ´on del modelo

Modelo lineal

uniecuacional m ´ultiple

Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

El modelo lineal uniecuacional m ´ultiple analiza la relaci ´on lineal entre una variable dependiente,

Y

, y m ´as de una variable independiente,

X

i,

i

= 1

, . . . , k

,

k >

1

, m ´as un t ´ermino aleatorio,

u

.

As´ı, a partir de

n

observaciones para cada variable, el modelo puede ser expresado como:

Y

t

=

β

1

+

β

2

X

t2

+

β

3

X

t3

+

· · ·

+

β

k

X

tk

+

u

t

,

t

= 1

, . . . , n,

(1)

donde se ha considerado que hay t ´ermino constante, es decir,

X

1t

= 1

,

t

.

El objetivo ser ´a estimar (es decir, obtener una aproximaci ´on num ´erica) aque-llas cantidades constantes presentes en el modelo (1), as´ı como la bondad de la estimaci ´on realizada. En primer lugar, se escribe dicho modelo para todas y cada una de las observaciones:

Y

1

=

β

1

+

β

2

X

12

+

β

3

X

13

+

· · ·

+

β

k

X

1k

+

u

1

Y

2

=

β

1

+

β

2

X

22

+

β

3

X

23

+

· · ·

+

β

k

X

2k

+

u

2 . . . . . .

Y

n

=

β

1

+

β

2

X

n2

+

β

3

X

n3

+

· · ·

+

β

k

X

nk

+

u

n

(12)

Modelo lineal uniecuacional m ´

ultiple

Contenidos Introducci ´on Especificaci ´on del modelo

Modelo lineal

uniecuacional m ´ultiple

Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Que nos conduce a la siguiente forma matricial:

y

n×1

=

X

n×k

·

β

k×1

+

u

n×1

,

(2) donde:

y

n×1

=

Y

1

Y

2 . . .

Y

n

,

β

k×1

=

β

1

β

2 . . .

β

k

,

u

n×1

=

u

1

u

2 . . .

u

n

,

X

n×k

=

1

X

12

. . .

X

1k

1

X

22

. . .

X

2k . . . ... . .. ...

1

X

n2

. . . X

nk

.

(13)

Hip ´

otesis del modelo

Contenidos Introducci ´on Especificaci ´on del modelo

Modelo lineal

uniecuacional m ´ultiple

Hip ´otesis del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Consideraremos las siguientes hip ´otesis b ´asicas en el modelo lineal uniecuacional m ´ultiple:

El vector

y

se puede expresar como combinaci ´on lineal de las variables expli-cativas m ´as un vector de perturbaci ´on.

La perturbaci ´on aleatoria est ´a centrada

(

E

[

u

t

] = 0

, t

= 1

, . . . , n

)

, es homoced ´astica

V ar

(

u

t

) =

E

[

u

t2

] =

σ

2

, t

= 1

, . . . , n

e incorrelada

(

Cov

(

u

t

, u

s

) =

E

[

u

t

·

u

s

] = 0

,

t

6

=

s, t, s

= 1

, . . . , n

)

. En tal caso se

dice que las perturbaciones son esf ´ericas y se verifica que

E

[

u

] = 0

n×1 y

V ar

(

u

) =

E

[

u

·

u

t

] =

σ

2

·

I

n×n

.

La matriz

X

es no estoc ´astica y de rango completo por columnas, es decir,

rg

(

X

) =

k

(como consecuencia

n > k

y las columnas de

X

, es decir,

X

i,

i

= 1

, . . . , n

, son linealmente independientes).

No hay relaci ´on entre variables independientes y la perturbaci ´on aleatoria:

Cov(un×1, Xi) = E (u E[u]) · (Xi − E[Xi])t = E u · (Xi − Xi)t = E[un×1 ·01×n] = 0n×n.

(14)

Estimaci ´

on del modelo

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo

Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(15)

Estimaci ´

on m´ınimo cuadr ´atica de los coeficientes del modelo

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo

Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Definiendo los errores o residuos,

e

, del modelo lineal uniecuacional m ´ultiple como la diferencia entre los verdaderos valores de la variable dependiente y su estima-ci ´on, esto es

e

=

y

y,

b

donde

y

b

=

X

β

b

, y siguiendo la premisa de minimizar la suma de los cuadrados de los residuos

e

t

e

= (

y

X

β

b

)

t

·

(

y

X

β

b

) =

y

t

y

2

β

b

t

X

t

y

+

β

b

t

X

t

X

β,

b

se obtiene la estimaci ´on del par ´ametro

β

como

b

β

=

X

t

X

−1

·

X

t

y.

Dicho m ´etodo recibe el nombre de m´ınimos cuadrados ordinarios, MCO, por lo que los estimadores obtenidos a partir de dicho m ´etodo reciben el nombre de estimadores de m´ınimos cuadrados ordinarios, EMCO.

Como consecuencias de dicha estimaci ´on se verifica que

X

t

·

e

= 0

k×1,

(16)

Estimaci ´

on m´ınimo cuadr ´atica de los coeficientes del modelo

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo

Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Advi ´ertase que:

X

t

X

=

n

n

P

t=1

X

t2

· · ·

n

P

t=1

X

tk n

P

t=1

X

t2 n

P

t=1

X

t22

· · ·

n

P

t=1

X

t2

X

tk . . . . . . . .. . . . n

P

t=1

X

tk n

P

t=1

X

tk

X

t2

· · ·

n

P

t=1

X

tk2

,

y

X

t

y

=

n

P

t=1

Y

t n

P

t=1

X

t2

Y

t . . . n

P

t=1

X

tk

Y

t

.

(17)

Teorema de Gauss-Markov

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Teorema 1 (Teorema de Gauss-Markov) Los estimadores de m´ınimos

cuadra-dos ordinarios son lineales, insesgacuadra-dos y ´optimos (ELIO), es decir, tienen varianza m´ınima entre la clase de los estimadores lineales e insesgados.

En efecto, por la forma de escribirse el estimador es evidente que es lineal. As´ı, llamando:

C

k×n

=

X

t

X

1 k×k

·

X

t k×n

=

c

11

c

12

. . .

c

1n

c

21

c

22

. . .

c

2n . . . . . . . .. . . .

c

k1

c

k2

. . . c

kn

,

se tiene que

β

b

se expresa como combinaci ´on lineal del vector

y

:

b

β

k×1

=

C

k×n

·

y

n×1

=

c

11

Y

1

+

c

12

Y

2

+

. . .

+

c

1n

Y

n

c

21

Y

1

+

c

22

Y

2

+

. . .

+

c

2n

Y

n . . .

c

k1

Y

1

+

c

k2

Y

2

+

. . .

+

c

kn

Y

n

.

(18)

Teorema de Gauss-Markov

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Para que el estimador

β

b

de

β

sea insesgado se ha de cumplir que

E

[

β

b

] =

β

. En efecto, sustituyendo

y

=

+

u

en

β

b

:

b

β

=

X

t

X

−1

·

X

t

y

=

X

t

X

−1

·

X

t

(

+

u

)

=

β

+

X

t

X

−1

·

X

t

u

−→

β

b

=

β

+

X

t

X

−1

·

X

t

u.

Entonces, teniendo en cuenta que

E

[

u

] = 0

:

E

[

β

b

] =

E

h

β

+

X

t

X

−1

·

X

t

u

i

=

β

+

X

t

X

−1

·

X

t

·

E

[

u

] =

β.

Por otro lado, la matriz de varianzas-covarianzas de

β

b

:

V ar βb = E b β E[βb] · βb E[βb]t = E b β β · βb β t = E h XtX−1 Xtu · utX XtX−1i = XtX−1 Xt ·E[u · ut] ·X XtX−1 = σ2 · XtX−1 XtX XtX−1 = σ2 · XtX−1 ,

(19)

Teorema de Gauss-Markov

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

donde se ha tenido en cuenta que

β

b

es insesgado,

β

b

β

= (

X

t

X

)

−1

X

t

u

y

V ar

(

u

) =

E

[

u

·

u

t

] =

σ

2

·

I

n×n.

Para demostrar que

β

b

es de m´ınima varianza consideraremos otro estimador,

β

, de

β

lineal e insesgado de forma que

V ar

β

b

< V ar

(

β

)

.

En efecto,

β

=

D

k×n

·

y

n×1 tal que

D

·

X

=

I

k×k es lineal e insesgado. Adem ´as,

V ar

(

β

) =

σ

2

·

DD

t.

En tal caso, puesto que podemos escribir

D

= (

X

t

X

)

−1

X

t

+

W

con

W

6

= 0

k×n, se tiene que

DD

t

= (

X

t

X

)

− 1

+

W W

t, y en tal caso:

V ar

(

β

) =

σ

2

·

DD

t

=

σ

2

·

X

t

X

−1

+

σ

2

·

W W

t

=

V ar

β

b

+

σ

2

·

W W

t

,

esto es,

V ar

(

β

)

V ar

b

β

=

σ

2

·

W W

t

.

Y como

W W

t es definida positiva:

V ar

(

β

)

V ar

b

β

>

0

, y en tal caso:

(20)

Estimaci ´

on de la varianza de la perturbaci ´

on aleatoria

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria

Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Adem ´as de los coeficientes de las variables independientes, hay en el modelo otra cantidad constante que habr ´a que estimar: la varianza de la perturbaci ´on aleatoria,

σ

2.

Un estimador insesgado de

σ

2 es:

b

σ

2

=

e

t

e

n

k

,

ya que

E

[

e

t

e

] = (

n

k

)

·

σ

2.

Para calcular dicho estimador se dispone de la expresi ´on:

b

σ

2

=

y

t

y

β

b

t

X

t

y

n

k

.

En consecuencia, la estimaci ´on de la matriz de varianzas-covarianzas de

β

b

es:

\

(21)

Validaci ´

on del modelo

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo

Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(22)

Bondad de ajuste: Coeficiente de determinaci ´

on

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste

Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Una vez estimado el modelo lineal uniecuacional multiple, es decir, una vez ob-tenidas las estimaciones de

β

y

σ

2, el siguiente paso ser ´a estudiar la calidad de dichas estimaciones.

As´ı, a continuaci ´on, obtendremos el coeficiente de determinaci ´on, que no es m ´as que una medida para estudiar la bondad del ajuste lineal determinado por los estimadores por m´ınimos cuadrados ordinarios.

Dicho coeficiente de determinaci ´on, que se denota por

R

2, se define como el porcentaje de variabilidad explicada por el modelo. Por tanto, ´este se obtendr ´a co-mo el cociente entre la varianza explicada por la estimaci ´on y la total:

R

2

=

1 T

·

n

P

i=1

b

Y

i

Y

2 1 T

·

n

P

i=1

Y

i

Y

2

=

n

P

i=1

b

Y

i

Y

2 n

P

i=1

Y

i

Y

2

.

Como se observa, el coeficiente de determinaci ´on queda expresado en funci ´on de la suma de cuadrados explicados (SCE) y los totales (SCT).

(23)

Bondad de ajuste: Coeficiente de determinaci ´

on

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste

Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Luego, teniendo en cuenta la descomposici ´on

SCT

=

SCE

+

SCR,

se tiene que

R

2

=

SCE

SCT

= 1

SCR

SCT

.

Entonces, para calcular dicho coeficiente se dispone de la expresi ´on:

R

2

=

β

b

t

X

t

y

n

·

Y

2

y

t

y

n

·

Y

2

= 1

y

t

y

β

b

t

X

t

y

y

t

y

n

·

Y

2

.

Advi ´ertase que, siempre que el modelo lineal tenga t ´ermino independiente, el coeficiente de determinaci ´on var´ıa entre 0 y 1. El valor 0 lo toma cuando la SCE es nula y, por tanto, el modelo no es adecuado; mientras que toma el valor 1 cuando la SCR es nula y, por tanto, el modelo es adecuado.

(24)

Coeficiente de determinaci ´

on corregido

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste

Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Puesto que a medida que vamos incluyendo variables en el modelo el coeficiente de determinaci ´on aumenta aunque las variables que incluyamos no sean signifi-cativas, esto supone un problema.

El coeficiente de determinaci ´on corregido,

R

2, viene a resolver este proble-ma del coeficiente de determinaci ´on. Dicho coeficiente mide el porcentaje de va-riaci ´on de la variable dependiente (al igual que el coeficiente de determinaci ´on) pero teniendo en cuenta el n ´umero de variables incluidas en el modelo. Se define como:

R

2

= 1

(1

R

2

)

·

n

1

n

k

.

En cualquier caso, estas medidas de bondad del ajuste no deben de ser sobrevaloradas. Obtener un

R

2 o

R

2 cercano a 1 no indica que los resultados sean fiables, ya que, por ejemplo, puede ser que no se cumpla alguna de las hip ´otesis b ´asicas y los resultados no ser v ´alidos. Por tanto, estos indicadores han de ser considerados como una herramienta m ´as a tener en cuenta dentro del an ´alisis.

(25)

Distribuci ´

on en el muestreo de los estimadores MCO

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste

Distribuci ´on en el muestreo de los estimadores MCO

Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Introduciendo la hip ´otesis de que la perturbaci ´on aleatoria sigue una distribuci ´on normal, esto es:

u

n×1

N

(0

n×1

, σ

2

·

I

n×n

)

.

En consecuencia,

β

b

k×1

N

(

β, σ

2

·

(

X

t

X

)

−1

)

, ya que:

b

β

sigue una distribuci ´on normal ya que se puede expresar en funci ´on de una normal:

β

b

=

β

+ (

X

t

X

)

−1

·

X

t

u

.

se tienen calculados el vector de medias,

E

h

b

β

i

=

β

, y matriz de varianzas-covarianzas,

V ar

b

β

=

σ

2

·

(

X

t

X

)

−1.

Por otro lado, ya que

e

t

e

=

u

t

M u

siendo

M

n×n

=

I

X

(

X

t

X

)

−1

X

t sim ´etrica, idempotente y con

rg

(

M

) =

n

k < k

se tiene que u

t

M u

σ2

χ

2nk

,

lo que se traduce en que

(

n

k

)

·

b

σ

2

σ

2

χ

2

(26)

Contraste de un conjunto de hip ´

otesis lineales

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO

Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

A continuaci ´on abordaremos la especificaci ´on de contrastes sobre un conjunto de hip ´otesis lineales sobre los coeficientes del modelo. Concretamente, suponiendo

q

restricciones lineales independientes entre s´ı:

a

11

β

1

+

a

12

β

2

+

· · ·

+

a

1k

β

k

=

b

1

a

21

β

1

+

a

22

β

2

+

· · ·

+

a

2k

β

k

=

b

2 . . . . . .

=

. . .

a

q1

β

1

+

a

q2

β

2

+

· · ·

+

a

qk

β

k

=

b

q

Plantearemos contrastar la hip ´otesis nula

H

0

:

=

r

donde

R

q×k

=

a

11

a

12

. . . a

1k

a

21

a

22

. . . a

2k . . . . . . . .. . . .

a

q1

a

q2

. . . a

qk

,

r

q×1

=

b

1

b

2 . . .

b

q

.

(27)

Contraste de un conjunto de hip ´

otesis lineales

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO

Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Usando la distribuci ´on

R

β

b

t

·

h

R

(

X

t

X

)

−1

R

t

i

−1

q

·

σ

b

2

·

R

β

b

F

q,nk

,

rechazaremos la hip ´otesis nula al nivel de significaci ´on

α

si

R

β

b

r

t

·

h

R

(

X

t

X

)

−1

R

t

i

−1

q

·

σ

b

2

·

R

β

b

r

> F

q,nk

(1

α

)

,

donde

F

q,nk

(1

α

)

es el punto de una

F

de Senedecor de

q

y

n

k

grados de libertad que deja por debajo suyo una probabilidad

1

α

.

(28)

Casos particulares

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO

Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Un caso particular de suma importancia ser ´a aquel en el que se desee contrastar la hip ´otesis nula

H

0

:

β

i

=

b

i,

i

= 1

, . . . , k

.

En tal caso,

q

= 1

,

R

= (0 0

. . .

1

i)

. . .

0)

y

r

=

b

i, por lo que la distribuci ´on anterior queda simplificada como

b

β

i

b

i

2

b

σ

2

·

w

i

F

1,nk

,

donde

w

i es el elemento (i,i) de la matriz

(

X

t

X

)

−1, o lo que es lo mismo,

σ

b

2

·

w

i es el elemento (i,i) de

σ

b

2

·

(

X

t

X

)

−1

=

V ar

\

b

β

, esto es, la varianza estimada de

β

b

i.

Teniendo en cuenta que la ra´ız cuadrada de una F-Snedecor con 1 y

n

grados de libertad es una t-Student con

n

grados de libertad se tiene que

b

β

i

b

i

b

σ

·

w

i

(29)

Casos particulares

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO

Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

y en tal caso rechazaremos

H

0

:

β

i

=

b

i al nivel de significaci ´on

α

si

b

β

i

b

i

b

σ

·

w

i

> t

n−k

1

α

2

,

donde

t

nk

1

α2

es el punto de una distribuci ´on

t

de student con

n

k

grados de libertad que deja por debajo suya una probabilidad

1

α2.

Este caso particular es de vital importancia cuando

b

i

= 0

, ya que entonces estaremos contrastando si el coeficiente de la variable independiente

X

i es o no nulo. De forma que al rechazar dicha hip ´otesis tenemos garantizado que la variable

X

i ha de estar en el modelo, por lo que sus variaciones influyen en la variable dependiente. En tal caso se dice que dicha variable es significativa y que el contraste es un contraste de significaci ´on individual.

(30)

M´ınimos Cuadrados Restringidos

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

En el caso en el que no se rechace la hip ´otesis nula

H

0

:

=

r

, ser´ıa deseable incorporar dicha informaci ´on al modelo. En tal caso, se obtiene un nuevo estima-dor:

b

β

R

=

β

b

+

X

t

X

1

R

t

h

R X

t

X

−1

R

t

i

−1

·

r

R

β

b

,

que recibe el nombre de m´ınimos cuadrados restringidos ya que se ha obtenido con la restricci ´on de que ha de verificar que

R

β

b

R

=

r

.

Dicho estimador es lineal, insesgado siempre que la hip ´otesis nula

H

0

:

=

r

sea cierta y ´optimo. Es decir, el estimador por m´ınimos cuadrados restrin-gidos tiene menor varianza que el estimador m´ınimo cuadr ´atico ordinario siempre y cuando la restricci ´on (hip ´otesis nula) sea cierta.

Luego, cuando una restricci ´on lineal sobre los coeficientes de las variables independientes es cierta, el estimador por m´ınimos cuadrados ordinarios deja de ser ´optimo y habr ´a que usar el estimador por m´ınimos cuadrados restringidos.

Adem ´as se verifica que:

(31)

An ´alisis de la varianza

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

El an ´alisis de la varianza aborda el contraste que tiene por hip ´otesis nula que todos los coeficientes de las variables independientes son nulos simult ´aneamente, esto es,

H

0

:

β

2

=

β

3

=

· · ·

=

β

k

= 0

.

Salta a la vista que estamos ante un caso particular de un contraste sobre

k

1

restricciones lineales de los coeficientes de las variables independientes. En este caso, rechazaremos la hip ´otesis nula al nivel de significaci ´on

α

si

F

exp

=

SCE k1 SCR nk

> F

k1,nk

(1

α

)

.

Para calcular dicho estad´ıstico se suele resumir la informaci ´on anterior en una tabla, conocida como tabla de an ´alisis de la varianza (tabla ANOVA) ya que en ella se recogen las fuentes de variaci ´on de la varianza:

Fuente de variaci ´on Suma de Cuadrados Grados de Libertad Medias Explicada SCE = βbtXty − nY 2 k − 1 SCEk

1

Residuos SCR = yty − βbtXty n − k SCRnk Total SCT = yty − nY 2 n − 1

(32)

An ´alisis de la varianza

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Advi ´ertase que rechazar

H

0 implica que hay al menos un coeficiente no nulo, por lo que la relaci ´on existente entre las variables independientes y la dependiente no se debe al azar, lo cual valida el modelo en su conjunto.

Por otro lado, sin m ´as que dividir la regi ´on de rechazo por SCT tanto en el numerador como en el denominador se obtiene la expresi ´on equivalente:

R2 k1 1R2

nk

> F

k1,nk

(1

α

)

.

La importancia de esta nueva expresi ´on para la regi ´on de rechazo es que permite calcular una cota, sin m ´as que despejar

R

2, a partir de la cual el coeficiente de determinaci ´on es significativo. Esto es, el coefciente de determinaci ´on es signifi-cativo al nivel de significaci ´on

α

si

R

2

>

k1 nk

·

F

k−1,n−k

(1

α

)

1 +

k−1 nk

·

F

k−1,n−k

(1

α

)

.

(33)

Intervalos de confianza

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares M´ınimos Cuadrados Restringidos An ´alisis de la varianza Intervalos de confianza

Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

A partir de las distribuciones en el muestreo para los estimadores estudiados es inmediato obtener los siguientes intervalos de confianza al nivel

1

α

:

Intervalo de confianza para

β

i

b

β

i

±

t

nk

1

α

2

·

b

σ

·

w

i

,

i

= 1

, . . . , k.

Intervalo de confianza para

σ

2

"

(

n

k

)

·

σ

b

2

χ

2nk

1

α2

,

(

n

k

)

·

σ

b

2

χ

2nk α2

#

,

donde

χ

2n −k

1

α 2

y

χ

2n −k α 2

son los puntos de una distribuci ´on chi-cuadrado con

n

k

grados de libertad que dejan a su izquierda, respectivamente, una probabilidad

1

α2 y α2.

Una forma alternativa de contrastar hip ´otesis es usando los intervalos de confianza. De manera que para contrastar

H

0

:

=

r

se calcular ´a la regi ´on de confianza para

y si

r

pertenece a dicha regi ´on, no se rechazar ´a la hip ´otesis nula.

(34)

Explotaci ´

on del modelo

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Explotaci ´on del modelo

Predicci ´on Puntual ´

Optima Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(35)

Predicci ´

on Puntual ´

Optima

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo

Predicci ´on Puntual ´

Optima

Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Una vez validado el modelo, la siguiente fase de un modelo econom ´etrico es la explotaci ´on, siendo entonces la predicci ´on o la permanencia estructural algunos de sus objetivos.

La predicci ´on se realiza desde dos puntos de vista: a) por un lado realizare-mos una predicci ´on puntual dando un ´unico valor de predicci ´on para un instante en concreto; b) por otra parte, puesto que

Y

es una variable aleatoria, podemos calcular su esperanza dado un valor en concreto de las variables independientes. Siguiendo las directrices anteriores se llega a la misma expresi ´on algebr ´aica en ambos casos:

p

0

=

x

t0

·

β,

b

donde

x

t0

= (1

X

02

X

03

. . . X

0k

)

contiene los valores de las variables inde-pendientes para los que se quiere obtener la predicci ´on.

Este predictor,

p

0, m´ınimo cuadr ´atico (ya que se obtiene a partir del estima-dor por m´ınimos cuadrados ordinarios de

β

) es lineal, insesgado y ´optimo (en el sentido de m´ınima varianza).

(36)

Predicci ´

on por intervalo

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo

Predicci ´on Puntual ´

Optima

Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

En este apartado calcularemos el intervalo de confianza para el valor esperado de

Y

dado

x

0, es decir, para

E

[

Y

0

/x

0

] =

x

t0

·

β

.

Como

x

t0

·

β

b

se distribuye seg ´un una normal (ya que est ´a en funci ´on de

β

b

) y

E

[

x

t0

·

β

b

] =

x

t0

β

, ya que es insesgado.

V ar

x

t0

·

β

b

=

E

h

x

t0

·

β

b

x

t0

·

β

·

x

t0

·

β

b

x

t0

·

β

i

=

x

t0

·

E

β

b

β

·

β

b

β

t

·

x

0

=

x

t0

·

V ar

b

β

·

x

0

=

σ

2

·

x

0t

(

X

t

X

)

−1

x

0

.

se tiene que

x

t0

·

β

b

N

x

t0

·

β, σ

2

·

x

t0

X

t

X

−1

x

0

.

Ahora bien, esta distribuci ´on no es apta para hacer inferencia puesto que depende de la cantidad desconocida

σ

2. Para resolver este problema, tipificare-mos la anterior distribuci ´on normal y la dividiretipificare-mos entre la ra´ız cuadrada de la siguiente distribuci ´on chi-cuadrado

(37)

Predicci ´

on por intervalo

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo

Predicci ´on Puntual ´

Optima

Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(

n

k

)

·

b

σ

2

σ

2

χ

2 nk

,

dividida a su vez entre sus grados de libertad, obteniendo la siguiente distribuci ´on t-Student:

x

t0

·

β

b

x

t0

·

β

b

σ

·

q

x

t 0

(

X

t

X

)

− 1

x

0

t

nk

.

A partir de esta distribuci ´on, el intervalo de confianza al nivel

1

α

para

E

[

Y

0

/x

0

] =

x

t0

·

β

es:

x

t0

·

β

b

±

t

nk

1

α

2

·

b

σ

·

q

x

t0

(

X

t

X

)

−1

x

0

,

donde

t

nk

1

α2

es el punto de una distribuci ´on

t

de Student con

n

k

grados de libertad que deja a su izquierda una probabilidad

1

α2.

(38)

Contraste de Permanencia Estructural

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo

Predicci ´on Puntual ´

Optima Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Al explotar el modelo mediante la predicci ´on se est ´a presuponiendo que la relaci ´on estimada se mantiene para la informaci ´on no presente en la muestra observada. Para confirmar este aspecto, calcularemos el intervalo de confianza para

Y

dado

x

0, de forma que si la nueva informaci ´on pertenece a dicho intervalo, la estructura del modelo estimado permanecer ´a.

Partiendo de que

Y

0

Y

b

0

=

u

0

x

t0

b

β

β

N

0

, σ

2

·

1 +

x

t0

X

t

X

−1

x

0

,

se llega de forma an ´aloga a la anterior a la distribuci ´on

Y

0

Y

b

0

b

σ

·

q

1 +

x

t0

(

X

t

X

)

−1

x

0

t

nk

,

donde

Y

b

0

=

x

t0

·

β

b

. Por tanto, el intervalo de confianza al nivel

1

α

para

Y

0 es:

x

t0

·

β

b

±

t

nk

1

α

2

·

σ

b

·

q

1 +

x

t0

(

X

t

X

)

−1

x

0

.

(39)

Incumplimiento de las hip ´

otesis

b ´asicas: Multicolinealidad

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo

Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on

(40)

Concepto y causas

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on

El problema de multicolinealidad consiste en la existencia de relaciones lineales entre dos o m ´as variables independientes del modelo lineal uniecuacional multiple. Dependiendo de c ´omo sea dicha relaci ´on lineal hablaremos de multicolineali-dad perfecta o aproximada.

Las principales causas que producen multicolinealidad en un modelo son: relaci ´on causal entre variables explicativas del modelo.

escasa variabilidad en las observaciones de las variables independientes. reducido tama ˜no de la muestra.

En definitiva, la multicolinealidad suele ser un problema muestral que se presenta normalmente en datos con el perfil de series temporales.

As´ı, por ejemplo, la edad y la experiencia suelen presentar una alta relaci ´on ya que ambas evolucionan conjuntamente: a mayor edad se presupone mayor experiencia. Por tal motivo ser ´a dif´ıcil separar el efecto de cada una sobre la va-riable dependiente y que se produzca multicolinealidad debido a la relaci ´on causal existente entre dichas variables (series temporales).

(41)

Multicolinealidad exacta o perfecta

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on

La multicolinealidad exacta o perfecta hace referencia a la existencia de una rela-ci ´on lineal exacta entre dos o m ´as variables independientes.

Dicho tipo de multicolinealidad se traduce en el incumplimiento de una de las hip ´otesis b ´asicas del modelo uniecuacional m ´ultiple: la matriz

X

no es de rango completo por columnas, esto es,

rg

(

X

)

< k

.

El incumplimiento de dicha hip ´otesis no permite invertir la matriz

X

t

X

, por lo que el sistema normal

X

t

X

·

β

=

X

t

y,

es compatible indeterminado, es decir, es imposible obtener una soluci ´on ´unica para

β

b

(hay infinitas).

¿Qu ´e hacer ante esta situaci ´on? Evidentemente no se podr ´an estimar los coeficientes de las varaibles independientes, sin embargo, si se podr ´a estimar una combinaci ´on lineal de los mismos. Y en tal caso no tenemos garantizado que se puedan recuperar a partir de ´estas las estimaciones de los par ´ametros originales.

(42)

Multicolinealidad aproximada

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on

La multicolinealidad aproximada hace referencia a la existencia de una relaci ´on lineal aproximada entre dos o m ´as variables independientes.

En este caso, no se incumplir ´a la hip ´otesis b ´asica de que la matriz

X

sea completa por columnas

(

rg

(

X

) =

k

)

, por lo que se podr ´a invertir

X

t

X

y obtener los estimadores por m´ınimos cuadrados ordinarios. Sin embargo, el determinante de

X

t

X

ser ´a muy pr ´oximo a cero, por lo que

(

X

t

X

)

−1 tender ´a a tener valores altos.

En consecuencia, cuando existe un problema de multicolinealidad no perfecta se presentan los siguientes problemas:

las varianzas de los estimadores son muy grandes.

al efectuar contrastes de significaci ´on individual no se rechazar ´a la hip ´otesis nula, mientras que al realizar contrastes conjuntos si.

los coeficientes estimados ser ´an muy sensibles ante peque ˜nos cambios en los datos.

(43)

Detecci ´

on de la multicolinealidad

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on

Basarse en los sintomas enumerados anteriormente para la detecci ´on de la mul-ticolinealidad no es un procedimiento fiable ya que es subjetivo.

Por tal motivo, para la detecci ´on de la multicolinealidad usaremos los m ´eto-dos:

N ´umero de condici ´on.

Factor de agrandamiento de la varianza.

El n ´umero de condici ´on,

k

(

X

)

, se define como la ra´ız cuadrada del cociente entre el autovalor m ´as grande de

X

t

X

,

λ

max, y el m ´as peque ˜no,

λ

min. Esto es:

k

(

X

) =

r

λ

max

λ

min

.

Si dicho n ´umero de condici ´on toma un valor entre 20 y 30 estamos ante un pro-blema de multicolinealidad probable y se considera seguro si supera 30.

(44)

Detecci ´

on de la multicolinealidad

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on

El factor de agrandamiento de la varianza,

F AV

, se define para cada uno de los coeficientes como:

F AV

(

β

b

i

) =

1

1

R

2i

,

i

= 2

, . . . , k,

donde

R

i2 es el coeficiente de determinaci ´on obtenido al efectuar la regresi ´on de

X

i sobre el resto de las variables independientes del modelo.

El FAV se interpreta como la raz ´on entre la varianza observada y la que habr´ıa sido en caso de que

X

i estuviera incorrelacionada con el resto de variables inde-pendientes del modelo, es decir, muestra en qu ´e medida se agranda la varianza del estimador como consecuencia de la relaci ´on de los regresores.

Valores del FAV superiores a 10 hacen pensar en la posible existencia de multicolinealidad en el modelo.

(45)

Soluciones al problema de multicolinealidad

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Concepto y causas Multicolinealidad exacta o perfecta Multicolinealidad aproximada Detecci ´on de la multicolinealidad Soluciones Heteroscedasticidad Autocorrelaci ´on

Algunas de las posibles soluciones al problema de multicolinealidad son las si-guientes:

mejora del dise ˜no muestral estrayendo la informaci ´on m ´axima de la variables observadas.

eliminaci ´on de las variables que se sospechan son causantes de la multicoli-nealidad.

en caso de disponer de pocas observaciones, aumentar el tama ˜no de la mues-tra.

utilizar la relaci ´on extramuestral que permita realizar relaciones entre los par ´ametros (informaci ´on a priori) que permita estimar el modelo por m´ınimos cuadrados restringidos.

Por otro lado, algunos autores sugieren tratar el problema de la multicolineali-dad de forma mec ´anica y puramente num ´erica proponiendo una t ´ecnica conocida como regresi ´on alomada. Sin embargo, esta t ´ecnica tiene dos problemas impor-tantes: es arbitraria y los estimadores obtenidos no son interpretables.

(46)

Incumplimiento de las hip ´

otesis

b ´asicas: Heterocedasticidad

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Naturaleza del problema Causas de la heteroscedasticidad Consecuencias de la heteroscedasticidad Procedimientos de Detecci ´on M´ınimos Cuadrados Ponderados Autocorrelaci ´on

(47)

Naturaleza del problema

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Naturaleza del problema Causas de la heteroscedasticidad Consecuencias de la heteroscedasticidad Procedimientos de Detecci ´on M´ınimos Cuadrados Ponderados Autocorrelaci ´on

En el modelo lineal general,

y

=

+

u

, se supone que la perturbaci ´on aleatoria es tal que

E

[

u

] = 0

n×1 y

V ar

(

u

) =

E

[

u

·

u

t

] =

σ

2

I

n×n, lo cual implica que:

E

[

u

t

] = 0

,

t

∈ {

1

, . . . , n

}

.

E

[

u

2t

] =

V ar

(

u

t

) =

σ

2

,

t

∈ {

1

, . . . , n

}

(varianza constante =

homoce-dasticidad).

E

[

u

i

·

u

j

] =

Cov

(

u

i

, u

j

) = 0

,

i

6

=

j

∈ {

1

, . . . , n

}

(incorrelaci ´on).

Cuando se incumple el supuesto de homocedasticidad, es decir, la varianza no es constante sino que var´ıa con la observaci ´on (

E

[

u

2t

] =

σ

t2

,

t

), se dice que hay heteroscedasticidad.

Consideramos entonces el modelo lineal general

y

n×1

=

X

n×k

·

β

k×1

+

u

n×1

,

tal que

E

[

u

] = 0

n×1 y

V ar

(

u

) =

σ

2

·

n×n donde

es una matriz

diagonal con diagonal no constante.

Advi ´ertase que en este caso se dice que el modelo tiene una matriz de varianzas-covarianzas no escalar o con perturbaciones no esf ´ericas (ya que la matriz de varianzas-covarianzas de la perturbaci ´on aleatoria ya no es igual al pro-ducto de una constante por la matriz identidad).

(48)

Causas de la heteroscedasticidad

Contenidos Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Naturaleza del problema Causas de la heteroscedasticidad Consecuencias de la heteroscedasticidad Procedimientos de Detecci ´on M´ınimos Cuadrados Ponderados Autocorrelaci ´on

Las principales causas de la presencia de heteroscedasticidad en un modelo lineal m ´ultiple son:

Naturaleza del fen ´omeno: en situaciones en las que se disponen de datos de secci ´on cruzada (como las del ejemplo anterior: consumo de bienes de lujo e ingresos familiares, pol´ıtica de dividendos y ganancias empresariales o pol´ıtica de inversi ´on y ganancias empresariales) es factible la presencia de heteroscedasticidad.

Usar datos agregados: cuando las observaciones de la variable dependiente pueden dividirse en grupos (por ejemplo, una persona que reside en una pro-vincia, un grupo de empresas que pertenecen a un mismo sector, etc.) y se usan como datos los promedios proporcionados por tales grupos es factible la presencia de heteroscedasticidad.

Si se omite una variable relevante en el modelo, es esperable que la pertur-baci ´on aleatoria dependa de dicha variable omitida, por lo que su varianza dif´ıcilmente ser ´a constante.

Referencias

Documento similar

De entre los resultados obtenidos para las superficies cultivadas destaca la drástica disminución que el modelo simula en la superficie de gira- sol bajo los escenarios «con

If certification of devices under the MDR has not been finalised before expiry of the Directive’s certificate, and where the device does not present an unacceptable risk to health

In addition to the requirements set out in Chapter VII MDR, also other MDR requirements should apply to ‘legacy devices’, provided that those requirements

The notified body that issued the AIMDD or MDD certificate may confirm in writing (after having reviewed manufacturer’s description of the (proposed) change) that the

Le Moyne [Le97Air-Fu] realiza un trabajo muy extenso sobre la evolución del combustible y la identificación de los parámetros X y τ, utilizando un motor de 2,0 l, cuatro cilindros y

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

[r]

La importancia de esta nueva expresi ´on para la regi ´on de rechazo es que permite calcular una cota, sin m ´as que despejar R 2 , a partir de la cual el coeficiente de determinaci