• No se han encontrado resultados

Introducci ´ on

N/A
N/A
Protected

Academic year: 2022

Share "Introducci ´ on"

Copied!
70
0
0

Texto completo

(1)

Introducci ´ on a la Econometr´ıa El modelo de regresi ´ on lineal m ´ ultiple Incumplimiento de las hip ´ otesis b ´asicas

Rom ´an Salmer ´on G ´omez

Universidad de Granada

(2)

Contenidos

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Introducci ´on

Especificaci ´on del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad

Heteroscedasticidad Autocorrelaci ´on

(3)

Introducci ´ on

Contenidos

Introducci ´on Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(4)

Econometr´ıa

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

La Estad´ıstica juega un papel importante en cualquier ciencia emp´ırica a la hora de estimular la formulaci ´on de modelos y contrastarlos. En la ciencia econ ´omica este papel se hace especialmente importante hasta el punto de que la necesidad de extender la Estad´ıstica ha dado lugar al nacimiento de una disciplina nueva que hoy goza de una gran vitalidad: la Econometr´ıa.

La Econometr´ıa es una rama de la Econom´ıa que aglutina a la Teor´ıa Econ ´omica, las Matem ´aticas, la Estad´ıstica y la Inform ´atica para estudiar y ana- lizar fen ´omenos econ ´omicos. Puede decirse que constituye en s´ı misma una dis- ciplina dentro de la Econom´ıa y a la vez una potente herramienta que tanto los economistas como otros muchos investigadores sociales utilizan para el estudio de sus problemas concretos. El principal prop ´osito de la Econometr´ıa es propor- cionar un sustrato emp´ırico a la Teor´ıa Econ ´omica.

Una breve descripci ´on de la historia econom ´etrica la puedes encontrar en las lecturas recomendadas.

(5)

Definici ´ on de Econometr´ıa

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

De entre las muchas definiciones existentes sobre la Econometr´ıa destacar´ıa la siguiente:

“La Econometr´ıa, usando la Teor´ıa Econ ´omica, las Matem ´aticas y la Inferencia Estad´ıstica como fundamentos anal´ıticos, y los datos econ ´omicos como la base informativa, proporciona una base para:

1. Modificar, refinar o posiblemente refutar las conclusiones en el cuerpo de conocimientos conocido como Teor´ıa Econ ´omica.

2. Conseguir signos, magnitudes y afirmaciones de calidad para los coeficientes de las variables en las relaciones econ ´omicas, de modo que esta informaci ´on puede usarse como base para la elecci ´on y toma de decisiones.”

Judge y otros (1985)

(6)

Modelo econ ´ omico y econom ´etrico

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Modelo econ ´omico: Un modelo econ ´omico es una representaci ´on simplificada de la realidad econ ´omica mediante la expresi ´on matem ´atica de una determina- da teor´ıa econ ´omica.

Modelo econom ´etrico: Un modelo econom ´etrico es aquel modelo econ ´omico que contiene todos los elementos necesarios para ser estudiado desde un pun- to de vista emp´ırico. Es decir, un modelo econ ´omico en el que se ha especi- ficado el tipo de relaci ´on entre variables (en este curso lineal), el n ´umero de variables, introducci ´on de la perturbaci ´on aleatoria (para recoger el efecto de las variables no incluidas fundamentalmente), etc.

As´ı, por ejemplo, un modelo econ ´omico es aquel en el que se especifica que el consumo es una funci ´on de la renta:

Consumo = f (Renta)

.

Mientras el modelo econom ´etrico ser ´a aquel en el que se establece que la relaci ´on es lineal y se introduce la perturbaci ´on aleatoria

u

t:

Consumo

t

= β

1

+ β

2

· Renta

t

+ u

t

.

(7)

Fases del m ´etodo econom ´etrico

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

La elaboraci ´on de un modelo econom ´etrico se puede dividir en las siguientes fases:

Especificaci ´on: En esta fase se propone la forma matem ´atica de la relaci ´on que liga las variables presentes en el modelo y la perturbaci ´on aleatoria. Tambi ´en debe decidirse el n ´umero de ecuaciones y variables que forman el modelo. Todo ello se realizar ´a partiendo de la Teor´ıa Econ ´omica.

Estimaci ´on: Esta fase consiste en la obtenci ´on de valores num ´ericos de las cantidades constantes del modelo econom ´etrico. Por tanto, ser ´a necesario dis- poner de informaci ´on emp´ırica sobre el fen ´omeno (datos) y haber decidido el m ´etodo de estimaci ´on a usar.

Validaci ´on: En esta fase se eval ´uan los resultados obtenidos en la etapa ante- rior para decidir si los mismos son o no aceptables tanto desde el punto de vista de la teor´ıa econ ´omica (magnitudes, signos, etc) como desde el punto de vista estad´ıstico (validez del modelo).

Explotaci ´on: Si el modelo es aceptado, este puede ser usado para la predicci ´on y contrastar la permanencia de la estructura estimada.

(8)

Componentes de un modelo econom ´etrico

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Las principales componentes de un modelo econom ´etrico son:

Variables: Dentro de las variables podemos distinguir entre las variables obser- vables (aquellas de las que se disponen datos) y no observables (la perturba- ci ´on aleatoria). Y dentro de las primeras tenemos a las variables dependientes, explicadas o end ´ogenas (aquellas que est ´an influidas por otras variables) y va- riables independientes, explicativas o ex ´ogenas (aquellas que no est ´an influidas por otras).

Par ´ametros: Los par ´ametros son las cantidades fijas o constantes del mode- lo econom ´etrico que se desean estimar (los coeficientes de las variables y la varianza de la perturbaci ´on aleatoria).

Ecuaciones: Las relaciones entre las distintas variables se explicitar ´a mediante una o m ´as ecuaciones.

(9)

Naturaleza de la informaci ´ on utilizada en Econometr´ıa

Contenidos Introducci ´on

Definici ´on de Econometr´ıa

Modelo econ ´omico y econom ´etrico Fases del m ´etodo econom ´etrico Componentes de un modelo econom ´etrico Naturaleza de la informaci ´on utilizada en Econometr´ıa Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Los datos econ ´omicos suelen ser de clases muy variadas, siendo los tipos m ´as importantes los siguientes:

Datos de corte transversal: son un conjunto de datos formada por unidades (individuos, empresas, regiones, etc) observadas en un momento determinado (d´ıa, mes, trimestre, a ˜no, etc). Por ejemplo, el consumo de varias familias en un mes en concreto.

Datos de series temporales: son un conjunto de datos formado por observa- ciones de una misma variable a lo largo del tiempo. Por ejemplo, el consumo mensual de una familia a lo largo de todo un a ˜no.

Datos de panel o longitudinales: son un conjunto de datos que combinan una dimensi ´on temporal con otra transversal. Por ejemplo, el consumo mensual de un conjunto de familias a lo largo de todo un a ˜no.

Habr ´a que atender al tipo de datos que se analicen ya que dependiendo de su naturaleza se podr ´an aplicar unos u otros m ´etodos econom ´etricos.

(10)

Especificaci ´ on del modelo

Contenidos

Introducci ´on Especificaci ´on del modelo

Modelo lineal

uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(11)

Modelo lineal uniecuacional m ´ ultiple

Contenidos

Introducci ´on Especificaci ´on del modelo

Modelo lineal

uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

El modelo lineal uniecuacional m ´ultiple analiza la relaci ´on lineal entre una variable dependiente,

Y

, y m ´as de una variable independiente,

X

i,

i = 1, . . . , k

,

k > 1

,

m ´as un t ´ermino aleatorio,

u

.

As´ı, a partir de

n

observaciones para cada variable, el modelo puede ser expresado como:

Y

t

= β

1

+ β

2

X

t2

+ β

3

X

t3

+ · · · + β

k

X

tk

+ u

t

, t = 1, . . . , n,

(1)

donde se ha considerado que hay t ´ermino constante, es decir,

X

1t

= 1

,

∀t

.

El objetivo ser ´a estimar (es decir, obtener una aproximaci ´on num ´erica) aque- llas cantidades constantes presentes en el modelo (1), as´ı como la bondad de la estimaci ´on realizada. En primer lugar, se escribe dicho modelo para todas y cada una de las observaciones:

Y

1

= β

1

+ β

2

X

12

+ β

3

X

13

+ · · · + β

k

X

1k

+ u

1

Y

2

= β

1

+ β

2

X

22

+ β

3

X

23

+ · · · + β

k

X

2k

+ u

2

.. .

.. .

Y

n

= β

1

+ β

2

X

n2

+ β

3

X

n3

+ · · · + β

k

X

nk

+ u

n

(12)

Modelo lineal uniecuacional m ´ ultiple

Contenidos

Introducci ´on Especificaci ´on del modelo

Modelo lineal

uniecuacional m ´ultiple Hip ´otesis del modelo Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Que nos conduce a la siguiente forma matricial:

y

n×1

= X

n×k

· β

k×1

+ u

n×1

,

(2)

donde:

y

n×1

=

 

  Y

1

Y

2

.. .

Y

n

 

  , β

k×1

=

 

  β

1

β

2

.. .

β

k

 

  , u

n×1

=

 

  u

1

u

2

.. .

u

n

 

  ,

X

n×k

=

 

 

1 X

12

. . . X

1k

1 X

22

. . . X

2k

..

. ... . .. ...

1 X

n2

. . . X

nk

 

  .

(13)

Hip ´ otesis del modelo

Contenidos

Introducci ´on Especificaci ´on del modelo

Modelo lineal

uniecuacional m ´ultiple Hip ´otesis del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Consideraremos las siguientes hip ´otesis b ´asicas en el modelo lineal uniecuacional m ´ultiple:

El vector

y

se puede expresar como combinaci ´on lineal de las variables expli- cativas m ´as un vector de perturbaci ´on.

La perturbaci ´on aleatoria est ´a centrada

(E[u

t

] = 0, t = 1, . . . , n)

, es

homoced ´astica

V ar(u

t

) = E[u

2t

] = σ

2

, t = 1, . . . , n 

e incorrelada

(Cov(u

t

, u

s

) = E[u

t

· u

s

] = 0, ∀t 6= s, t, s = 1, . . . , n)

. En tal caso se dice que las perturbaciones son esf ´ericas y se verifica que

E[u] = 0

n×1 y

V ar(u) = E[u · u

t

] = σ

2

· I

n×n

.

La matriz

X

es no estoc ´astica y de rango completo por columnas, es decir,

rg(X) = k

(como consecuencia

n > k

y las columnas de

X

, es decir,

X

i,

i = 1, . . . , n

, son linealmente independientes).

No hay relaci ´on entre variables independientes y la perturbaci ´on aleatoria:

Cov(un×1, Xi) = E 

(u − E[u]) · (Xi − E[Xi])t

= E 

u · (Xi − Xi)t

= E[un×1 · 01×n] = 0n×n.

(14)

Estimaci ´ on del modelo

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo

Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(15)

Estimaci ´ on m´ınimo cuadr ´atica de los coeficientes del modelo

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo

Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Definiendo los errores o residuos,

e

, del modelo lineal uniecuacional m ´ultiple como la diferencia entre los verdaderos valores de la variable dependiente y su estima- ci ´on, esto es

e = y − b y,

donde

y = X b b β

, y siguiendo la premisa de minimizar la suma de los cuadrados de los residuos

e

t

e = (y − X b β)

t

· (y − X b β) = y

t

y − 2b β

t

X

t

y + b β

t

X

t

X b β,

se obtiene la estimaci ´on del par ´ametro

β

como

β = X b

t

X 

−1

· X

t

y.

Dicho m ´etodo recibe el nombre de m´ınimos cuadrados ordinarios, MCO, por lo que los estimadores obtenidos a partir de dicho m ´etodo reciben el nombre de estimadores de m´ınimos cuadrados ordinarios, EMCO.

Como consecuencias de dicha estimaci ´on se verifica que

X

t

· e = 0

k×1,

i

t

· e = 0

1×1,

i

t

· b y = i

t

· y

y

y b

t

· e = 0

1×1 donde

i

t

= (1 1 . . . 1)

1×n.

(16)

Estimaci ´ on m´ınimo cuadr ´atica de los coeficientes del modelo

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo

Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Advi ´ertase que:

X

t

X =

 

 

 

 

n

P

n t=1

X

t2

· · ·

P

n t=1

X

tk

P

n t=1

X

t2

P

n t=1

X

t22

· · ·

P

n t=1

X

t2

X

tk

.. .

..

. . .. ...

P

n t=1

X

tk

P

n t=1

X

tk

X

t2

· · ·

P

n t=1

X

tk2

 

 

 

 

 ,

y

X

t

y =

 

 

 

 

P

n t=1

Y

t

P

n t=1

X

t2

Y

t

.. .

P

n t=1

X

tk

Y

t

 

 

 

 

.

(17)

Teorema de Gauss-Markov

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo

Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Teorema 1 (Teorema de Gauss-Markov) Los estimadores de m´ınimos cuadra- dos ordinarios son lineales, insesgados y ´optimos (ELIO), es decir, tienen varianza m´ınima entre la clase de los estimadores lineales e insesgados.

En efecto, por la forma de escribirse el estimador es evidente que es lineal.

As´ı, llamando:

C

k×n

= X

t

X 

−1

k×k

· X

k×nt

=

 

 

c

11

c

12

. . . c

1n

c

21

c

22

. . . c

2n

.. .

..

. . .. ...

c

k1

c

k2

. . . c

kn

 

  ,

se tiene que

β b

se expresa como combinaci ´on lineal del vector

y

:

β b

k×1

= C

k×n

· y

n×1

=

 

 

c

11

Y

1

+ c

12

Y

2

+ . . . + c

1n

Y

n

c

21

Y

1

+ c

22

Y

2

+ . . . + c

2n

Y

n

.. .

c

k1

Y

1

+ c

k2

Y

2

+ . . . + c

kn

Y

n

 

  .

(18)

Teorema de Gauss-Markov

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo

Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Para que el estimador

β b

de

β

sea insesgado se ha de cumplir que

E[ b β] = β

. En

efecto, sustituyendo

y = Xβ + u

en

β b

:

β b = X

t

X 

−1

· X

t

y = X

t

X 

−1

· X

t

(Xβ + u)

= β + X

t

X 

−1

· X

t

u −→ b β = β + X

t

X 

−1

· X

t

u.

Entonces, teniendo en cuenta que

E[u] = 0

:

E[ b β] = E h

β + X

t

X 

−1

· X

t

u i

= β + X

t

X 

−1

· X

t

· E[u] = β.

Por otro lado, la matriz de varianzas-covarianzas de

β b

:

V ar  βb

= E

βb− E[ bβ]

· 

βb− E[ bβ]t

= E 

βb− β

· 

βb− βt

= E h

XtX1

Xtu · utX XtX1i

= XtX1

Xt · E[u · ut] · X XtX1

= σ2 · XtX1

XtX XtX1

= σ2 · XtX1

,

(19)

Teorema de Gauss-Markov

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo

Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

donde se ha tenido en cuenta que

β b

es insesgado,

β − β = (X b

t

X)

−1

X

t

u

y

V ar(u) = E[u · u

t

] = σ

2

· I

n×n.

Para demostrar que

β b

es de m´ınima varianza consideraremos otro estimador,

β

, de

β

lineal e insesgado de forma que

V ar  β b 

< V ar (β

)

.

En efecto,

β

= D

k×n

· y

n×1 tal que

D · X = I

k×k es lineal e insesgado.

Adem ´as,

V ar (β

) = σ

2

· DD

t.

En tal caso, puesto que podemos escribir

D = (X

t

X)

−1

X

t

+ W

con

W 6= 0

k×n, se tiene que

DD

t

= (X

t

X)

−1

+ W W

t, y en tal caso:

V ar (β

) = σ

2

·DD

t

= σ

2

· X

t

X 

−1

2

·W W

t

= V ar  β b 

2

·W W

t

,

esto es,

V ar (β

) − V ar  β b 

= σ

2

· W W

t

.

Y como

W W

t es definida positiva:

V ar (β

) − V ar  β b 

> 0

, y en tal

caso:

V ar (β

) > V ar  β b 

.

(20)

Estimaci ´ on de la varianza de la perturbaci ´ on aleatoria

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Estimaci ´on m´ınimo cuadr ´atica de los coeficientes del modelo

Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ´on aleatoria

Validaci ´on del modelo Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Adem ´as de los coeficientes de las variables independientes, hay en el modelo otra cantidad constante que habr ´a que estimar: la varianza de la perturbaci ´on aleatoria,

σ

2.

Un estimador insesgado de

σ

2 es:

b

σ

2

= e

t

e n − k ,

ya que

E[e

t

e] = (n − k) · σ

2.

Para calcular dicho estimador se dispone de la expresi ´on:

b

σ

2

= y

t

y − b β

t

X

t

y n − k .

En consecuencia, la estimaci ´on de la matriz de varianzas-covarianzas de

β b

es:

V ar \  β b 

= b σ

2

· X

t

X 

−1

.

(21)

Validaci ´ on del modelo

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(22)

Bondad de ajuste: Coeficiente de determinaci ´ on

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Una vez estimado el modelo lineal uniecuacional multiple, es decir, una vez ob- tenidas las estimaciones de

β

y

σ

2, el siguiente paso ser ´a estudiar la calidad de dichas estimaciones.

As´ı, a continuaci ´on, obtendremos el coeficiente de determinaci ´on, que no es m ´as que una medida para estudiar la bondad del ajuste lineal determinado por los estimadores por m´ınimos cuadrados ordinarios.

Dicho coeficiente de determinaci ´on, que se denota por

R

2, se define como el porcentaje de variabilidad explicada por el modelo. Por tanto, ´este se obtendr ´a co- mo el cociente entre la varianza explicada por la estimaci ´on y la total:

R

2

=

1 T

·

P

n i=1

 Y b

i

− Y 

2

1 T

·

P

n i=1

Y

i

− Y 

2

= P

n i=1

 Y b

i

− Y 

2

P

n i=1

Y

i

− Y 

2

.

Como se observa, el coeficiente de determinaci ´on queda expresado en funci ´on de la suma de cuadrados explicados (SCE) y los totales (SCT).

(23)

Bondad de ajuste: Coeficiente de determinaci ´ on

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Luego, teniendo en cuenta la descomposici ´on

SCT = SCE + SCR,

se tiene que

R

2

= SCE

SCT = 1 − SCR SCT .

Entonces, para calcular dicho coeficiente se dispone de la expresi ´on:

R

2

= β b

t

X

t

y − n · Y

2

y

t

y − n · Y

2

= 1 − y

t

y − b β

t

X

t

y y

t

y − n · Y

2

.

Advi ´ertase que, siempre que el modelo lineal tenga t ´ermino independiente, el coeficiente de determinaci ´on var´ıa entre 0 y 1. El valor 0 lo toma cuando la SCE es nula y, por tanto, el modelo no es adecuado; mientras que toma el valor 1 cuando la SCR es nula y, por tanto, el modelo es adecuado.

(24)

Coeficiente de determinaci ´ on corregido

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Puesto que a medida que vamos incluyendo variables en el modelo el coeficiente de determinaci ´on aumenta aunque las variables que incluyamos no sean signifi- cativas, esto supone un problema.

El coeficiente de determinaci ´on corregido,

R

2, viene a resolver este proble- ma del coeficiente de determinaci ´on. Dicho coeficiente mide el porcentaje de va- riaci ´on de la variable dependiente (al igual que el coeficiente de determinaci ´on) pero teniendo en cuenta el n ´umero de variables incluidas en el modelo. Se define como:

R

2

= 1 − (1 − R

2

) · n − 1 n − k .

En cualquier caso, estas medidas de bondad del ajuste no deben de ser sobrevaloradas. Obtener un

R

2 o

R

2 cercano a 1 no indica que los resultados sean fiables, ya que, por ejemplo, puede ser que no se cumpla alguna de las hip ´otesis b ´asicas y los resultados no ser v ´alidos. Por tanto, estos indicadores han de ser considerados como una herramienta m ´as a tener en cuenta dentro del an ´alisis.

(25)

Distribuci ´ on en el muestreo de los estimadores MCO

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Introduciendo la hip ´otesis de que la perturbaci ´on aleatoria sigue una distribuci ´on normal, esto es:

u

n×1

∼ N(0

n×1

, σ

2

· I

n×n

).

En consecuencia,

β b

k×1

∼ N(β, σ

2

· (X

t

X)

−1

)

, ya que:

β b

sigue una distribuci ´on normal ya que se puede expresar en funci ´on de una normal:

β = β + (X b

t

X)

−1

· X

t

u

.

se tienen calculados el vector de medias,

E h β b i

= β

, y matriz de varianzas- covarianzas,

V ar 

β b 

= σ

2

· (X

t

X)

−1.

Por otro lado, ya que

e

t

e = u

t

M u

siendo

M

n×n

= I − X (X

t

X)

−1

X

t

sim ´etrica, idempotente y con

rg(M ) = n − k < k

se tiene que u

tM u

σ2

∼ χ

2n−k

,

lo que se traduce en que

(n − k) · b σ

2

σ

2

∼ χ

2n−k

.

(26)

Contraste de un conjunto de hip ´ otesis lineales

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

A continuaci ´on abordaremos la especificaci ´on de contrastes sobre un conjunto de hip ´otesis lineales sobre los coeficientes del modelo. Concretamente, suponiendo

q

restricciones lineales independientes entre s´ı:

a

11

β

1

+ a

12

β

2

+ · · · + a

1k

β

k

= b

1

a

21

β

1

+ a

22

β

2

+ · · · + a

2k

β

k

= b

2

.. .

..

.

=

...

a

q1

β

1

+ a

q2

β

2

+ · · · + a

qk

β

k

= b

q

Plantearemos contrastar la hip ´otesis nula

H

0

: Rβ = r

donde

R

q×k

=

 

 

a

11

a

12

. . . a

1k

a

21

a

22

. . . a

2k

.. .

..

. . .. ...

a

q1

a

q2

. . . a

qk

 

  , r

q×1

=

 

  b

1

b

2

.. .

b

q

 

  .

(27)

Contraste de un conjunto de hip ´ otesis lineales

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Usando la distribuci ´on

 R b β − Rβ 

t

·

h R (X

t

X)

−1

R

t

i

−1

q · b σ

2

· 

R b β − Rβ 

∼ F

q,n−k

,

rechazaremos la hip ´otesis nula al nivel de significaci ´on

α

si

 R b β − r 

t

·

h R (X

t

X)

−1

R

t

i

−1

q · b σ

2

· 

R b β − r 

> F

q,n−k

(1 − α),

donde

F

q,n−k

(1 − α)

es el punto de una

F

de Senedecor de

q

y

n − k

grados

de libertad que deja por debajo suyo una probabilidad

1 − α

.

(28)

Casos particulares

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Un caso particular de suma importancia ser ´a aquel en el que se desee contrastar la hip ´otesis nula

H

0

: β

i

= b

i,

i = 1, . . . , k

.

En tal caso,

q = 1

,

R = (0 0 . . . 1

i)

. . . 0)

y

r = b

i, por lo que la distribuci ´on anterior queda simplificada como

 β b

i

− b

i



2

b

σ

2

· w

i

∼ F

1,n−k

,

donde

w

i es el elemento (i,i) de la matriz

(X

t

X)

−1, o lo que es lo mismo,

σ b

2

·w

i

es el elemento (i,i) de

σ b

2

· (X

t

X)

−1

= \ V ar 

β b 

, esto es, la varianza estimada de

β b

i.

Teniendo en cuenta que la ra´ız cuadrada de una F-Snedecor con 1 y

n

grados

de libertad es una t-Student con

n

grados de libertad se tiene que

β b

i

− b

i

b

σ · √ w

i

∼ t

n−k

,

(29)

Casos particulares

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

y en tal caso rechazaremos

H

0

: β

i

= b

i al nivel de significaci ´on

α

si

β b

i

− b

i

b

σ · √ w

i

> t

n−k



1 − α 2

 ,

donde

t

n−k

1 −

α2



es el punto de una distribuci ´on

t

de student con

n − k

grados de libertad que deja por debajo suya una probabilidad

1 −

α2.

Este caso particular es de vital importancia cuando

b

i

= 0

, ya que entonces estaremos contrastando si el coeficiente de la variable independiente

X

i es o no nulo. De forma que al rechazar dicha hip ´otesis tenemos garantizado que la variable

X

i ha de estar en el modelo, por lo que sus variaciones influyen en la variable dependiente. En tal caso se dice que dicha variable es significativa y que el contraste es un contraste de significaci ´on individual.

(30)

M´ınimos Cuadrados Restringidos

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

En el caso en el que no se rechace la hip ´otesis nula

H

0

: Rβ = r

, ser´ıa deseable incorporar dicha informaci ´on al modelo. En tal caso, se obtiene un nuevo estima- dor:

β b

R

= b β + X

t

X 

−1

R

t

h

R X

t

X 

−1

R

t

i

−1

· 

r − R b β  ,

que recibe el nombre de m´ınimos cuadrados restringidos ya que se ha obtenido con la restricci ´on de que ha de verificar que

R b β

R

= r

.

Dicho estimador es lineal, insesgado siempre que la hip ´otesis nula

H

0

: Rβ = r

sea cierta y ´optimo. Es decir, el estimador por m´ınimos cuadrados restrin- gidos tiene menor varianza que el estimador m´ınimo cuadr ´atico ordinario siempre y cuando la restricci ´on (hip ´otesis nula) sea cierta.

Luego, cuando una restricci ´on lineal sobre los coeficientes de las variables independientes es cierta, el estimador por m´ınimos cuadrados ordinarios deja de ser ´optimo y habr ´a que usar el estimador por m´ınimos cuadrados restringidos.

Adem ´as se verifica que:

SCR

R

≥ SCR, R

2R

≤ R

2

.

(31)

An ´alisis de la varianza

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

El an ´alisis de la varianza aborda el contraste que tiene por hip ´otesis nula que todos los coeficientes de las variables independientes son nulos simult ´aneamente, esto es,

H

0

: β

2

= β

3

= · · · = β

k

= 0

.

Salta a la vista que estamos ante un caso particular de un contraste sobre

k − 1

restricciones lineales de los coeficientes de las variables independientes.

En este caso, rechazaremos la hip ´otesis nula al nivel de significaci ´on

α

si

F

exp

=

SCE k−1 SCR

n−k

> F

k−1,n−k

(1 − α).

Para calcular dicho estad´ıstico se suele resumir la informaci ´on anterior en una tabla, conocida como tabla de an ´alisis de la varianza (tabla ANOVA) ya que en ella se recogen las fuentes de variaci ´on de la varianza:

Fuente de variaci ´on Suma de Cuadrados Grados de Libertad Medias Explicada SCE = bβtXty − nY 2 k − 1 SCEk−1

Residuos SCR = yty − bβtXty n − k SCRn−k

Total SCT = yty − nY 2 n − 1

(32)

An ´alisis de la varianza

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Advi ´ertase que rechazar

H

0 implica que hay al menos un coeficiente no nulo, por lo que la relaci ´on existente entre las variables independientes y la dependiente no se debe al azar, lo cual valida el modelo en su conjunto.

Por otro lado, sin m ´as que dividir la regi ´on de rechazo por SCT tanto en el numerador como en el denominador se obtiene la expresi ´on equivalente:

R2 k−1 1−R2

n−k

> F

k−1,n−k

(1 − α).

La importancia de esta nueva expresi ´on para la regi ´on de rechazo es que permite calcular una cota, sin m ´as que despejar

R

2, a partir de la cual el coeficiente de determinaci ´on es significativo. Esto es, el coefciente de determinaci ´on es signifi- cativo al nivel de significaci ´on

α

si

R

2

>

n−kk−1

· F

k−1,n−k

(1 − α)

1 +

n−kk−1

· F

k−1,n−k

(1 − α) .

(33)

Intervalos de confianza

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza

Explotaci ´on del modelo Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

A partir de las distribuciones en el muestreo para los estimadores estudiados es inmediato obtener los siguientes intervalos de confianza al nivel

1 − α

:

Intervalo de confianza para

β

i

β b

i

± t

n−k

 1 − α 2

 · b σ · √

w

i

, i = 1, . . . , k.

Intervalo de confianza para

σ

2

"

(n − k) · b σ

2

χ

2n−k

1 −

α2

 , (n − k) · b σ

2

χ

2n−k α2



# ,

donde

χ

2n−k

1 −

α2



y

χ

2n−k α2



son los puntos de una distribuci ´on chi- cuadrado con

n−k

grados de libertad que dejan a su izquierda, respectivamente, una probabilidad

1 −

α2 y α2.

Una forma alternativa de contrastar hip ´otesis es usando los intervalos de confianza. De manera que para contrastar

H

0

: Rβ = r

se calcular ´a la regi ´on de confianza para

y si

r

pertenece a dicha regi ´on, no se rechazar ´a la hip ´otesis nula.

(34)

Explotaci ´ on del modelo

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo

Predicci ´on Puntual Optima´

Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

(35)

Predicci ´ on Puntual ´ Optima

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo

Predicci ´on Puntual Optima´

Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

Una vez validado el modelo, la siguiente fase de un modelo econom ´etrico es la explotaci ´on, siendo entonces la predicci ´on o la permanencia estructural algunos de sus objetivos.

La predicci ´on se realiza desde dos puntos de vista: a) por un lado realizare- mos una predicci ´on puntual dando un ´unico valor de predicci ´on para un instante en concreto; b) por otra parte, puesto que

Y

es una variable aleatoria, podemos calcular su esperanza dado un valor en concreto de las variables independientes.

Siguiendo las directrices anteriores se llega a la misma expresi ´on algebr ´aica en ambos casos:

p

0

= x

t0

· b β,

donde

x

t0

= (1 X

02

X

03

. . . X

0k

)

contiene los valores de las variables inde- pendientes para los que se quiere obtener la predicci ´on.

Este predictor,

p

0, m´ınimo cuadr ´atico (ya que se obtiene a partir del estima- dor por m´ınimos cuadrados ordinarios de

β

) es lineal, insesgado y ´optimo (en el sentido de m´ınima varianza).

(36)

Predicci ´ on por intervalo

Contenidos

Introducci ´on Especificaci ´on del modelo

Estimaci ´on del modelo Validaci ´on del modelo Explotaci ´on del modelo

Predicci ´on Puntual Optima´

Predicci ´on por intervalo Contraste de Permanencia Estructural Multicolinealidad Heteroscedasticidad Autocorrelaci ´on

En este apartado calcularemos el intervalo de confianza para el valor esperado de

Y

dado

x

0, es decir, para

E[Y

0

/x

0

] = x

t0

· β

.

Como

x

t0

· b β

se distribuye seg ´un una normal (ya que est ´a en funci ´on de

β b

) y

E[x

t0

· b β] = x

t0

β

, ya que es insesgado.

V ar 

x

t0

· b β 

= E h

x

t0

· b β − x

t0

· β 

· 

x

t0

· b β − x

t0

· β i

= x

t0

· E 

β − β b 

· 

β − β b 

t



·x

0

= x

t0

·V ar  β b 

·x

0

= σ

2

·x

t0

(X

t

X)

−1

x

0

.

se tiene que

x

t0

· b β ∼ N 

x

t0

· β, σ

2

· x

t0

X

t

X 

−1

x

0

 .

Ahora bien, esta distribuci ´on no es apta para hacer inferencia puesto que depende de la cantidad desconocida

σ

2. Para resolver este problema, tipificare- mos la anterior distribuci ´on normal y la dividiremos entre la ra´ız cuadrada de la siguiente distribuci ´on chi-cuadrado

Referencias

Documento similar

Por lo tanto, la significaci´ on que toma la relaci´ on de la educaci´ on con el desarrollo econ´ omico en pa´ıses como los latinoamericanos est´ a a veces muy pr´ oxima a la

Los datos brindan apoyo a la hip´ otesis de una relaci´ on positiva entre au- tonom´ıa fiscal y desarrollo econ´ omico, mientras que las trasferencias por coparticipaci´ on

Introducci´ on a la Teor´ıa de la Informaci´ on.. Asymptotic

Adem´as puede tener un n´umero, como (1.21) que indica el n´umero de ejercicio del libro del curso, Se˜nales y Sistemas, Oppenheim/Willsky, 2nd.edition.. Manipulaci´on de la

Cuando no queda satisfecha esta cl´ausula (es decir que existe relaci´on lineal entre explicativas) se dice que dichas variables son colineales perfec- tas o bien que hay un problema

Para estudiar gr´aficamente el grado de asociaci´on existente entre dos variables elegimos la opci´on: Analyses ,→ Exploration ,→ Scatterplot Como variable Y debemos elegir la

SOLUCIONES DE LA RELACI ´ON DE PROBLEMAS MATEM ´ATICAS II Curso 2022/2023 Escuela T´ecnica Superior de Ingenier´ıa Agron´omica Departamento de Matem´atica Aplicada I Tema 2..

An´ alisis factorial: 1 An´ alisis factorial: Procedimiento para obtener variables latentes, llamadas factores, a partir de una matriz de datos.. 2 Extensi´ on: El an´ alisis factorial