Especificaci ´ on del modelo

(1)

El modelo Lineal General

Rom án Salmer ón G ómez

Universidad de Granada

(2)

Contenidos

Contenidos Especificaci ´on del modelo

Estimaci ón del modelo Validaci ón del modelo Explotaci ón del modelo Ejemplos

Especificaci ón del modelo Estimaci ón del modelo Validaci ón del modelo Explotaci ón del modelo Ejemplos

(3)

Especificaci ´ on del modelo

Modelo lineal

uniecuacional m últiple Hip ótesis del modelo Estimaci ón del modelo Validaci ón del modelo Explotaci ón del modelo Ejemplos

(4)

Modelo lineal uniecuacional m ´ ultiple

Modelo lineal

El modelo lineal uniecuacional m ´ultiple analiza la relaci ´on lineal entre una variable dependiente,

Y

, y m ´as de una variable independiente,

X

i,

i = 1, . . . , k

^,

k > 1

^,

m ´as un t ´ermino aleatorio,

u

^.

As´ı, a partir de

n

observaciones para cada variable, el modelo puede ser expresado como:

Y

t

= β

₁

+ β

₂

X

_t2

+ β

₃

X

_t3

+ · · · + β

^k

X

tk

+ u

t

, t = 1, . . . , n,

⁽¹⁾

donde se ha considerado que hay t ´ermino constante, es decir,

X

_1t

= 1

^,

∀t

^.

El objetivo ser á estimar (es decir, obtener una aproximaci ón num érica) aque- llas cantidades constantes presentes en el modelo (1), as´ı como la bondad de la estimaci ón realizada. En primer lugar, se escribe dicho modelo para todas y cada una de las observaciones:

Y

₁

= β

₁

+ β

₂

X

₁₂

+ β

₃

X

₁₃

+ · · · + β

^k

X

_1k

+ u

₁

Y

₂

= β

₁

+ β

₂

X

₂₂

+ β

₃

X

₂₃

+ · · · + β

^k

X

_2k

+ u

₂

.. .

(5)

Modelo lineal uniecuacional m ´ ultiple

Modelo lineal

Que nos conduce a la siguiente forma matricial:

y

_n×1

= X

n×k

· β

^k×1

+ u

_n×1

,

⁽²⁾

donde:

y

_n×1

=



 

  Y

₁

Y

₂

.. .

Y

_n



 

  , β

_k×1

=



 

  β

₁

β

₂

.. .

β

_k



 

  , u

_n×1

=



 

  u

₁

u

₂

.. .

u

_n



 

  ,

X

n×k

=



 

 

1 X

₁₂

. . . X

_1k

1 X

₂₂

. . . X

_2k

..

. ... . .. ...

1 X

_n2

. . . X

nk



 

  .

(6)

Hip ´ otesis del modelo

Modelo lineal

uniecuacional m ´ultiple Hip ´otesis del modelo

Consideraremos las siguientes hip ótesis b ásicas en el modelo lineal uniecuacional m últiple:

^{El vector}

y

se puede expresar como combinaci ón lineal de las variables explicativas m ás un vector de perturbaci ón.

La perturbaci ´on aleatoria est ´a centrada

(E[u

t

] = 0, t = 1, . . . , n)

^{, es}

homoced ´astica

V ar(u

t

) = E[u

²_t

] = σ

²

, t = 1, . . . , n

e incorrelada

(Cov(u

t

, u

s

) = E[u

t

· u

^s

] = 0, ∀t 6= s, t, s = 1, . . . , n)

. En tal caso se dice que las perturbaciones son esf ´ericas y se verifica que

E[u] = 0

_n×1 ^y

V ar(u) = E[u · u

^t

] = σ

²

· I

^n×n

.

^{La matriz}

X

es no estoc ´astica y de rango completo por columnas, es decir,

rg(X) = k

(como consecuencia

n > k

y las columnas de

X

, es decir,

X

i,

i = 1, . . . , n

, son linealmente independientes).

No hay relaci ´on entre variables independientes y la perturbaci ´on aleatoria:

Cov(un×1, X_i) = E

(u − E[u]) · (Xⁱ − E[Xⁱ])^t

= E

u · (X )^t

= E[u ] = 0 .

(7)

Estimaci ´ on del modelo

Estimaci ón del modelo Estimaci ón m´ınimo cuadr ática de los coeficientes del modelo

Teorema de Gauss-Markov Estimaci ´on de la varianza de la

perturbaci ón aleatoria Validaci ón del modelo Explotaci ón del modelo Ejemplos

(8)

Estimaci ´ on m´ınimo cuadr ´atica de los coeficientes del modelo

Definiendo los errores o residuos,

e

, del modelo lineal uniecuacional m ´ultiple como la diferencia entre los verdaderos valores de la variable dependiente y su estimaci ´on, esto es

e = y − b y,

donde

y = X b b β

, y siguiendo la premisa de minimizar la suma de los cuadrados de los residuos

e

^t

e = (y − X b β)

^t

· (y − X b β) = y

^t

y − 2b β

^t

X

^t

y + b β

^t

X

^t

X b β,

se obtiene la estimaci ´on del par ´ametro

β

^como

β = X b

^t

X

⁻1

· X

^t

y.

Dicho m ´etodo recibe el nombre de m´ınimos cuadrados ordinarios, MCO, por lo que los estimadores obtenidos a partir de dicho m ´etodo reciben el nombre de estimadores de m´ınimos cuadrados ordinarios, EMCO.

Como consecuencias de dicha estimaci ´on se verifica que

X

^t

· e = 0

^k×1^,

t t t t t

(9)

Estimaci ´ on m´ınimo cuadr ´atica de los coeficientes del modelo

Advi ´ertase que:

X

^t

X =



 



n

P

n t=1

X

_t2

· · ·

P

n t=1

X

tk

P

n t=1

X

_t2

P

n t=1

X

_t2²

· · ·

P

n t=1

X

_t2

X

tk

.. .

..

. . .. ...

P

n t=1

X

_tk

P

n t=1

X

_tk

X

_t2

· · ·

P

n t=1

X

_tk²



 

 ,

y

X

^t

y =



 



P

n t=1

Y

t

P

n t=1

X

_t2

Y

t

.. .

P

n



 



.

(10)

Teorema de Gauss-Markov

Teorema 1 (Teorema de Gauss-Markov) Los estimadores de m´ınimos cuadra- dos ordinarios son lineales, insesgados y ´optimos (ELIO), es decir, tienen varianza m´ınima entre la clase de los estimadores lineales e insesgados.

En efecto, por la forma de escribirse el estimador es evidente que es lineal.

As´ı, llamando:

C

k×n

= X

^t

X

⁻1

k×k

· X

k×n^t

=



 

 

c

₁₁

c

₁₂

. . . c

_1n

c

₂₁

c

₂₂

. . . c

_2n

.. .

..

. . .. ...

c

_k1

c

_k2

. . . c

kn



 

  ,

se tiene que

β b

se expresa como combinaci ´on lineal del vector

y

^:

β b

_k×1

= C

_k×n

· y

n×1

=



 

 

c

₁₁

Y

₁

+ c

₁₂

Y

₂

+ . . . + c

_1n

Y

n

c

₂₁

Y

₁

+ c

₂₂

Y

₂

+ . . . + c

_2n

Y

n

.. .



 

  .

(11)

Teorema de Gauss-Markov

Para que el estimador

β b

^de

β

sea insesgado se ha de cumplir que

E[ b β] = β

^{. En}

efecto, sustituyendo

y = Xβ + u

^en

β b

^:

β b = X

^t

X

⁻1

· X

^t

y = X

^t

X

⁻1

· X

^t

(Xβ + u)

= β + X

^t

X

⁻1

· X

^t

u −→ b β = β + X

^t

X

⁻1

· X

^t

u.

Entonces, teniendo en cuenta que

E[u] = 0

^:

E[ b β] = E h

β + X

^t

X

⁻1

· X

^t

u i

= β + X

^t

X

⁻1

· X

^t

· E[u] = β.

Por otro lado, la matriz de varianzas-covarianzas de

β b

^:

V ar βb

= E

β − E[ bb β]

·

β − E[ bb β]^t

= E

β − βb

·

β − βb ^t

= E h

X^tX⁻1

X^tu · u^tX X^tX⁻1i

1 1

(12)

Teorema de Gauss-Markov

donde se ha tenido en cuenta que

β b

es insesgado,

β − β = (X b

^t

X)

⁻¹

X

^t

u

^y

V ar(u) = E[u · u

^t

] = σ

²

· I

^n×n^.

Para demostrar que

β b

es de m´ınima varianza consideraremos otro estimador,

β

^∗^{, de}

β

lineal e insesgado de forma que

V ar β b

< V ar (β

^∗

)

^.

En efecto,

β

^∗

= D

k×n

· y

^n×1 ^{tal que}

D · X = I

^k×k es lineal e insesgado.

Adem ´as,

V ar (β

^∗

) = σ

²

· DD

^t^.

En tal caso, puesto que podemos escribir

D = (X

^t

X)

⁻¹

X

^t

+ W

^con

W 6= 0

^k×n, se tiene que

DD

^t

= (X

^t

X)

⁻¹

+ W W

^t, y en tal caso:

V ar (β

^∗

) = σ

²

·DD

^t

= σ

²

· X

^t

X

⁻1

+σ

²

·W W

^t

= V ar β b

+σ

²

·W W

^t

,

esto es,

V ar (β

^∗

) − V ar β b

= σ

²

· W W

^t

.

Y como

W W

^t es definida positiva:

V ar (β

^∗

) − V ar β b

> 0

^{, y en tal}

caso:

V ar (β

^∗

) > V ar β b

.

(13)

Estimaci ´ on de la varianza de la perturbaci ´ on aleatoria

perturbaci ´on aleatoria

Validaci ´on del modelo Explotaci ´on del modelo Ejemplos

Adem ás de los coeficientes de las variables independientes, hay en el modelo otra cantidad constante que habr á que estimar: la varianza de la perturbaci ón aleatoria,

σ

²^.

Un estimador insesgado de

σ

² ^es:

σ b

²

= e

^t

e n − k ,

ya que

E[e

^t

e] = (n − k) · σ

²^.

Para calcular dicho estimador se dispone de la expresi ´on:

σ b

²

= y

^t

y − b β

^t

X

^t

y n − k .

En consecuencia, la estimaci ´on de la matriz de varianzas-covarianzas de

β b

^es:

V ar \ β b

= b σ

²

· X

^t

X

⁻1

.

(14)

Validaci ´ on del modelo

Estimaci ´on del modelo

Validaci ´on del modelo Bondad de ajuste:

Coeficiente de determinaci ´on Criterios de selecci ´on de modelos

Distribuci ´on en el muestreo de los estimadores MCO Contraste de un conjunto de hip ´otesis lineales: casos particulares

M´ınimos Cuadrados Restringidos

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo Ejemplos

(15)

Bondad de ajuste: Coeficiente de determinaci ´ on

Estimaci ´on del modelo Validaci ´on del modelo

Bondad de ajuste:

An ´alisis de la varianza Intervalos de confianza Explotaci ´on del modelo

Una vez estimado el modelo lineal uniecuacional multiple, es decir, una vez ob- tenidas las estimaciones de

β

^y

σ

², el siguiente paso ser ´a estudiar la calidad de dichas estimaciones.

As´ı, a continuaci ón, obtendremos el coeficiente de determinaci ón, que no es m ás que una medida para estudiar la bondad del ajuste lineal determinado por los estimadores por m´ınimos cuadrados ordinarios.

Dicho coeficiente de determinaci ´on, que se denota por

R

², se define como el porcentaje de variabilidad explicada por el modelo. Por tanto, éste se obtendr á como el cociente entre la varianza explicada por la estimaci ón y la total:

R

²

=

1 T

· P

n i=1

Y b

i

− Y

2

1 T

· P

n i=1

Y

i

− Y

2

= P

n i=1

Y b

i

− Y

2

P

n i=1

Y

i

− Y

2

.

Como se observa, el coeficiente de determinaci ´on queda expresado en funci ´on de la suma de cuadrados explicados (SCE) y los totales (SCT).

(16)

Bondad de ajuste: Coeficiente de determinaci ´ on

Bondad de ajuste:

Luego, teniendo en cuenta la descomposici ´on

SCT = SCE + SCR,

se tiene que

R

²

= SCE

SCT = 1 − SCR SCT .

Entonces, para calcular dicho coeficiente se dispone de la expresi ´on:

R

²

= β b

^t

X

^t

y − n · Y

²

y

^t

y − n · Y

²

= 1 − y

^t

y − b β

^t

X

^t

y y

^t

y − n · Y

²

.

Advi értase que, siempre que el modelo lineal tenga t érmino independiente, el coeficiente de determinaci ón var´ıa entre 0 y 1. El valor 0 lo toma cuando la SCE es nula y, por tanto, el modelo no es adecuado; mientras que toma el valor 1 cuando la SCR es nula y, por tanto, el modelo es adecuado.

(17)

Coeficiente de determinaci ´ on corregido

Bondad de ajuste:

Puesto que a medida que vamos incluyendo variables en el modelo el coeficiente de determinaci ´on aumenta aunque las variables que incluyamos no sean signifi- cativas, esto supone un problema.

El coeficiente de determinaci ´on corregido,

R

², viene a resolver este problema del coeficiente de determinaci ón. Dicho coeficiente mide el porcentaje de variaci ón de la variable dependiente (al igual que el coeficiente de determinaci ón) pero teniendo en cuenta el n úmero de variables incluidas en el modelo. Se define como:

R

²

= 1 − (1 − R

²

) · n − 1 n − k .

En cualquier caso, estas medidas de bondad del ajuste no deben de ser sobrevaloradas. Obtener un

R

² ^o

R

² cercano a 1 no indica que los resultados sean fiables, ya que, por ejemplo, puede ser que no se cumpla alguna de las hip ótesis b ásicas y los resultados no ser v álidos. Por tanto, estos indicadores han de ser considerados como una herramienta m ás a tener en cuenta dentro del an álisis.

(18)

Criterios de selecci ´ on de modelos

Bondad de ajuste:

Por otro lado, se podr´ıa pensar en usar el coeficiente de determinaci ón para comparar distintos modelos. En tal caso, estos deben de tener la misma variable dependiente ya que as´ı tendr án la misma suma de cuadrados totales. Y a ún as´ı, habr´ıa que tener cuidado con el problema ya comentado: aumenta su valor al a ñadir una nueva variable explicativa, sea cual sea su aportaci ón al modelo.

Para evitar tales problemas, a la hora de comparar modelos para elegir uno de ellos se usan los criterios de selecci ón de modelos. M ás concretamente, es- tudiaremos los criterios de informaci ón de Akaike (AIC), el bayesiano de Schwarz (BIC) y el de Hannan-Quinn (HQC).

Estos criterios se obtienen a partir de la suma de cuadrados de los residuos y de un factor que penaliza la inclusi ón de par ámetros. As´ı, un modelo m ás complejo (con m ás variables explicativas) reducir á la suma de cuadrados de los residuos pero aumentar á el factor de penalizaci ón.

Utilizando estos criterios se escoger´ıa aquel modelo con un menor valor de AIC, BIC o HQC.

(19)

Criterios de selecci ´ on de modelos: AIC, BIC y HQC

Bondad de ajuste:

Teniendo en cuenta que:

L = − n

2 · (1 + ln(2 · π) − ln(n)) − n

2 · ln(SCR),

el criterio de informaci ´on de Akaike responde a la expresi ´on:

AIC = −2 · L + 2 · k,

el de Schwarz a:

BIC = −2 · L + k · ln(n),

y el de Hannan-Qinn:

HQC = −2 · L + 2 · k · ln (ln(n)) .

(20)

Distribuci ´ on en el muestreo de los estimadores MCO

Bondad de ajuste:

Introduciendo la hip ótesis de que la perturbaci ón aleatoria sigue una distribuci ón normal, esto es:

u

_n×1

∼ N(0

^n×1

, σ

²

· I

^n×n

).

En consecuencia,

β b

_k×1

∼ N(β, σ

²

· (X

^t

X)

⁻¹

)

^{, ya que:}

β b

sigue una distribuci ´on normal ya que se puede expresar en funci ´on de una normal:

β = β + (X b

^t

X)

⁻¹

· X

^t

u

^.

se tienen calculados el vector de medias,

E h β b i

= β

, y matriz de varianzas-covarianzas,

V ar

β b

= σ

²

· (X

^t

X)

⁻¹^.

Por otro lado, ya que

e

^t

e = u

^t

M u

^siendo

M

_n×n

= I − X (X

^t

X)

⁻¹

X

^t

sim ´etrica, idempotente y con

rg(M ) = n − k < k

se tiene que ^u^t_σ^{M u}2

∼ χ

²n−k

,

lo que se traduce en que

(n − k) · b σ

²

σ

²

∼ χ

²n−k

.

(21)

Contraste de un conjunto de hip ´ otesis lineales

Bondad de ajuste:

A continuaci ón abordaremos la especificaci ón de contrastes sobre un conjunto de hip ótesis lineales sobre los coeficientes del modelo. Concretamente, suponiendo

q

restricciones lineales independientes entre s´ı:

a

₁₁

β

₁

+ a

₁₂

β

₂

+ · · · + a

1k

β

_k

= b

₁

a

₂₁

β

₁

+ a

₂₂

β

₂

+ · · · + a

^2k

β

k

= b

₂

.. .

..

.

=

^.^.^.

a

_q1

β

₁

+ a

_q2

β

₂

+ · · · + a

^qk

β

_k

= b

_q

Plantearemos contrastar la hip ´otesis nula

H

₀

: Rβ = r

^donde

R

q×k

=



 

 

a

₁₁

a

₁₂

. . . a

_1k

a

₂₁

a

₂₂

. . . a

_2k

.. .

..

. . .. ...

a

_q1

a

_q2

. . . a

qk



 

  , r

_q×1

=



 

  b

₁

b

₂

.. .

b

q



 

  .

(22)

Contraste de un conjunto de hip ´ otesis lineales

Bondad de ajuste:

Usando la distribuci ´on

R b β − Rβ

t

· h

R (X

^t

X)

⁻¹

R

^t

i

⁻1

q · b σ

²

· R b β − Rβ

∼ F

^q,n−k

,

rechazaremos la hip ´otesis nula al nivel de significaci ´on

α

^si

R b β − r

t

· h R (X

^t

X)

⁻¹

R

^t

i

⁻1

q · b σ

²

· R b β − r

> F

q,n−k

(1 − α),

donde

F

q,n−k

(1 − α)

es el punto de una

F

de Senedecor de

q

^y

n − k

^grados

de libertad que deja por debajo suyo una probabilidad

1 − α

^.

(23)

Casos particulares

Bondad de ajuste:

Un caso particular de suma importancia ser ´a aquel en el que se desee contrastar la hip ´otesis nula

H

₀

: β

i

= b

i,

i = 1, . . . , k

^.

En tal caso,

q = 1

^,

R = (0 0 . . . 1

ⁱ⁾

. . . 0)

^y

r = b

i, por lo que la distribuci ´on anterior queda simplificada como

β b

i

− b

ⁱ

2

b σ

²

· w

ⁱ

∼ F

^1,n−k

,

donde

w

i es el elemento (i,i) de la matriz

(X

^t

X)

⁻¹, o lo que es lo mismo,

σ b

²

· w

ⁱ

es el elemento (i,i) de

σ b

²

· (X

^t

X)

⁻¹

= \ V ar

β b

, esto es, la varianza estimada de

β b

_i^.

Teniendo en cuenta que la ra´ız cuadrada de una F-Snedecor con 1 y

n

^grados

de libertad es una t-Student con

n

grados de libertad se tiene que

β b

i

− b

ⁱ

√ ∼ t

^n−k

,

(24)

Casos particulares

Bondad de ajuste:

y en tal caso rechazaremos

H

₀

: β

_i

= b

_i al nivel de significaci ´on

α

^si

β b

i

− b

ⁱ

b σ · √ w

i

> t

n−k

1 − α 2

,

donde

t

n−k

1 −

^α₂

es el punto de una distribuci ´on

t

de student con

n − k

grados de libertad que deja por debajo suya una probabilidad

1 −

^α₂^.

Este caso particular es de vital importancia cuando

b

i

= 0

, ya que entonces estaremos contrastando si el coeficiente de la variable independiente

X

i es o no nulo. De forma que al rechazar dicha hip ´otesis tenemos garantizado que la variable

X

_i ha de estar en el modelo, por lo que sus variaciones influyen en la variable dependiente. En tal caso se dice que dicha variable es significativa y que el contraste es un contraste de significaci ´on individual.

(25)

M´ınimos Cuadrados Restringidos

Bondad de ajuste:

En el caso en el que no se rechace la hip ´otesis nula

H

₀

: Rβ = r

, ser´ıa deseable incorporar dicha informaci ´on al modelo. En tal caso, se obtiene un nuevo estimador:

β b

R

= b β + X

^t

X

⁻1

R

^t

h

R X

^t

X

⁻1

R

^t

i

⁻1

· r − R b β ,

que recibe el nombre de m´ınimos cuadrados restringidos ya que se ha obtenido con la restricci ´on de que ha de verificar que

R b β

R

= r

^.

Dicho estimador es lineal, insesgado siempre que la hip ´otesis nula

H

₀

: Rβ = r

sea cierta y óptimo. Es decir, el estimador por m´ınimos cuadrados restringidos tiene menor varianza que el estimador m´ınimo cuadr ático ordinario siempre y cuando la restricci ón (hip ótesis nula) sea cierta.

Luego, cuando una restricci ón lineal sobre los coeficientes de las variables independientes es cierta, el estimador por m´ınimos cuadrados ordinarios deja de ser óptimo y habr á que usar el estimador por m´ınimos cuadrados restringidos.

Adem ´as se verifica que:

SCR

R

≥ SCR, R

²R

≤ R

²

.

(26)

An ´alisis de la varianza

Bondad de ajuste:

El an álisis de la varianza aborda el contraste que tiene por hip ótesis nula que todos los coeficientes de las variables independientes son nulos simult áneamente, esto es,

H

₀

: β

₂

= β

₃

= · · · = β

^k

= 0

^.

Salta a la vista que estamos ante un caso particular de un contraste sobre

k − 1

restricciones lineales de los coeficientes de las variables independientes.

En este caso, rechazaremos la hip ´otesis nula al nivel de significaci ´on

α

^si

F

exp

=

SCE k−1 SCR

n−k

> F

_k−1,n−k

(1 − α).

Para calcular dicho estad´ıstico se suele resumir la informaci ón anterior en una tabla, conocida como tabla de an álisis de la varianza (tabla ANOVA) ya que en ella se recogen las fuentes de variaci ón de la varianza:

Fuente de variaci ´on Suma de Cuadrados Grados de Libertad Medias Explicada SCE = bβ^tX^ty − nY ² k − 1 ^SCE_k−1

Residuos SCR = y^ty − bβ^tX^ty n − k ^SCR_n−k

Total SCT = y^ty − nY ² n − 1

(27)

An ´alisis de la varianza

Bondad de ajuste:

Advi ´ertase que rechazar

H

₀ implica que hay al menos un coeficiente no nulo, por lo que la relaci ´on existente entre las variables independientes y la dependiente no se debe al azar, lo cual valida el modelo en su conjunto.

Por otro lado, sin m ás que dividir la regi ón de rechazo por SCT tanto en el numerador como en el denominador se obtiene la expresi ón equivalente:

R² k−1 1−R²

n−k

> F

_k−1,n−k

(1 − α).

La importancia de esta nueva expresi ón para la regi ón de rechazo es que permite calcular una cota, sin m ás que despejar

R

², a partir de la cual el coeficiente de determinaci ón es significativo. Esto es, el coefciente de determinaci ón es significativo al nivel de significaci ón

α

^si

R

²

>

k−1

n−k

· F

^k−1,n−k

(1 − α)

1 +

_n−k^k−1

· F

^k−1,n−k

(1 − α) .

(28)

Intervalos de confianza

Bondad de ajuste:

An ´alisis de la varianza Intervalos de confianza

Explotaci ´on del modelo Ejemplos

A partir de las distribuciones en el muestreo para los estimadores estudiados es inmediato obtener los siguientes intervalos de confianza al nivel

1 − α

^:

Intervalo de confianza para

β

i

β b

i

± t

^n−k

1 − α 2

· b σ · √

w

i

, i = 1, . . . , k.

Intervalo de confianza para

σ

²

"

(n − k) · b σ

²

χ

²_n−k

1 −

^α₂

, (n − k) · b σ

²

χ

²_n−k ^α₂

# ,

donde

χ

²_n−k

1 −

^α₂

y

χ

²_n−k ^α₂

son los puntos de una distribuci ´on chi- cuadrado con

n−k

grados de libertad que dejan a su izquierda, respectivamente, una probabilidad

1 −

^α₂ ^y ^α₂^.

Una forma alternativa de contrastar hip ´otesis es usando los intervalos de confianza. De manera que para contrastar

H

₀

: Rβ = r

se calcular ´a la regi ´on de confianza para

Rβ

^{y si}

r

pertenece a dicha regi ón, no se rechazar á la hip ótesis nula.

(29)

Explotaci ´ on del modelo

Estimaci ón del modelo Validaci ón del modelo Explotaci ón del modelo

Predicci ´on Puntual Optima´

Predicci ´on por intervalo Contraste de Permanencia Estructural Ejemplos

(30)

Predicci ´ on Puntual ´ Optima

Una vez validado el modelo, la siguiente fase de un modelo econom étrico es la explotaci ón, siendo entonces la predicci ón o la permanencia estructural algunos de sus objetivos.

La predicci ón se realiza desde dos puntos de vista: a) por un lado realizare- mos una predicci ón puntual dando un único valor de predicci ón para un instante en concreto; b) por otra parte, puesto que

Y

es una variable aleatoria, podemos calcular su esperanza dado un valor en concreto de las variables independientes.

Siguiendo las directrices anteriores se llega a la misma expresi ´on algebr ´aica en ambos casos:

p

₀

= x

^t₀

· b β,

donde

x

^t₀

= (1 X

₀₂

X

₀₃

. . . X

_0k

)

contiene los valores de las variables independientes para los que se quiere obtener la predicci ´on.

Este predictor,

p

₀, m´ınimo cuadr ´atico (ya que se obtiene a partir del estimador por m´ınimos cuadrados ordinarios de

β

) es lineal, insesgado y ´optimo (en el sentido de m´ınima varianza).

(31)

Predicci ´ on por intervalo

En este apartado calcularemos el intervalo de confianza para el valor esperado de

Y

^dado

x

₀, es decir, para

E[Y

₀

/x

₀

] = x

^t₀

· β

^.

Como

x

^t₀

· b β

se distribuye seg ún una normal (ya que est á en funci ón de

β b

^{) y}

E[x

^t₀

· b β] = x

^t₀

β

, ya que es insesgado.

V ar

x

^t₀

· b β

= E h

x

^t₀

· b β − x

^t0

· β

· x

^t₀

· b β − x

^t0

· β i

= x

^t₀

· E

β − β b

· β − β b

t

· x

0

= x

^t₀

· V ar β b

· x

0

= σ

²

· x

^t₀

(X

^t

X)

⁻¹

x

₀

.

se tiene que

x

^t₀

· b β ∼ N

x

^t₀

· β, σ

²

· x

^t0

X

^t

X

⁻1

x

₀

.

Ahora bien, esta distribuci ´on no es apta para hacer inferencia puesto que depende de la cantidad desconocida

σ

². Para resolver este problema, tipificare- mos la anterior distribuci ´on normal y la dividiremos entre la ra´ız cuadrada de la

(32)

Predicci ´ on por intervalo

(n − k) · b σ

²

σ

²

∼ χ

²n−k

,

dividida a su vez entre sus grados de libertad, obteniendo la siguiente distribuci ´on t-Student:

x

^t₀

· b β − x

^t0

· β σ · b

q

x

^t₀

(X

^t

X)

⁻¹

x

₀

∼ t

^n−k

.

A partir de esta distribuci ´on, el intervalo de confianza al nivel

1 − α

^para

E[Y

₀

/x

₀

] = x

^t₀

· β

^es:

x

^t₀

· b β ± t

^n−k

1 − α 2

· b σ · q

x

^t₀

(X

^t

X)

⁻¹

x

₀

,

donde

t

n−k

1 −

^α₂

es el punto de una distribuci ´on

t

de Student con

n − k

grados de libertad que deja a su izquierda una probabilidad

1 −

^α₂^.

(33)

Contraste de Permanencia Estructural

Al explotar el modelo mediante la predicci ón se est á presuponiendo que la relaci ón estimada se mantiene para la informaci ón no presente en la muestra observada.

Para confirmar este aspecto, calcularemos el intervalo de confianza para

Y

^dado

x

₀, de forma que si la nueva informaci ´on pertenece a dicho intervalo, la estructura del modelo estimado permanecer ´a.

Partiendo de que

Y

₀

− b Y

₀

= u

₀

− x

^t0

β − β b

∼ N

0, σ

²

· 1 + x

^t₀

X

^t

X

⁻1

x

₀

,

se llega de forma an ´aloga a la anterior a la distribuci ´on

Y

₀

− b Y

₀

σ · b

q

1 + x

^t₀

(X

^t

X)

⁻¹

x

₀

∼ t

^n−k

,

donde

Y b

₀

= x

^t₀

· b β

. Por tanto, el intervalo de confianza al nivel

1 − α

^para

Y

₀ ^es:

α q

(34)

Ejemplos

Ejemplo 1 Ejemplo 2 Ejemplo 3

(35)

Ejemplo 1

A continuaci ´on vamos a realizar un an ´alisis exhaustivo del modelo

Y

t

= β

₁

+ β

₂

· X

^t2

+ β

₃

· X

^t3

+ u

t

,

a partir de las siguiente informaci ´on muestral:

Observaci ´on

Y

t

X

_t2

X

_t3

1 16 1 1

2 26 3 2

3 30 5 -1

4 44 7 3

5 56 8 -2

6 64 10 0

7 68 10 1

8 72 12 4

En primer lugar calcularemos la estimaci ´on por m´ınimos cuadrados ordinarios de los coeficientes de las variables a partir de la expresi ´on

(36)

Ejemplo 1

A partir de la informaci ´on muestral anterior es claro que:

y =



 

 16 26 30 44 56 64 68 72



 



, X =



 



1 1 1

1 3 2

1 5 −1

1 7 3

1 8 −2 1 10 0 1 10 1 1 12 4



 

 ,

de forma que:

X

^t

X =





8 56 8 56 492 65

8 65 36



 , X

^t

y =





376 3184

414 

 ,

y entonces a partir de la f ´ormula (3):

(37)

Ejemplo 1

β b =





8 56 8 56 492 65

8 65 36





−1

· 



376 3184

414 



=





0

^′

62 −0

^′

0688 −0

^′

0136

−0

^′

0688 0

^′

0103 −0

^′

0033

−0

^′

0136 −0

^′

0033 0

^′

0368



 ·





376 3184

414 



=





8

^′

5189 5

^′

5587

−0

^′

4296



 .

Es decir,

β b

₁

= 8

^′

5189

^,

β b

₂

= 5

^′

5587

^y

β b

₃

= −0

^′

4296

. Lo cual se traduce en la siguiente estimaci ´on del modelo considerado:

Y b

t

= 8

^′

5189 + 5

^′

5587X

_t2

− 0

^′

4296X

_t3

.