4.1 Estimación de parámetros por MCO

(1)

73

CAPÍTULO 4

ESTIMACIÓN DE

MODELOS ECONÓMICOS

N

uestra primera tarea consiste en estimar la función

de regresión poblacional (FRP) con base en la función de regresión muestral (FRM) de la forma más precisa posible. Para ello existen varios modos de calcular la FRM, pero el más utilizado es el método de mínimos cuadrados ordinarios MCO (en lo que respecta al análisis de regresión); así mismo, se recuerda que el método de MCO nos permitirá analizar únicamente modelos lineales uniecuacionales y es preciso para el objetivo del presente texto.

4.1 Estimación de parámetros por MCO

El método de MCO se atribuye a Carl Friedrich Gauss, matemático alemán. Bajo ciertos supuestos que se estudiarán, tiene propiedades estadísticas muy atractivas:

Recordando la FRP Yi =β1+β2X2i+ui (5)

no podemos observarla directamente; esta función debe de ser estimada a partir de la FRM

(2)

Curso Básico de Econometría Clásica

74

i i i X u Y =βˆ₁+βˆ₂ + ˆ (6) i i i Y u Y = ˆ+ˆ (4.1)

donde

Y

ˆ

i es el valor estimado de (media condicional) de Yi. Sin embargo ¿cómo se determina en sí misma la FRM?

Por tanto, (4.1) se expresa como reemplazamos; i i i i i X Y Y Y u 2 1 ˆ ˆ ˆ ˆ β β − − = − = recordando (3), reemplazamos: (4.2)

que refleja que los residuos (uˆi) son simplemente las diferencias entre los valores observados y los estimados de Yi.

De esta forma se fija el criterio de seleccionar la FRM de tal

manera que la suma de los residuos sea la menor posible Σuˆ_i. Este criterio no es muy eficiente a pesar de ser atractivo; véase

la imagen 8. Imagen 8 Y X X1 X2 X3 X4 X5 X6 FRM Û1 Û 3 Û4 Û5 Û6 Û2 Yi

Al adoptar el criterio de minimizar Σuˆ_i, la imagen 8 muestra que los residuales uˆ2, uˆ3, uˆ4,uˆ5al igual que los residuales uˆ1 y

6 ˆ

u , reciben el mismo peso en la suma (uˆ1+uˆ2 +uˆ3+uˆ4 +uˆ5+uˆ6) aunque los cuatro primeros están mucho más cerca de la FRM que los dos últimos.

(3)

75

Es decir que a todos los residuos se les da el mismo peso sin importar que tan lejos o cerca se encuentren las observaciones de la FRM. Pudiera presentarse que la suma total de residuos sea cero11_{a pesar de que las}

i

uˆ se encuentran dispersas alrededor de la FRM.

Por tanto, podemos evitar este problema si utilizamos el método de MCO, que establece que la FRM puede determinarse en forma tal que sea lo más pequeña posible, donde 2

ˆ

_i

u

son los residuos elevados al cuadrado. De este modo, a los residuales más lejanos se les da más peso y la situación que se presenta en el ejemplo anterior con u₁ y u₆, en los que en la minimización de la Σuˆ_ilos uî, sin importar su grado de dispersión la suma es pequeña, en el proceso de MCO no podría presentarse; es más, a mayor uî, mayor será la Σuî.

Se parte de un modelo: Y en forma matricial:

u

X

Y

=

β

ˆ

+

ˆ

Es decir: Y₁ 1 X12 X13 … Xk1

β

ˆ

₁ uˆ1 Y₂ 1 X22 X23 … Xk2

β

ˆ

₂ uˆ₁ Y₃ = 1 X32 X33 … Xk3 x

β

ˆ

₃ + uˆ1 : : : : : : : : Y_n 1 X2n X3n … Xkn

β

ˆ

_k uˆ1 Ynx1 nxk Kxn nx1

11 Si asumiéramos que û₁ + û₂ + û₃ + û₄ + û₅ + û₆ tienen los valores de 8, -3,

+2, -2, +3 y -8, respectivamente, la suma de estos residuos sería cero a pesar

de que se encuentran dos residuos con mayor grado de dispersión alrededor de la FRM. i ki k i i i

X

u

Y

=

β

ˆ

₁

+

β

ˆ

₂ ₂

+

β

ˆ

₃ ₃

+

...

+

β

ˆ

+

ˆ

(4)

76 )

ˆ

(

ˆ

2

u

Minimizar

u

Minimizar

errores

los

reducir

es

busca

se

que

lo

′

=

∑

[

]

=

+

=

_∑













∗

=

2 2 2` 3 2 2 2 1 3 2 1 3 2 1

ˆ

'

ˆ

u

_n n n







Y partimos de que Y =Xβˆ+uˆ βˆ ˆ ˆ u Y X u despejamos si → = −

[

] [

]

(

)

[

β

] [

β

]

[

β

][

β

]

β

ˆ ˆ min ˆ ˆ min , ˆ ˆ min ) ˆ ' ˆ ( min ˆ2 X Y X Y X Y X Y tenemos B A B A d propiededa la recordando X Y X Y u u u Minimizar Al − ′ ′ − ′ = − ′ − ′ + ′ = ′ + − ′ − = =

∑

desarrollamos el producto multiplicando término a término

[

]

[

]

[

β

]

β

ˆ ˆ ˆ 2 min ˆ ˆ ˆ ˆ ˆ ˆ min X X X Y Y Y Y X escalar X Y como X X Y X X Y Y Y ′ ′ + ′ − ′ ⇒ ′ ′ = = ′ ′ ′ + ′ ′ − ′ − ′ β β β β β _ˆ 2 2 ˆ ) ˆ ˆ ˆ 2 ( min X X Y X X X X Y Y Y betas los a respecto derivamos imizar Para ′ + ′ − = ∂ ′ ′ + ′ − ′ ∂ Y X es a y a a donde = ′ ∂ ′ ∂ β β ˆ ˆ β β β β _ˆ 2 ˆ ˆ ˆ a a ₌ ∂ ′ ∂

β

ˆ

´

ˆ

Despejamos

X

Y

X

′

=

′

⇒

(5)

77

por tanto, multiplicamos por la inversa a ambos lados para reducir términos, β β ˆ ) ' ( ˆ ) ' ( ) ' ( 1 1 1 I Y X X X X X X X Y X X X = ′ ′ = ′ − − −

(

X

′

X

)

X

′

Y

=

⇒

_β

_ˆ

−1 (4.3)

4.2 Propiedades de los estimadores de los

parámetros

• Son lineales

(

)

1 1 1

ˆ

nx kxn kx

A

Y

X

=

′

=

⇒

−

β

• Son insesgados E(β =ˆ) β

• Tienen varianza mínima (4.4) Recordando la ecuación (4.3) βˆ=

(

X′X

)

−1X′Y Si sustituimos Y

Y

=

X

β

+

u

(4) tenemos

β

ˆ

=

(

X

′

X

)

−1

X

′

(

X

β

+

u

)

(

)

(

)

(

XX

)

XX I recordando u X X X X X X X = ′ ′ ′ + ′ ′ = − − − 1 1 1 ' ˆ _β β

(

)

(

X

)

X

u

X

I

'

ˆ

'

ˆ

1 1 − −

′

=

−

′

+

=

β

donde

I

β

=

β

Por la propiedad de insesgamiento:

donde, (X´X)-1 X´X = 1

(6)

78 (

)(

)

[

]

(

)

(

)

[

]

(

)

(

)

[

1 1

]

1 1 ' ' )' ' )( ' ( ' ˆ ˆ − − − − ′ ′ = ′ ′ = − − = X X X uu X X X E u X X X u X X X E E β β β β bajoel uestoE uu uI 2 ) ' ( sup =σ

(

)

(

)

(

)

1 2 1 2 1 ) ' ( − − − ′ = ′ ′ = X X I X X X X X X u u σ σ 1 2₍ ₎ ) ˆ ( = X′X − Cov β σ_µ _(4.4) k n y x y y k n u k n u u halla se la donde i u u − ′ ′ − ′ = − Σ = − ′ = β σ σ ˆ ˆ ˆ ˆ : 2 2 2 (4.5)

4.3 Coeficiente de determinación

• Mide en qué porcentaje las variables exógenas explican la variación de la endógena. • Descomposición de la varianza

∑

=

+

n i n i n i

y

1 2 1 2 1 2

ˆ

µ

(4.6) • STC=SEC+SRC CUADRADO AL RESIDUALES DE SUMA Y Y CUADRADOS DE EXPLICADA SUMA Y Y y CUADRADOS DE TOTAL SUMA Y Y y i i n i i n i n i i = − = = − = = − =

∑

2 1 2 2 1 2 1 2 2 ) ˆ ( ˆ ) ˆ ( ˆ ) ( µ (4.7) (4.8) (4.9)

(

)

(

)

(

)

1 2

(

)

1 1 1 ) ( ' ) ' ( ' − − − − ′ ′ = ′ ′ = X X X I X X X X X X uu E X X X u σ

(7)

79 4.3.1 Si el modelo tiene término independiente el R

2

se calcula:

1

0 )

(

)

ˆ

(

₂ 2 2 2

<

−

=

∑

_R

Y

STC

SEC

R

i i (4.10) en cualquier caso

∑

−

=

−

=

⇒

+

=

₂ 2 2 2

)

(

ˆ

1

1 Y

Y

STC

SRC

R

STC

SRC

R

i i

µ

(4.11) En su expresión matricial: (4.12) (4.13)

(4.14)

4.3.2 Coeficiente de determinación ajustado

) 1 ( 1 1 1 1 ~ 2 2 R k n n n STC k n SRC R − − − − = − − − = (4.15)

4.4 Coeficiente de correlación simple y parcial

4.4.1 Coeficiente de correlación simple: mide el

grado de asociación lineal entre X y Y

1 1 2 2 2 ₌ ₋ _< _< =

∑ ∑

∑

xy i i i i xy r y x y x R r (4.16)

(8)

80 4.4.2 Coeficiente de correlación parcial

∑ ∑

∑

= 2 2 2 1 2 1 .... ,3,4, 2 u u u u r k x x x yx (4.17)

4.5 Estimación por intervalos

α

β

_α _α

_

=

−











+

≤

−

(

ˆ

)

ˆ

(

ˆ

)

1 ˆ

2 2 i i i i i

t

ee

t

ee

P

(4.18)

4.6 Contrastes de significancia estadística de

parámetros

Tipo de

hipótesis

H

0

H

I Decisión Gráficos

Dos colas

β =

i

β

_i0

β ≠

i

β

_i0

/

t

/

>

t

α/2 1 Cola izquierda

β ≥

_i

β

_i0

β <

_i

β

_i0

t

<

−

t

α 2 Cola derecha

β ≤

i

β

_i0

β >

i

β

_i0

t

>

t

α 3 Imagen 9 ZONA DE ACEPTACIÓN Ho

4.7 Contrastes de significancia

• Se tiene el modelo: i i i i i i

x

u

Y

=

β

1

+

β

2 2

+

β

3 3

+

β

4 4

+

β

5 5

+

(9)

81 4.7.1 Contraste de significancia individual

0 0 0 ≠ = = = i i i H H β β (4.19)

4.7.2 Contraste de significancia global

0 ... : ₂ ₃ 0 = = k = H β β β

)

,

1 (

/

)

1 /(

k

n

k

F

k

n

SRC

k

SEC

F

→

−

=

(4.20)

4.7.3 Contraste de significancia para un

subconjunto de parámetros

3 , 2 0 : 0 : ₂ ₃ = ≠ = = i un menos al H H i i o β β β * 5 5 4 4 1 x x SCR Yi=β +β +β →

4.7.4 Modelo restringido

(4.21) Donde k1 es el número de parámetros de Ho

4.8 Test de hipótesis para un conjunto de

restricciones lineales

Se definen las matrices R de tamaño j x k donde j es el número de restricciones lineales y un vector r de tamaño (jx1).

R contiene los coeficientes de cada una de las restricciones

lineales y r los valores a los que son iguales estas restricciones.

r R H r R H i i ≠ = β β : : 0

(

)

[

(

)

] (

)

F

(

J n k

)

J r R R X X R r R F U − → − ′ ′ ′ − = − − , ˆ ˆ 2 1 1 σ β β ) ˆ ( ˆ i i i k n ee t β β β − = −

(10)

82 4.9 Predicción

Después de la estimación de los parámetros y de hacer análisis estructural, el uso más habitual de la regresión consiste en la predicción.

[

]

( )

(

)

( )

1 2 / 1 1 1 1 2 1 1 1 1 1 3 1 2 1 1 1 1 1 3 3 1 2 2 1 1 ˆ 1 ˆ ) ˆ var( intervalo por prediccion ... 1 ˆ ˆ ˆ .... ˆ ˆ ˆ ˆ + + + + − + + + + + + + + + + + + + + ± ′ ′ + = = − ≡ = + + + + = t t t t t t t t k t t t t t t k k t t t e DS t Y X X X X e Var Y Y X X X X donde puntual prediccion X Y X X X Y α

σ

β

4.10 Contraste de hipótesis estructurales del

modelo

• Muestras pequeñas • Cambio estructural • Especificación errónea • Multicolinealidad

4.10.1 Muestras pequeñas

Para que el modelo tenga solución se exige que el número de datos (observaciones) sea superior al número de parámetros del modelo (n>k).

Para efectos operativos se necesita un mínimo de alrededor de 15 datos para tener alguna garantía en la estimación de 3 o 4 parámetros.

(11)

83 4.10.2 Cambio estructural

Una de las hipótesis estructurales del modelo es la constancia de los parámetros del modelo de regresión durante todo el periodo de observación y que se mantiene para el horizonte de predicción. Cuando esta condición no se cumple se dice que el modelo sufre de cambio estructural.

4.10.2.1 Cómo detectar el cambio estructural

Para detectarlo se aplica el test de Chow (pasos) 1. Estimar

Y

=

X

β

ˆ

+

µ

ˆ

y obtener SRC 2. Estimar *

=

*

β

ˆ

*

+

µ

_ˆ

*

X

Y

y obtener SRC* 3. Estimar ** ** ** **

ˆ

_µ

β

+

=

X

Y

y obtener SRC** 4. Obtener F calculado

(

)

(

SRC SRC

)

n k k SRC SRC SRC F 2 / / * * * * * * − + + − = (4.21)

5. Hacer el Contraste F calculado contra F Tabulado con K y n-2k gl bajo la hipótesis

Ho: B=B*=B**(no hay cambio estructural)

4.10.2.2 Para solucionar el cambio estructural

• Aplicar regresiones cambiantes a cada submuestra • Readaptar el modelo básico de regresión

• Incluir una variable ficticia en la regresión

pendientes

afecta

U

X

D

X

Y

intercepto

afecta

U

X

D

Y

t t t t t t t t

+

=

+

=

* * *

ˆ

α

β

µ

β

α

µ

(12)

84 4.10.3 Especificación errónea

Cuando se plantea un modelo se supone especificación

correcta, pero esto es difícil de cumplir bien porque: • La forma funcional no es la correcta

• Por omisión de variables relevantes • Por incluir variables no relevantes

4.10.4 Multicolinealidad -MC

4.10.4.1 MC exacta

Es cuando existe una relación exacta entre variables exógenas. En este caso el determinante de X’X es igual a cero, no se puede hallar la inversa (X’X)-1_{y por tanto no se pueden}

estimar los parámetros (β).

4.10.4.2 MC aproximada

Es cuando existe una relación aproximada entre variables exógenas. En este caso el determinante de X’X es cercano a cero; esto hace que los estimadores se distorsionen.

Imagen 10 X₂ _X 3 Y X₂ X₃ Y No existe Colinealidad Gráfico de Ballentine de Multicolinealidad Baja colinealidad

Colinealidad alta Colinealidad muy alta Colinealidad moderada X₂ X₃ Y X₂ X₃ Y X₂ X3 Y MULTICOLINEALIDAD

(13)

85 4.10.4.3 Cómo detectar la multicolinealidad

• A partir de las consecuencias

• Calcular los coeficientes de correlación simple- r_xy entre variables exógenas y destacar aquellos casos en que r_xy > 0.9

• Hacer regresiones auxiliares entre las variables exógenas del modelo y destacar aquellos casos en los cuales el R² de

la regresión auxiliar es mayor al R² del modelo original.

4.10.4.4 Tratamiento de variables ficticias o

variables dummy

• Las variables dummy son aquellas que reciben los valores 1 y 0; se utilizan cuando en los modelos existen variables que

no son directamente cuantificables y que son importantes

para explicar la variable endógena.

Ejemplo:

1. El estrato socioeconómico 2. La época del año

Ejemplo:

u D D D D Exp Salario=β₁+β₂ +β₃ ₁+β₄ ₂+β₅ ₃+β₆ ₄+

Se debe tener cuidado al incluir las dummy porque se puede

caer en la trampa de las variables ficticias; multicolinealidad m, m-1,

1 7 1 0 0 0 1 10 0 0 1 0 1 25 0 1 0 0 1 20 0 0 0 1 1 18 1 0 0 0 1 16 0 0 1 0 1 10 0 1 0 0

(14)

86

categoria. una eliminar debe se tanto, por . intercepto del columna la a igual es Dummys las de suma la categorias m tiene se Si −





















.

,

primaria

de

Dummy

la

educacion

ejemplo

Por

Al eliminar la dummy de primaria D1, todo se referencia a primaria

u

D

Exp

Salario

=

500 +

52 +

12

₂

+

20

₃

+

50

₄

+

D2→El individuo de secundaria gana $ 12.000 más que el

de primaria.

4.11 Contraste de hipótesis sobre la

perturbación aleatoria

Heterocedasticidad y autocorrelación

4.11.1 Heterocedasticidad

La varianza de los errores no es constante a lo largo de la muestra

}

n i i

X

para

i

n

U

X

U

VAR

(

|

)

=

σ

_µ2

=

1 ...

Ε

(

′

|

)

=

σ

_µ2

Ω

4.11.1.1 Cómo detectar la heteroscedasticidad

• Gráfico

• Prueba de Park • Prueba de Glejser

• Prueba de Goldfeld y Quandt • Prueba de White

(15)

87 4.11.1.2 Posibles soluciones de la heteroscedasticidad

• Aplicar mínimos cuadrados generalizados -MCG Y X X X MCG 1 1 1 ) ( ˆ ₌ _′_Ω− − _′_Ω− β

• Transformar el modelo por la matriz P y aplicar MCO Y*=PY

X*=PX el nuevo modelo será Y* = X*B+U*

Donde la matriz P lleva en la diagonal los elementos de la variable con la cual es proporcional la heterocedasticidad y el resto son cero.

4.11.2 Autocorrelación

Existe relación entre los errores de un periodo con los de otro.

}

n i t tU parai UU X U COV( −)≠0 ≠0 Ε( ′| )=σµ2Ω

4.11.2.1 Cómo detectar la autocorrelación

• Gráfico • Durbin Watson • h de Durbin • Box Pierce • Ljung Box • Test de Wallis • Prueba de rachas

(16)

88 4.11.2.2 Método de Durbin Watson

Se utiliza para detectar AR(1)

(

)

∑

= = −

−

=

_n t t n t t t

U

d

1 2 2 2 1

ˆ

(4.22)

Definida como la razón de la suma de las diferencias al

cuadrado de residuales sucesivos sobre la SRC. Supuestos en los cuales se basa:

• El modelo de regresión incluye intercepto

• Las variables explicativas X, son fijas en muestreos repetidos

• Los errores se generan mediante un proceso AR(1) es decir que u_t=ρ u_t-1 +ε_t

• El modelo no incluye valores rezagados de la variable dependiente

• Dada la definición, es posible llegar a demostrar que

)

ˆ

1 (

2 −

ρ

≈

d

pero como: -1 < ρ < 1, entonces 0 < d < 4. Reglas de decisión: • Si 0<d<dl AR (1) positiva • Si du<d<4-du no AR(1) • Si 4-dl<d<4 AR(1) negativa

(17)

89

Imagen 11. Durbin Watson

d

2 0 dL dU 4dU 4dL 4 Rechácese Ho Evidencia de autocorrelación positiva

Sin embargo, la prueba d tiene como desventaja que cuando cae en la zona de indecisión o región de ignorancia no se puede concluir la existencia de autocorrelación.

Zona de indecisión No se rechace Hou H*o, o ambas. Zona de indecisión Rechácese H*o Evidencia de autocorrelación negativa

4.11.2.3 Posibles soluciones para la autocorrelación

• Ensayar nuevas variables explicativas o reconsiderar la forma funcional del modelo.

• Aplicar MCG o transformar el modelo utilizando la matriz

P. Tanto Ω como P son matrices que dependen de ρ.

4.11.3 No normalidad

• El supuesto es que los residuos se distribuyen normalmente. • Cuando no se cumple esta condición, las pruebas de inferencia

estadística pierden confiabilidad.

• Las principales pruebas para detectarla son la de Jarque Bera y Shapiro Wilk.

(18)

90 Taller

12

1. La siguiente información es una muestra de 7 industrias de refrescos, donde K es el número de máquinas utilizadas en el proceso, L es el número de trabajadores y Q el número de unidades producidas (todo expresado en logaritmos).

K L Q 2,08 3,14 4,66 2,2 2,64 4,4 1,39 3,64 4,29 0,69 4,57 4,05 1,79 2,4 4,2 1,79 3,76 4,59 1,1 4,53 4,41 Sumas 11,04 24,68 30,6 promedios 1,57714286 3,52571429 4,37142857 1

)

(

X

′

X

− 27,1065029 -6,9220181 -4,55131445 -6,9220181 1,98670246 1,07459204 -4,55131445 1,07459204 0,81019874 a. Interprete B₂ y B_3.

b. Calcule R² y R² ajustado e interprete.

c. Establezca intervalos de confianza y pruebas de significancia

para B₂ y B₃e interprete.

d. Realice la prueba de significancia global e interprete.

e. Pruebe la hipótesis de que estas industrias poseen una función de producción Cobb Douglas con rendimientos constantes a escala.

(19)

91 Solución

3 2 3 2 1 β β

β

X X Yi =

ln

Y

i

=

β

0

+

β

2

ln

X

2

+

β

3

ln

X

3 donde

β =

0

ln

β

1

Recordando la ecuación (4.3) para estimar los betas

(

X′X

)

X′Y

= −1

ˆ

β y que ya poseemos la matriz inversa 1

)

(

X

′

X

−

tendríamos:

X =

La matriz X está compuesta por el intercepto; la columna de unos y por k y l, el número de máquinas utilizadas en el proceso y por el número de trabajadores requeridos respectivamente.

1 2,08 3,14 1 2,2 2,64 1 1,39 3,64 1 0,69 4,57 1 1,79 2,4 1 1,79 3,76 1 1,1 4,53

Por tanto se halla la X’ = por las ropiedades de la transpuesta

(donde las filas se transforman en columnas)

1 1 1 1 1 1 1

2,08 2,2 1,39 0,69 1,79 1,79 1,1 3,14 2,6 3,64 4,57 2,4 3,76 4,53

3x7

X’Y = X’ multiplicada por Y (el número de unidades producidas)

X’ Y X’Y

1 1 1 1 1 1 1 4,66 30,6

2,08 2,2 1,39 0,69 1,79 1,79 1,1 X 4,4 = 48,7155

3,14 2,6 3,64 4,57 2,4 3,76 4,53 4,29 107,6882

3x7 4,05 3x1

Recordemos que la multiplicación se realiza término a término,

fila por columna.

4,2 4,59 4,41

7x1

(20)

92

(1x4,66)+(1x4,4)+(1x4,29)+(1x4,05)+(1x4,2)+(1x4,59)+ (1x4,41) = 30,6 y así sucesivamente

(

X′X

)

X′Y = −1 ˆ β (X’X)-1 X’Y 27,1065029 -6,9220181 -4,55131445 30,6 2,1266 -6,9220181 1,98670246 1,07459204 X 48,7155 = 0,6903 -4,55131445 1,07459204 0,81019874 107,6882 0,3279 3x3 3x1 3x1 a. Interpretación de la regresión 2 1 0,3279 6903 , 0 1266 , 2 ˆ _X _X Y = + +

B₂: según los resultados del coeficiente de elasticidad del

capital de 0,6903, por cada incremento del 1% de maquinaria utilizada en el proceso, el producto (medido en unidades de refrescos producidos) se eleva en promedio cerca del 0,69%, manteniendo el número de trabajadores constante. B₃: nos indica que con un incremento del 1% en el número de trabajadores (teniendo en cuenta los resultados del

coeficiente de elasticidad de trabajo de 0,3279), el número

de unidades producidas se eleva en promedio cerca del 0,33%, manteniendo constantes el número de máquinas utilizadas en el proceso.

b. Recordando la ecuación (4.10) y así mismo la ecuación

(4.15)

STC

SEC

R

2

=

)

1 (

1

1 ~

2 2

R

k

n

STC

k

n

SRC

R

−

=

−

=

Para hallar el R² y el R² ajustado debemos hallar la STC, la

SEC y la SRC, ecuaciones 4,12, 4,13 y 4,23 respectivamente: 2

ˆ_X_Y _n_Y

(21)

93

X’Y n (-) 2,1266 0,6903 0,3279 x 30,6 = 134,01323 - (7 x 19,1094) = 1x3 48,7155 (134,0132 - 133,7658) 0,247514 107,6882 SEC 3x1

Transponemos los betas

2

Y

n

Y

STC

=

′

−

(4.12) Y’Y Y 4,66 4,4 4,29 4,05 4,2 4,59 4,41 X 4,66 = 134,0384 - (7 x 19,1094) = 1x7 4,4 (134,0384 - 133,7658) = 4,29 0,272684 4,05 STC 4,2 4,59 4,41 7x1 Transponemos Y

STC = SEC + SRC despejando la SRC tenemos: STC - SEC = SRC Y X Y Y Y n Y X Y n Y Y ′ ′ − = − ′ ′ − − ′ β β ˆ ' ˆ 2 2 (4.23) 0,272684 – 0,247514 = 0,02377565 SRC Ahora sí:

STC

SEC

R

2

=

R

2

=

₀

0 _,

,

₂₇₂₆₈₄

247514

=

0 ,

907695

(4.10)

(22)

94

Como el modelo tiene término independiente su:

1 1 ~2 − − − = n STC k n SRC R 869213 , 0 1 7 272684 , 0 3 7 02377565 , 0 1 ~2 = − − − = R (4.15)

El coeficiente de determinación R² nos muestra qué tanto se

ajusta la línea de regresión a los datos; el R² = 0,9076 nos dice

que aproximadamente el 91% de la variación de las unidades producidas en las 7 industrias de refrescos está explicada por las variables número de máquinas y número de trabajadores. Si se tiene en cuenta que el R² se encuentra entre 0 y 1 (0 < R²

<1), esta variación es bastante aceptable.

c. Prueba de significancia e intervalos de confianza para

B₂ y B₃

Para realizar las pruebas de hipótesis se requieren los errores estándar de los betas; por tanto, debemos hallar la matriz Var-Cov de los betas (ecuación 4,4), la cual como se vio en el capítulo introductorio de ÁLGEBRA matricial, posee en su diagonal las varianzas de los betas y la raíz cuadrada de cada uno de ellos. Recordando la ecuación:

son los errores estándar. 1 2₍ ₎ ) ˆ ( = ′ − −Cov XX Var β σ_µ (4.4) De la matriz 2 1 ) ( ) ˆ ( = ′ − −Cov XX

Var β σµ ya tenemos la matriz inversa,

pero se debe hallar la varianza de los residuales: k n SRC k n y x y y k n u k n u u i u ₋ = ₋ ′ ′ − ′ = − Σ = − ′ = β σ 2 ˆ ˆ ˆ2 ˆ (4.5) 7 3 0,005944 02377565 , 0 2 ₌ − = u σ 1 ) (X′X − Var−Cov(βˆ)=σ2µ(X′X)−1 0,005944 x 27,1065029 -6,9220181 -4,55131445 0,16112105 -0,04114448 -0,02705301 -6,9220181 1,98670246 1,07459204 = -0,04114448 0,01180896 0,00638738 -4,55131445 1,07459204 0,81019874 -0,02705301 0,00638738 0,00481582 3x3 3x3

)

ˆ

(

ˆ

var

β

_i

=

ee

β

_i

(23)

95

) ˆ ( ˆ varβ =i ee βi 0,16112105=ee(βˆ1)=0,401399 0,01180896=ee(βˆ2)=0,1086682 0,00481582 =ee(βˆ3)=0,069396

d. Prueba de significancia de los coeficientes de regresión. Una prueba de significancia es un procedimiento mediante el cual se utilizan los resultados muestrales para verificar la

verdad o falsedad de una hipótesis nula Ho. (4.19) Bajo el supuesto de normalidad tenemos:

) ˆ ( ˆ 2 2 2 β β β ee t = −

₂

_.

₇₇₆

2 =

=

α

t

βˆ2= 0,69033233 α = 5% ee(βˆ₂)=_{0,1086682 gl = 4}

(buscar en la tabla t- anexo, el ejemplo)

Planteamos lo siguiente: 0 0 * 2 2 2 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.776 6,352662 -2.776

352662

,

6 1086682

,

0 69033233

,

0 ₌

=

t

Ho = se rechaza. B2 es estadísticamente significativo ya que

el valor estadísticamente de prueba cayó en la zona de rechazo. Para B3: ) ˆ ( ˆ 3 3 3 β β β ee t = −

2 .

776

2 =

=

α

t

βˆ3= 0,32791085 α = 5% ee(βˆ3)= 0,069396 gl = 4 Planteamos lo siguiente: 0 0 * 3 3 3 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.776 4,725213 2.776

(24)

96 725213

,

4 069396

,

0 32791085

,

0 ₌

=

t

el valor estadísticamente de prueba cayó en la zona de rechazo.

Intervalos de significancia:

[

βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )

]

=1−α Pr 2 t /2ee 2 2 2 t /2ee 2 (4.18)

776 ,

2

2 =

=

α

t

βˆ2= 0,69033233 α = 5%

ee

(

β

ˆ

₂

)

=

_{0,1086682 gl = 4} Planteamos: 2 2 2 2 0 ˆ ˆ β β β β ≠ = = = i H H

[

(0,69033233) (2.776)*(0,1086682) (0,69033233) (2.776)*(0,1086682)

]

95% Pr − ≤

β

2 ≤ + =

[

(0,69033233) (2.776)*(0,1086682) (0,69033233) (2.776)*(0,1086682)

]

95% Pr − ≤

β

2≤ + =

991995

,

0 38869

,

0 ≤

β

₂

≤

0,69033233

Aceptamos la hipótesis nula.

Dado el coeficiente de confianza de 95% en el largo plazo,

en 95 de cada 100 casos, intervalos como (0,38869 - 0,991995) contendrán el verdadero valor de B2.

B3

[

βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )

]

=1−α Pr 3 t /2ee 3 3 3 t /2ee 3

776 ,

2

2 =

=

α

t

βˆ3= 0,32791085 α = 5%

=

)

ˆ

(

β

3

ee

0,069396 gl = 4

(25)

97

Planteamos: 3 3 3 3 0 ˆ ˆ β β β β ≠ = = = i H H

[

(

0 ,

32791085

)

(

2 ,

776 )

*

(

0 ,

069396

)

(

0 ,

32791085

)

(

2 ,

776 )

*

(

0 ,

069396

]

95 %

Pr

−

≤

β

₃

≤

+

=

[

(

0 ,

32791085

)

(

2 ,

776 )

*

(

0 ,

069396

)

(

0 ,

32791085

)

(

2 ,

776 )

*

(

0 ,

069396

]

95 %

Pr

−

≤

β

3

≤

+

=

520554 , 0 135268 , 0 ≤β₃≤ 0,32791085

Dado el coeficiente de confianza del 95% en el largo plazo,

en 95 de cada 100 casos, intervalos como (0,135268 - 0,520554) contendrán el verdadero valor de B2.

Prueba de significancia de los parámetros en conjunto: ) /( ) 1 ( ) 1 /( / ) 1 /( 2 2 k n R k R k n SRC k SEC F − − − = − − = (4.20) reemplazamos:

837581

,

20 )

3

7 /(

)

9076

,

0

1 (

)

1

3 /(

9076

,

0

3

7 /

02377565

,

0 )

1

3 /(

247514

,

0 ₌

−

=

−

=

F

Bajo el supuesto de que los Ui →N(0,σu2) planteamos la

hipótesis nula: ZONA DE RECHAZO Ho ZONA DE ACEPTACIÓN Ho 6,94 20,837581 0 ; , : 0 : 3 2 3 2 ≠ = = i i o un menos al H H

β

Si el Fc > Ft, se debe rechazar la hipótesis nula. (buscar

en la tabla f- anexo, el ejemplo (6,94)

En nuestro caso el Fcalculado > Fen tablas siendo F(k-1, n-k) α

= 5% 1 - α = 95%

(26)

98

Ahora, en contraste con el valor p value del F obtenido, nos

permite rechazar la hipótesis nula por ser suficientemente bajo. 0

:β₂=β₃=

o H

2. Se tienen los resultados de la siguiente regresión: LINREG Y

# CONSTANT X1 X2

Dependent Variable Y - Estimation by Least Squares Annual Data From 1978:01 To 1992:01

Usable Observations 15 Degrees of Freedom 12 R**2 0.851461 R**2 ajustado 0.826705 Sum of Squared Residuals 411886.37547 F(2,12) 34.3935

Significance Level of F 0.00001074

Durbin-Watson Statistic 1.517636 Q(3-0) 5.679080

Significance Level of Q 0.12831149

Variable Coeff Std Error T-Stat Signif

1. Constant 523.7710 211.3178466 2.47859 0.02903281 2. X1 17.02586 2.1929287 7.76399 0.00000510 3. X2 -8.11345 2.1364034 -3.79772 0.00254035

Y = exportaciones de café (miles de dólares)

X1 = precio externo del café (centavos de dólar por libra) X2 = precio de otros suaves (centavos de dólar por libra) a. Interprete B₂ y B₃y el R².

b. Haga la prueba de significancia y el intervalo de confianza

para B₂ y B₃; interprete t (alfa/2) = 2.179.

c. Haga la prueba de significancia de los parámetros en

conjunto e interprete. f. (2,12 alfa=5%) = 3.89

(27)

99

d. ¿Para qué se utiliza el estadístico q y que se puede concluir para el modelo planteado?

e. Describa dos problemas o restricciones que tiene el estadístico Durbin-Watson (d).

f. Describa brevemente una solución a los problemas del Durbin Watson.

g. ¿Qué puede concluir a cerca de la AR(1) para el modelo planteado?

Solución

2 1 8,11345 02586 , 17 7710 , 523 ˆ _X _X Y = + −

Matemáticamente B₂ es la pendiente de la recta.

Económicamente B₂ es el promedio de crecimiento de exportaciones del café durante el periodo 01-1978 a 01-1992.

a. Interpretación de la regresión

Si durante el periodo muestral X₁, X₂ hubiesen sido 0, el promedio de las exportaciones de café sería de US

$524.000.El coeficiente de regresión parcial 17,02586 significa que al mantener constante X₂(el precio de otros suaves), el crecimiento observado en las exportaciones de café durante el periodo 01-1978 a 01-1992 en promedio fue de 0,17%; de igual manera, al mantener constante el precio externo del café, el valor de -8,11345 implica que durante el mismo periodo de tiempo las exportaciones totales de café cayeron en aproximadamente 0,08%.

El coeficiente de determinación R² muestra qué tanto se ajusta la línea de regresión a los datos; el R² = 0,85 nos

dice que aproximadamente el 85% de la variación de las exportaciones totales de café durante el periodo 01-1978 a 01-1992 está explicada por las variables precio externo de café y precio de otros suaves. Si se tiene en cuenta que el R² se encuentra entre 0 y 1 (0 < R² <1), esta variación es

bastante aceptable.

b. Prueba de significancia e intervalos de confianza para

(28)

100

Prueba de significancia de los coeficientes de regresión. Una prueba de significancia es un procedimiento mediante el cual se utilizan los resultados muestrales para verificar la

verdad o falsedad de una hipótesis nula Ho. Bajo el supuesto de normalidad tenemos:

) ˆ ( ˆ 2 2 2 β β β ee t = −

₂

_.

₁₇₉

2 =

=

α

t

βˆ2= 17.02586 α = 5%

ee

(

β

ˆ

2

)

=

2.1929287 gl = 12 Planteamos lo siguiente: 0 0 * 2 2 2 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.179 7.7640 -2.179

7640

.

7 1929287

.

2 02586

.

17 ₌

=

t

el valor estadísticamente de prueba cayó en la zona de rechazo. Para B3: ) ˆ ( ˆ 3 3 3 β β β ee t = −

₂

_.

₁₇₉

2 =

=

α

t

3= ˆ β _-8.11345α = 5% ee(βˆ3)= 2.1364034 gl = 12 Planteamos lo siguiente: 0 0 * 3 3 3 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.179 -2.179

7977

.

3 1364034

.

2 11345

.

8 ₌

₋

−

=

t

(29)

101

Intervalos de significancia:

[

βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )

]

=1−α Pr 2 t /2ee 2 2 2 t /2ee 2

179 .

2

2 =

=

α

t

βˆ2= 17.02586 α = 5% ee(βˆ₂)= 2.1929287 gl = 12 Planteamos: 2 2 2 2 0 ˆ ˆ β β β β ≠ = = = i H H

[

(

17 .

2586

)

(

2 .

179 )

*

(

2 .

1929287

)

(

17 .

2586

)

(

2 .

179 )

*

(

2 .

1929287

)

]

95 %

Pr

−

≤

β

2

≤

+

=

[

(

17 .

2586

)

(

2 .

179 )

*

(

2 .

1929287

)

(

17 .

2586

)

(

2 .

179 )

*

(

2 .

1929287

)

]

95 %

Pr

−

≤

β

2

≤

+

=

8043

.

21 2475

.

12 ≤

β

₂

≤

17.2586

en 95 de cada 100 casos, intervalos como (12.2475, 21.8043) contendrán el verdadero valor de B2.

B3

[

βˆ − α (βˆ)≤β ≤βˆ + α (βˆ)

]

=1−α Pr 3 t /2ee 3 3 3 t /2ee 3

179 .

2

2 =

=

α

t

βˆ3= -8.11345 α = 5% ee(βˆ3)= 2.1364034 gl = 12 Planteamos: 3 3 3 3 0 ˆ ˆ β β β β ≠ = = = i H H

[

( 8.11345) (2.179)*(2.1364034) ( 8.11345) (2.179)*(2.1364034

]

95% Pr − − ≤β₃≤ − + =

[

(

8 .

11345

)

(

2 .

179 )

*

(

2 .

1364034

)

(

8 .

11345

)

(

2 .

179 )

*

(

2 .

1364034

]

95 %

Pr

−

≤

β

₃

≤

−

+

=

8314

.

1 7687

.

12 ≤

₃

≤

−

β

-8.11345

(30)

102

en 95 de cada 100 casos, intervalos como (-12.7687, 1.8314) contendrán el verdadero valor de B3.

Prueba de significancia de los parámetros en conjunto ) /( ) 1 ( ) 1 /( / ) 1 /( 2 2 k n R k R k n SRC k SEC F − − − = − − = (4.20)

Bajo el supuesto de que los Ui→N(0,σu2) planteamos la

hipótesis nula:

0 ;

,

:

0 :

3 2 3 2

≠

=

i i o

un

menos

al

H

β

ZONA DE RECHAZO Ho ZONA DE ACEPTACIÓN Ho 3,89 34,3934

Si el Fc > Ft, se debe rechazar la hipótesis nula.

En nuestro caso el F calculado > F en tablas siendo F(k-1, n-k) = 5% 1 - = 95% 34,3934 > 3,89

Ahora, en contraste con el valor p value del F obtenido, nos permite rechazar la hipótesis nula H_o:β₂ =β₃=0 por ser suficientemente bajo.