• No se han encontrado resultados

4.1 Estimación de parámetros por MCO

N/A
N/A
Protected

Academic year: 2021

Share "4.1 Estimación de parámetros por MCO"

Copied!
30
0
0

Texto completo

(1)

73

CAPÍTULO 4

ESTIMACIÓN DE

MODELOS ECONÓMICOS

N

uestra primera tarea consiste en estimar la función

de regresión poblacional (FRP) con base en la función de regresión muestral (FRM) de la forma más precisa posible. Para ello existen varios modos de calcular la FRM, pero el más utilizado es el método de mínimos cuadrados ordinarios MCO (en lo que respecta al análisis de regresión); así mismo, se recuerda que el método de MCO nos permitirá analizar únicamente modelos lineales uniecuacionales y es preciso para el objetivo del presente texto.

4.1 Estimación de parámetros por MCO

El método de MCO se atribuye a Carl Friedrich Gauss, matemático alemán. Bajo ciertos supuestos que se estudiarán, tiene propiedades estadísticas muy atractivas:

Recordando la FRP Yi =β1+β2X2i+ui (5)

no podemos observarla directamente; esta función debe de ser estimada a partir de la FRM

(2)

Curso Básico de Econometría Clásica

74

i i i X u Y =βˆ1+βˆ2 + ˆ (6) i i i Y u Y = ˆ+ˆ (4.1)

donde

Y

ˆ

i es el valor estimado de (media condicional) de Yi. Sin embargo ¿cómo se determina en sí misma la FRM?

Por tanto, (4.1) se expresa como reemplazamos; i i i i i X Y Y Y u 2 1 ˆ ˆ ˆ ˆ β β − − = − = recordando (3), reemplazamos: (4.2)

que refleja que los residuos (uˆi) son simplemente las diferencias entre los valores observados y los estimados de Yi.

De esta forma se fija el criterio de seleccionar la FRM de tal

manera que la suma de los residuos sea la menor posible Σuˆi. Este criterio no es muy eficiente a pesar de ser atractivo; véase

la imagen 8. Imagen 8 Y X X1 X2 X3 X4 X5 X6 FRM Û1 Û 3 Û4 Û5 Û6 Û2 Yi

Al adoptar el criterio de minimizar Σuˆi, la imagen 8 muestra que los residuales uˆ2, uˆ3, uˆ4,uˆ5al igual que los residuales uˆ1 y

6 ˆ

u , reciben el mismo peso en la suma (uˆ1+uˆ2 +uˆ3+uˆ4 +uˆ5+uˆ6) aunque los cuatro primeros están mucho más cerca de la FRM que los dos últimos.

(3)

75

Es decir que a todos los residuos se les da el mismo peso sin importar que tan lejos o cerca se encuentren las observaciones de la FRM. Pudiera presentarse que la suma total de residuos sea cero11 a pesar de que las

i

uˆ se encuentran dispersas alrededor de la FRM.

Por tanto, podemos evitar este problema si utilizamos el método de MCO, que establece que la FRM puede determinarse en forma tal que sea lo más pequeña posible, donde 2

ˆ

i

u

son los residuos elevados al cuadrado. De este modo, a los residuales más lejanos se les da más peso y la situación que se presenta en el ejemplo anterior con u1 y u6, en los que en la minimización de la Σuˆilos uˆi, sin importar su grado de dispersión la suma es pequeña, en el proceso de MCO no podría presentarse; es más, a mayor uˆi, mayor será la Σuˆi.

Se parte de un modelo: Y en forma matricial:

u

X

Y

=

β

ˆ

+

ˆ

Es decir: Y1 1 X12 X13 … Xk1

β

ˆ

1 uˆ1 Y2 1 X22 X23 … Xk2

β

ˆ

2 uˆ1 Y3 = 1 X32 X33 … Xk3 x

β

ˆ

3 + uˆ1 : : : : : : : : Yn 1 X2n X3n … Xkn

β

ˆ

k uˆ1 Ynx1 nxk Kxn nx1

11 Si asumiéramos que û1 + û2 + û3 + û4 + û5 + û6 tienen los valores de 8, -3,

+2, -2, +3 y -8, respectivamente, la suma de estos residuos sería cero a pesar

de que se encuentran dos residuos con mayor grado de dispersión alrededor de la FRM. i ki k i i i

X

X

X

u

Y

=

β

ˆ

1

+

β

ˆ

2 2

+

β

ˆ

3 3

+

...

+

β

ˆ

+

ˆ

(4)

Curso Básico de Econometría Clásica

76

)

ˆ

ˆ

(

ˆ

2

u

u

Minimizar

u

Minimizar

errores

los

reducir

es

busca

se

que

lo

=

[

]

=

+

+

+

+

=

=

2 2 2` 3 2 2 2 1 3 2 1 3 2 1

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

'

ˆ

u

u

u

u

u

u

u

u

u

u

u

u

u

u

u

n n n

Y partimos de que Y =Xβˆ+uˆ βˆ ˆ ˆ u Y X u despejamos si → = −

[

] [

]

(

)

[

β

] [

β

]

[

β

][

β

]

β

β

ˆ ˆ min ˆ ˆ min , ˆ ˆ min ) ˆ ' ˆ ( min ˆ2 X Y X Y X Y X Y tenemos B A B A d propiededa la recordando X Y X Y u u u Minimizar Al − ′ ′ − ′ = − ′ − ′ + ′ = ′ + − ′ − = =

desarrollamos el producto multiplicando término a término

[

]

[

]

[

β

β

β

]

β

β

β

β

β

β

ˆ ˆ ˆ 2 min ˆ ˆ ˆ ˆ ˆ ˆ min X X X Y Y Y Y X escalar X Y como X X Y X X Y Y Y ′ ′ + ′ − ′ ⇒ ′ ′ = = ′ ′ ′ + ′ ′ − ′ − ′ β β β β β ˆ 2 2 ˆ ) ˆ ˆ ˆ 2 ( min X X Y X X X X Y Y Y betas los a respecto derivamos imizar Para ′ + ′ − = ∂ ′ ′ + ′ − ′ ∂ Y X es a y a a donde = ′ ∂ ′ ∂ β β ˆ ˆ β β β β ˆ 2 ˆ ˆ ˆ a a = ∂ ′ ∂

β

β

ˆ

´

ˆ

Despejamos

X

X

Y

X

=

(5)

77

por tanto, multiplicamos por la inversa a ambos lados para reducir términos, β β ˆ ) ' ( ˆ ) ' ( ) ' ( 1 1 1 I Y X X X X X X X Y X X X = ′ ′ = ′ − − −

(

X

X

)

X

Y

=

β

ˆ

−1 (4.3)

4.2 Propiedades de los estimadores de los

parámetros

• Son lineales

(

)

1 1 1

ˆ

ˆ

nx kxn kx

A

Y

Y

X

X

X

=

=

β

β

• Son insesgados E(β =ˆ) β

• Tienen varianza mínima (4.4) Recordando la ecuación (4.3) βˆ=

(

XX

)

−1XY Si sustituimos Y

Y

=

X

β

+

u

(4) tenemos

β

ˆ

=

(

X

X

)

−1

X

(

X

β

+

u

)

(

)

(

)

(

XX

)

XX I recordando u X X X X X X X = ′ ′ ′ + ′ ′ = − − − 1 1 1 ' ˆ β β

(

)

(

X

X

)

X

u

u

X

X

X

I

'

ˆ

'

ˆ

1 1 − −

=

+

=

β

β

β

β

donde

I

β

=

β

Por la propiedad de insesgamiento:

donde, (X´X)-1 X´X = 1

(6)

Curso Básico de Econometría Clásica

78

(

)(

)

[

]

(

)

(

)

[

]

(

)

(

)

[

1 1

]

1 1 ' ' )' ' )( ' ( ' ˆ ˆ − − − − ′ ′ = ′ ′ = − − = X X X uu X X X E u X X X u X X X E E β β β β bajoel uestoE uu uI 2 ) ' ( sup =σ

(

)

(

)

(

)

1 2 1 2 1 ) ' ( − − − ′ = ′ ′ = X X I X X X X X X u u σ σ 1 2( ) ) ˆ ( = XXCov β σµ (4.4) k n y x y y k n u k n u u halla se la donde i u u − ′ ′ − ′ = − Σ = − ′ = β σ σ ˆ ˆ ˆ ˆ : 2 2 2 (4.5)

4.3 Coeficiente de determinación

• Mide en qué porcentaje las variables exógenas explican la variación de la endógena. • Descomposición de la varianza

=

+

n i n i n i

y

y

1 2 1 2 1 2

ˆ

ˆ

µ

(4.6) • STC=SEC+SRC CUADRADO AL RESIDUALES DE SUMA Y Y CUADRADOS DE EXPLICADA SUMA Y Y y CUADRADOS DE TOTAL SUMA Y Y y i i n i i n i n i i = − = = − = = − =

2 1 2 2 1 2 1 2 2 ) ˆ ( ˆ ) ˆ ( ˆ ) ( µ (4.7) (4.8) (4.9)

(

)

(

)

(

)

1 2

(

)

1 1 1 ) ( ' ) ' ( ' − − − − ′ ′ = ′ ′ = X X X I X X X X X X uu E X X X u σ

(7)

79

4.3.1 Si el modelo tiene término independiente el R

2

se calcula:

1

0

)

(

)

ˆ

(

2 2 2 2

<

<

=

=

R

Y

Y

Y

Y

STC

SEC

R

i i (4.10) en cualquier caso

=

=

+

=

2 2 2 2

)

(

ˆ

1

1

1

Y

Y

STC

SRC

R

STC

SRC

R

i i

µ

(4.11) En su expresión matricial: (4.12) (4.13)

(4.14)

4.3.2 Coeficiente de determinación ajustado

) 1 ( 1 1 1 1 ~ 2 2 R k n n n STC k n SRC R − − − − = − − − = (4.15)

4.4 Coeficiente de correlación simple y parcial

4.4.1 Coeficiente de correlación simple: mide el

grado de asociación lineal entre X y Y

1 1 2 2 2 = < < =

∑ ∑

xy i i i i xy r y x y x R r (4.16)

(8)

Curso Básico de Econometría Clásica

80

4.4.2 Coeficiente de correlación parcial

∑ ∑

= 2 2 2 1 2 1 .... ,3,4, 2 u u u u r k x x x yx (4.17)

4.5 Estimación por intervalos

α

β

β

β

β

β

α α

=

+

(

ˆ

)

ˆ

(

ˆ

)

1

ˆ

2 2 i i i i i

t

ee

t

ee

P

(4.18)

4.6 Contrastes de significancia estadística de

parámetros

Tipo de

hipótesis

H

0

H

I Decisión Gráficos

Dos colas

β =

i

β

i0

β ≠

i

β

i0

/

t

/

>

t

α/2 1 Cola izquierda

β ≥

i

β

i0

β <

i

β

i0

t

<

t

α 2 Cola derecha

β ≤

i

β

i0

β >

i

β

i0

t

>

t

α 3 Imagen 9 ZONA DE ACEPTACIÓN Ho

4.7 Contrastes de significancia

• Se tiene el modelo: i i i i i i

x

x

x

x

u

Y

=

β

1

+

β

2 2

+

β

3 3

+

β

4 4

+

β

5 5

+

(9)

81

4.7.1 Contraste de significancia individual

0 0 0 ≠ = = = i i i H H β β (4.19)

4.7.2 Contraste de significancia global

0 ... : 2 3 0 = = k = H β β β

)

,

1

(

/

)

1

/(

k

n

k

F

k

n

SRC

k

SEC

F

=

(4.20)

4.7.3 Contraste de significancia para un

subconjunto de parámetros

3 , 2 0 : 0 : 2 3 = ≠ = = i un menos al H H i i o β β β * 5 5 4 4 1 x x SCR Yi=β +β +β →

4.7.4 Modelo restringido

(4.21) Donde k1 es el número de parámetros de Ho

4.8 Test de hipótesis para un conjunto de

restricciones lineales

Se definen las matrices R de tamaño j x k donde j es el número de restricciones lineales y un vector r de tamaño (jx1).

R contiene los coeficientes de cada una de las restricciones

lineales y r los valores a los que son iguales estas restricciones.

r R H r R H i i ≠ = β β : : 0

(

)

[

(

)

] (

)

F

(

J n k

)

J r R R X X R r R F U − → − ′ ′ ′ − = − − , ˆ ˆ 2 1 1 σ β β ) ˆ ( ˆ i i i k n ee t β β β − = −

(10)

Curso Básico de Econometría Clásica

82

4.9 Predicción

Después de la estimación de los parámetros y de hacer análisis estructural, el uso más habitual de la regresión consiste en la predicción.

[

]

( )

(

(

)

)

( )

1 2 / 1 1 1 1 2 1 1 1 1 1 3 1 2 1 1 1 1 1 3 3 1 2 2 1 1 ˆ 1 ˆ ) ˆ var( intervalo por prediccion ... 1 ˆ ˆ ˆ .... ˆ ˆ ˆ ˆ + + + + − + + + + + + + + + + + + + + ± ′ ′ + = = − ≡ = + + + + = t t t t t t t t k t t t t t t k k t t t e DS t Y X X X X e Var Y Y X X X X donde puntual prediccion X Y X X X Y α

σ

β

β

β

β

β

4.10 Contraste de hipótesis estructurales del

modelo

• Muestras pequeñas • Cambio estructural • Especificación errónea • Multicolinealidad

4.10.1 Muestras pequeñas

Para que el modelo tenga solución se exige que el número de datos (observaciones) sea superior al número de parámetros del modelo (n>k).

Para efectos operativos se necesita un mínimo de alrededor de 15 datos para tener alguna garantía en la estimación de 3 o 4 parámetros.

(11)

83

4.10.2 Cambio estructural

Una de las hipótesis estructurales del modelo es la constancia de los parámetros del modelo de regresión durante todo el periodo de observación y que se mantiene para el horizonte de predicción. Cuando esta condición no se cumple se dice que el modelo sufre de cambio estructural.

4.10.2.1 Cómo detectar el cambio estructural

Para detectarlo se aplica el test de Chow (pasos) 1. Estimar

Y

=

X

β

ˆ

+

µ

ˆ

y obtener SRC 2. Estimar *

=

*

β

ˆ

*

+

µ

ˆ

*

X

Y

y obtener SRC* 3. Estimar ** ** ** **

ˆ

ˆ

µ

β

+

=

X

Y

y obtener SRC** 4. Obtener F calculado

(

(

)

)

(

SRC SRC

)

n k k SRC SRC SRC F 2 / / * * * * * * − + + − = (4.21)

5. Hacer el Contraste F calculado contra F Tabulado con K y n-2k gl bajo la hipótesis

Ho: B=B*=B**(no hay cambio estructural)

4.10.2.2 Para solucionar el cambio estructural

• Aplicar regresiones cambiantes a cada submuestra • Readaptar el modelo básico de regresión

• Incluir una variable ficticia en la regresión

pendientes

afecta

U

X

D

X

Y

intercepto

afecta

U

X

D

Y

t t t t t t t t

+

+

+

=

+

+

+

=

* * *

ˆ

ˆ

α

β

µ

β

α

µ

(12)

Curso Básico de Econometría Clásica

84

4.10.3 Especificación errónea

Cuando se plantea un modelo se supone especificación

correcta, pero esto es difícil de cumplir bien porque: • La forma funcional no es la correcta

• Por omisión de variables relevantes • Por incluir variables no relevantes

4.10.4 Multicolinealidad -MC

4.10.4.1 MC exacta

Es cuando existe una relación exacta entre variables exógenas. En este caso el determinante de X’X es igual a cero, no se puede hallar la inversa (X’X)-1 y por tanto no se pueden

estimar los parámetros (β).

4.10.4.2 MC aproximada

Es cuando existe una relación aproximada entre variables exógenas. En este caso el determinante de X’X es cercano a cero; esto hace que los estimadores se distorsionen.

Imagen 10 X2 X 3 Y X2 X3 Y No existe Colinealidad Gráfico de Ballentine de Multicolinealidad Baja colinealidad

Colinealidad alta Colinealidad muy alta Colinealidad moderada X2 X3 Y X2 X3 Y X2 X3 Y MULTICOLINEALIDAD

(13)

85

4.10.4.3 Cómo detectar la multicolinealidad

• A partir de las consecuencias

• Calcular los coeficientes de correlación simple- rxy entre variables exógenas y destacar aquellos casos en que rxy > 0.9

• Hacer regresiones auxiliares entre las variables exógenas del modelo y destacar aquellos casos en los cuales el R² de

la regresión auxiliar es mayor al R² del modelo original.

4.10.4.4

Tratamiento de variables ficticias o

variables dummy

• Las variables dummy son aquellas que reciben los valores 1 y 0; se utilizan cuando en los modelos existen variables que

no son directamente cuantificables y que son importantes

para explicar la variable endógena.

Ejemplo:

1. El estrato socioeconómico 2. La época del año

Ejemplo:

u D D D D Exp Salario123 14 25 36 4+

Se debe tener cuidado al incluir las dummy porque se puede

caer en la trampa de las variables ficticias; multicolinealidad m, m-1,

1 7 1 0 0 0 1 10 0 0 1 0 1 25 0 1 0 0 1 20 0 0 0 1 1 18 1 0 0 0 1 16 0 0 1 0 1 10 0 1 0 0

(14)

Curso Básico de Econometría Clásica

86

categoria. una eliminar debe se tanto, por . intercepto del columna la a igual es Dummys las de suma la categorias m tiene se Si

.

,

primaria

de

Dummy

la

educacion

ejemplo

Por

Al eliminar la dummy de primaria D1, todo se referencia a primaria

u

D

D

D

Exp

Salario

=

500

+

52

+

12

2

+

20

3

+

50

4

+

D2→El individuo de secundaria gana $ 12.000 más que el

de primaria.

4.11 Contraste de hipótesis sobre la

perturbación aleatoria

Heterocedasticidad y autocorrelación

4.11.1 Heterocedasticidad

La varianza de los errores no es constante a lo largo de la muestra

}

n i i

X

para

i

n

U

U

X

U

VAR

(

|

)

=

σ

µ2

=

1

...

Ε

(

|

)

=

σ

µ2

4.11.1.1 Cómo detectar la heteroscedasticidad

• Gráfico

• Prueba de Park • Prueba de Glejser

• Prueba de Goldfeld y Quandt • Prueba de White

(15)

87

4.11.1.2 Posibles soluciones de la heteroscedasticidad

• Aplicar mínimos cuadrados generalizados -MCG Y X X X MCG 1 1 1 ) ( ˆ = − − − β

• Transformar el modelo por la matriz P y aplicar MCO Y*=PY

X*=PX el nuevo modelo será Y* = X*B+U*

Donde la matriz P lleva en la diagonal los elementos de la variable con la cual es proporcional la heterocedasticidad y el resto son cero.

4.11.2 Autocorrelación

Existe relación entre los errores de un periodo con los de otro.

}

n i t tU parai UU X U COV( −)≠0 ≠0 Ε( ′| )=σµ2Ω

4.11.2.1 Cómo detectar la autocorrelación

• Gráfico • Durbin Watson • h de Durbin • Box Pierce • Ljung Box • Test de Wallis • Prueba de rachas

(16)

Curso Básico de Econometría Clásica

88

4.11.2.2 Método de Durbin Watson

Se utiliza para detectar AR(1)

(

)

= = −

=

n t t n t t t

U

U

U

d

1 2 2 2 1

ˆ

ˆ

ˆ

(4.22)

Definida como la razón de la suma de las diferencias al

cuadrado de residuales sucesivos sobre la SRC. Supuestos en los cuales se basa:

• El modelo de regresión incluye intercepto

• Las variables explicativas X, son fijas en muestreos repetidos

• Los errores se generan mediante un proceso AR(1) es decir que ut ut-1t

• El modelo no incluye valores rezagados de la variable dependiente

• Dada la definición, es posible llegar a demostrar que

)

ˆ

1

(

2

ρ

d

pero como: -1 < ρ < 1, entonces 0 < d < 4. Reglas de decisión: • Si 0<d<dl AR (1) positiva • Si du<d<4-du no AR(1) • Si 4-dl<d<4 AR(1) negativa

(17)

89

Imagen 11. Durbin Watson

d

2 0 dL dU 4dU 4dL 4 Rechácese Ho Evidencia de autocorrelación positiva

Sin embargo, la prueba d tiene como desventaja que cuando cae en la zona de indecisión o región de ignorancia no se puede concluir la existencia de autocorrelación.

Zona de indecisión No se rechace Hou H*o, o ambas. Zona de indecisión Rechácese H*o Evidencia de autocorrelación negativa

4.11.2.3 Posibles soluciones para la autocorrelación

• Ensayar nuevas variables explicativas o reconsiderar la forma funcional del modelo.

• Aplicar MCG o transformar el modelo utilizando la matriz

P. Tanto Ω como P son matrices que dependen de ρ.

4.11.3 No normalidad

• El supuesto es que los residuos se distribuyen normalmente. • Cuando no se cumple esta condición, las pruebas de inferencia

estadística pierden confiabilidad.

• Las principales pruebas para detectarla son la de Jarque Bera y Shapiro Wilk.

(18)

Curso Básico de Econometría Clásica

90

Taller

12

1. La siguiente información es una muestra de 7 industrias de refrescos, donde K es el número de máquinas utilizadas en el proceso, L es el número de trabajadores y Q el número de unidades producidas (todo expresado en logaritmos).

K L Q 2,08 3,14 4,66 2,2 2,64 4,4 1,39 3,64 4,29 0,69 4,57 4,05 1,79 2,4 4,2 1,79 3,76 4,59 1,1 4,53 4,41 Sumas 11,04 24,68 30,6 promedios 1,57714286 3,52571429 4,37142857 1

)

(

X

X

− 27,1065029 -6,9220181 -4,55131445 -6,9220181 1,98670246 1,07459204 -4,55131445 1,07459204 0,81019874 a. Interprete B2 y B3.

b. Calcule R² y R² ajustado e interprete.

c. Establezca intervalos de confianza y pruebas de significancia

para B2 y B3 e interprete.

d. Realice la prueba de significancia global e interprete.

e. Pruebe la hipótesis de que estas industrias poseen una función de producción Cobb Douglas con rendimientos constantes a escala.

(19)

91

Solución

3 2 3 2 1 β β

β

X X Yi =

ln

Y

i

=

β

0

+

β

2

ln

X

2

+

β

3

ln

X

3 donde

β =

0

ln

β

1

Recordando la ecuación (4.3) para estimar los betas

(

XX

)

XY

= −1

ˆ

β y que ya poseemos la matriz inversa 1

)

(

X

X

tendríamos:

X =

La matriz X está compuesta por el intercepto; la columna de unos y por k y l, el número de máquinas utilizadas en el proceso y por el número de trabajadores requeridos respectivamente.

1 2,08 3,14 1 2,2 2,64 1 1,39 3,64 1 0,69 4,57 1 1,79 2,4 1 1,79 3,76 1 1,1 4,53

Por tanto se halla la X’ = por las ropiedades de la transpuesta

(donde las filas se transforman en columnas)

1 1 1 1 1 1 1

2,08 2,2 1,39 0,69 1,79 1,79 1,1 3,14 2,6 3,64 4,57 2,4 3,76 4,53

3x7

X’Y = X’ multiplicada por Y (el número de unidades producidas)

X’ Y X’Y

1 1 1 1 1 1 1 4,66 30,6

2,08 2,2 1,39 0,69 1,79 1,79 1,1 X 4,4 = 48,7155

3,14 2,6 3,64 4,57 2,4 3,76 4,53 4,29 107,6882

3x7 4,05 3x1

Recordemos que la multiplicación se realiza término a término,

fila por columna.

4,2 4,59 4,41

7x1

(20)

Curso Básico de Econometría Clásica

92

(1x4,66)+(1x4,4)+(1x4,29)+(1x4,05)+(1x4,2)+(1x4,59)+ (1x4,41) = 30,6 y así sucesivamente

(

XX

)

XY = −1 ˆ β (X’X)-1 X’Y 27,1065029 -6,9220181 -4,55131445 30,6 2,1266 -6,9220181 1,98670246 1,07459204 X 48,7155 = 0,6903 -4,55131445 1,07459204 0,81019874 107,6882 0,3279 3x3 3x1 3x1 a. Interpretación de la regresión 2 1 0,3279 6903 , 0 1266 , 2 ˆ X X Y = + +

B2: según los resultados del coeficiente de elasticidad del

capital de 0,6903, por cada incremento del 1% de maquinaria utilizada en el proceso, el producto (medido en unidades de refrescos producidos) se eleva en promedio cerca del 0,69%, manteniendo el número de trabajadores constante. B3: nos indica que con un incremento del 1% en el número de trabajadores (teniendo en cuenta los resultados del

coeficiente de elasticidad de trabajo de 0,3279), el número

de unidades producidas se eleva en promedio cerca del 0,33%, manteniendo constantes el número de máquinas utilizadas en el proceso.

b. Recordando la ecuación (4.10) y así mismo la ecuación

(4.15)

STC

SEC

R

2

=

)

1

(

1

1

1

1

~

2 2

R

k

n

n

n

STC

k

n

SRC

R

=

=

Para hallar el R² y el R² ajustado debemos hallar la STC, la

SEC y la SRC, ecuaciones 4,12, 4,13 y 4,23 respectivamente: 2

ˆXY nY

(21)

93

X’Y n (-) 2,1266 0,6903 0,3279 x 30,6 = 134,01323 - (7 x 19,1094) = 1x3 48,7155 (134,0132 - 133,7658) 0,247514 107,6882 SEC 3x1

Transponemos los betas

2

Y

n

Y

Y

STC

=

(4.12) Y’Y Y 4,66 4,4 4,29 4,05 4,2 4,59 4,41 X 4,66 = 134,0384 - (7 x 19,1094) = 1x7 4,4 (134,0384 - 133,7658) = 4,29 0,272684 4,05 STC 4,2 4,59 4,41 7x1 Transponemos Y

STC = SEC + SRC despejando la SRC tenemos: STC - SEC = SRC Y X Y Y Y n Y X Y n Y Y ′ ′ − = − ′ ′ − − ′ β β ˆ ' ˆ 2 2 (4.23) 0,272684 – 0,247514 = 0,02377565 SRC Ahora sí:

STC

SEC

R

2

=

R

2

=

0

0

,

,

272684

247514

=

0

,

907695

(4.10)

(22)

Curso Básico de Econometría Clásica

94

Como el modelo tiene término independiente su:

1 1 ~2 − − − = n STC k n SRC R 869213 , 0 1 7 272684 , 0 3 7 02377565 , 0 1 ~2 = − − − = R (4.15)

El coeficiente de determinación R² nos muestra qué tanto se

ajusta la línea de regresión a los datos; el R² = 0,9076 nos dice

que aproximadamente el 91% de la variación de las unidades producidas en las 7 industrias de refrescos está explicada por las variables número de máquinas y número de trabajadores. Si se tiene en cuenta que el R² se encuentra entre 0 y 1 (0 < R²

<1), esta variación es bastante aceptable.

c. Prueba de significancia e intervalos de confianza para

B2 y B3

Para realizar las pruebas de hipótesis se requieren los errores estándar de los betas; por tanto, debemos hallar la matriz Var-Cov de los betas (ecuación 4,4), la cual como se vio en el capítulo introductorio de ÁLGEBRA matricial, posee en su diagonal las varianzas de los betas y la raíz cuadrada de cada uno de ellos. Recordando la ecuación:

son los errores estándar. 1 2( ) ) ˆ ( = ′ − −Cov XX Var β σµ (4.4) De la matriz 2 1 ) ( ) ˆ ( = ′ − −Cov XX

Var β σµ ya tenemos la matriz inversa,

pero se debe hallar la varianza de los residuales: k n SRC k n y x y y k n u k n u u i u = ′ ′ − ′ = − Σ = − ′ = β σ 2 ˆ ˆ ˆ2 ˆ (4.5) 7 3 0,005944 02377565 , 0 2 = − = u σ 1 ) (XXVarCov(βˆ)=σ2µ(XX)−1 0,005944 x 27,1065029 -6,9220181 -4,55131445 0,16112105 -0,04114448 -0,02705301 -6,9220181 1,98670246 1,07459204 = -0,04114448 0,01180896 0,00638738 -4,55131445 1,07459204 0,81019874 -0,02705301 0,00638738 0,00481582 3x3 3x3

)

ˆ

(

ˆ

var

β

i

=

ee

β

i

(23)

95

) ˆ ( ˆ varβ =i ee βi 0,16112105=ee(βˆ1)=0,401399 0,01180896=ee(βˆ2)=0,1086682 0,00481582 =ee(βˆ3)=0,069396

d. Prueba de significancia de los coeficientes de regresión. Una prueba de significancia es un procedimiento mediante el cual se utilizan los resultados muestrales para verificar la

verdad o falsedad de una hipótesis nula Ho. (4.19) Bajo el supuesto de normalidad tenemos:

) ˆ ( ˆ 2 2 2 β β β ee t = −

2

.

776

2

=

=

α

t

βˆ2= 0,69033233 α = 5% ee(βˆ2)= 0,1086682 gl = 4

(buscar en la tabla t- anexo, el ejemplo)

Planteamos lo siguiente: 0 0 * 2 2 2 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.776 6,352662 -2.776

352662

,

6

1086682

,

0

69033233

,

0

=

=

t

Ho = se rechaza. B2 es estadísticamente significativo ya que

el valor estadísticamente de prueba cayó en la zona de rechazo. Para B3: ) ˆ ( ˆ 3 3 3 β β β ee t = −

2

.

776

2

=

=

α

t

βˆ3= 0,32791085 α = 5% ee(βˆ3)= 0,069396 gl = 4 Planteamos lo siguiente: 0 0 * 3 3 3 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.776 4,725213 2.776

(24)

Curso Básico de Econometría Clásica

96

725213

,

4

069396

,

0

32791085

,

0

=

=

t

Ho = se rechaza. B3 es estadísticamente significativo ya que

el valor estadísticamente de prueba cayó en la zona de rechazo.

Intervalos de significancia:

[

βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )

]

=1−α Pr 2 t /2ee 2 2 2 t /2ee 2 (4.18)

776

,

2

2

=

=

α

t

βˆ2= 0,69033233 α = 5%

ee

(

β

ˆ

2

)

=

0,1086682 gl = 4 Planteamos: 2 2 2 2 0 ˆ ˆ β β β β ≠ = = = i H H

[

(0,69033233) (2.776)*(0,1086682) (0,69033233) (2.776)*(0,1086682)

]

95% Pr − ≤

β

2 ≤ + =

[

(0,69033233) (2.776)*(0,1086682) (0,69033233) (2.776)*(0,1086682)

]

95% Pr − ≤

β

2≤ + =

991995

,

0

38869

,

0

β

2

0,69033233

Aceptamos la hipótesis nula.

Dado el coeficiente de confianza de 95% en el largo plazo,

en 95 de cada 100 casos, intervalos como (0,38869 - 0,991995) contendrán el verdadero valor de B2.

B3

[

βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )

]

=1−α Pr 3 t /2ee 3 3 3 t /2ee 3

776

,

2

2

=

=

α

t

βˆ3= 0,32791085 α = 5%

=

)

ˆ

(

β

3

ee

0,069396 gl = 4

(25)

97

Planteamos: 3 3 3 3 0 ˆ ˆ β β β β ≠ = = = i H H

[

(

0

,

32791085

)

(

2

,

776

)

*

(

0

,

069396

)

(

0

,

32791085

)

(

2

,

776

)

*

(

0

,

069396

]

95

%

Pr

β

3

+

=

[

(

0

,

32791085

)

(

2

,

776

)

*

(

0

,

069396

)

(

0

,

32791085

)

(

2

,

776

)

*

(

0

,

069396

]

95

%

Pr

β

3

+

=

520554 , 0 135268 , 0 ≤β3≤ 0,32791085

Aceptamos la hipótesis nula.

Dado el coeficiente de confianza del 95% en el largo plazo,

en 95 de cada 100 casos, intervalos como (0,135268 - 0,520554) contendrán el verdadero valor de B2.

Prueba de significancia de los parámetros en conjunto: ) /( ) 1 ( ) 1 /( / ) 1 /( 2 2 k n R k R k n SRC k SEC F − − − = − − = (4.20) reemplazamos:

837581

,

20

)

3

7

/(

)

9076

,

0

1

(

)

1

3

/(

9076

,

0

3

7

/

02377565

,

0

)

1

3

/(

247514

,

0

=

=

=

F

Bajo el supuesto de que los UiN(0,σu2) planteamos la

hipótesis nula: ZONA DE RECHAZO Ho ZONA DE ACEPTACIÓN Ho 6,94 20,837581 0 ; , : 0 : 3 2 3 2 ≠ = = i i o un menos al H H

β

β

β

β

β

Si el Fc > Ft, se debe rechazar la hipótesis nula. (buscar

en la tabla f- anexo, el ejemplo (6,94)

En nuestro caso el Fcalculado > Fen tablas siendo F(k-1, n-k) α

= 5% 1 - α = 95%

(26)

Curso Básico de Econometría Clásica

98

Ahora, en contraste con el valor p value del F obtenido, nos

permite rechazar la hipótesis nula por ser suficientemente bajo. 0

23=

o H

2. Se tienen los resultados de la siguiente regresión: LINREG Y

# CONSTANT X1 X2

Dependent Variable Y - Estimation by Least Squares Annual Data From 1978:01 To 1992:01

Usable Observations 15 Degrees of Freedom 12 R**2 0.851461 R**2 ajustado 0.826705 Sum of Squared Residuals 411886.37547 F(2,12) 34.3935

Significance Level of F 0.00001074

Durbin-Watson Statistic 1.517636 Q(3-0) 5.679080

Significance Level of Q 0.12831149

Variable Coeff Std Error T-Stat Signif

1. Constant 523.7710 211.3178466 2.47859 0.02903281 2. X1 17.02586 2.1929287 7.76399 0.00000510 3. X2 -8.11345 2.1364034 -3.79772 0.00254035

Y = exportaciones de café (miles de dólares)

X1 = precio externo del café (centavos de dólar por libra) X2 = precio de otros suaves (centavos de dólar por libra) a. Interprete B2 y B3 y el R².

b. Haga la prueba de significancia y el intervalo de confianza

para B2 y B3; interprete t (alfa/2) = 2.179.

c. Haga la prueba de significancia de los parámetros en

conjunto e interprete. f. (2,12 alfa=5%) = 3.89

(27)

99

d. ¿Para qué se utiliza el estadístico q y que se puede concluir para el modelo planteado?

e. Describa dos problemas o restricciones que tiene el estadístico Durbin-Watson (d).

f. Describa brevemente una solución a los problemas del Durbin Watson.

g. ¿Qué puede concluir a cerca de la AR(1) para el modelo planteado?

Solución

2 1 8,11345 02586 , 17 7710 , 523 ˆ X X Y = + −

Matemáticamente B2 es la pendiente de la recta.

Económicamente B2 es el promedio de crecimiento de exportaciones del café durante el periodo 01-1978 a 01-1992.

a. Interpretación de la regresión

Si durante el periodo muestral X1, X2 hubiesen sido 0, el promedio de las exportaciones de café sería de US

$524.000.El coeficiente de regresión parcial 17,02586 significa que al mantener constante X2 (el precio de otros suaves), el crecimiento observado en las exportaciones de café durante el periodo 01-1978 a 01-1992 en promedio fue de 0,17%; de igual manera, al mantener constante el precio externo del café, el valor de -8,11345 implica que durante el mismo periodo de tiempo las exportaciones totales de café cayeron en aproximadamente 0,08%.

El coeficiente de determinación R² muestra qué tanto se ajusta la línea de regresión a los datos; el R² = 0,85 nos

dice que aproximadamente el 85% de la variación de las exportaciones totales de café durante el periodo 01-1978 a 01-1992 está explicada por las variables precio externo de café y precio de otros suaves. Si se tiene en cuenta que el R² se encuentra entre 0 y 1 (0 < R² <1), esta variación es

bastante aceptable.

b. Prueba de significancia e intervalos de confianza para

(28)

Curso Básico de Econometría Clásica

100

Prueba de significancia de los coeficientes de regresión. Una prueba de significancia es un procedimiento mediante el cual se utilizan los resultados muestrales para verificar la

verdad o falsedad de una hipótesis nula Ho. Bajo el supuesto de normalidad tenemos:

) ˆ ( ˆ 2 2 2 β β β ee t = −

2

.

179

2

=

=

α

t

βˆ2= 17.02586 α = 5%

ee

(

β

ˆ

2

)

=

2.1929287 gl = 12 Planteamos lo siguiente: 0 0 * 2 2 2 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.179 7.7640 -2.179

7640

.

7

1929287

.

2

02586

.

17

=

=

t

Ho = se rechaza. B2 es estadísticamente significativo ya que

el valor estadísticamente de prueba cayó en la zona de rechazo. Para B3: ) ˆ ( ˆ 3 3 3 β β β ee t = −

2

.

179

2

=

=

α

t

3= ˆ β -8.11345 α = 5% ee(βˆ3)= 2.1364034 gl = 12 Planteamos lo siguiente: 0 0 * 3 3 3 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.179 -2.179

7977

.

3

1364034

.

2

11345

.

8

=

=

t

Ho = se rechaza. B3 es estadísticamente significativo ya que

(29)

101

Intervalos de significancia:

[

βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )

]

=1−α Pr 2 t /2ee 2 2 2 t /2ee 2

179

.

2

2

=

=

α

t

βˆ2= 17.02586 α = 5% ee(βˆ2)= 2.1929287 gl = 12 Planteamos: 2 2 2 2 0 ˆ ˆ β β β β ≠ = = = i H H

[

(

17

.

2586

)

(

2

.

179

)

*

(

2

.

1929287

)

(

17

.

2586

)

(

2

.

179

)

*

(

2

.

1929287

)

]

95

%

Pr

β

2

+

=

[

(

17

.

2586

)

(

2

.

179

)

*

(

2

.

1929287

)

(

17

.

2586

)

(

2

.

179

)

*

(

2

.

1929287

)

]

95

%

Pr

β

2

+

=

8043

.

21

2475

.

12

β

2

17.2586

Aceptamos la hipótesis nula.

Dado el coeficiente de confianza del 95% en el largo plazo,

en 95 de cada 100 casos, intervalos como (12.2475, 21.8043) contendrán el verdadero valor de B2.

B3

[

βˆ − α (βˆ)≤β ≤βˆ + α (βˆ)

]

=1−α Pr 3 t /2ee 3 3 3 t /2ee 3

179

.

2

2

=

=

α

t

βˆ3= -8.11345 α = 5% ee(βˆ3)= 2.1364034 gl = 12 Planteamos: 3 3 3 3 0 ˆ ˆ β β β β ≠ = = = i H H

[

( 8.11345) (2.179)*(2.1364034) ( 8.11345) (2.179)*(2.1364034

]

95% Pr − − ≤β3≤ − + =

[

(

8

.

11345

)

(

2

.

179

)

*

(

2

.

1364034

)

(

8

.

11345

)

(

2

.

179

)

*

(

2

.

1364034

]

95

%

Pr

β

3

+

=

8314

.

1

7687

.

12

3

β

-8.11345

(30)

Curso Básico de Econometría Clásica

102

Aceptamos la hipótesis nula.

Dado el coeficiente de confianza del 95% en el largo plazo,

en 95 de cada 100 casos, intervalos como (-12.7687, 1.8314) contendrán el verdadero valor de B3.

Prueba de significancia de los parámetros en conjunto ) /( ) 1 ( ) 1 /( / ) 1 /( 2 2 k n R k R k n SRC k SEC F − − − = − − = (4.20)

Bajo el supuesto de que los UiN(0,σu2) planteamos la

hipótesis nula:

0

;

,

:

0

:

3 2 3 2

=

=

i i o

un

menos

al

H

H

β

β

β

β

β

ZONA DE RECHAZO Ho ZONA DE ACEPTACIÓN Ho 3,89 34,3934

Si el Fc > Ft, se debe rechazar la hipótesis nula.

En nuestro caso el F calculado > F en tablas siendo F(k-1, n-k) = 5% 1 - = 95% 34,3934 > 3,89

Ahora, en contraste con el valor p value del F obtenido, nos permite rechazar la hipótesis nula Ho23=0 por ser suficientemente bajo.

Referencias

Documento similar

2.- Aunque, para elaborar un comentario completo, debemos formular varias preguntas, en los ejercicios pedagógicos es preferible que reduzcamos, sobre todo al principio,

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

Pliegue asimétrico mostrando una pizarrosidad de plano axial (martillo) en las pizarras del volcanismo ácido inicial del anticlinorio de Coto Vicario.. El martillo muestra la

jo de lavas básicas, y en la pared de la derecha so bre volcanitas ácidas-in- termedias (Volcanismo pri mero)..9.

La mena se compone esencialmente de pirita, siendo los demás minerales -especialmente galena y blenda- escasos; entre estos, calcopirita es relativamente frecuente (en cristales

Dolomías, margas dolomíticas y calizas de Santo Domingo de Silos... F-10.- Margo-calizas del Paleógeno en las proximidades de Burgo de