73
CAPÍTULO 4
ESTIMACIÓN DE
MODELOS ECONÓMICOS
N
uestra primera tarea consiste en estimar la funciónde regresión poblacional (FRP) con base en la función de regresión muestral (FRM) de la forma más precisa posible. Para ello existen varios modos de calcular la FRM, pero el más utilizado es el método de mínimos cuadrados ordinarios MCO (en lo que respecta al análisis de regresión); así mismo, se recuerda que el método de MCO nos permitirá analizar únicamente modelos lineales uniecuacionales y es preciso para el objetivo del presente texto.
4.1 Estimación de parámetros por MCO
El método de MCO se atribuye a Carl Friedrich Gauss, matemático alemán. Bajo ciertos supuestos que se estudiarán, tiene propiedades estadísticas muy atractivas:
Recordando la FRP Yi =β1+β2X2i+ui (5)
no podemos observarla directamente; esta función debe de ser estimada a partir de la FRM
Curso Básico de Econometría Clásica
74
i i i X u Y =βˆ1+βˆ2 + ˆ (6) i i i Y u Y = ˆ+ˆ (4.1)donde
Y
ˆ
i es el valor estimado de (media condicional) de Yi. Sin embargo ¿cómo se determina en sí misma la FRM?Por tanto, (4.1) se expresa como reemplazamos; i i i i i X Y Y Y u 2 1 ˆ ˆ ˆ ˆ β β − − = − = recordando (3), reemplazamos: (4.2)
que refleja que los residuos (uˆi) son simplemente las diferencias entre los valores observados y los estimados de Yi.
De esta forma se fija el criterio de seleccionar la FRM de tal
manera que la suma de los residuos sea la menor posible Σuˆi. Este criterio no es muy eficiente a pesar de ser atractivo; véase
la imagen 8. Imagen 8 Y X X1 X2 X3 X4 X5 X6 FRM Û1 Û 3 Û4 Û5 Û6 Û2 Yi
Al adoptar el criterio de minimizar Σuˆi, la imagen 8 muestra que los residuales uˆ2, uˆ3, uˆ4,uˆ5al igual que los residuales uˆ1 y
6 ˆ
u , reciben el mismo peso en la suma (uˆ1+uˆ2 +uˆ3+uˆ4 +uˆ5+uˆ6) aunque los cuatro primeros están mucho más cerca de la FRM que los dos últimos.
75
Es decir que a todos los residuos se les da el mismo peso sin importar que tan lejos o cerca se encuentren las observaciones de la FRM. Pudiera presentarse que la suma total de residuos sea cero11 a pesar de que lasi
uˆ se encuentran dispersas alrededor de la FRM.
Por tanto, podemos evitar este problema si utilizamos el método de MCO, que establece que la FRM puede determinarse en forma tal que sea lo más pequeña posible, donde 2
ˆ
iu
son los residuos elevados al cuadrado. De este modo, a los residuales más lejanos se les da más peso y la situación que se presenta en el ejemplo anterior con u1 y u6, en los que en la minimización de la Σuˆilos uˆi, sin importar su grado de dispersión la suma es pequeña, en el proceso de MCO no podría presentarse; es más, a mayor uˆi, mayor será la Σuˆi.Se parte de un modelo: Y en forma matricial:
u
X
Y
=
β
ˆ
+
ˆ
Es decir: Y1 1 X12 X13 … Xk1β
ˆ
1 uˆ1 Y2 1 X22 X23 … Xk2β
ˆ
2 uˆ1 Y3 = 1 X32 X33 … Xk3 xβ
ˆ
3 + uˆ1 : : : : : : : : Yn 1 X2n X3n … Xknβ
ˆ
k uˆ1 Ynx1 nxk Kxn nx111 Si asumiéramos que û1 + û2 + û3 + û4 + û5 + û6 tienen los valores de 8, -3,
+2, -2, +3 y -8, respectivamente, la suma de estos residuos sería cero a pesar
de que se encuentran dos residuos con mayor grado de dispersión alrededor de la FRM. i ki k i i i
X
X
X
u
Y
=
β
ˆ
1+
β
ˆ
2 2+
β
ˆ
3 3+
...
+
β
ˆ
+
ˆ
Curso Básico de Econometría Clásica
76
)
ˆ
ˆ
(
ˆ
2u
u
Minimizar
u
Minimizar
errores
los
reducir
es
busca
se
que
lo
′
=
∑
[
]
=
+
+
+
+
=
∑
∗
=
2 2 2` 3 2 2 2 1 3 2 1 3 2 1ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
'
ˆ
u
u
u
u
u
u
u
u
u
u
u
u
u
u
u
n n n
Y partimos de que Y =Xβˆ+uˆ βˆ ˆ ˆ u Y X u despejamos si → = −[
] [
]
(
)
[
β
] [
β
]
[
β
][
β
]
β
β
ˆ ˆ min ˆ ˆ min , ˆ ˆ min ) ˆ ' ˆ ( min ˆ2 X Y X Y X Y X Y tenemos B A B A d propiededa la recordando X Y X Y u u u Minimizar Al − ′ ′ − ′ = − ′ − ′ + ′ = ′ + − ′ − = =∑
desarrollamos el producto multiplicando término a término
[
]
[
]
[
β
β
β
]
β
β
β
β
β
β
ˆ ˆ ˆ 2 min ˆ ˆ ˆ ˆ ˆ ˆ min X X X Y Y Y Y X escalar X Y como X X Y X X Y Y Y ′ ′ + ′ − ′ ⇒ ′ ′ = = ′ ′ ′ + ′ ′ − ′ − ′ β β β β β ˆ 2 2 ˆ ) ˆ ˆ ˆ 2 ( min X X Y X X X X Y Y Y betas los a respecto derivamos imizar Para ′ + ′ − = ∂ ′ ′ + ′ − ′ ∂ Y X es a y a a donde = ′ ∂ ′ ∂ β β ˆ ˆ β β β β ˆ 2 ˆ ˆ ˆ a a = ∂ ′ ∂β
β
ˆ
´
ˆ
Despejamos
X
X
Y
X
′
=
′
⇒
77
por tanto, multiplicamos por la inversa a ambos lados para reducir términos, β β ˆ ) ' ( ˆ ) ' ( ) ' ( 1 1 1 I Y X X X X X X X Y X X X = ′ ′ = ′ − − −(
X
′
X
)
X
′
Y
=
⇒
β
ˆ
−1 (4.3)4.2 Propiedades de los estimadores de los
parámetros
• Son lineales(
)
1 1 1ˆ
ˆ
nx kxn kxA
Y
Y
X
X
X
=
′
′
=
⇒
−β
β
• Son insesgados E(β =ˆ) β• Tienen varianza mínima (4.4) Recordando la ecuación (4.3) βˆ=
(
X′X)
−1X′Y Si sustituimos YY
=
X
β
+
u
(4) tenemosβ
ˆ
=
(
X
′
X
)
−1X
′
(
X
β
+
u
)
(
)
(
)
(
XX)
XX I recordando u X X X X X X X = ′ ′ ′ + ′ ′ = − − − 1 1 1 ' ˆ β β(
)
(
X
X
)
X
u
u
X
X
X
I
'
ˆ
'
ˆ
1 1 − −′
=
−
′
+
=
β
β
β
β
donde
I
β
=
β
Por la propiedad de insesgamiento:
donde, (X´X)-1 X´X = 1
Curso Básico de Econometría Clásica
78
(
)(
)
[
]
(
)
(
)
[
]
(
)
(
)
[
1 1]
1 1 ' ' )' ' )( ' ( ' ˆ ˆ − − − − ′ ′ = ′ ′ = − − = X X X uu X X X E u X X X u X X X E E β β β β bajoel uestoE uu uI 2 ) ' ( sup =σ(
)
(
)
(
)
1 2 1 2 1 ) ' ( − − − ′ = ′ ′ = X X I X X X X X X u u σ σ 1 2( ) ) ˆ ( = X′X − Cov β σµ (4.4) k n y x y y k n u k n u u halla se la donde i u u − ′ ′ − ′ = − Σ = − ′ = β σ σ ˆ ˆ ˆ ˆ : 2 2 2 (4.5)4.3 Coeficiente de determinación
• Mide en qué porcentaje las variables exógenas explican la variación de la endógena. • Descomposición de la varianza
∑
∑
∑
=
+
n i n i n iy
y
1 2 1 2 1 2ˆ
ˆ
µ
(4.6) • STC=SEC+SRC CUADRADO AL RESIDUALES DE SUMA Y Y CUADRADOS DE EXPLICADA SUMA Y Y y CUADRADOS DE TOTAL SUMA Y Y y i i n i i n i n i i = − = = − = = − =∑
∑
∑
∑
∑
∑
2 1 2 2 1 2 1 2 2 ) ˆ ( ˆ ) ˆ ( ˆ ) ( µ (4.7) (4.8) (4.9)(
)
(
)
(
)
1 2(
)
1 1 1 ) ( ' ) ' ( ' − − − − ′ ′ = ′ ′ = X X X I X X X X X X uu E X X X u σ79
4.3.1 Si el modelo tiene término independiente el R
2se calcula:
1
0
)
(
)
ˆ
(
2 2 2 2<
<
−
−
=
=
∑
∑
R
Y
Y
Y
Y
STC
SEC
R
i i (4.10) en cualquier caso∑
∑
−
−
=
−
=
⇒
+
=
2 2 2 2)
(
ˆ
1
1
1
Y
Y
STC
SRC
R
STC
SRC
R
i iµ
(4.11) En su expresión matricial: (4.12) (4.13)(4.14)
4.3.2 Coeficiente de determinación ajustado
) 1 ( 1 1 1 1 ~ 2 2 R k n n n STC k n SRC R − − − − = − − − = (4.15)
4.4 Coeficiente de correlación simple y parcial
4.4.1 Coeficiente de correlación simple: mide el
grado de asociación lineal entre X y Y
1 1 2 2 2 = − < < =∑ ∑
∑
xy i i i i xy r y x y x R r (4.16)Curso Básico de Econometría Clásica
80
4.4.2 Coeficiente de correlación parcial
∑ ∑
∑
= 2 2 2 1 2 1 .... ,3,4, 2 u u u u r k x x x yx (4.17)4.5 Estimación por intervalos
α
β
β
β
β
β
α α
=
−
+
≤
≤
−
(
ˆ
)
ˆ
(
ˆ
)
1
ˆ
2 2 i i i i it
ee
t
ee
P
(4.18)4.6 Contrastes de significancia estadística de
parámetros
Tipo de
hipótesis
H
0H
I Decisión GráficosDos colas
β =
iβ
i0β ≠
iβ
i0/
t
/
>
t
α/2 1 Cola izquierdaβ ≥
iβ
i0β <
iβ
i0t
<
−
t
α 2 Cola derechaβ ≤
iβ
i0β >
iβ
i0t
>
t
α 3 Imagen 9 ZONA DE ACEPTACIÓN Ho4.7 Contrastes de significancia
• Se tiene el modelo: i i i i i ix
x
x
x
u
Y
=
β
1+
β
2 2+
β
3 3+
β
4 4+
β
5 5+
81
4.7.1 Contraste de significancia individual
0 0 0 ≠ = = = i i i H H β β (4.19)
4.7.2 Contraste de significancia global
0 ... : 2 3 0 = = k = H β β β)
,
1
(
/
)
1
/(
k
n
k
F
k
n
SRC
k
SEC
F
→
−
−
−
−
=
(4.20)4.7.3 Contraste de significancia para un
subconjunto de parámetros
3 , 2 0 : 0 : 2 3 = ≠ = = i un menos al H H i i o β β β * 5 5 4 4 1 x x SCR Yi=β +β +β →4.7.4 Modelo restringido
(4.21) Donde k1 es el número de parámetros de Ho4.8 Test de hipótesis para un conjunto de
restricciones lineales
Se definen las matrices R de tamaño j x k donde j es el número de restricciones lineales y un vector r de tamaño (jx1).
R contiene los coeficientes de cada una de las restricciones
lineales y r los valores a los que son iguales estas restricciones.
r R H r R H i i ≠ = β β : : 0
(
)
[
(
)
] (
)
F(
J n k)
J r R R X X R r R F U − → − ′ ′ ′ − = − − , ˆ ˆ 2 1 1 σ β β ) ˆ ( ˆ i i i k n ee t β β β − = −Curso Básico de Econometría Clásica
82
4.9 Predicción
Después de la estimación de los parámetros y de hacer análisis estructural, el uso más habitual de la regresión consiste en la predicción.
[
]
( )
(
(
)
)
( )
1 2 / 1 1 1 1 2 1 1 1 1 1 3 1 2 1 1 1 1 1 3 3 1 2 2 1 1 ˆ 1 ˆ ) ˆ var( intervalo por prediccion ... 1 ˆ ˆ ˆ .... ˆ ˆ ˆ ˆ + + + + − + + + + + + + + + + + + + + ± ′ ′ + = = − ≡ = + + + + = t t t t t t t t k t t t t t t k k t t t e DS t Y X X X X e Var Y Y X X X X donde puntual prediccion X Y X X X Y ασ
β
β
β
β
β
4.10 Contraste de hipótesis estructurales del
modelo
• Muestras pequeñas • Cambio estructural • Especificación errónea • Multicolinealidad4.10.1 Muestras pequeñas
Para que el modelo tenga solución se exige que el número de datos (observaciones) sea superior al número de parámetros del modelo (n>k).
Para efectos operativos se necesita un mínimo de alrededor de 15 datos para tener alguna garantía en la estimación de 3 o 4 parámetros.
83
4.10.2 Cambio estructural
Una de las hipótesis estructurales del modelo es la constancia de los parámetros del modelo de regresión durante todo el periodo de observación y que se mantiene para el horizonte de predicción. Cuando esta condición no se cumple se dice que el modelo sufre de cambio estructural.
4.10.2.1 Cómo detectar el cambio estructural
Para detectarlo se aplica el test de Chow (pasos) 1. Estimar
Y
=
X
β
ˆ
+
µ
ˆ
y obtener SRC 2. Estimar *=
*β
ˆ
*+
µ
ˆ
*X
Y
y obtener SRC* 3. Estimar ** ** ** **ˆ
ˆ
µ
β
+
=
X
Y
y obtener SRC** 4. Obtener F calculado(
(
)
)
(
SRC SRC)
n k k SRC SRC SRC F 2 / / * * * * * * − + + − = (4.21)5. Hacer el Contraste F calculado contra F Tabulado con K y n-2k gl bajo la hipótesis
Ho: B=B*=B**(no hay cambio estructural)
4.10.2.2 Para solucionar el cambio estructural
• Aplicar regresiones cambiantes a cada submuestra • Readaptar el modelo básico de regresión
• Incluir una variable ficticia en la regresión
pendientes
afecta
U
X
D
X
Y
intercepto
afecta
U
X
D
Y
t t t t t t t t+
+
+
=
+
+
+
=
* * *ˆ
ˆ
α
β
µ
β
α
µ
Curso Básico de Econometría Clásica
84
4.10.3 Especificación errónea
Cuando se plantea un modelo se supone especificación
correcta, pero esto es difícil de cumplir bien porque: • La forma funcional no es la correcta
• Por omisión de variables relevantes • Por incluir variables no relevantes
4.10.4 Multicolinealidad -MC
4.10.4.1 MC exacta
Es cuando existe una relación exacta entre variables exógenas. En este caso el determinante de X’X es igual a cero, no se puede hallar la inversa (X’X)-1 y por tanto no se pueden
estimar los parámetros (β).
4.10.4.2 MC aproximada
Es cuando existe una relación aproximada entre variables exógenas. En este caso el determinante de X’X es cercano a cero; esto hace que los estimadores se distorsionen.
Imagen 10 X2 X 3 Y X2 X3 Y No existe Colinealidad Gráfico de Ballentine de Multicolinealidad Baja colinealidad
Colinealidad alta Colinealidad muy alta Colinealidad moderada X2 X3 Y X2 X3 Y X2 X3 Y MULTICOLINEALIDAD
85
4.10.4.3 Cómo detectar la multicolinealidad
• A partir de las consecuencias
• Calcular los coeficientes de correlación simple- rxy entre variables exógenas y destacar aquellos casos en que rxy > 0.9
• Hacer regresiones auxiliares entre las variables exógenas del modelo y destacar aquellos casos en los cuales el R² de
la regresión auxiliar es mayor al R² del modelo original.
4.10.4.4
Tratamiento de variables ficticias o
variables dummy
• Las variables dummy son aquellas que reciben los valores 1 y 0; se utilizan cuando en los modelos existen variables que
no son directamente cuantificables y que son importantes
para explicar la variable endógena.
Ejemplo:
1. El estrato socioeconómico 2. La época del año
Ejemplo:
u D D D D Exp Salario=β1+β2 +β3 1+β4 2+β5 3+β6 4+Se debe tener cuidado al incluir las dummy porque se puede
caer en la trampa de las variables ficticias; multicolinealidad m, m-1,
1 7 1 0 0 0 1 10 0 0 1 0 1 25 0 1 0 0 1 20 0 0 0 1 1 18 1 0 0 0 1 16 0 0 1 0 1 10 0 1 0 0
Curso Básico de Econometría Clásica
86
categoria. una eliminar debe se tanto, por . intercepto del columna la a igual es Dummys las de suma la categorias m tiene se Si −
.
,
primaria
de
Dummy
la
educacion
ejemplo
Por
Al eliminar la dummy de primaria D1, todo se referencia a primaria
u
D
D
D
Exp
Salario
=
500
+
52
+
12
2+
20
3+
50
4+
D2→El individuo de secundaria gana $ 12.000 más que el
de primaria.
4.11 Contraste de hipótesis sobre la
perturbación aleatoria
Heterocedasticidad y autocorrelación
4.11.1 Heterocedasticidad
La varianza de los errores no es constante a lo largo de la muestra
}
n i iX
para
i
n
U
U
X
U
VAR
(
|
)
=
σ
µ2=
1
...
Ε
(
′
|
)
=
σ
µ2Ω
4.11.1.1 Cómo detectar la heteroscedasticidad
• Gráfico
• Prueba de Park • Prueba de Glejser
• Prueba de Goldfeld y Quandt • Prueba de White
87
4.11.1.2 Posibles soluciones de la heteroscedasticidad
• Aplicar mínimos cuadrados generalizados -MCG Y X X X MCG 1 1 1 ) ( ˆ = ′Ω− − ′Ω− β
• Transformar el modelo por la matriz P y aplicar MCO Y*=PY
X*=PX el nuevo modelo será Y* = X*B+U*
Donde la matriz P lleva en la diagonal los elementos de la variable con la cual es proporcional la heterocedasticidad y el resto son cero.
4.11.2 Autocorrelación
Existe relación entre los errores de un periodo con los de otro.
}
n i t tU parai UU X U COV( −)≠0 ≠0 Ε( ′| )=σµ2Ω4.11.2.1 Cómo detectar la autocorrelación
• Gráfico • Durbin Watson • h de Durbin • Box Pierce • Ljung Box • Test de Wallis • Prueba de rachas
Curso Básico de Econometría Clásica
88
4.11.2.2 Método de Durbin Watson
Se utiliza para detectar AR(1)
(
)
∑
∑
= = −−
=
n t t n t t tU
U
U
d
1 2 2 2 1ˆ
ˆ
ˆ
(4.22)Definida como la razón de la suma de las diferencias al
cuadrado de residuales sucesivos sobre la SRC. Supuestos en los cuales se basa:
• El modelo de regresión incluye intercepto
• Las variables explicativas X, son fijas en muestreos repetidos
• Los errores se generan mediante un proceso AR(1) es decir que ut=ρ ut-1 +εt
• El modelo no incluye valores rezagados de la variable dependiente
• Dada la definición, es posible llegar a demostrar que
)
ˆ
1
(
2
−
ρ
≈
d
pero como: -1 < ρ < 1, entonces 0 < d < 4. Reglas de decisión: • Si 0<d<dl AR (1) positiva • Si du<d<4-du no AR(1) • Si 4-dl<d<4 AR(1) negativa89
Imagen 11. Durbin Watsond
2 0 dL dU 4dU 4dL 4 Rechácese Ho Evidencia de autocorrelación positivaSin embargo, la prueba d tiene como desventaja que cuando cae en la zona de indecisión o región de ignorancia no se puede concluir la existencia de autocorrelación.
Zona de indecisión No se rechace Hou H*o, o ambas. Zona de indecisión Rechácese H*o Evidencia de autocorrelación negativa
4.11.2.3 Posibles soluciones para la autocorrelación
• Ensayar nuevas variables explicativas o reconsiderar la forma funcional del modelo.
• Aplicar MCG o transformar el modelo utilizando la matriz
P. Tanto Ω como P son matrices que dependen de ρ.
4.11.3 No normalidad
• El supuesto es que los residuos se distribuyen normalmente. • Cuando no se cumple esta condición, las pruebas de inferencia
estadística pierden confiabilidad.
• Las principales pruebas para detectarla son la de Jarque Bera y Shapiro Wilk.
Curso Básico de Econometría Clásica
90
Taller
121. La siguiente información es una muestra de 7 industrias de refrescos, donde K es el número de máquinas utilizadas en el proceso, L es el número de trabajadores y Q el número de unidades producidas (todo expresado en logaritmos).
K L Q 2,08 3,14 4,66 2,2 2,64 4,4 1,39 3,64 4,29 0,69 4,57 4,05 1,79 2,4 4,2 1,79 3,76 4,59 1,1 4,53 4,41 Sumas 11,04 24,68 30,6 promedios 1,57714286 3,52571429 4,37142857 1
)
(
X
′
X
− 27,1065029 -6,9220181 -4,55131445 -6,9220181 1,98670246 1,07459204 -4,55131445 1,07459204 0,81019874 a. Interprete B2 y B3.b. Calcule R² y R² ajustado e interprete.
c. Establezca intervalos de confianza y pruebas de significancia
para B2 y B3 e interprete.
d. Realice la prueba de significancia global e interprete.
e. Pruebe la hipótesis de que estas industrias poseen una función de producción Cobb Douglas con rendimientos constantes a escala.
91
Solución
3 2 3 2 1 β ββ
X X Yi =ln
Y
i=
β
0+
β
2ln
X
2+
β
3ln
X
3 dondeβ =
0ln
β
1Recordando la ecuación (4.3) para estimar los betas
(
X′X)
X′Y= −1
ˆ
β y que ya poseemos la matriz inversa 1
)
(
X
′
X
−tendríamos:
X =
La matriz X está compuesta por el intercepto; la columna de unos y por k y l, el número de máquinas utilizadas en el proceso y por el número de trabajadores requeridos respectivamente.
1 2,08 3,14 1 2,2 2,64 1 1,39 3,64 1 0,69 4,57 1 1,79 2,4 1 1,79 3,76 1 1,1 4,53
Por tanto se halla la X’ = por las ropiedades de la transpuesta
(donde las filas se transforman en columnas)
1 1 1 1 1 1 1
2,08 2,2 1,39 0,69 1,79 1,79 1,1 3,14 2,6 3,64 4,57 2,4 3,76 4,53
3x7
X’Y = X’ multiplicada por Y (el número de unidades producidas)
X’ Y X’Y
1 1 1 1 1 1 1 4,66 30,6
2,08 2,2 1,39 0,69 1,79 1,79 1,1 X 4,4 = 48,7155
3,14 2,6 3,64 4,57 2,4 3,76 4,53 4,29 107,6882
3x7 4,05 3x1
Recordemos que la multiplicación se realiza término a término,
fila por columna.
4,2 4,59 4,41
7x1
Curso Básico de Econometría Clásica
92
(1x4,66)+(1x4,4)+(1x4,29)+(1x4,05)+(1x4,2)+(1x4,59)+ (1x4,41) = 30,6 y así sucesivamente(
X′X)
X′Y = −1 ˆ β (X’X)-1 X’Y 27,1065029 -6,9220181 -4,55131445 30,6 2,1266 -6,9220181 1,98670246 1,07459204 X 48,7155 = 0,6903 -4,55131445 1,07459204 0,81019874 107,6882 0,3279 3x3 3x1 3x1 a. Interpretación de la regresión 2 1 0,3279 6903 , 0 1266 , 2 ˆ X X Y = + +B2: según los resultados del coeficiente de elasticidad del
capital de 0,6903, por cada incremento del 1% de maquinaria utilizada en el proceso, el producto (medido en unidades de refrescos producidos) se eleva en promedio cerca del 0,69%, manteniendo el número de trabajadores constante. B3: nos indica que con un incremento del 1% en el número de trabajadores (teniendo en cuenta los resultados del
coeficiente de elasticidad de trabajo de 0,3279), el número
de unidades producidas se eleva en promedio cerca del 0,33%, manteniendo constantes el número de máquinas utilizadas en el proceso.
b. Recordando la ecuación (4.10) y así mismo la ecuación
(4.15)
STC
SEC
R
2=
)
1
(
1
1
1
1
~
2 2R
k
n
n
n
STC
k
n
SRC
R
−
−
−
−
=
−
−
−
=
Para hallar el R² y el R² ajustado debemos hallar la STC, la
SEC y la SRC, ecuaciones 4,12, 4,13 y 4,23 respectivamente: 2
ˆXY nY
93
X’Y n (-) 2,1266 0,6903 0,3279 x 30,6 = 134,01323 - (7 x 19,1094) = 1x3 48,7155 (134,0132 - 133,7658) 0,247514 107,6882 SEC 3x1Transponemos los betas
2
Y
n
Y
Y
STC
=
′
−
(4.12) Y’Y Y 4,66 4,4 4,29 4,05 4,2 4,59 4,41 X 4,66 = 134,0384 - (7 x 19,1094) = 1x7 4,4 (134,0384 - 133,7658) = 4,29 0,272684 4,05 STC 4,2 4,59 4,41 7x1 Transponemos YSTC = SEC + SRC despejando la SRC tenemos: STC - SEC = SRC Y X Y Y Y n Y X Y n Y Y ′ ′ − = − ′ ′ − − ′ β β ˆ ' ˆ 2 2 (4.23) 0,272684 – 0,247514 = 0,02377565 SRC Ahora sí:
STC
SEC
R
2=
R
2=
0
0
,
,
272684
247514
=
0
,
907695
(4.10)Curso Básico de Econometría Clásica
94
Como el modelo tiene término independiente su:
1 1 ~2 − − − = n STC k n SRC R 869213 , 0 1 7 272684 , 0 3 7 02377565 , 0 1 ~2 = − − − = R (4.15)
El coeficiente de determinación R² nos muestra qué tanto se
ajusta la línea de regresión a los datos; el R² = 0,9076 nos dice
que aproximadamente el 91% de la variación de las unidades producidas en las 7 industrias de refrescos está explicada por las variables número de máquinas y número de trabajadores. Si se tiene en cuenta que el R² se encuentra entre 0 y 1 (0 < R²
<1), esta variación es bastante aceptable.
c. Prueba de significancia e intervalos de confianza para
B2 y B3
Para realizar las pruebas de hipótesis se requieren los errores estándar de los betas; por tanto, debemos hallar la matriz Var-Cov de los betas (ecuación 4,4), la cual como se vio en el capítulo introductorio de ÁLGEBRA matricial, posee en su diagonal las varianzas de los betas y la raíz cuadrada de cada uno de ellos. Recordando la ecuación:
son los errores estándar. 1 2( ) ) ˆ ( = ′ − −Cov XX Var β σµ (4.4) De la matriz 2 1 ) ( ) ˆ ( = ′ − −Cov XX
Var β σµ ya tenemos la matriz inversa,
pero se debe hallar la varianza de los residuales: k n SRC k n y x y y k n u k n u u i u − = − ′ ′ − ′ = − Σ = − ′ = β σ 2 ˆ ˆ ˆ2 ˆ (4.5) 7 3 0,005944 02377565 , 0 2 = − = u σ 1 ) (X′X − Var−Cov(βˆ)=σ2µ(X′X)−1 0,005944 x 27,1065029 -6,9220181 -4,55131445 0,16112105 -0,04114448 -0,02705301 -6,9220181 1,98670246 1,07459204 = -0,04114448 0,01180896 0,00638738 -4,55131445 1,07459204 0,81019874 -0,02705301 0,00638738 0,00481582 3x3 3x3
)
ˆ
(
ˆ
var
β
i=
ee
β
i95
) ˆ ( ˆ varβ =i ee βi 0,16112105=ee(βˆ1)=0,401399 0,01180896=ee(βˆ2)=0,1086682 0,00481582 =ee(βˆ3)=0,069396d. Prueba de significancia de los coeficientes de regresión. Una prueba de significancia es un procedimiento mediante el cual se utilizan los resultados muestrales para verificar la
verdad o falsedad de una hipótesis nula Ho. (4.19) Bajo el supuesto de normalidad tenemos:
) ˆ ( ˆ 2 2 2 β β β ee t = −
2
.
776
2
=
=
α
t
βˆ2= 0,69033233 α = 5% ee(βˆ2)= 0,1086682 gl = 4(buscar en la tabla t- anexo, el ejemplo)
Planteamos lo siguiente: 0 0 * 2 2 2 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.776 6,352662 -2.776
352662
,
6
1086682
,
0
69033233
,
0
=
=
t
Ho = se rechaza. B2 es estadísticamente significativo ya que
el valor estadísticamente de prueba cayó en la zona de rechazo. Para B3: ) ˆ ( ˆ 3 3 3 β β β ee t = −
2
.
776
2
=
=
α
t
βˆ3= 0,32791085 α = 5% ee(βˆ3)= 0,069396 gl = 4 Planteamos lo siguiente: 0 0 * 3 3 3 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.776 4,725213 2.776Curso Básico de Econometría Clásica
96
725213
,
4
069396
,
0
32791085
,
0
=
=
t
Ho = se rechaza. B3 es estadísticamente significativo ya que
el valor estadísticamente de prueba cayó en la zona de rechazo.
Intervalos de significancia:
[
βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )]
=1−α Pr 2 t /2ee 2 2 2 t /2ee 2 (4.18)776
,
2
2
=
=
α
t
βˆ2= 0,69033233 α = 5%ee
(
β
ˆ
2)
=
0,1086682 gl = 4 Planteamos: 2 2 2 2 0 ˆ ˆ β β β β ≠ = = = i H H[
(0,69033233) (2.776)*(0,1086682) (0,69033233) (2.776)*(0,1086682)]
95% Pr − ≤β
2 ≤ + =[
(0,69033233) (2.776)*(0,1086682) (0,69033233) (2.776)*(0,1086682)]
95% Pr − ≤β
2≤ + =991995
,
0
38869
,
0
≤
β
2≤
0,69033233Aceptamos la hipótesis nula.
Dado el coeficiente de confianza de 95% en el largo plazo,
en 95 de cada 100 casos, intervalos como (0,38869 - 0,991995) contendrán el verdadero valor de B2.
B3
[
βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )]
=1−α Pr 3 t /2ee 3 3 3 t /2ee 3776
,
2
2
=
=
α
t
βˆ3= 0,32791085 α = 5%=
)
ˆ
(
β
3ee
0,069396 gl = 497
Planteamos: 3 3 3 3 0 ˆ ˆ β β β β ≠ = = = i H H[
(
0
,
32791085
)
(
2
,
776
)
*
(
0
,
069396
)
(
0
,
32791085
)
(
2
,
776
)
*
(
0
,
069396
]
95
%
Pr
−
≤
β
3≤
+
=
[
(
0
,
32791085
)
(
2
,
776
)
*
(
0
,
069396
)
(
0
,
32791085
)
(
2
,
776
)
*
(
0
,
069396
]
95
%
Pr
−
≤
β
3≤
+
=
520554 , 0 135268 , 0 ≤β3≤ 0,32791085Aceptamos la hipótesis nula.
Dado el coeficiente de confianza del 95% en el largo plazo,
en 95 de cada 100 casos, intervalos como (0,135268 - 0,520554) contendrán el verdadero valor de B2.
Prueba de significancia de los parámetros en conjunto: ) /( ) 1 ( ) 1 /( / ) 1 /( 2 2 k n R k R k n SRC k SEC F − − − = − − = (4.20) reemplazamos:
837581
,
20
)
3
7
/(
)
9076
,
0
1
(
)
1
3
/(
9076
,
0
3
7
/
02377565
,
0
)
1
3
/(
247514
,
0
=
−
−
−
=
−
−
=
F
Bajo el supuesto de que los Ui →N(0,σu2) planteamos la
hipótesis nula: ZONA DE RECHAZO Ho ZONA DE ACEPTACIÓN Ho 6,94 20,837581 0 ; , : 0 : 3 2 3 2 ≠ = = i i o un menos al H H
β
β
β
β
β
Si el Fc > Ft, se debe rechazar la hipótesis nula. (buscar
en la tabla f- anexo, el ejemplo (6,94)
En nuestro caso el Fcalculado > Fen tablas siendo F(k-1, n-k) α
= 5% 1 - α = 95%
Curso Básico de Econometría Clásica
98
Ahora, en contraste con el valor p value del F obtenido, nos
permite rechazar la hipótesis nula por ser suficientemente bajo. 0
:β2=β3=
o H
2. Se tienen los resultados de la siguiente regresión: LINREG Y
# CONSTANT X1 X2
Dependent Variable Y - Estimation by Least Squares Annual Data From 1978:01 To 1992:01
Usable Observations 15 Degrees of Freedom 12 R**2 0.851461 R**2 ajustado 0.826705 Sum of Squared Residuals 411886.37547 F(2,12) 34.3935
Significance Level of F 0.00001074
Durbin-Watson Statistic 1.517636 Q(3-0) 5.679080
Significance Level of Q 0.12831149
Variable Coeff Std Error T-Stat Signif
1. Constant 523.7710 211.3178466 2.47859 0.02903281 2. X1 17.02586 2.1929287 7.76399 0.00000510 3. X2 -8.11345 2.1364034 -3.79772 0.00254035
Y = exportaciones de café (miles de dólares)
X1 = precio externo del café (centavos de dólar por libra) X2 = precio de otros suaves (centavos de dólar por libra) a. Interprete B2 y B3 y el R².
b. Haga la prueba de significancia y el intervalo de confianza
para B2 y B3; interprete t (alfa/2) = 2.179.
c. Haga la prueba de significancia de los parámetros en
conjunto e interprete. f. (2,12 alfa=5%) = 3.89
99
d. ¿Para qué se utiliza el estadístico q y que se puede concluir para el modelo planteado?e. Describa dos problemas o restricciones que tiene el estadístico Durbin-Watson (d).
f. Describa brevemente una solución a los problemas del Durbin Watson.
g. ¿Qué puede concluir a cerca de la AR(1) para el modelo planteado?
Solución
2 1 8,11345 02586 , 17 7710 , 523 ˆ X X Y = + −Matemáticamente B2 es la pendiente de la recta.
Económicamente B2 es el promedio de crecimiento de exportaciones del café durante el periodo 01-1978 a 01-1992.
a. Interpretación de la regresión
Si durante el periodo muestral X1, X2 hubiesen sido 0, el promedio de las exportaciones de café sería de US
$524.000.El coeficiente de regresión parcial 17,02586 significa que al mantener constante X2 (el precio de otros suaves), el crecimiento observado en las exportaciones de café durante el periodo 01-1978 a 01-1992 en promedio fue de 0,17%; de igual manera, al mantener constante el precio externo del café, el valor de -8,11345 implica que durante el mismo periodo de tiempo las exportaciones totales de café cayeron en aproximadamente 0,08%.
El coeficiente de determinación R² muestra qué tanto se ajusta la línea de regresión a los datos; el R² = 0,85 nos
dice que aproximadamente el 85% de la variación de las exportaciones totales de café durante el periodo 01-1978 a 01-1992 está explicada por las variables precio externo de café y precio de otros suaves. Si se tiene en cuenta que el R² se encuentra entre 0 y 1 (0 < R² <1), esta variación es
bastante aceptable.
b. Prueba de significancia e intervalos de confianza para
Curso Básico de Econometría Clásica
100
Prueba de significancia de los coeficientes de regresión. Una prueba de significancia es un procedimiento mediante el cual se utilizan los resultados muestrales para verificar la
verdad o falsedad de una hipótesis nula Ho. Bajo el supuesto de normalidad tenemos:
) ˆ ( ˆ 2 2 2 β β β ee t = −
2
.
179
2
=
=
α
t
βˆ2= 17.02586 α = 5%ee
(
β
ˆ
2)
=
2.1929287 gl = 12 Planteamos lo siguiente: 0 0 * 2 2 2 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.179 7.7640 -2.1797640
.
7
1929287
.
2
02586
.
17
=
=
t
Ho = se rechaza. B2 es estadísticamente significativo ya que
el valor estadísticamente de prueba cayó en la zona de rechazo. Para B3: ) ˆ ( ˆ 3 3 3 β β β ee t = −
2
.
179
2
=
=
α
t
3= ˆ β -8.11345 α = 5% ee(βˆ3)= 2.1364034 gl = 12 Planteamos lo siguiente: 0 0 * 3 3 3 0 ≠ = = = = β β β i H H ZONA DE ACEPTACIÓN Ho ZONA DE RECHAZO Ho ZONA DE RECHAZO Ho 2.179 -2.1797977
.
3
1364034
.
2
11345
.
8
=
−
−
=
t
Ho = se rechaza. B3 es estadísticamente significativo ya que
101
Intervalos de significancia:[
βˆ − α (βˆ )≤β ≤βˆ + α (βˆ )]
=1−α Pr 2 t /2ee 2 2 2 t /2ee 2179
.
2
2
=
=
α
t
βˆ2= 17.02586 α = 5% ee(βˆ2)= 2.1929287 gl = 12 Planteamos: 2 2 2 2 0 ˆ ˆ β β β β ≠ = = = i H H[
(
17
.
2586
)
(
2
.
179
)
*
(
2
.
1929287
)
(
17
.
2586
)
(
2
.
179
)
*
(
2
.
1929287
)
]
95
%
Pr
−
≤
β
2≤
+
=
[
(
17
.
2586
)
(
2
.
179
)
*
(
2
.
1929287
)
(
17
.
2586
)
(
2
.
179
)
*
(
2
.
1929287
)
]
95
%
Pr
−
≤
β
2≤
+
=
8043
.
21
2475
.
12
≤
β
2≤
17.2586Aceptamos la hipótesis nula.
Dado el coeficiente de confianza del 95% en el largo plazo,
en 95 de cada 100 casos, intervalos como (12.2475, 21.8043) contendrán el verdadero valor de B2.
B3
[
βˆ − α (βˆ)≤β ≤βˆ + α (βˆ)]
=1−α Pr 3 t /2ee 3 3 3 t /2ee 3179
.
2
2
=
=
α
t
βˆ3= -8.11345 α = 5% ee(βˆ3)= 2.1364034 gl = 12 Planteamos: 3 3 3 3 0 ˆ ˆ β β β β ≠ = = = i H H[
( 8.11345) (2.179)*(2.1364034) ( 8.11345) (2.179)*(2.1364034]
95% Pr − − ≤β3≤ − + =[
(
8
.
11345
)
(
2
.
179
)
*
(
2
.
1364034
)
(
8
.
11345
)
(
2
.
179
)
*
(
2
.
1364034
]
95
%
Pr
−
−
≤
β
3≤
−
+
=
8314
.
1
7687
.
12
≤
3≤
−
β
-8.11345Curso Básico de Econometría Clásica
102
Aceptamos la hipótesis nula.
Dado el coeficiente de confianza del 95% en el largo plazo,
en 95 de cada 100 casos, intervalos como (-12.7687, 1.8314) contendrán el verdadero valor de B3.
Prueba de significancia de los parámetros en conjunto ) /( ) 1 ( ) 1 /( / ) 1 /( 2 2 k n R k R k n SRC k SEC F − − − = − − = (4.20)
Bajo el supuesto de que los Ui→N(0,σu2) planteamos la
hipótesis nula:
0
;
,
:
0
:
3 2 3 2≠
=
=
i i oun
menos
al
H
H
β
β
β
β
β
ZONA DE RECHAZO Ho ZONA DE ACEPTACIÓN Ho 3,89 34,3934Si el Fc > Ft, se debe rechazar la hipótesis nula.
En nuestro caso el F calculado > F en tablas siendo F(k-1, n-k) = 5% 1 - = 95% 34,3934 > 3,89
Ahora, en contraste con el valor p value del F obtenido, nos permite rechazar la hipótesis nula Ho:β2 =β3=0 por ser suficientemente bajo.