Econometria
2. Modelo de Regresión Lineal Simple Prof. Ma. Isabel Santana
FRP Y FRM
• La diferencia entre los Yi poblacionales y los Y^ estimados es lo que llamaremos residuos
EStimación de β
1y β
2• El objetivo es determinar la FRM de tal manera que esté lo más cerca posible a la Y observada.
• Una posibilidad sería minimizar la sumatoria de los residuos
• Sin embargo, este método no es factible ya que da el mismo peso a todos los residuos sin considerar qué tan cerca o qué tan dispersas están las observaciones de la FRM.
ˆi Yi Yˆi
EStimación de β
1y β
2• Esto se puede evitar adoptando el criterio de mínimos cuadrados
• Adicionalmente, este método posee propiedades estadísticas deseables (que veremos más adelante
ˆi2 Y i Yˆi 2
ˆi2 Yi ˆ1 ˆ2X i 2
ˆ1, ˆ2
ˆ2
i f
Derivación
i2 Yi 1 2X i
min ˆ ˆ ˆ 2
ˆ 0 ˆ
1 2
i
ˆ 0 ˆ
2 2
i
ˆ 0 ˆ
2 1
2 2
i
ˆ 0 ˆ
2 2
2 2
i
CNPO
CNSO
ˆ ˆ 1 0
ˆ 2 ˆ
2 1 1
2
i i
i Y X
ˆ1 ˆ2 0
Yi Xi
Yi ˆ11ˆ2 Xi 0
1
2 ˆ
ˆ
i
i X
Y
1
2 ˆ
ˆ
n X n
Yi i
Resolviendo para :ˆ1
(1)
Derivación
ˆ ˆ 1 0
ˆ 2 ˆ
2 1 2
2
i i i
i Y X X
ˆ 0
ˆ 2
1 2
YiXi Xi Xi
ˆ2 ˆ2 2 0
YiXi Y X Xi Xi
ˆ 0
ˆ 2
2 2
YiXi Y Xi X Xi Xi
YiXi Y Xinn ˆ2 Xi2 ˆ2X Xinn
2 2 2
2 ˆ
ˆ X n X
X Y n X
Yi i i
2 2
ˆ2 X nX X
Y n X
Yi i i
2 2
2 ˆ
X n X
X Y n X
Y
i i i
Resolviendo para :ˆ2 (2)
Sustituyendo ˆ1Y ˆ2X
Derivación
1 0
2 ˆ ˆ
ˆ
1
2
i
i
ˆi 0
1 0
2 ˆ ˆ
ˆ
2
2
i i
i X
(1) También es igual a:
ˆiXi 0
(2) También se puede expresar como:
Ejemplo
• Supongamos que conocemos los datos de producción y horas trabajadas dee 10 trabajadores de una fábrica en un momento de tiempo (corte transversal).
• Definimos Y= producto, X= horas de trabajo.
Ejemplo
8 X
6 .
9 Y
i i
i X u
Y ˆ ˆ ˆ
2
1
2 2 2
ˆ X nX
X Y n X Y
i i
i
X Y 2
1 ˆ
ˆ
X X
Yˆi ˆ ˆ i 3.6 0.75
2
1
75 . 8 0
10 688
6 . 9 8 10 ˆ 789
2 2
ˆ 8 6
. ˆ 9
2
1
6 . 3 8 75 . 0 6 . ˆ 9
1
MICO expresado en desvíos
• Existe otra manera de representar ˆ2 X
X xi i
Y Y
yi i
2
ˆ2
i i i
x y
x
Si Las variables en minisculas
representan desvios respecto a la media de la variable
Entonces:
Propiedades de la regresión MICO
1. Pasa a través de las medias muestrales de Y y X.
ˆ 0
i
i i
i X u
Y ˆ ˆ ˆ
2
1
Yi ˆ1 ˆ2 Xi uˆi
n n
X n
n n
Yi ˆ ˆ2 i 0
1
X Y ˆ1 ˆ2
X Y
FRM
i
i X
Yˆ ˆ1ˆ2
X Y
Propiedades de la regresión MICO
2. El valor promedio del Y estimado= , es igual al valor medio del Y real para:
Yˆ
i
i X
Yˆ ˆ1 ˆ2
i
i Y X X
Yˆ ˆ2 ˆ2
X X
Y
Yˆi ˆ2 i
Yˆi nY ˆ2 Xi nˆ2X
n X n n
X n
Y n n
Yˆi ˆ2 i ˆ2
X X
Y
Yˆ ˆ2 ˆ2 Y
Yˆ
Propiedades de la regresión MICO
3. El valor de la media de los residuos es ceroˆi
CNPO ˆˆ 2 ˆ1 ˆ2 1 0
1 2
i i
i Y X
Dado que uˆi Yi ˆ1ˆ2Xi
2 ˆi 0 ˆi 0
i i
i X u
Y ˆ ˆ ˆ
2
1
Yi nˆ1ˆ2 Xi uˆi
Yi nˆ1 ˆ2 Xi
X Y ˆ1 ˆ2
i i
i Y X X
Y ˆ ˆ
2
x
y ˆ ˆ
La regresión muestral puede ser expresada como desviaciones de Y y X.
Dividiendo por n
ˆi 0
*
**
Restando ** de *
Propiedades de la regresión MICO
4. Los residuos no están correlacionados con el valor predicho de Yi, lo cual puede ser verificado utilizando la forma de desviación.
ˆi
i i i
i x
y ˆ ˆ2 ˆ
i i
i i
i x y x
y ˆ ˆ2 ˆ2
yiˆi ˆ2 xiyi ˆ22 xi2 ˆ2 xxiiy2i
yiˆi ˆ22 xi2 ˆ22 xi2
ˆ 0
yii
5. Los residuos no están correlacionados con Xˆi i. Esto es:
ˆ 0
ixi
1. El modelo de regresión es lineal en los parámetros 2. Los valores de X son fijos en muestreo repetido 3. El valor medio de es igual a cero.
4. Homocedasticidad o igual varianza de . 5. No autocorrelación entre los .
6. La covarianza entre y Xi es cero.
7. El número de observaciones debe ser mayor que el de parámetros
8. Variabilidad en los valores de X.
9. El modelo de regresión está correctamente especificado
10. No hay multicolinealidad perfecta
Supuestos Clásicos de los MICO
ˆi i / Xi 0
ˆi vari/ Xi s2
ˆi covi,j 0
ˆi
ˆi covi,Xj0
Supuestos Clásicos de los MICO
1. El modelo de regresión es lineal en los parámetros
2. Los valores de X son fijos en muestreo repetido
– Supone que las variables X no son aleatorias
– Es posible mantener fijo el valor de X, y repetir el experimento, obteniendo en cada observación un valor de la variable distinto aleatoria Y.
– El análisis de regresión es un análisis de regresión condicional, es decir, condicionado a los valores dados de los regresores X.
Supuestos Clásicos de los MICO
3. El valor medio de es igual a cero.
– Los residuos no son más que las desviaciones de la muestra aleatoria con respecto a la FRP.
– Los factores que no están incluidos en el modelo, no afectan sistemáticamente el valor esperado de Y.
– Los valores positivos de se cancelan con los valores negativos, de tal manera que su efecto promedio sobre Y es cero.
–
ˆi
ˆi
Y X X
E / 12
Supuestos Clásicos de los MICO
4. Homocedasticidad o igual varianza de .
– La variación alrededor de la recta de regresión es la misma para los valores de X, es decir, las perturbaciones se distribuyen con igual dispersión respecto a la media.
– y dado el supuesto 2 es equivalente a
i 2 E i E i 2
V
ˆi
/ 2
var i Xi s
i2 2
E
Homocedasticidad
Heterocestadisticidad
Supuestos Clásicos de los MICO
5. No autocorrelación entre los .
- No existe tendencia de que los errores asociados a una observación estén relacionados a los errores de otra.
- Si en un momento de tiempo o en un individuo de la muestra se genera un error positivo, esto no nos da información alguna sobre si el próximo error será positivo o negativo.
- Los errores no tienen un patrón de comportamiento sistemático.
- Si y están correlacionados, Yt no sólo depende de Xt, sino también de .
ˆt
ˆi covi,j 0
ˆ
ˆt1
Supuestos Clásicos de los MICO
Supuestos Clásicos de los MICO
Supuestos Clásicos de los MICO
6. La covarianza entre y Xi es cero.
– Si hay correlación, no es posible saber como afecta individualmente y a la variable Yi.
– Este supuesto se cumple inmediatamente si X no es una variable aleatoria (sino que es fija).
7. El número de observaciones debe ser mayor que el de parámetros
ˆi
ˆi covi, X j 0
Xi
Supuestos Clásicos de los MICO
8. Variabilidad en los valores de X.
– El modelo de MCO requiere que exista una dispersión entre las X para poder calcular los valores de los coeficientes, pues si no, éstos serían una cantidad infinita.
– Ejemplo.
2 2
ˆ
i i i
x y
x
2 0
xi
X Xi Si todos los valores de X son
idénticos, entonces Por lo cual
Y entonces,
Supuestos Clásicos de los MICO
9. El modelo de regresión está correctamente especificado
– La forma de la FRM es igual a la FRP
– El modelo posee las variables correctas: no se incluyen variables irrelevante ni se excluyen relevantes.
– La forma funcional es la correcta
10. No hay multicolinealidad perfecta
– No hay una relación perfectamente lineal entre las X