Tema 3 Modelo de regresión lineal simple (I)

(1)

Tema 3

Modelo de regresión lineal simple (I)

3º de Economía

• El modelo de regresión lineal simple trata de capturar la relación entre

dos variables y, x.

y = f(x,u)

• y es la variable dependiente, o variable explicada o regresando.

• x es la variable independiente, o variable explicativa, o regresor.

• u es el término de error o perturbación aleatoria o inobservable.

Contiene todos los factores distintos de x que afectan a y.

1. EL MODELO: MOTIVACIÓN Y DEFINICIONES

¿ Qué recoge u?

- Algunas variables que explican la variable dependiente y, pero que no son

observables o no se pueden medir.

- Errores de especificación, es decir, variables explicativas importantes que

hemos omitido por error, no porque no las podamos medir.

(2)

• Para obtener un modelo útil que nos permita cuantificar “cómo x

explica y”, tenemos que responder a las siguientes cuestiones:

1) ¿Qué forma funcional suponemos para f(x,u) ?

Supondremos que la relación que vincula x e y es lineal en parámetros

y que el término inobservable entra de forma aditiva.

y =

β

₁

+

β

₂

x + u

β

₀

es la constante (intercept parameter)

β

₁

es la pendiente (slope parameter)

1

Y

1. EL MODELO: MOTIVACIÓN Y DEFINICIONES

Supongamos que la variable Y es una función lineal de otra variable X, donde la relación entre Y y X depende de parámetrosβ₁y β₂desconocidos.

X Y =

β

₁+

β

₂

β

₁

X

₁

X

₂

X

₃

X

₄

Si nuestro interés fuera conocer la relación que une a X con Y, entonces deberíamos estimar los parámetros desconocidos.

(3)

Supongamos que tenemos una muestra de 4 observaciones de (X,Y). Suponemos que esas observaciones proceden de una muestra aleatoria simple.

Si la relación entre X e Y fuera exacta, solo bastarían dos puntos para hallar una solución para los parámetrosβ1y β2.

Q

₁

Q

2

Q

₃

Q

4 3 X Y =

β

₁+

β

₂

β

₁

Y

X

₁

X

₂

X

₃

X

₄

P

₄

Sin embargo, las relaciones económicas no son exactas: muchos de los puntos que observamos no van a estar en la recta

P

₃

P

₂

P

₁

Q

₁

Q

2

Q

₃

Q

4 4 X Y =

β

₁+

β

₂

β

₁

Y

X

₁

X

₂

X

₃

X

₄

(4)

P

₄

Para permitir divergencia entre la variable Y de la recta de interés, introducimos un término de perturbación al modelo, que no es observable: Y = β1+ β2X + u.

Por ejemplo, si Y es el salario y X la educación, u puede representar la habilidad innata para ganar más dinero: así dos individuos con la misma educación pueden tener un salario diferente.

P

₃

P

₂

P

₁

Q

₁

Q

2

Q

₃

Q

4 5 X Y =

β

₁+

β

₂

β

₁

Y

X

₁

X

₂

X

₃

X

₄

P

₄

Cada valor de Y tiene entonces un “componente no aleatorio” o “sistemático” β₁+ β₂X

y un “componente aleatoria”, u.

La primera observación la hemos descompuesto en estas dos partes.

P

₃

P

₂

P

₁

Q

₁

Q

2

Q

₃

Q

4

u

₁ 6 X Y =

β

₁+

β

₂

β

₁

Y

1 2 1

β

X

β

+

X

₁

X

₂

X

₃

X

₄

(5)

P

₄

En el mundo real, únicamente observamos los puntos P para cada X.

P

₃

P

₂

P

₁ 7

Y

X

₁

X

₂

X

₃

X

₄

P

₄

P

₃

P

₂

P

₁

Naturalmente, podríamos utilizar los puntos P para dibujar una línea que aproxime

Y = β₁+ β₂X.

Podemos escribir esta línea como Y = b₁+ b₂X, donde b₁es una estimación de β1y b2

es una estimación de β2. ^ 8 X b b Yˆ = ₁+ ₂

b

₁

Y

X

₁

X

₂

X

₃

X

₄

(6)

P

₄

A esta línea aproximada se la conoce como el modelo ajustado, y a los valores de la variable Y en esa línea se le llama valores predichos o ajustados (son los puntos R).

P

₃

P

₂

P

₁

R

₁

R

₂

R

₃

_R

4 9 X b b Yˆ = ₁+ ₂

b

₁

Yˆ (valor predicho)

Y (valor real)

Y

X

₁

X

₂

X

₃

X

₄

P

₄

X

₁

X

₂

X

₃

X

₄

Observad que hay una discrepancia entre el valor de Y realmente observado (los puntos P) y el valor predicho por la línea aproximada (R). A esta discrepancia se le llama residuo.

P

₃

P

₂

P

₁

R

₁

R

₂

R

₃

_R

4

e

₁

e

₂

e

3

e

₄ 10 X b b Yˆ = ₁+ ₂

b

₁

Yˆ

Y (valor real)

e Y Y − ˆ =

Y

(residuo)

(valor predicho)

(7)

P

₄

Es importante observar que los valores que toman los residuos son distintos a los valores del término de perturbación. Esto es debido a que la aproximación que hacemos nunca va a coincidir exactamente con la verdadera línea que relaciona a estas variables.

P

₃

P

₂

P

₁

R

₁

R

₂

R

₃

_R

4

b

₁ 11 X b b Yˆ = ₁+ ₂ X Y =

β

₁+

β

₂

β

₁

Yˆ

Y (valor real)

Y

X

₁

X

₂

X

₃

X

₄

(valor predicho)

P

₄

La perturbación es la responsable de la desviación que existe entre el componente “no aleatorio” y las verdaderas observaciones.

P

₃

P

₂

P

₁ 12

Q

₂

Q

₁

Q

₃

Q

4 X b b Yˆ = ₁+ ₂ X Y =

β

₁+

β

₂

β

₁

b

₁

Y

X

₁

X

₂

X

₃

X

₄

1. EL MODELO: MOTIVACIÓN Y DEFINICIONES

Yˆ

Y (valor real)

(8)

P

₄

Los residuos son la diferencia entre el valor real y el valor predicho por la recta estimada en base a la “aproximación” de los parámetros desconocidos

P

₃

P

₂

P

₁

R

₁

R

₂

R

₃

_R

4 13 X b b Yˆ = ₁+ ₂ X Y =

β

₁+

β

₂

β

₁

b

₁

Y

X

₁

X

₂

X

₃

X

₄

Yˆ

Y (valor real)

(valor predicho)

P

₄

Entonces, es natural que cuando los residuos sean pequeños el ajuste sea bueno y los residuos tiendan a estar cerca de la perturbación. Pero lo que debe quedar claro es que los dos conceptos representan cosas distintas.

P

₃

P

₂

P

₁

R

₁

R

₂

R

₃

_R

4 14 X b b Yˆ = ₁+ ₂ X Y =

β

₁+

β

₂

β

₁

b

₁

Y

X

₁

X

₂

X

₃

X

₄

1. EL MODELO: MOTIVACIÓN Y DEFINICIONES

Yˆ

Y (valor real)

(9)

P

₄

Ambas líneas, la aproximada y la verdadera, son importantes en el análisis de regresión, puesto que permiten descomponer el valor observado de Y en dos partes.

15

Q

₄

u

₄ Yˆ =b1+b2X X Y =

β

₁+

β

₂

β

₁

b

₁

Y

4 2 1

β

X

β

+

X

₁

X

₂

X

₃

X

₄

Usando la relación téorica, o verdadera, Y se descompone en su parte no estocástica

β₁+ β₂X y su parte estocástica u.

Yˆ

Y (valor real)

(valor predicho)

P

₄

Esta es una descomposición teórica dado que no conocemos los valores

exactos de

β

₁

o

β

₂

, ni los del término de perturbación.

17

Q

₄

u

₄ Yˆ =b₁+b₂X X Y =

β

₁+

β

₂

β

₁

b

₁

Y

4 2 1

β

X

β

+

X

₁

X

₂

X

₃

X

₄

1. EL MODELO: MOTIVACIÓN Y DEFINICIONES

Yˆ

Y (valor real)

(10)

P

₄

La segunda descomposición del valor real de

Y se hace en función de la

línea ajustada: es la suma del valor predicho de

Y y de su residuo.

Esta descomposición la utilizaremos para obtener fórmulas que nos permitan aproximar los valores desconocidos de los parámetros

18

e

₄

R

₄ X b b Yˆ = ₁+ ₂ X Y =

β

₁+

β

₂

β

₁

b

₁

Y

4 2 1 b X b +

X

₁

X

₂

X

₃

X

₄

Yˆ

Y (valor real)

(valor predicho)

2) ¿Cómo podemos obtener buenas estimaciones de los parámetros

del modelo?

1. EL MODELO: MOTIVACIÓN Y DEFINICIONES

• Más adelante mostraremos que sólo podemos obtener estimadores

fiables de

β

₁

y

β

₂

, partiendo de un muestreo aleatorio de datos,

cuando establecemos supuestos que restringen el modo en el que el

término de error u se relaciona con x.

• Dado que x y u son variables aleatorias, necesitamos realizar

supuestos importantes sobre su distribución conjunta. Es decir,

necesitamos hacer supuestos sobre cómo es la relación entre x y u.

• Antes de establecer el supuesto clave, vamos a establecer un

supuesto sobre cómo se comporta u. Siempre y cuando

introduzcamos un término constante en la regresión, no perdemos

nada al suponer que

(11)

2) ¿Cómo podemos obtener buenas estimaciones de los parámetros

del modelo?

Por qué decimos que este supuesto no es restrictivo:

Y = β

₁

+ β

₂

X + u

Suponed

E(u) = µ

_u

≠ 0.

Definimos

v = u - µ

_u

, entonces u = v + µ

_u

Entonces

Y = b

₁

+ b

₂

X + v + µ

_u

= (b

₁

+ µ

_u

) + b

₂

X + v

donde

E(v) = E(u - µ

_u

) = E(u) - E(µ

_u

) = 0

Por qué decimos que este supuesto no es restrictivo:

Y = β

₁

+ β

₂

X + u

Suponed

E(u) = µ

_u

≠ 0.

Definimos

v = u - µ

_u

, entonces u = v + µ

_u

Entonces

Y = b

₁

+ b

₂

X + v + µ

_u

= (b

₁

+ µ

_u

) + b

₂

X + v

donde

E(v) = E(u - µ

_u

) = E(u) - E(µ

_u

) = 0

2) ¿Cómo podemos obtener buenas estimaciones de los parámetros

del modelo?

1. EL MODELO: MOTIVACIÓN Y DEFINICIONES

• Pero el supuesto clave para poder identificar el efecto de x sobre y es

que x y u no están relacionadas. Para garantizar esto ¿bastaría con

suponer cov(x,u)=0?

• Queremos que x no nos dé ninguna información sobre u, es decir,

queremos que estas dos variables no tengan ningún tipo de relación.

• Supuesto:

E(u|x) = E(u) = 0

(12)

Es decir, estamos suponiendo que E(y|x) es una función lineal

de x tal que, para cualquier x, la distribución de y está centrada

en E(y|x)

E(y|x) =

β

₁

+

β

₂

x

f(y)

• EJEMPLO:

Ecuación de salarios

wage =

β

₁

+

β

₂

educ + u

• Supongamos que u es la “capacidad innata del individuo” (para ganar

dinero).

• El supuesto de media condicional igual a cero implica que:

E( ability | educ =10) = E( ability | educ =16)

• Es decir, el nivel medio de “capacidad” debe ser el mismo para todos

los niveles educativos.

• Si la gente con más capacidad tiende a educarse más, entonces este

supuesto no se cumple. ESTO ES UN PROBLEMA IMPORTANTE.

(13)

Sea kids el número de niños que una mujer ha tenido y educ el

número de años de educación que la mujer ha recibido. El

siguiente es un modelo simple que relaciona la fertilidad con

el número de años de educación.

kids = β

1

+ β

2

educ + u

Donde u es el error no observado.

a) ¿Qué tipo de factores están en u? ¿Pueden estos estar

correlacionados con el nivel de educación?

b) En el análisis de regresión nosotros estamos interesados

en hacer interpretaciones de efectos causales. Para ello

debemos medir relaciones entre educ y kids “ceteris

paribus”, es decir, si lo demás permanece constante. De

acuerdo con lo que respondiste en el apartado anterior,

¿crees que en este modelo el β

₂

mide el efecto causal de

educ sobre kids?

2 2 1 1 2

_...

n n i i

e

SCR

=

∑

=

+

=

Minimizar la SCR (suma de cuadrados de los residuos),

donde

Si un ajuste bueno es aquél que tiene los residuos pequeños, ¿por qué no

buscar unos valores para los parámetros que hagan mínimo este residuo?

19

2. ESTIMACIÓN POR MÍNIMOS CUADRADOS ORDINARIOS

¿Por qué no minimizamos…?

n n i i

e

=

+

∑

=

...

1 1

(14)

P

₄

La respuesta está en que los errores positivos y negativos se compensarían. El ajuste perfecto en este caso sería una línea recta en la media del valor de Y

P

₃

P

₂

P

₁

Y

21

X

₁

X

₂

X

₃

X

₄

Y

X

_n

X

₁

Y

1

Y

n

Y

¿Qué pasa si tenemos n observaciones?

13

2. ESTIMACIÓN POR MÍNIMOS CUADRADOS ORDINARIOS

u

X

Y

₁ ₂

:

(15)

X

_n

X

₁

Y

b

₁ 1 1 2 1

ˆ

_b

_X

Y

=

+

1

Y

b

₂ n

Y

n n

b

X

Y

ˆ

=

₁

+

₂

Dada nuestra elección de

b

₁

y

b

₂

, la recta ajustada es la que se muestra en

el gráfico.

14

X

b

Y

u

X

Y

2 1 2 1

ˆ

:

Ajustado

:

Verdadero

+

=

+

=

β

X

_n

X

₁

Y

b

₁

X

b

Y

u

X

Y

2 1 2 1

ˆ

:

Ajustado

:

Verdadero

+

=

+

=

β

n n n n n

Y

b

X

e

X

b

Y

e

2 1 1 2 1 1 1 1 1

ˆ

...

ˆ

−

=

−

=

−

=

−

=

1 2 1 1

ˆ

_b

_X

Y

=

+

1

Y

b

₂ n

Y

1

e

n n

b

X

Y

ˆ

=

₁

+

₂

Definimos el residuo para la primera observación

15

(16)

Del mismo modo, definimos los residuos para el resto de observaciones. En

la gráfica se señala el correspondiente a la última observación.

X

_n

X

₁

Y

b

₁

X

b

Y

u

X

Y

2 1 2 1

ˆ

:

Ajustado

:

Verdadero

+

=

+

=

β

n n n n n

Y

b

X

e

X

b

Y

e

2 1 1 2 1 1 1 1 1

ˆ

...

ˆ

−

=

−

=

−

=

−

=

1 2 1 1

ˆ

_b

_X

Y

=

+

1

Y

b

₂ n

Y

1

e

n

e

Y

ˆ

n

=

b

1

+

b

2

X

n 16 17

( )

_∑

(

)

∑

= =

−

=

n i i i n i i

Y

b

X

e

SCR

1 2 2 1 1 2

Observad que los residuos dependen de b

₁

y b

₂

y que, por lo tanto, se pueden elegir sus valores de

forma tal que hagan mínima dicha suma de residuos al cuadrado

2. ESTIMACIÓN POR MÍNIMOS CUADRADOS ORDINARIOS

(17)

17

⇒

=

∂

0

1

b

SCR

⇒

=

∂

0

2

b

SCR

( )

_∑

(

)

∑

= =

−

=

n i i i n i i b b

SCR

e

Y

b

X

1 2 2 1 1 2 , ₂ 1

min

X

b

Y

b

₁

=

−

₂

⇒

=

−

∑

2 (

Y

_i

b

₁

b

₂

X

_i

)(

1 )

0 ………….

⇒

=

−

∑

2 (

y

_i

b

₁

b

₂

X

_i

)(

X

_i

)

0

2

2 b

₂

∑

X

_i2

−

∑

X

_i

Y

_i

+

_b

₁

∑

X

_i

=

0

2

0

2 ₁ 2 2

=

+

−

⇒

=

∂

∑

X

i

X

i

Y

i

b

X

i

b

SCR

0

1 2 2

∑

X

i

−

∑

X

i

Y

i

+

b

∑

X

i

=

b

Se divide por 2.

26

(18)

0

2

0

₂ 2 ₁ 2

=

+

−

⇒

=

∂

∑

X

i

X

i

Y

i

b

X

i

b

SCR

0

1 2 2

∑

X

i

−

∑

X

i

Y

i

+

b

∑

X

i

=

b

0 )

(

₂ 2 2

∑

X

i

−

∑

X

i

Y

i

+

Y

−

b

X

∑

X

i

=

b

Se sustituye

b

₁

por la expresión obtenida anteriormente, de manera que la

ecuación queda sólo en función de

b

₂

.

27

X

b

Y

b

₁

=

−

₂

0

2

0

2 ₁ 2 2

=

+

−

⇒

=

∂

_∑

i i i i

X

Y

b

X

b

SCR

0

1 2 2

∑

X

i

−

∑

X

i

Y

i

+

b

∑

X

i

=

b

0 )

(

₂ 2 2

∑

X

i

−

∑

X

i

Y

i

+

Y

−

b

X

∑

X

i

=

b

0 )

(

₂ 2 2

∑

X

−

∑

X

Y

+

Y

−

b

X

n

X

=

b

_i _i _i

Utilizamos la definición de la media muestral

28

n

X

=

∑

i

X

n

X

_i

=

∑

(19)

0

2

0

2 ₁ 2 2

=

+

−

⇒

=

∂

∑

X

i

X

i

Y

i

b

X

i

b

SCR

0

1 2 2

∑

X

i

−

∑

X

i

Y

i

+

b

∑

X

i

=

b

0 )

(

₂ 2 2

∑

X

i

−

∑

X

i

Y

i

+

Y

−

b

X

∑

X

i

=

b

0 )

(

₂ 2 2

∑

X

−

∑

X

Y

+

Y

−

b

X

n

X

=

b

_i _i _i

(

X

n

X

)

X

Y

n

X

Y

b

∑

_i2

−

2

=

∑

_i _i

−

2

Y

X

Y

X

n

X

n

b

_i

_

=

_i _i

−











1 _∑

2

₋

2

1 _∑

2

Los términos que no contienen

b

₂

se pasan a la parte de la derecha y se

divide la ecuación por

n.

29

0

2

0

2 ₁ 2 2

=

+

−

⇒

=

∂

_∑

i i i i

X

Y

b

X

b

SCR

0

1 2 2

∑

X

i

−

∑

X

i

Y

i

+

b

∑

X

i

=

b

0 )

(

₂ 2 2

∑

X

i

−

∑

X

i

Y

i

+

Y

−

b

X

∑

X

i

=

b

0 )

(

₂ 2 2

∑

X

−

∑

X

Y

+

Y

−

b

X

n

X

=

b

_i _i _i

(

X

n

X

)

X

Y

n

X

Y

b

∑

_i2

−

2

=

∑

_i _i

−

2

Y

X

Y

X

n

X

n

b

_i

_

=

_i _i

−











1 _∑

₂

₋

₂

1 _∑

2

)

,

(

Cov

)

(

Var

2

X

Y

b

=

)

Var(

)

,

(

Cov

2

_X

Y

X

b

=

Así, obtenemos una expresión para b₂.

(20)

X

_n

X

₁

Y

b

₁

X

b

Y

u

X

Y

2 1 2 1

ˆ

:

Ajustado

:

Verdadero

+

=

+

=

β

1 2 1 1

ˆ

_b

_X

Y

=

+

1

Y

b

₂ n

Y

n n

b

X

Y

ˆ

=

₁

+

₂

De nuevo, mostramos el gráfico para ilustrar lo que hemos hecho. Hemos

especificado un modelo de regresión y, a partir de los datos, hemos

ajustado la recta que aparece en el gráfico.

31

X

_n

X

₁

Y

b

₁

X

b

Y

u

X

Y

2 1 2 1

ˆ

:

+

=

+

=

β

1 2 1 1

ˆ

_b

_X

Y

=

+

1

Y

b

₂ n

Y

n n

b

X

Y

ˆ

=

₁

+

₂

)

Var(

)

,

(

Cov

2

_X

Y

X

b

=

X

b

Y

b

₁

=

−

₂

Hemos elegido los parámetros de la recta ajustada de modo que minimicen

la suma de cuadrados de los residuos.

32

Verdadero

Ajustado

(21)

Expresiones alternativas para b

₂

)

Var(

)

,

(

Cov

2

X

Y

X

b

=

En función de las expresiones de la varianza y covarianza muestral....

34

∑

−

=

−

=

₂ 2 2

)

(

)

)(

(

)

(

1 )

)(

(

1 X

X

Y

X

n

Y

X

n

b

i i i i i i

)

Var(

)

,

(

Cov

2

_X

Y

X

b

=

2 2 2 2 2

₁

1 X

n

X

Y

X

n

Y

X

n

Y

X

Y

X

n

b

i i i i i i

−

=

−

=

∑

−

=

−

=

₂ 2 2

₍

₎

)

)(

(

)

(

1 )

)(

(

1 X

X

Y

X

n

Y

X

n

b

i i i i i i 35

Expresiones alternativas para b

₂

...y utilizando las expresiones alternativas de la varianza y covarianza

muestral que calculamos en clases anteriores.

(22)

1

Este gráfico muestra el salario por hora de 570 individuos. -10 0 10 20 30 40 50 60 70 80 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Estudios S al ar io por hor a ($ )

. Regresión Salario- Estudios

Source | SS df MS Number of obs = 570 ---+--- F( 1, 568) = 65.64 Model | 3977.38016 1 3977.38016 Prob > F = 0.0000 Residual | 34419.6569 568 60.5979875 R-squared = 0.1036 ---+--- Adj R-squared = 0.1020 Total | 38397.0371 569 67.4816117 Root MSE = 7.7845 ---SALARIO | Coef. Std. Err. t P>|t| [95% Conf. Interval] ---+---S | 1.073055 .1324501 8.102 0.000 .8129028 1.333206 _cons | -1.391004 1.820305 -0.764 0.445 -4.966354 2.184347 ---5

3. INTERPRETACIÓN DE LA REGRESIÓN

(23)

-10 0 10 20 30 40 50 60 70 80 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Estudios Sa la ri o 11

S

Salario

^

=

−

1 .

391 +

1 .

073 ¿Qué significan los coeficientes?

7 8 9 10 11 12 13 14 15 10.8 11 11.2 11.4 11.6 11.8 12 12.2 Estudios Sal ar io 12

Un año

$1.07

$10.41

$11.49

¿Qué mide la pendiente?

(24)

-10 0 10 20 30 40 50 60 70 80 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Estudios In g re so 15

¿Qué significa el término constante? En este caso, ¿su valor tiene sentido?

La razón por la que obtenemos ese valor negativo es porque en nuestra muestra sólo hay individuos con un nivel de estudios igual o superior a 6 años. Entonces….

^

S

Salario

=

−

1 .

391 +

1 .

073

-10 0 10 20 30 40 50 60 70 80 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Estudios Sa la ri o 18

^

S

Salario

=

−

1 .

391 +

1 .

073 3. INTERPRETACIÓN DE LA REGRESIÓN

… ésta sería la parte de la regresión que se corresponde con las observaciones disponibles.

(25)

El siguiente cuadro contiene los resultados de la prueba de aptitud para el

acceso a la universidad en EE.UU. (ACT, American College Testing) y la nota

media en la universidad (GPA, Grade Point Average) de 8 estudiantes. El

GPA se basa en una escala de 1 a 4.

a) Estimar la relación entre GPA y ACT empleando MCO, es decir, obtener los

valores estimados de los parámetros del modelo

GPA = β

₁

+ β

₂

ACT + u

¿El término constante tiene una interpretación útil en este caso? ¿Cuánto

aumenta GPA si ACT aumenta 5 puntos?

b) Calcula los valores ajustados y los residuos para cada observación.

c) Calcular el valor predicho para GPA cuando ACT=20.

30 3.7 8 26 3.0 3 27 3.5 4 29 3.6 5 25 3.0 6 25 2.7 7 24 3.4 2 21 2.8 1 ACT GPA Estudiante

Tres resultados relevantes:

4. BONDAD DE AJUSTE

0 =

e

Y

ˆ

=

Y

_Cov

₍

_Y

ˆ

_,

_e

₎

₌

₀

(26)

Tres resultados relevantes:

0 =

e

Y

ˆ

=

Y

Cov

(

Y

ˆ

,

e

)

=

0

i i i i i

Y

b

X

e

=

−

ˆ

=

−

₁

−

₂ 3 i i

b

X

Y

ˆ

=

₁

+

₂

Residuo

Demostrar

e

=

0 Tres resultados relevantes:

0 =

e

Y

ˆ

=

Y

_Cov

₍

_Y

ˆ

_,

_e

₎

₌

₀

i i i i i

Y

b

X

e

=

−

ˆ

=

−

₁

−

₂

∑

e

_i

=

Y

_i

−

Y

ˆ

_i

∑

_i

=

_i

−

Y

_i

n

Y

n

e

n

ˆ

1

1 Y

Y

e

=

−

ˆ

Y

ˆ

=

Y

11

4. BONDAD DE AJUSTE

Demostrar

Y

ˆ

=

Y

(27)

[

]

[

]

0 )

(

Var

)

(

Var

)

,

(

Cov

)

,

(

Cov

)

,

(

Cov

)

,

(

Cov

)

,

(

Cov

)

,

(

Cov

)

,

(

Cov

])

[

,

(

Cov

)

,

(

Cov

0 )

,

(

Cov

)

,

(

Cov

)

]),

([

Cov

)

,

ˆ

(

Cov

2 2 2 2 1 2 2 1 2 2 2 1 2 1

=









₋

=

−

=

−

=

−

=

+

=

+

=

+

=

X

Y

X

Y

X

b

X

b

Y

X

b

X

b

X

b

X

Y

X

b

X

b

Y

X

b

e

X

b

e

X

b

e

b

e

X

b

e

Y

Tres resultados relevantes:

0 =

e

Y

ˆ

=

Y

Cov

(

Y

ˆ

,

e

)

=

0

21

Demostrad que es igual a 0

Demostrar

Y

ˆ

=

Y

i i i i i i

Y

e

=

−

ˆ

⇒

=

ˆ

+

Para analizar la bondad del ajuste, descomponemos el valor observado en el

valor ajustado y el residuo.

23

(28)

i i i i i i

Y

e

=

−

ˆ

⇒

=

ˆ

+

)

Var(

)

ˆ

Var(

)

,

ˆ

Cov(

2 )

Var(

)

ˆ

Var(

)

ˆ

Var(

)

(

Var

e

Y

e

Y

e

Y

e

Y

+

=

+

=

+

=

∑

₍

−

₎

2

=

1 ₍

ˆ

−

ˆ

₎

2

+

1 ₍

−

₎

2

1 e

e

n

Y

n

Y

n

∑

−

=

−

=

₂ 2 2 2 2

)

(

1 )

(

)

ˆ

(

Y

e

Y

SCT

SCE

R

i i i i

SCR

SCE

SCT

=

+

∑

₍

_Y

−

_Y

₎

2

=

₍

_Y

ˆ

−

_Y

₎

2

+

_e

2 35

Un criterio de bondad de ajuste de ajuste es el coeficiente de determinación.

2 ˆ ,

)

(

Var

)

ˆ

(

Var

)

ˆ

(

Var

)

(

Var

)

ˆ

(

Var

)

ˆ

(

Var

)

ˆ

(

Var

)

(

Var

)

ˆ

(

Var

)

ˆ

(

Var

)

(

Var

)

ˆ

,

(

Cov

)

ˆ

,

ˆ

(

Cov

)

ˆ

(

Var

)

(

Var

)

ˆ

],

ˆ

([

Cov

)

ˆ

(

Var

)

(

Var

)

ˆ

,

(

Cov

R

Y

e

Y

e

Y

r

_Y _Y

=

+

=

+

=

Otro criterio de bondad de ajuste es la correlacion entre el valor observado

y ajustado de la variable

Y.

37

(29)

2 ˆ ,

)

(

Var

)

ˆ

(

Var

)

ˆ

(

Var

)

(

Var

)

ˆ

(

Var

)

ˆ

(

Var

)

ˆ

(

Var

)

(

Var

)

ˆ

(

Var

)

ˆ

(

Var

)

(

Var

)

ˆ

,

(

Cov

)

ˆ

,

ˆ

(

Cov

)

ˆ

(

Var

)

(

Var

)

ˆ

],

ˆ

([

Cov

)

ˆ

(

Var

)

(

Var

)

ˆ

,

(

Cov

R

Y

e

Y

e

Y

r

_Y _Y

=

+

=

+

=

43