Propiedades algebraicas de los estimadores MCO
Mauricio Olivares
ITAM
I Los estimadores de MCO satisfacen una serie de propiedades algebraicas bastante convenientes. Recalcamos que estamos estimando α yβ.
I Antes de ver las propiedades estad´ısticas, es importante mencionar las siguientes propiedades que ser´an de bastante utilidad para mostrar las propiedades estad´ısticas.
I Piensa en ellas como propiedades de MCO para una muestra determinada.
I Aunque muchas de ellas parecer´an triviales, nos arrojar´an mucha luz cuando estudiemos ciertas manipulaciones a los datos.
I Los estimadores de MCO satisfacen una serie de propiedades algebraicas bastante convenientes. Recalcamos que estamos estimando α yβ.
I Antes de ver las propiedades estad´ısticas, es importante mencionar las siguientes propiedades que ser´an de bastante utilidad para mostrar las propiedades estad´ısticas.
I Piensa en ellas como propiedades de MCO para una muestra determinada.
I Aunque muchas de ellas parecer´an triviales, nos arrojar´an mucha luz cuando estudiemos ciertas manipulaciones a los datos.
I Los estimadores de MCO satisfacen una serie de propiedades algebraicas bastante convenientes. Recalcamos que estamos estimando α yβ.
I Antes de ver las propiedades estad´ısticas, es importante mencionar las siguientes propiedades que ser´an de bastante utilidad para mostrar las propiedades estad´ısticas.
I Piensa en ellas como propiedades de MCO para una muestra determinada.
I Aunque muchas de ellas parecer´an triviales, nos arrojar´an mucha luz cuando estudiemos ciertas manipulaciones a los datos.
I Los estimadores de MCO satisfacen una serie de propiedades algebraicas bastante convenientes. Recalcamos que estamos estimando α yβ.
I Antes de ver las propiedades estad´ısticas, es importante mencionar las siguientes propiedades que ser´an de bastante utilidad para mostrar las propiedades estad´ısticas.
I Piensa en ellas como propiedades de MCO para una muestra determinada.
I Aunque muchas de ellas parecer´an triviales, nos arrojar´an mucha luz cuando estudiemos ciertas manipulaciones a los datos.
I Los estimadores de MCO satisfacen una serie de propiedades algebraicas bastante convenientes. Recalcamos que estamos estimando α yβ.
I Antes de ver las propiedades estad´ısticas, es importante mencionar las siguientes propiedades que ser´an de bastante utilidad para mostrar las propiedades estad´ısticas.
I Piensa en ellas como propiedades de MCO para una muestra determinada.
I Aunque muchas de ellas parecer´an triviales, nos arrojar´an mucha luz cuando estudiemos ciertas manipulaciones a los datos.
Propiedades
1. La suma de residuales es cero, i.e.
n
X
i=1
ˆ εi =0
2. La covarianza muestral entre la variable explicativa y el residual es cero i.e.
n
X
i=1
xiεˆi =0
3. El punto(En(x),En(y))siempre est´a sobre la funci´on de
Propiedades
1. La suma de residuales es cero, i.e.
n
X
i=1
ˆ εi =0
2. La covarianza muestral entre la variable explicativa y el residual es cero i.e.
n
X
i=1
xiεˆi =0
3. El punto(En(x),En(y))siempre est´a sobre la funci´on de
Propiedades
1. La suma de residuales es cero, i.e.
n
X
i=1
ˆ εi =0
2. La covarianza muestral entre la variable explicativa y el residual es cero i.e.
n
X
i=1
xiεˆi =0
3. El punto(En(x),En(y))siempre est´a sobre la funci´on de
Observaciones
I Las primeras dos propiedades se siguen inmediatamente de las condiciones de primer orden del problema de minimizaci´on de los residuales al cuadrado.
I Nota que estas condiciones, multiplicadas por 1n, puedes pensarlas tambi´en como el an´alogo muestral de las condiciones de momentos que derivaste en la tarea:
E(ε) = 0 E(xε) = 0
I La tercera propiedad se sigue inmediatamente al evaluar la funci´on de regresi´on muestral enEn(x)y usar la definici´on de
Observaciones
I Las primeras dos propiedades se siguen inmediatamente de las condiciones de primer orden del problema de minimizaci´on de los residuales al cuadrado.
I Nota que estas condiciones, multiplicadas por 1n, puedes pensarlas tambi´en como el an´alogo muestral de las condiciones de momentos que derivaste en la tarea:
E(ε) = 0 E(xε) = 0
I La tercera propiedad se sigue inmediatamente al evaluar la funci´on de regresi´on muestral enEn(x)y usar la definici´on de
Observaciones
I Las primeras dos propiedades se siguen inmediatamente de las condiciones de primer orden del problema de minimizaci´on de los residuales al cuadrado.
I Nota que estas condiciones, multiplicadas por 1n, puedes pensarlas tambi´en como el an´alogo muestral de las condiciones de momentos que derivaste en la tarea:
E(ε) = 0 E(xε) = 0
I La tercera propiedad se sigue inmediatamente al evaluar la funci´on de regresi´on muestral enEn(x)y usar la definici´on de
Implicaciones
I A partir de estas tres propiedades vamos a derivar otras tantas.
I Recuerda la definici´on de residualεˆi =yi −ˆyi
I Entonces podemos reescribir nuestro modelo como
yi = ˆyi+ ˆεi
I Usando las propiedades 1 y 2, podemos concluir:
Implicaciones
I A partir de estas tres propiedades vamos a derivar otras tantas.
I Recuerda la definici´on de residualεˆi =yi −ˆyi
I Entonces podemos reescribir nuestro modelo como
yi = ˆyi+ ˆεi
I Usando las propiedades 1 y 2, podemos concluir:
Implicaciones
I A partir de estas tres propiedades vamos a derivar otras tantas.
I Recuerda la definici´on de residualεˆi =yi −ˆyi
I Entonces podemos reescribir nuestro modelo como
yi = ˆyi+ ˆεi
I Usando las propiedades 1 y 2, podemos concluir:
Implicaciones
I A partir de estas tres propiedades vamos a derivar otras tantas.
I Recuerda la definici´on de residualεˆi =yi −ˆyi
I Entonces podemos reescribir nuestro modelo como
yi = ˆyi+ ˆεi
I Usando las propiedades 1 y 2, podemos concluir:
Implicaciones
I A partir de estas tres propiedades vamos a derivar otras tantas.
I Recuerda la definici´on de residualεˆi =yi −ˆyi
I Entonces podemos reescribir nuestro modelo como
yi = ˆyi+ ˆεi
I Usando las propiedades 1 y 2, podemos concluir:
Implicaciones
I Implicaci´on 2: La covarianza entre los residuales y el valor ajustado es cero i.e.
Cn(ˆy,ε) =ˆ 0
I Esta propiedad nos dice que cadayi se puede descomponer en dos partes,yˆi yεˆi, y ambas partes no est´an correlacionadas en
la muestra.
Implicaciones
I Implicaci´on 2: La covarianza entre los residuales y el valor ajustado es cero i.e.
Cn(ˆy,ε) =ˆ 0
I Esta propiedad nos dice que cadayi se puede descomponer en dos partes,yˆi yεˆi, y ambas partes no est´an correlacionadas en
la muestra.
Implicaciones
I Implicaci´on 2: La covarianza entre los residuales y el valor ajustado es cero i.e.
Cn(ˆy,ε) =ˆ 0
I Esta propiedad nos dice que cadayi se puede descomponer en dos partes,yˆi yεˆi, y ambas partes no est´an correlacionadas en
la muestra.
Sumas de cuadrados
I Vamos a definir tres objetos en t´erminos de sumas de cuadrados.
I LaSuma cuadrados totales (SST):
SST =
n
X
i=1
(yi −y¯)2
I LaSuma de cuadrados explicada (SSE):
SSE =
n
X
i=1
(ˆyi −y¯)2
I LaSuma de residuales cuadrados (SSR):
SSR =
n
X
i=1
Sumas de cuadrados
I Vamos a definir tres objetos en t´erminos de sumas de cuadrados.
I LaSuma cuadrados totales (SST):
SST =
n
X
i=1
(yi −y¯)2
I LaSuma de cuadrados explicada (SSE):
SSE =
n
X
i=1
(ˆyi −y¯)2
I LaSuma de residuales cuadrados (SSR):
SSR =
n
X
i=1
Sumas de cuadrados
I Vamos a definir tres objetos en t´erminos de sumas de cuadrados.
I LaSuma cuadrados totales (SST):
SST =
n
X
i=1
(yi −y¯)2
I LaSuma de cuadrados explicada (SSE):
SSE =
n
X
i=1
(ˆyi −y¯)2
I LaSuma de residuales cuadrados (SSR):
SSR =
n
X
i=1
Sumas de cuadrados
I Vamos a definir tres objetos en t´erminos de sumas de cuadrados.
I LaSuma cuadrados totales (SST):
SST =
n
X
i=1
(yi −y¯)2
I LaSuma de cuadrados explicada (SSE):
SSE =
n
X
i=1
(ˆyi −y¯)2
I LaSuma de residuales cuadrados (SSR):
SSR =
n
X
i=1
Observaciones
I SST es una medida de dispersi´on de yi en la muestra.
I De hecho, si dividimos SST sobre n−1 obtenemos el estimador insesgado de la varianza.
I Usando la misma l´ogica, SSE mide la varianci´on deyˆi en la
muestra (recuerda quey¯ˆ= ¯y).
I Finalmente, SSR mide la dispersi´on deεˆrespecto a su media muestral (que es cero dado que Pn
Observaciones
I SST es una medida de dispersi´on de yi en la muestra.
I De hecho, si dividimos SST sobre n−1 obtenemos el estimador insesgado de la varianza.
I Usando la misma l´ogica, SSE mide la varianci´on deyˆi en la
muestra (recuerda quey¯ˆ= ¯y).
I Finalmente, SSR mide la dispersi´on deεˆrespecto a su media muestral (que es cero dado que Pn
Observaciones
I SST es una medida de dispersi´on de yi en la muestra.
I De hecho, si dividimos SST sobre n−1 obtenemos el estimador insesgado de la varianza.
I Usando la misma l´ogica, SSE mide la varianci´on deyˆi en la
muestra (recuerda quey¯ˆ= ¯y).
I Finalmente, SSR mide la dispersi´on deεˆrespecto a su media muestral (que es cero dado que Pn
Observaciones
I SST es una medida de dispersi´on de yi en la muestra.
I De hecho, si dividimos SST sobre n−1 obtenemos el estimador insesgado de la varianza.
I Usando la misma l´ogica, SSE mide la varianci´on deyˆi en la
muestra (recuerda quey¯ˆ= ¯y).
I Finalmente, SSR mide la dispersi´on deεˆrespecto a su media muestral (que es cero dado que Pn
Detour: Identidad ANOVA
I Recuerda la identidad ANOVAV(y) =V(E(y|x)) +E(V(y|x))
I En la tarea mostraron queV(y|x) =V(ε|x).
I Entonces la identidad ANOVA resulta
V(y) =V(E(y|x)) +E(V(ε|x))
I Recuerda el supuesto de homoscedasticidad condicional V(ε|x) =σ2
I Entonces
Detour: Identidad ANOVA
I Recuerda la identidad ANOVAV(y) =V(E(y|x)) +E(V(y|x))
I En la tarea mostraron queV(y|x) =V(ε|x).
I Entonces la identidad ANOVA resulta
V(y) =V(E(y|x)) +E(V(ε|x))
I Recuerda el supuesto de homoscedasticidad condicional V(ε|x) =σ2
I Entonces
Detour: Identidad ANOVA
I Recuerda la identidad ANOVAV(y) =V(E(y|x)) +E(V(y|x))
I En la tarea mostraron queV(y|x) =V(ε|x).
I Entonces la identidad ANOVA resulta
V(y) =V(E(y|x)) +E(V(ε|x))
I Recuerda el supuesto de homoscedasticidad condicional V(ε|x) =σ2
I Entonces
Detour: Identidad ANOVA
I Recuerda la identidad ANOVAV(y) =V(E(y|x)) +E(V(y|x))
I En la tarea mostraron queV(y|x) =V(ε|x).
I Entonces la identidad ANOVA resulta
V(y) =V(E(y|x)) +E(V(ε|x))
I Recuerda el supuesto de homoscedasticidad condicional V(ε|x) =σ2
I Entonces
Detour: Identidad ANOVA
I Recuerda la identidad ANOVAV(y) =V(E(y|x)) +E(V(y|x))
I En la tarea mostraron queV(y|x) =V(ε|x).
I Entonces la identidad ANOVA resulta
V(y) =V(E(y|x)) +E(V(ε|x))
I Recuerda el supuesto de homoscedasticidad condicional V(ε|x) =σ2
I Entonces
Observaciones
I En este contexto, podemos interpretar la identidad ANOVA de la siguiente manera
I
V(y) = V(E(y|x))
| {z }
Variabilidad del modelo
+ σ2 |{z}
Variabilidad de lo que no es
el modelo
I Piensa en lo siguiente, ¿qu´e pasar´ıa si dividimos ambos lados por V(y)?
I La identidad ANOVA en el contexto del modelo de regresi´on lineal simple prescribe una forma para estudiar la volatilidad de una variable aleatoria.
Observaciones
I En este contexto, podemos interpretar la identidad ANOVA de la siguiente manera
I
V(y) = V(E(y|x))
| {z }
Variabilidad del modelo
+ σ2 |{z}
Variabilidad de lo que no es
el modelo
I Piensa en lo siguiente, ¿qu´e pasar´ıa si dividimos ambos lados por V(y)?
I La identidad ANOVA en el contexto del modelo de regresi´on lineal simple prescribe una forma para estudiar la volatilidad de una variable aleatoria.
Observaciones
I En este contexto, podemos interpretar la identidad ANOVA de la siguiente manera
I
V(y) = V(E(y|x))
| {z }
Variabilidad del modelo
+ σ2 |{z}
Variabilidad de lo que no es
el modelo
I Piensa en lo siguiente, ¿qu´e pasar´ıa si dividimos ambos lados por V(y)?
I La identidad ANOVA en el contexto del modelo de regresi´on lineal simple prescribe una forma para estudiar la volatilidad de una variable aleatoria.
Observaciones
I En este contexto, podemos interpretar la identidad ANOVA de la siguiente manera
I
V(y) = V(E(y|x))
| {z }
Variabilidad del modelo
+ σ2 |{z}
Variabilidad de lo que no es
el modelo
I Piensa en lo siguiente, ¿qu´e pasar´ıa si dividimos ambos lados por V(y)?
I La identidad ANOVA en el contexto del modelo de regresi´on lineal simple prescribe una forma para estudiar la volatilidad de una variable aleatoria.
Observaciones
I En este contexto, podemos interpretar la identidad ANOVA de la siguiente manera
I
V(y) = V(E(y|x))
| {z }
Variabilidad del modelo
+ σ2 |{z}
Variabilidad de lo que no es
el modelo
I Piensa en lo siguiente, ¿qu´e pasar´ıa si dividimos ambos lados por V(y)?
I La identidad ANOVA en el contexto del modelo de regresi´on lineal simple prescribe una forma para estudiar la volatilidad de una variable aleatoria.
...de vuelta a las sumas
I La variaci´on total dey puede ser expresada como la suma de la variaci´on explicada por el modelo y la variaci´onno
explicadapor el modelo.
I Entonces
SST =SSE +SSR
I O en otras palabras
n
X
i=1
(yi −y¯)2 =
n
X
i=1
(ˆyi −y¯)2+
n
X
i=1
...de vuelta a las sumas
I La variaci´on total dey puede ser expresada como la suma de la variaci´on explicada por el modelo y la variaci´onno
explicadapor el modelo.
I Entonces
SST =SSE +SSR
I O en otras palabras
n
X
i=1
(yi −y¯)2 =
n
X
i=1
(ˆyi −y¯)2+
n
X
i=1
...de vuelta a las sumas
I La variaci´on total dey puede ser expresada como la suma de la variaci´on explicada por el modelo y la variaci´onno
explicadapor el modelo.
I Entonces
SST =SSE +SSR
I O en otras palabras
n
X
i=1
(yi −y¯)2 =
n
X
i=1
(ˆyi −y¯)2+
n
X
i=1
Precauciones
I No hay consenso sobre las abrevituras SST, SSE, SSR.
I SSE a veces se lee como suma deerrores y no comosuma
explicada.
I Similar confusi´on con SSR: a veces se lee como suma dela regresi´ony no como suma deresiduales .
I Algunos paquetes estad´ısticos se refieren a SSE como la suma
de cuadrados del modelo.
I Nosotros usaremos SSR como lasuma de residuos al cuadrado
Precauciones
I No hay consenso sobre las abrevituras SST, SSE, SSR.
I SSE a veces se lee como suma deerrores y no comosuma
explicada.
I Similar confusi´on con SSR: a veces se lee como suma dela regresi´ony no como suma deresiduales .
I Algunos paquetes estad´ısticos se refieren a SSE como la suma
de cuadrados del modelo.
I Nosotros usaremos SSR como lasuma de residuos al cuadrado
Precauciones
I No hay consenso sobre las abrevituras SST, SSE, SSR.
I SSE a veces se lee como suma deerrores y no comosuma
explicada.
I Similar confusi´on con SSR: a veces se lee como suma dela regresi´ony no como suma deresiduales .
I Algunos paquetes estad´ısticos se refieren a SSE como la suma
de cuadrados del modelo.
I Nosotros usaremos SSR como lasuma de residuos al cuadrado
Precauciones
I No hay consenso sobre las abrevituras SST, SSE, SSR.
I SSE a veces se lee como suma deerrores y no comosuma
explicada.
I Similar confusi´on con SSR: a veces se lee como suma dela regresi´ony no como suma deresiduales .
I Algunos paquetes estad´ısticos se refieren a SSE como la suma
de cuadrados del modelo.
I Nosotros usaremos SSR como lasuma de residuos al cuadrado
Precauciones
I No hay consenso sobre las abrevituras SST, SSE, SSR.
I SSE a veces se lee como suma deerrores y no comosuma
explicada.
I Similar confusi´on con SSR: a veces se lee como suma dela regresi´ony no como suma deresiduales .
I Algunos paquetes estad´ısticos se refieren a SSE como la suma
de cuadrados del modelo.
I Nosotros usaremos SSR como lasuma de residuos al cuadrado
Bondad de ajuste
I Hasta ahora no hemos definido un criterio para establecer qu´e tan bien hemos explicado y a partir de x.
I Idealmente nos gustar´ıa tener un n´umero que resuma qu´e tan bien la funci´on de regresi´on muestral ajusta a los datos.
I Supongamos que SST>0 entonces dividamos la identidad
SST =SSE+SSR por SST
1= SSE
SST +
SSR SST
I LaR-cuadrada de la regresi´on (a veces llamada coeficiente de determinaci´on), se define como
R2 = SSE
SST =1−
SSR SST
I
Bondad de ajuste
I Hasta ahora no hemos definido un criterio para establecer qu´e tan bien hemos explicado y a partir de x.
I Idealmente nos gustar´ıa tener un n´umero que resuma qu´e tan bien la funci´on de regresi´on muestral ajusta a los datos.
I Supongamos que SST>0 entonces dividamos la identidad
SST =SSE+SSR por SST
1= SSE
SST +
SSR SST
I LaR-cuadrada de la regresi´on (a veces llamada coeficiente de determinaci´on), se define como
R2 = SSE
SST =1−
SSR SST
I
Bondad de ajuste
I Hasta ahora no hemos definido un criterio para establecer qu´e tan bien hemos explicado y a partir de x.
I Idealmente nos gustar´ıa tener un n´umero que resuma qu´e tan bien la funci´on de regresi´on muestral ajusta a los datos.
I Supongamos que SST>0 entonces dividamos la identidad
SST =SSE+SSR por SST
1= SSE
SST +
SSR SST
I LaR-cuadrada de la regresi´on (a veces llamada coeficiente de determinaci´on), se define como
R2 = SSE
SST =1−
SSR SST
I
Bondad de ajuste
I Hasta ahora no hemos definido un criterio para establecer qu´e tan bien hemos explicado y a partir de x.
I Idealmente nos gustar´ıa tener un n´umero que resuma qu´e tan bien la funci´on de regresi´on muestral ajusta a los datos.
I Supongamos que SST>0 entonces dividamos la identidad
SST =SSE+SSR por SST
1= SSE
SST +
SSR SST
I LaR-cuadrada de la regresi´on (a veces llamada coeficiente de determinaci´on), se define como
R2= SSE
SST =1−
SSR SST
I
Bondad de ajuste
I Hasta ahora no hemos definido un criterio para establecer qu´e tan bien hemos explicado y a partir de x.
I Idealmente nos gustar´ıa tener un n´umero que resuma qu´e tan bien la funci´on de regresi´on muestral ajusta a los datos.
I Supongamos que SST>0 entonces dividamos la identidad
SST =SSE+SSR por SST
1= SSE
SST +
SSR SST
I LaR-cuadrada de la regresi´on (a veces llamada coeficiente de determinaci´on), se define como
R2= SSE
SST =1−
SSR SST
I
Bondad de ajuste
I Hasta ahora no hemos definido un criterio para establecer qu´e tan bien hemos explicado y a partir de x.
I Idealmente nos gustar´ıa tener un n´umero que resuma qu´e tan bien la funci´on de regresi´on muestral ajusta a los datos.
I Supongamos que SST>0 entonces dividamos la identidad
SST =SSE+SSR por SST
1= SSE
SST +
SSR SST
I LaR-cuadrada de la regresi´on (a veces llamada coeficiente de determinaci´on), se define como
R2= SSE
SST =1−
SSR SST
I
Bondad de ajuste
I LaR2 es el cociente de la variaci´on explicada sobre la
variaci´on total.
I Entonces, la R2 se interpreta comola proporci´on de la
variaci´on muestral en y que es explicada por la variaci´on enx.
I LaR2 ∈[0,1]dado que la suma explicada no puede ser mayor a la suma total.
I R2 =1 significa que la funci´on de regresi´on muestral cruza por todos los puntos, ajustando perfectamente con los datos.
I R2 cercana a 0 indica un desempe˜no pobre de la funci´on de regresi´on muestral.
I Si multiplicamos R2∗100 podemos interpretarlo como
Bondad de ajuste
I LaR2 es el cociente de la variaci´on explicada sobre la
variaci´on total.
I Entonces, la R2 se interpreta comola proporci´on de la
variaci´on muestral en y que es explicada por la variaci´on enx.
I LaR2 ∈[0,1]dado que la suma explicada no puede ser mayor a la suma total.
I R2 =1 significa que la funci´on de regresi´on muestral cruza por todos los puntos, ajustando perfectamente con los datos.
I R2 cercana a 0 indica un desempe˜no pobre de la funci´on de regresi´on muestral.
I Si multiplicamos R2∗100 podemos interpretarlo como
Bondad de ajuste
I LaR2 es el cociente de la variaci´on explicada sobre la
variaci´on total.
I Entonces, la R2 se interpreta comola proporci´on de la
variaci´on muestral en y que es explicada por la variaci´on enx.
I LaR2 ∈[0,1]dado que la suma explicada no puede ser mayor a la suma total.
I R2 =1 significa que la funci´on de regresi´on muestral cruza por todos los puntos, ajustando perfectamente con los datos.
I R2 cercana a 0 indica un desempe˜no pobre de la funci´on de regresi´on muestral.
I Si multiplicamos R2∗100 podemos interpretarlo como
Bondad de ajuste
I LaR2 es el cociente de la variaci´on explicada sobre la
variaci´on total.
I Entonces, la R2 se interpreta comola proporci´on de la
variaci´on muestral en y que es explicada por la variaci´on enx.
I LaR2 ∈[0,1]dado que la suma explicada no puede ser mayor a la suma total.
I R2 =1 significa que la funci´on de regresi´on muestral cruza por todos los puntos, ajustando perfectamente con los datos.
I R2 cercana a 0 indica un desempe˜no pobre de la funci´on de regresi´on muestral.
I Si multiplicamos R2∗100 podemos interpretarlo como
Bondad de ajuste
I LaR2 es el cociente de la variaci´on explicada sobre la
variaci´on total.
I Entonces, la R2 se interpreta comola proporci´on de la
variaci´on muestral en y que es explicada por la variaci´on enx.
I LaR2 ∈[0,1]dado que la suma explicada no puede ser mayor a la suma total.
I R2 =1 significa que la funci´on de regresi´on muestral cruza por todos los puntos, ajustando perfectamente con los datos.
I R2 cercana a 0 indica un desempe˜no pobre de la funci´on de regresi´on muestral.
I Si multiplicamos R2∗100 podemos interpretarlo como
Bondad de ajuste
I LaR2 es el cociente de la variaci´on explicada sobre la
variaci´on total.
I Entonces, la R2 se interpreta comola proporci´on de la
variaci´on muestral en y que es explicada por la variaci´on enx.
I LaR2 ∈[0,1]dado que la suma explicada no puede ser mayor a la suma total.
I R2 =1 significa que la funci´on de regresi´on muestral cruza por todos los puntos, ajustando perfectamente con los datos.
I R2 cercana a 0 indica un desempe˜no pobre de la funci´on de regresi´on muestral.
I Si multiplicamos R2∗100 podemos interpretarlo como
Ejemplo del sueldo de los CEOs
I En la regresi´on de los sueldos anuales de los CEOs sobre el rendimiento de la empresa obtuvimos
I
ˆs =963.191+18.501r
con una R2=0.0132.
I Vemos que de hecho el rendimiento de la empresa no explica muy bien la variaci´on de los sueldos en la muestra.
I El 1.3 % de la variaci´on en sueldos es explicada por variaci´on en el rendimiento de la empresa.
I Es decir, el 98.7 % de la variaci´on no es explicada por el modelo.
Ejemplo del sueldo de los CEOs
I En la regresi´on de los sueldos anuales de los CEOs sobre el rendimiento de la empresa obtuvimos
I
ˆs =963.191+18.501r
con una R2=0.0132.
I Vemos que de hecho el rendimiento de la empresa no explica muy bien la variaci´on de los sueldos en la muestra.
I El 1.3 % de la variaci´on en sueldos es explicada por variaci´on en el rendimiento de la empresa.
I Es decir, el 98.7 % de la variaci´on no es explicada por el modelo.
Ejemplo del sueldo de los CEOs
I En la regresi´on de los sueldos anuales de los CEOs sobre el rendimiento de la empresa obtuvimos
I
ˆs =963.191+18.501r
con una R2=0.0132.
I Vemos que de hecho el rendimiento de la empresa no explica muy bien la variaci´on de los sueldos en la muestra.
I El 1.3 % de la variaci´on en sueldos es explicada por variaci´on en el rendimiento de la empresa.
I Es decir, el 98.7 % de la variaci´on no es explicada por el modelo.
Ejemplo del sueldo de los CEOs
I En la regresi´on de los sueldos anuales de los CEOs sobre el rendimiento de la empresa obtuvimos
I
ˆs =963.191+18.501r
con una R2=0.0132.
I Vemos que de hecho el rendimiento de la empresa no explica muy bien la variaci´on de los sueldos en la muestra.
I El 1.3 % de la variaci´on en sueldos es explicada por variaci´on en el rendimiento de la empresa.
I Es decir, el 98.7 % de la variaci´on no es explicada por el modelo.
Ejemplo del sueldo de los CEOs
I En la regresi´on de los sueldos anuales de los CEOs sobre el rendimiento de la empresa obtuvimos
I
ˆs =963.191+18.501r
con una R2=0.0132.
I Vemos que de hecho el rendimiento de la empresa no explica muy bien la variaci´on de los sueldos en la muestra.
I El 1.3 % de la variaci´on en sueldos es explicada por variaci´on en el rendimiento de la empresa.
I Es decir, el 98.7 % de la variaci´on no es explicada por el modelo.
Ejemplo del sueldo de los CEOs
I En la regresi´on de los sueldos anuales de los CEOs sobre el rendimiento de la empresa obtuvimos
I
ˆs =963.191+18.501r
con una R2=0.0132.
I Vemos que de hecho el rendimiento de la empresa no explica muy bien la variaci´on de los sueldos en la muestra.
I El 1.3 % de la variaci´on en sueldos es explicada por variaci´on en el rendimiento de la empresa.
I Es decir, el 98.7 % de la variaci´on no es explicada por el modelo.
Observaciones
I En corte transversal es com´un encontrar unaR2 baja.
I Sin embargo debemos recalcar que una R2 bajano implica que la regresi´on es inservible.
I Puede ser que la regresi´on me de un estimador muy bueno (insesgado, consistente, etc.) de β a´un si laR2 es baja. I De hecho, ninguna de estas propiedades deseables de un
estimador dependen de la R2.
Observaciones
I En corte transversal es com´un encontrar unaR2 baja. I Sin embargo debemos recalcar que una R2 bajano implica
que la regresi´on es inservible.
I Puede ser que la regresi´on me de un estimador muy bueno (insesgado, consistente, etc.) de β a´un si laR2 es baja. I De hecho, ninguna de estas propiedades deseables de un
estimador dependen de la R2.
Observaciones
I En corte transversal es com´un encontrar unaR2 baja. I Sin embargo debemos recalcar que una R2 bajano implica
que la regresi´on es inservible.
I Puede ser que la regresi´on me de un estimador muy bueno (insesgado, consistente, etc.) de β a´un si laR2 es baja.
I De hecho, ninguna de estas propiedades deseables de un estimador dependen de la R2.
Observaciones
I En corte transversal es com´un encontrar unaR2 baja. I Sin embargo debemos recalcar que una R2 bajano implica
que la regresi´on es inservible.
I Puede ser que la regresi´on me de un estimador muy bueno (insesgado, consistente, etc.) de β a´un si laR2 es baja. I De hecho, ninguna de estas propiedades deseables de un
estimador dependen de la R2.
Observaciones
I En corte transversal es com´un encontrar unaR2 baja. I Sin embargo debemos recalcar que una R2 bajano implica
que la regresi´on es inservible.
I Puede ser que la regresi´on me de un estimador muy bueno (insesgado, consistente, etc.) de β a´un si laR2 es baja. I De hecho, ninguna de estas propiedades deseables de un
estimador dependen de la R2.
Ejemplo del gasto en campa˜
na y resultados electorales
I En este caso, al correr la regresi´on de votos sobre el gasto obtuvimos
I
ˆ
v =40.90+0.306s
con una R2=0.505.
I Entonces, la variaci´on en el gasto en campa˜na explica aproximadamente el 50 % de la variaci´on en el resultado electoral.
Ejemplo del gasto en campa˜
na y resultados electorales
I En este caso, al correr la regresi´on de votos sobre el gasto obtuvimos
I
ˆ
v =40.90+0.306s
con una R2=0.505.
I Entonces, la variaci´on en el gasto en campa˜na explica aproximadamente el 50 % de la variaci´on en el resultado electoral.
Ejemplo del gasto en campa˜
na y resultados electorales
I En este caso, al correr la regresi´on de votos sobre el gasto obtuvimos
I
ˆ
v =40.90+0.306s
con una R2=0.505.
I Entonces, la variaci´on en el gasto en campa˜na explica aproximadamente el 50 % de la variaci´on en el resultado electoral.
Ejemplo del gasto en campa˜
na y resultados electorales
I En este caso, al correr la regresi´on de votos sobre el gasto obtuvimos
I
ˆ
v =40.90+0.306s
con una R2=0.505.
I Entonces, la variaci´on en el gasto en campa˜na explica aproximadamente el 50 % de la variaci´on en el resultado electoral.