DOSSIER ECONOMETRIA 1

Texto completo

(1)UNIDAD ACADEMICA COCHABAMBA DEPARTAMENTO DE CIENCIAS ECONOMICAS Y FINANCIERAS. DOSSIER DE LA ASIGNATURA. ECONOMETRIA 1 PREPARADO POR:. RODRIGO PANIAGUA TAPIA. GESTIÓN ACADÉMICA – 2017.

(2) Econometría I. Rodrigo Paniagua. REPASO DE MATRICES Mediante el uso del álgebra matricial, los resultados fundamentales en econometría se presentan de manera compacta y clara. Una matriz es una colección de números ordenados rectangularmente,. A = [ aik ] = [ A ]ik. ! # # =# # #". a11. a12. a21. a22. ... an1. ... an2. a1k $ & ... a2k & & ... ... & ... ank &% .... Un vector es un conjunto ordenado de números dispuestos en una fila o en una columna. Una matriz puede ser también interpretada como un conjunto de vectores columna. La dimensión de una matriz indica el número de filas y el número de columnas que contiene: “A es una matriz nxk”, que indica que A tiene n filas y k columnas. Si n es igual a k, entonces A es una matriz cuadrada. Una matriz simétrica A, es aquella en la cual aik = aki , para todo i. Una matriz diagonal, es una matriz cuadrada cuyos únicos elementos distintos de cero, aparecen en su diagonal principal. Una matriz escalar es una matriz diagonal, con el mismo valor en todos los elementos de la diagonal. Una matriz identidad es una matriz escalar con unos en la diagonal. Una matriz triangular es aquella que contiene ceros encima, o bien debajo de la diagonal principal. 1. OPERACIONES CON MATRICES.-. 2.

(3) Econometría I. Rodrigo Paniagua. Igualdad:. A = B ⇔ aik = bik ∀ik. Transpuesta: B = A' ⇔ bik = aki ∀ik. A = (A')' Suma:. C = A ± B = [aik + bik ]. Conmutativa: A + B = B + A. (A + B)' = A'+ B' Asociativa:. (A + B) + C = A + (B + C). Producto: De dos vectores es un escalar.. C = AB ⇔ Ank BkT ⇒ CnT AB ≠ BA. No es conmutativa. (AB)C = A(BC). Asociativa. A(B + C) = AB + AC. Distributiva. (AB)' = B' A'. Transpuesta.. 2. SUMA DE ELEMENTOS: i matriz escalar de “1”.. ∑x = x + x i. 1. Si xi = a :. 2. +... + xn = iX. = i'(ai) = a(i'i) = na. ∑ ax = ai' X i. = 1 n ∑ xi = 1 n i' X = x. Si a = 1 n :. ∑ x = i' X = nx i. Suma de cuadrados de los elementos de un vector:. ∑x. 2 i. = x'x 3.

(4) Econometría I. Rodrigo Paniagua. Suma de los productos de los vectores X e Y:. ∑x y = x'y i i. Matriz idempotente.Es la que se emplea para transformar datos en desviaciones de la media.. ix =. 1 1 1 x = i i' x = ii' x n n n. donde 1n ii' es nxn con cada elemento. 1. n. Entonces,. [x − ix ] = [x − 1 n ii' x]. y puesto que x = Ix. = [Ix − 1 n ii' x] = [I − 1 n ii']x = M o x Todos los elementos de la diagonal de Mº son 1− 1 n y los demás son − 1 n . Suma de desviaciones respecto a la media:. ∑(x − x ) = i'[M º x] = 0' x = 0 i. Suma de desviaciones al cuadrado:. ∑(x − x ) i. 2. = (x − ix )'(x − ix ) = (M º x)'(M º x) = x ' M º ' M º x = x ' M º x. Dado que Mº es una matriz idempotente. La suma de cuadrados y productos cruzados de desviaciones respecto a las medias:. ∑(x − x )(y − y ) = (M º x)(M º y) i. i. Pero si Z = [xy] ⇒ M º z. 3. RANGO DE UNA MATRIZ: El producto escalar: un escalar múltiplo de un vector “a” es otro vector “a” cuyas coordenadas son el múltiplo escalar de las coordenadas de “a”. Cualquier escalar múltiplo de a es un segmento de esta línea.. 4.

(5) Econometría I. Rodrigo Paniagua. Un conjunto de vectores es linealmente dependiente si cualquiera de los vectores en el conjunto puede ser escrito como una combinación lineal de los otros. Un conjunto de vectores es linealmente independiente si y solo si, la única solución a la ecuación x1a1 + x2 a2 +... + xk ak = 0 es: x1 = x2 = ... = xk = 0 El rango columna de una matriz es la dimensión del vector espacio generados por sus columnas: Rango de una Matriz:. r(A) = r(A') ≤ min(N º filas, N º columnas). Para cualquier matriz,. r(A) = r(AA') = r(A' A). Dos vectores a y b son ortogonales, si a'b = b'a = 0. “a ⊥b”. Un sistema de ecuaciones es homogéneo si adopta la forma Ax=0. Un sistema de ecuaciones es No Homogéneo si Ax=b. Donde b es un vector no nulo y A debe tener rango completo. La traza de una matriz cuadrada kxk es la suma de los elementos de la diagonal principal. Todas las matrices simétricas idempotentes, excepto I, son singulares.. 5.

(6) Econometría I. Rodrigo Paniagua. INTRODUCCIÓN. ¿QUÉ ES ECONOMETRÍA? Econometría: Medición Económica Pero el avance de la disciplina es más amplio. Def. 1: “La econometría consiste en la aplicación de la estadística matemática a la información económica para dar soporte empírico a los modelos construidos por la economía matemática y obtener resultados numéricos” G. Titner. Def. 2: “La econometría puede ser definida como el análisis cuantitativo de fenómenos económicos reales, basados en el desarrollo simultáneo de la teoría y la observación,. relacionados. mediante. métodos. apropiados. de. inferencia”. P.. Samuelson. Def. 3: El arte del econometrista consiste en encontrar el conjunto de supuestos que sean lo suficientemente específicos y realistas, de tal forma que le permitan aprovechar de la mejor manera los datos que tiene a su disposición”. E. Malinvaud. Def. 4: El método de la investigación econométrica busca esencialmente una conjunción entre la teoría económica y la medición real, utilizando como puente la teoría y la técnica de la inferencia estadística”. T. Haavelmo. ¿DISCIPLINA APARTE? La econometría es una amalgama de Teoría Económica, Economía matemática, estadística económica y estadística matemática. Por eso merece ser estudiada de forma separada.. 6.

(7) Econometría I. Rodrigo Paniagua. TEORÍA ECONÓMICA: Formula hipótesis de naturaleza principalmente cualitativa. Por sí misma no proporciona medida numérica alguna de la relación de variables. La econometría da contenido empírico a gran parte de la teoría económica. ECONOMÍA MATEMÁTICA: Su interés es expresar la teoría económica en forma matemática (por medio de ecuaciones) sin preocuparse de la verificación empírica de la teoría. La econometría se preocupa principalmente de la verificación empírica de la teoría económica. La conversión de ecuaciones matemáticas en ecuaciones econométricas requiere mucha destreza. ESTADÍSTICA ECONÓMICA: Se relaciona principalmente con la recolección, procesamiento y presentación de cifras económicas en forma de gráficos y tablas. El estadístico económico no va mas allá de la recolección de información, no le concierne la utilización de las cifras recopiladas para probar la validez de las teorías económicas. ESTADÍSTICA MATEMÁTICA: Aunque se utilizan muchas herramientas de ésta, el econometrista requiere métodos especiales en vista de la naturaleza única de la mayoría de las cifras económicas. (i.e. no provienen de experimentos controlados). La econometría es el campo de la economía que tiene que ver con la aplicación de la estadística matemática y las herramientas de la inferencia estadística a las mediciones empíricas de relaciones postuladas por la economía teórica. MODELIZACIÓN ECONOMÉTRICA La economía teórica es generalmente estricta y no ambigua. Los modelos postulan relaciones determinísticas precisas (pero no se debe olvidar que un modelo es solo una simplificación de la realidad).. 7.

(8) Econometría I. -. Rodrigo Paniagua. Ningún modelo puede esperar englobar la gran cantidad de los aspectos aleatorios de la vida económica. Es necesario por tanto incorporar elementos estocásticos en nuestros modelos empíricos "𝜀".. -. Se debe entender que la introducción de un error aleatorio en un modelo determinístico no pretende meramente recoger sus ineficiencias.. -. Un modelo (o teoría) nunca puede ser realmente confirmado a menos que se haga tan amplio como para incluir cualquier posibilidad (pero un modelo puede ser falsado).. La introducción de elementos estocásticos en el modelo hace que este cambie, de una afirmación exacta, a una descripción probabilística de los valores esperados. (Únicamente el predominio de evidencia empírica puede invalidar convenientemente el modelo probabilistico). METODOLOGÍA DE LA ECONOMETRÍA ¿Cómo proceden los econometristas en el análisis de un problema económico? Aunque hay varias escuelas de pensamiento, se presenta la metodología tradicional o clásica. Se tienen los siguientes lineamientos: i. Planteamiento de la teoría o de la hipótesis. ii. Especificación del modelo matemático de la teoría. iii. Especificación del modelo econométrico o estadístico de la teoría. iv. Obtención de datos. v. Estimación de los parámetros del modelo econométrico. vi. Prueba de hipótesis. vii. Pronóstico o predicción. viii. Utilización del modelo para fines de control o política.. 8.

(9) Econometría I. Rodrigo Paniagua. Ejemplo: 1. La ley psicológica fundamental de Keynes, consiste en que los hombres (y mujeres) como regla general y en promedio, están dispuestos a incrementar su consumo a medida que su ingreso aumenta pero no en la misma cuantía. 2. Se tiene una relación positiva entre el consumo (C) y el ingreso (Y). El economista matemático sugiere:. C = β 0 + β1Y. donde 0 < β1 < 1. β 0 y β1 son los parámetros del modelo y C y Y, las variables. A este modelo se le conoce como la función de consumo. 3. Especificación del modelo econométrico de consumo. Se supone que no existe relación exacta o determinística entre C y Y. Para considerar las relaciones inexactas, el econometrista modifica la función de consumo de la siguiente manera:. C = β 0 + β1Y + ε. ε es el término de perturbación, también conocido como la variable estocástica. Representa todos los otros factores que afectan y que no son considerados en el modelo. 4. Para estimar el modelo econométrico (básicamente β 0 y β1 ) se requieren datos, que pueden provenir de tablas y ser expresados en gráficos. 5. Lo siguiente es estimar los parámetros de la función consumo. Esto da contenido empírico a la función consumo. La técnica estadística se conoce como “Análisis de regresión”. Un ejemplo de la función estimada es: Cˆ = −184,7 + 0,781Y La propensión marginal a consumir del ejemplo indica que por cada 1$ de ingreso, 0,78$ se destinan al consumo real, en promedio. 6. Se tienen que plantear criterios para evaluar si los valores estimados concuerdan con las expectativas de la teoría que está siendo probada. Se realiza la inferencia estadística (o prueba de hipótesis). 7. Si el modelo escogido confirma la hipótesis o teoría, se puede utilizar para predecir los valores futuros de la variable dependiente. Se logra identificar el. 9.

(10) Econometría I. Rodrigo Paniagua. error de predicción. 8. Para medidas de política (en modelos macroeconómicos), por ejemplo, ¿cuánto debe cambiar Y para mantener C en C0? REPASO DE CONCEPTOS BÁSICOS DE PROBABILIDADES ¿Por qué necesitamos estudiar teoría de probabilidades para analizar observaciones o datos de la realidad? ¿Por qué no nos concentramos con hacer histogramas y usar medidas descriptivas? Supongamos que contamos con una muestra de datos de un fenómeno de interés. Podemos hacer un gráfico de frecuencias empíricas de los datos y derivar información útil.. 500. Frequency. 400 300 200 100 0 1. 2. 3. 4. 5. 6. 7. 8. 9. Midpoint. Aunque el gráfico anterior describe adecuadamente la distribución del ancho de una muestra de calles de Cochabamba, los estadísticos descriptivos están confinados a dicha muestra. Cualquier pregunta respecto de la población de la cual se derivó la muestra no puede ser discutida. La esencia del trabajo econométrico es, en este sentido, proveer resultados generales a partir de muestras cuya información es limitada. La teoría de probabilidades provee un modelo matemático para la inferencia estadística que, al realizarse sobre una muestra de observaciones, permite estudiar. 10.

(11) Econometría I. Rodrigo Paniagua. fenómenos generales. Por esto, este capítulo repasa la principal teoría de probabilidades. VARIABLES ALEATORIAS. Definición útil de variable aleatoria (X): Función cuyo rango de valores es conocido ex-ante pero el varo que toma es solo conocido ex-post. X es una variable aleatoria porque hasta que se realice el experimento su valor es incierto. Las probabilidades se asocian a las realizaciones cuantificando la incertidumbre. Asociamos a ellas una “probabilidad de ocurrencia”, que denotamos por: Prob(X=x) donde X es el conjunto de valores y x es un elemento (realización) de la función. Para este curso, las probabilidades son exógenas. Lo anterior indica que la probabilidad de que X asuma un valor x depende de su probabilidad de ocurrencia. Existen dos tipos de variables aleatorias: las variables discretas y las variables continuas. FUNCIONES DE DISTRIBUCIÓN Exigiremos que las funciones de probabilidad cumplan algunas restricciones. La manera más simple de visualizarlo es: 0 ≤ P(X = x) ≤ 1. ∑ P(X = x) =∑ f (x) = 1 Lo anterior es directo si la variable X es discreta, pero si ésta es continua entonces. 11.

(12) Econometría I. Rodrigo Paniagua. P(X=x)=0. Sin embargo, para x ∈ [ x, x], P (a ≤ x ≤ b) existe y de hecho: x. b. ∫. ∫ f ( x)dx = 1. f ( x)dx ≥ 0. x. a. La distribución acumulada de probabilidades es la probabilidad que X sea menor que un cierto valor “z” y la denominamos F(x). z. F ( x) = ∑ f ( x) x≤ z. o. F ( x) = ∫ f ( x)dx x. Para describir variables aleatorias y su distribución, usualmente empleamos los momentos de la distribución (esperanza, mediana, moda, varianza, skewness, Kurtosis, etc.), los cuales pueden ser “brutos” o “centrados”. Los segundos utilizan desviaciones con respecto a la media, en tanto que los primeros no. DESCRIPTORES DEL MOMENTO CENTRAL DE UNA DISTRIBUCIÓN El valor esperado de una variable aleatoria se define como el promedio de las realizaciones de X ponderado por su probabilidad de ocurrencia.. E[ x] = ∑ xf ( x). para toda función X discreta. x. E[ x] = ∫ xf ( x)dx. para toda función X continua. x. Note que la esperanza (media) no tiene que ser un valor que la variable aleatoria puede tomar cuando ésta es discreta. Por ejemplo, al lanzar un dado numerado de 1 a 6, el valor esperado es 3,5. Otros descriptores de uso común son la mediana que es el valor del medio del rango de valores de la distribución y se usa principalmente cuando hay valores extremos, pues a diferencia de la media no se ve tan influida por éstos. Ocasionalmente se usa la moda, que es el valor que ocurre con mayor probabilidad, pero cuya definición es arbitraria para variables continuas. 12.

(13) Econometría I. Rodrigo Paniagua. DESCRIPTORES DE OTROS MOMENTOS DE UNA DISTRIBUCIÓN •. Varianza de una distribución V ( x) = E[ x − E ( x)]2 es decir, es el valor esperado de la dispersión de una variable aleatoria.. •. Skewness de una distribución S ( x) = E[ x − E ( x)]3 es decir, es el valor esperado de la asimetría de la variable aleatoria.. •. Kurtosis de una distribución K ( x) = E[ x − E ( x)]4 es decir, es el valor esperado de las colas de la distribución de la variable aleatoria.. DISTRIBUCIONES DISCRETAS DE USO COMÚN Supongamos que el experimento A tiene dos posibles resultados S={éxito, fracaso} con probabilidades de ocurrencia de p y 1-p respectivamente: Éxito. x=1. P( x = 1) = p. Fracaso. x=0. P( x = 0) = 1 − p. La distribución (o descripción) de los datos del experimento anterior es la llamada distribución de Bernoulli:. f ( x) = p x (1 − p) (1− x ) 0. ∀x = 0,1 en otro caso.. Como el mismo Bernoulli se encargó de demostrar, si el experimento se repite n veces se obtiene la distribución “binomial”.. ⎛n⎞ f ( y ) = ⎜⎜ ⎟⎟ p y (1 − p) ( n− y ) ⎝ y⎠. donde. ⎛n⎞ n! ⎜⎜ ⎟⎟ = ⎝ y ⎠ (n − y )! y!. Hay otras discretas útiles. Entre ellas está la de Poisson, que corresponde al límite de la binomial cuando n → ∞ y p → 0 , tal que np es constante.. 13.

(14) Econometría I. Rodrigo Paniagua. f ( xi ;θ ) =. e −θ θ xi xi !. DISTRIBUCIONES CONTINUAS DE USO COMÚN En muchos experimentos en economía no puede suponerse que las variables aleatorias de interés sean discretas, por lo que se utilizan funciones continuas. La distribución normal: Si n → ∞ , la expresión de la binomial es poco práctica. De Moivre encuentra la distribución que resulta en este caso: 2. 1 "[ z−E ( x )]% '& σ. 1 1 − 2$# f (z) = e 2π σ. es decir, la distribución normal. Esta distribución es la base de muchos test y procedimientos de estimación que usaremos en este curso. La representación de la normal se indica como: 𝑥~𝑁(𝜇, 𝜎 ! ) Si 𝑥~𝑁(𝜇, 𝜎 ! ) entonces 𝑎 + 𝑏𝑥~𝑁(𝑎 + 𝑏𝜇, 𝑏 ! 𝜎 ! ) Lo anterior representa que la forma de la distribución se mantiene ante transformaciones lineales. !. De 𝑎 + 𝑏𝑥~𝑁(𝑎 + 𝑏𝜇, 𝑏 ! 𝜎 ! ) si 𝑎 = − !. !. y𝑏=!. entonces ~𝑁(0,1). La distribución normal estándar: La función normal se estandariza fácilmente: si z → N ( µ ,σ 2 ). z−µ. ⇒. x=. ⇒. y = x 2 → χ 2 (1). σ. → N (0,1). La distribución Chi-cuadrado: si x → N (0,1). 2 Una propiedad de esta función es que sumas de variables que se distribuyen χ. 14.

(15) Econometría I. Rodrigo Paniagua. 2 también se distribuyen χ :. si x1 → χ 2 (1) y x2 → χ 2 (1) , entonces y = x1 + x2 → χ 2 (1) La distribución F: si y → χ 2 (m) y w → χ 2 (n) ⇒. x=. y/m → F (m, n) w/ n. La distribución “t” de student: si z → N (0,1) y w → χ 2 (1) ⇒. x=. z → t (n) wn. La distribución logística: z −a ⎡ ⎤ f ( z ) = ⎢1 + e b ⎥ ⎣ ⎦. −1. DISTRIBUCIONES CONJUNTAS Es posible que dos o mas variables puedan ser descritas por una función de probabilidades conjunta.. P(a ≤ x ≤ b; c ≤ y ≤ d ) =. ∑ ∑ f ( x, y). a≤ x≤b c≤ y ≤d b d. =. ∫∫ f ( x, y)dxdy a c. El objetivo principal de las ciencias sociales y la economía en particular es describir (i.e. modelar) distribuciones conjuntas. La probabilidad acumulada es: 𝐹 𝑥, 𝑦 = Pr (𝑋 ≤ 𝑥; 𝑌 ≤ 𝑦) DISTRIBUCIONES MARGINALES Suponiendo que existe la densidad conjunta de dos o más variables, resulta natural preguntarse ¿qué probabilidad tiene x (o y) de ocurrir, independiente de los valores 15.

(16) Econometría I. Rodrigo Paniagua. que tome la o las otras variables y (o x)? Es decir, para obtener las distribuciones marginales a partir de la densidad conjunta, es necesario sumar o integrar la(las) otra(s) variable(s). En un caso de dos variables:. f x (x) = ∑ f ( x, y ) y. f x (x) = ∫ f ( x, y )dy y. De aquí se deriva el concepto de independencia estadística. Si la densidad conjunta es el producto de las marginales, las variables son independientes. 𝑓 𝑥; 𝑦 = 𝑓! 𝑥 𝑓! (𝑦) <=> x e y son independientes. Asociada a la distribución marginal habrá, naturalmente, esperanzas marginales, varianzas marginales, etc. La esperanza en una distribución conjunta se obtiene respecto a la distribución marginal. Es decir: 𝐸𝑥 =. 𝑥𝑓(𝑥, 𝑦) !. !. [𝑥 − 𝐸 𝑥 ]! 𝑓(𝑥, 𝑦). 𝑉𝑥 = !. !. DISTRIBUCIONES CONDICIONALES Para ciencias sociales, la distribución más interesante es la condicional, es decir aquella que describe cuál es la probabilidad que x condicional en que y tome algún cierto valor y que denotamos por. Se puede demostrar que f (y x) =. f ( y x). .. f (x, y) = f y (y) . f x (x). 16.

(17) Econometría I. Rodrigo Paniagua. Para ello definiremos primero la noción de probabilidad condicional. Supongamos que en el experimento de tirar dos monedas, sabemos que el primer tiro fue cara. ¿Cambia esta información la estructura de probabilidades? Primero, note que ahora el espacio de eventos se reduce a: S A = {CC, SC} . Entonces, tienen que cambiar las probabilidades P(.), siendo ahora:. PA = {CS} = 12. PA = {CC} = 12 Definiremos la probabilidad condicional como:. PA ( A1 ) = P( A1 A) =. P( A1 ∩ A) P( A). si y solo si P(A)>0. Resulta clave entender que la media condicional de y en x,. E[ y x]. es exactamente el. concepto de una regresión lineal en econometría. Supongamos que el experimento puede ser descrito por la siguiente relación: y = βx + ε , con ε como ruido blanco,. cov[ε i , ε j ] = σ 2 cuyas características son E[ε ] = 0 y para i=j, y cero en otro caso. Entonces. E[ y x] = βx. .. Una segunda propiedad interesante se deriva al aplicar el operador de la varianza condicional al modelo anterior. Un poco de álgebra permite obtener:. 2. V [ y x] = E[ y 2 x] − (E[ y x]). Esta es la función cedástica. Aplicando la ley de las esperanzas iteradas. E[ y] = Ex [E[ y x]]. se puede obtener:. 17.

(18) Econometría I. Rodrigo Paniagua. V[y] = Vx !" E[y x]#$ + E x !"V[y x]#$. de donde se desprende que:. Ex [V [ y x]] = V [ y] − Vx [E[ y x]] es decir, la incertidumbre asociada a la predicción hecha sobre la base de una regresión es menor a aquella de los datos. Por lo tanto, la variación de y surge por dos motivos: 1ro. 𝐸 𝑦 𝑥 varía con x è Varianza de la regresión = Vx !" E[y x]#$ 2do. y varía alrededor de la media condicional è Varianza residual E x !"V[y x]#$ 3ro. la suma total es la varianza total. Y al analizar una regresión, resulta de interés preguntarnos cuál de las dos partes es más grande. De ahí se deriva. Coeficiente de determinación =. !"#$"%&".!"#!"$%&' !"#$%&'%.!"!#$. TEORÍA ASINTÓTICA. El conocimiento del comportamiento en el límite de la distribución de un estimador, puede utilizarse para inferir una distribución aproximada para el estimador obtenido de una muestra finita. a) Convergencia en probabilidad. Los límites están considerados respecto al tamaño muestral “n”. La variable aleatoria xn converge en probabilidad a “c” si:. 18.

(19) Econometría I. Rodrigo Paniagua. lim Pr 𝑥 − 𝑐 > 𝜀 = 0. !→!. 𝑝𝑙𝑖𝑚 𝑥! = 𝑐 la convergencia en probabilidad implica que los valores cercanos a “c” que toma la variable, son cada vez más probables, a medida que n aumenta. La convergencia en media cuadrática implica que, si “x” tiene 𝜇 y 𝜎 ! con sus límites ordinarios iguales a c y 0, entonces 𝑥! converge en media cuadrática a c. Es decir: 𝑝𝑙𝑖𝑚 𝑥! = 𝑐 La convergencia en media cuadrática implica la convergencia en probabilidad, pero la convergencia en probabilidad no implica convergencia en media cuadrática. Por lo tanto, se puede definir un estimador consistente de la siguiente manera: 𝑝𝑙𝑖𝑚 𝜃 = 𝜃 y luego se puede definir la consistencia de la media cuadrática: 𝑝𝑙𝑖𝑚 𝑥 = 𝜇 la consistencia de la media de funciones es: !. 𝑝𝑙𝑖𝑚 !. 𝑔(𝑥) = 𝐸[𝑔 𝑥 ] !. Teorema de Slutzky.. 19.

(20) Econometría I. Rodrigo Paniagua. Se cumple para funciones continuas g(x) que no son función de n. 𝑝𝑙𝑖𝑚 𝑔 𝑥! = 𝑔(𝑝𝑙𝑖𝑚 𝑥! ) establece una comparación entre el valor esperado de una variable aleatoria y su límite en probabilidad.. Por lo tanto, 𝑝𝑙𝑖𝑚. 𝑥 𝜇 = 𝑠! 𝜎!. Reglas límite en probabilidad: Si. 𝑝𝑙𝑖𝑚 𝑥! = 𝑐. plim (xn + d) = c + d. 𝑝𝑙𝑖𝑚 𝑦! = 𝑑. plim (xn d) = c d plim (xn / d) = c/d. b) Convergencia en distribución y distribución límite.La sucesión de variables aleatorias {𝑥! } converge en distribución a una variable aleatoria x con fda F(x) si:. 20.

(21) Econometría I. Rodrigo Paniagua. EL MODELO CLÁSICO DE REGRESIÓN LINEAL Su forma genérica:. y i = f (xi1 , xi 2 ,..., xik ) + ε i Uno de los aspectos más útiles del modelo de regresión múltiple es su capacidad para identificar efectos de un conjunto de variables independientes sobre una dependiente. SUPUESTOS DEL MODELO CLÁSICO DE REGRESIÓN LINEAL a. Forma funcional lineal b. Identificabilidad de los parámetros del modelo c. Valor esperado de la perturbación dada la información observada d. Varianzas y convarianzas de las perturbaciones dada la información observada e. Naturaleza de los datos sobre variables independientes f. Distribución de probabilidad de la parte estocástica del modelo LINEALIDAD DEL MODELO DE REGRESIÓN. y = x1 β1 + ... + xk β k + ε. ; los subíndices “j k” son de columnas de X (variables). y i = x il β + ε. ; los subíndices “i t” son para filas de X (observaciones). La variables dependiente y es la suma del componente determinístico y una variable aleatoria. La linealidad hace referencia a la manera en que los parámetros y ε entran a formar parte de la ecuación y no necesariamente a la relación entre variables. Modelo logarítmico lineal: ln y = β1 + β 2 ln x 2 + ... + β k ln x k + ε (elasticidad constante) Modelo semilogarítmico:. ln y t = xt β + δt + ε t (modelo de crecimiento económico). Modelo logístico:. ln y t 1 − y t = x tl β + δt + ε t K. K. T. Modelo translogarítmico: ln y = β 0 + ∑ β k ln x k + 12 ∑∑ δ kt ln x k + ε k =1. k =1 t =1. 21.

(22) Econometría I. Rodrigo Paniagua. RANGO COMPLETO X es una matriz nxk con rango k. Eso significa que X tiene rango de columna completa: las columnas de X son linealmente independientes y hay al menos k observaciones (condición de identificación). En un modelo lineal debe existir variación en Xi, de lo contrario no se puede aprender nada de él. REGRESIÓN. E [ε i x ] = 0 ⎡ E [ε 1 x ]⎤ ⎢ ⎥ E [ε 2 x ]⎥ ⎢ E [ε x ] = =0 ⎢ ... ⎥ ⎢ ⎥ ⎣⎢ E [ε n x ]⎦⎥ E [ε i ε 1 ,..., ε n ] = 0 E [ε i ] = E x [E [ε i x ]] = E x [0] = 0 Cov [x, e] = 0 Las observaciones en x no conllevan información sobre el valor esperado de ε.. E[y x] = xβ. esperanza condicionada.. PERTURBACIONES ESFÉRICAS. Var[ε i x ] = σ 2. [. ]. Cov ε i ε j x = 0 Donde:. 22.

(23) Econometría I. Rodrigo Paniagua. ⎡σ 2 0 ⎢ 0 σ2 E [εε ' x ] = ⎢ ⎢ ... ... ⎢ 0 ⎢⎣ 0. ... 0 ⎤ ⎥ ... 0 ⎥ ⇒ E [εε ' x ] = σ 2 I ⎥ ... ... ⎥ ... σ 2 ⎥⎦. Var[ε ] = E[Var[ε x]]− Var[E[ε x]] = σ 2 I Existe homocedasticidad No hay autocorrelación REGRESORES NO ESTOCÁSTICOS X es una matriz conocida nxk, de constantes. NORMALIDAD DE LA PERTURBACION. ε x → N [0, σ 2 I ]. perturbaciones normalmente distribuidas, media cero y varianza. constante El Teorema del Límite Central (TCL) puede generalmente aplicarse a ε. El supuesto implica que εi es estadísticamente independiente y es no correlacionado. REGRESIÓN POR MÍNIMOS CUADRADOS Los parámetros desconocidos de la relación estocástica y i = xi' β son el objetivo a. [. ]. [. ]. estimar. La regresión poblacional es E yi xi = xi' β , y la estimación de E yi xi es. yˆ i = xi' β̂ . VECTOR DE COEFICIENTES DE MCRL Minimiza la suma de cuadrados de los residuos.. 23.

(24) Econometría I. Rodrigo Paniagua. ∑ε. 2 i0. (. = ∑ yi − β 0' xi. 2. ). Minβ 0 :. S (β 0 ) = ε 0' ε 0 = ( y − xβ 0 )' ( y − xβ 0 ). = y' y − β '0 x' y − y' xβ 0 + β '0 x' xβ 0 ∂S ( β 0 ) = −2 x' y + 2 x' xβ 0 = 0 ∂β 0. sustituyendo β 0 por β̂. x' xβˆ = x' y. βˆ = (x' x )−1 x' y. Si es mínimo:. ∂ 2 S ( βˆ ) = 2 x' x matriz positiva definida. ∂βˆ∂βˆ. Mínimos cuadrados en un modelo de dos variables: 2 i. 2. ∑ e = ∑ ( y − a − bx ) ∂ (∑ e ) = ∑ 2( y − a − bx )(− 1) = 0 ∂a i. i. 2 i. i. ∑y. i. i. = na + (∑ xi )b dividiendo por n. y = a + x b la regresión pasa por las medias.. (. ∂ ∑ ei2 ∂b. )=. ∑ 2( y. i. − a − bxi )(− xi ) = 0. ∑ x y = (∑ x )a + (∑ x )b donde ∑ x ∑ x y − nxy = b(∑ x − nx ) ∑ (x − x )( y − y ) b= ∑ (x − x ) i. i. i. i. 2 i. i. 2 i. i. i. = nx. 2. i. 2. i. REGRESIÓN ORTOGONAL. 24.

(25) Econometría I. Rodrigo Paniagua. Si las variables en una regresión múltiple no están correlacionadas (son ortogonales) las pendientes de la regresión múltiple son las misma que las pendientes de las regresiones simples individuales. ASPECTOS ALGEBRAICOS. (. ). βˆ = (x' x )−1 x' y → (x' x )βˆ = x' y → x' xβˆ − x' y = − x' y − xβˆ = − x' e = 0 Si la primera columna de X es una columna de unos: 1. La suma de los residuos de OLS es cero:. x'1 e = i' e = ∑ e = 0 2. El hiperplano de la regresión pasa por el punto de las medias de los datos:. y = x βˆ 3. La media de los valores calculados por la regresión es igual a la media de los valores pendientes:. yˆ = xβ̂ El vector de residuos OLS es:. e = y − xβˆ −1. e = y − x (x ' x ) x ' y. [. −1. ]. e = I − x(x' x ) x' y = My M es simétrica e idempotente. M es una matriz que produce el vector de los residuos de Mínimos Cuadrados en la regresión de Y sobre X, cuando se premultiplica cualquier vector Y.. y = xβ + ε. puede ser estimado con: βˆ = ( x' x) −1 x' y. βˆ = ( x' x) −1 x' ( xβ + ε ) = ( x' x) −1 x' xβ + ( x' x) −1 x' ε = β + ( x' x) −1 x' ε = β + Aε “ β̂ ” es una función lineal de ε. Si X es no estocástico E[x' ε ] = 0. 25.

(26) Econometría I. Rodrigo Paniagua. “ β̂ ” es un estimador lineal insesgado de β. βˆ = β. [] [. ]. Var βˆ = E ( βˆ − β )( βˆ − β )' = E[( Aε )( Aε )']. [. = E ( x' x) −1 x' εε ' x( x' x) −1 −1. ]. −1. = ( x' x) x' E[εε ']x( x' x) = E[εε ']( x' x) −1 x' x( x' x) −1 = σ 2 I ( x' x) −1 Sea b0=cy un estimador lineal e insesgado de β, donde c es kxn.. D = c − ( x' x) −1 x' D = b − βˆ y. E[cy ] = E[cxβ + cε ] = β ⇔ cx = I. 0. c = D + ( x' x) −1 x'. Var[b0 ] = σ 2 cc ' ⇔ c = ( x' x) −1 x'. cx = I Dx = 0. [( )( [DD'+ Dx( x' x) + ( x' x) [DD'+( x' x) ]. = σ 2 D + ( x' x) −1 x' D + ( x' x) −1 x'. Var[b0 ]. =σ. 2. =σ. 2. −1. −1. )]. xD + ( x' x) −1 x' x( x' x) −1. ]. −1. []. = Var βˆ + σ 2 DD'. La Var[b0] es igual a Var[ β̂ ] mas una matriz definida no negativa. Por consiguiente Var[b0]> Var[ β̂ ]. Teorema de Gauss-Markov: En el modelo clásico de regresión lineal el estimador de mínimos cuadrados ( β̂ ) es el estimador lineal insesgado de varianza mínima de β. Para cualquier vector de constantes w, el estimador lineal insesgado de varianza mínima w’β en el MCRL es w’ β̂ . Si los represores son no estocásticos, entonces (x’x)-1x’ es una constante. Entonces. E ( βˆ ) = β es un estimador insesgado, y por Gauss-Markov, es además de mínima varianza. REGRESORES ESTOCÁSTICOS. 26.

(27) Econometría I. Rodrigo Paniagua. Un método para obtener las propiedades estadísticas de β̂ consiste en obtener primero los resultados deseados condicionados en X. Si podemos establecer insesgadez condicionada en X arbitrario, podemos promediar las X para obtener un resultado incondicionado.. βˆ = β + ( x' x) −1 x' ε E βˆ x = β + ( x' x) −1 x' E [ε x ] = β + ( x' x) −1 x'0 = β. [ ]. Lo que implica que para una muestra (x’x)-1x’ ya no es aleatorio. Usando la ley de expectativas iteradas (para obtener la esperanza incondicional):. [] [ ] E [βˆ ] = E [β ] = β. [. ]. E βˆ = E x E[ βˆ x] = β + E ( x' x) −1 x' E[ε x] x. Este resultado solo depende del supuesto 3 de MCRL. La varianza condicional es:. [ ]. Var βˆ x = σ 2 ( x' x) −1 utilizando la descomposición de varianzas, la varianza incondicional será:. [] [ = E [Var[ βˆ x]]. ]. [. [. ]. ]. Var βˆ = Ex Var[ βˆ x] + Varx E[ βˆ x] x. [. ]. = E σ 2 ( x' x) −1 = σ 2 E ( x' x) −1. lo que significa que el estimador depende de la muestra, y al final la conclusión de Gauss-Markov no se altera. La varianza incondicionada de β̂ solo puede ser descrita en términos del comportamiento de X (para cada muestra el estimador β̂ es de Varianza Mínima, pero no de sabe cual es la muestra óptima.. 27.

(28) Econometría I. Rodrigo Paniagua. NORMALIDAD Y LA DISTRIBUCIÓN DE β̂ Debido a que se supone que los errores se distribuyen normales, se tiene:. ε = y − xβˆ. beta es una función lineal del vector de perturbaciones ε.. Si ε sigue una distribución normal, se cumple: X~ N [ µ , Σ] ⇒ AX+ β̂ ~ N [ Aµ + βˆ , AΣA' ]. [. Entonces: βˆ x ~ N β , σ 2 ( x' x) −1. ]. Donde la distribución normal de β̂ es una consecuencia del supuesto que indica que las perturbaciones ε se distribuyen normalmente. Algunas propiedades son:. ε → N (0,σ 2 ). aε → N (0,σ 2 a 2 ). βˆ → N [β ,σ 2 ( x' x) −1 ]. b + ε → N (b,σ 2 ). βˆ j → N [β j ,σ 2 ( x' x) −jj1 ]. Cuando x es NO ESTOCÁSTICA, esa es exactamente la distribución del estimador. Cuando x es ESTOCÁSTICA, de debe considerar la distribución condicional del estimador. Como se ha supuesto que la distribución de los residuos es normal, la densidad conjunta queda descrita por la siguiente función de verosimilitud. 1 2 −2. Π i f ( xi ;θ ) = Π i [2πσ ] e. −. ε i2 2σ 2. −n. = (2πσ 2 ) 2 e[ −ε 'ε. 2σ 2 ]. aplicando logaritmos se tiene:. n 1 ln L( β ,σ 2 , xi ) = − ln(2πσ 2 ) − 2 ( yi − xi β )'( yi − xi β ) 2 2σ Para maximizar la función de verosimilitud, en este caso equivale a minimizar el segundo término de la parte de la ecuación de la derecha, que a su vez es una. 28.

(29) Econometría I. Rodrigo Paniagua. función de la suma de residuos al cuadrado. Entonces, OLS es el estimador de Máximo Verosimilitud y es MELI. ESTIMACIÓN DE σ2. σˆ 2 =. 1 ∑ ei2 está n. estimado. imperfectamente. a. sus. homólogos. poblacionales. Los residuos de los mínimos cuadrados son:. e = My = M [xβ + ε ] = Me. con el supuesto: Mx=0. e' e = ε ' Mε. el estimador de σ2. E[e' e x] = E[ε ' Mε x] = tr[ME[εε ' x]] = tr[Mσ 2 I ] = σ 2tr[M ] = σ 2 (n − k ) Puesto que:. E[tr[ε ' Mε x]] = E[tr (Mεε ' x)]. (. [. ). ]. tr (M ) = tr I n − ( x' x) −1 x' = tr ( I n ) − tr ( x' x) −1 x' = tr ( I n ) − tr ( I k ) = n − k Entonces:. σ2 =. e' e 1 = ei2 ∑ n−k n−k. VarE[ βˆ ] = σˆ 2 ( x' x) −1 estimador muestral de la varianza muestral del estimador β̂ . CONTRASTE DE HIPÓTESIS. t=. βˆ S βˆ. el contraste para un parámetro β k. INTERVALO DE CONFIANZA. (. ). Prob bk − tλ 2σˆ , β , bk + tλ 2σˆ = 1 − λ con (n-k) g.l. 29.

(30) Econometría I. Rodrigo Paniagua. CONTASTE DE SIGNIFICATIVIDAD DE LA REGRESIÓN Si todos los β̂ son cero, el coeficiente de correlación múltiple también lo será:. F[k − 1, n − k ] =. R 2 (k − 1) donde H 0 = β 2 = 0 (1 − R 2 )(n − k ). Si F es alto, la hipótesis se rechaza. BONDAD DE AJUSTE El objetivo del análisis de regresión es dar cuenta (explicar) de las variaciones de y. Es decir, la variación total de y: ∑i ( yi − y ) 2 .. ⎡ 1 ⎤ Sea M 0 = ⎢ I − ii'⎥ , entonces la suma de cuadrados totales se puede escribir como: ⎣ n ⎦. y' M 0 y . Así: y' M 0 y = βˆ ' x' M 0 xβˆ + ε ' M 0 M 0ε = βˆ ' x' M 0 xβˆ + ε 'ε entonces, SCT=SCR+SCE y se define el coeficiente de ajuste como:. R2 =. SCE SCR e' e = 1− = 1− SCT SCT y' M 0 y. El problema de R 2 es que si añaden variables a la regresión, éste no puede reducirse. Por ello, se necesita una medida de ajuste que penalice el exceso de regresores. El R 2 ajustado es dicha medida:. R 2 = 1−. (e' e) /(n − k ) ( y ' M 0 y ) /(n − 1). ESTIMADOR DE MÁXIMA VEROSIMILITUD Consideremos que tenemos una muestra de “n” observaciones independientes de 30.

(31) Econometría I. Rodrigo Paniagua. una misma distribución que no conocemos pero que queremos descubrir, f ( xi ;θ ) . Si cada dato viene de f ( xi ;θ ) y éstos son independientes, su distribución conjunta (la densidad de la muestra) viene de:. L = f ( x1 ;θ ) f ( x2 ;θ )... f ( xn ;θ ) Esta es la función de verosimilitud que mide la probabilidad que los datos que disponemos vengan de una misma distribución f ( xi ;θ ) . Propuesta base: ¿Por qué no buscamos el θ que hace máxima la probabilidad que los datos vengan de f ( xi ;θ ) ? Ejemplo elemental. Supongamos que los datos son tomados independientemente y corresponden a “robos de bicicletas en la Universidad”. La muestra es : {5,0,1,1,0,3,2,3,4,1}. Supongamos que creemos que la distribución que mejor representa los datos es la Poisson. Entonces:. f ( xi ;θ ) =. e −θ θ xi xi !. Así la función de verosimilitud es:. e −θ θ xi e −10θ θ 20 f ( x1 , x2 ,..., x10 ;θ ) = ∏ = xi ! 207.360 i =1 10. Podemos optimizar la función, pero resulta más fácil optimizar el logaritmo de la función de verosimilitud. Entonces,. log f ( x1 , x2 ,..., x10 ;θ ) = −10θ + 20 logθ − log 207.360. 31.

(32) Econometría I. Rodrigo Paniagua. Buscamos aquel θ que hace más probable que los datos vengan de una Poisson. Lo que se resuelve de manera elemental mediante cálculo para obtener θˆ = 2 . Se debe comprobar que la segunda derivada sea negativa para asegurar que θˆ es un máximo. Ese es el estimador de máxima verosimilitud y es óptimo. Es insesgado, de varianza mínima, asintóticamente normal e invariante. Si la distribución que utilizamos es multivariada, θˆ será un vector. LÍMITE CRAMER-RAO Suponiendo que la densidad satisface ciertas restricciones, la varianza de un estimador lineal insesgado de un parámetro θ es siempre o igual a: −1. ⎛ ⎡⎛ ∂ ln L(θ ) ⎞ 2 ⎤ ⎞ ⎛ ⎡ ∂ 2 ln L(θ ) ⎤ ⎞ ⎜ ⎜ ⎟ [ I (θ )] = ⎜ − E ⎢ ⎟ ⎥⎟ ⎥ ⎟ = ⎜ − E ⎢⎜ 2 ∂ θ ∂ θ ⎝ ⎠ ⎦⎥ ⎟⎠ ⎣ ⎦⎠ ⎝ ⎣⎢ ⎝ −1. El límite Cramer-Rao en el ejemplo de la poisson sería:. ∂ 2 ln L(θ ) Σxi − nθ = 2 = 2 ∂θ 2 θ θ La utilidad de Cramer-Rao es que so algún estimador insesgado lineal alcanza dicho límite, entonces éste será óptimo.. 32.

(33) Econometría I. Rodrigo Paniagua. PRUEBAS DE HIPÓTESIS Prueba t-student La prueba de hipótesis para un parámetro del modelo (t-student) se puede generalizar para el caso de (k-1) variables explicativas. Dado que: βî → N ( βi ,σ 2aii ) , se tiene que: βˆ − β i Zi = i σ a ii tiene una distribución normal estándar. Por otro lado, dado que:. σˆ 2 ( N − k ) → χ N2 − k 2 σ. y usando las propiedades estadísticas (anteriormente), se tiene que el siguiente estadístico tiene una distribución t-student con (N-k) grados de libertad.. βˆ i − β i t=. σ a ii σˆ 2 σ. 2. ( N − k ) /( N − k ). =. βˆ i − β i σˆ a ii. Como se estableció antes, sobre la base de este estadístico, se pueden llevar a cabo pruebas de una o dos colas. Bajo el razonamiento de los intervalos de confianza, también se pueden construir intervalos de confianza:. Prob(βî − tα / 2σˆ aii ≤ βi ≤ βî + tα / 2σˆ aii ) = 1 − α Por lo que para que no se rechace la hipótesis nula, el valor planteado en la hipótesis debería entrar dentro del intervalo. Prueba de significancia global En el modelo lineal general, la hipótesis de la prueba de significancia global es: H 0 : β 2 = β 3 = β 4 = ..... = β k = 0 contra la hipótesis alterna de que uno o más de estos parámetros es distinto de cero.. 33.

(34) Econometría I. Rodrigo Paniagua. Se puede demostrar que bajo la hipótesis nula, el siguiente estadístico sigue una distribución F, con (k-1) grados de libertad en el numerador y (N-k) grados de libertad en el denominador. −2. ( βˆ ' X ' y − N Y ) /(k − 1) F= µˆ ' µˆ /( N − k ) El estadístico F, puede ser escrito en función del R 2 del modelo. −2. 2 R 2 /(k − 1) ( βˆ ' X ' y − N Y ) /(k − 1) ⎛⎜ y ' y − NY ⎞⎟ F= = ⎜ y ' y − NY 2 ⎟ (1 − R 2 ) /( N − k ) µˆ ' µˆ /( N − k ) ⎝ ⎠. Si el estadístico planteado supera el valor F de tablas con (k-1) grados de libertad en el numerador y (N-k) grados de libertad en el denominador a un nivel de significancia α entonces se rechaza la hipótesis nula. Prueba de hipótesis de un conjunto de restricciones lineales (WALD) La hipótesis nula bajo una prueba de hipótesis de un conjunto de restricciones lineales consiste en: H o : Rβ = r Donde: R de dimensión q x k (y de rango igual a q), tiene como elementos los coeficientes que acompañan a cada uno de los parámetros en cada una de las restricciones. r de dimensión q x 1, tiene como elementos los valores independientes en cada una de las restricciones.. Bajo la hipótesis nula, el siguiente estadístico, sigue una distribución F con q grados de libertad en el numerador y (N-k) grados de libertad en el denominador.. F=. ( Rβˆ − r )' ( R( X ' X )−1 R' ) −1 ( Rβˆ − r ) / q. µˆ ' µˆ /( N − k ). Esta prueba es muy poderosa en la medida que permite probar desde la hipótesis lineal más simple (significancia individual de algún parámetro) hasta hipótesis lineales más complejas. Ej: En el modelo. Yi = β1 + β 2 X 2i + β 3 X 3i + β 4 X 4i + β 5 X 5i + µi. 34.

(35) Econometría I. Rodrigo Paniagua. Se desea probar la siguiente hipótesis: ⎧β 2 + β 3 = 1⎫ ⎪ ⎪ H 0 : ⎨ 3β 4 = 0.5 ⎬ ⎪ β = −1 ⎪ ⎩ 5 ⎭ En este caso: ⎡0 1 1 0 0 ⎤ ⎡1⎤ ⎢ ⎥ R = ⎢0 0 0 3 0⎥ r = ⎢⎢0.5⎥⎥ ⎢⎣0 0 0 0 1⎥⎦ ⎢⎣ − 1⎥⎦ Nótese que tanto las pruebas de significancia individual, como la prueba de significancia global son casos particulares de esta prueba. La regla de decisión establece que si el estadístico supera los valores críticos, se rechaza la hipótesis nula: Si : F > Fq , N − k ,α , entonces se rechaza Ho. Prueba de hipótesis a través del modelo restringido y el no restringido Una forma alternativa de llevar a cabo pruebas de hipótesis es a través del modelo restringido y no restringido. Se puede demostrar que bajo la hipótesis nula, el siguiente estadístico sigue una distribución F, con q grados de libertad en el numerador y (N-k) grados de libertad en el denominador.. ( µˆ r' µˆ r − µˆ nr' µˆ nr ) / q F= ' µˆ nr µˆ nr /( N − knr ) Donde:. µˆ r , µˆ nr son los errores estimados del modelo restringido y no restringido, respectivamente.. k nr corresponde al número de parámetros estimados del modelo no restringido La estimación del modelo no restringido corresponde a la del modelo original, mientras que la estimación de los resultados del modelo restringido proviene de aquella estimación donde una vez introducidas en el modelo las restricciones se lleva a cabo la estimación. La regla de decisión establece que si el estadístico supera los valores críticos, se rechaza la hipótesis nula: Si : F > Fq, N −k ,α , entonces se rechaza Ho. nr. 35.

(36) Econometría I. Rodrigo Paniagua. ERRORES DE ESPECIFICACIÓN Omisión de variables relevantes e inclusión de variables irrelevantes: Planteamiento General Sea el modelo:. y = Xβ + µ E (µ ) = 0 Var( µ ) = σ 2 I Los supuestos del modelo clásico se mantienen pero el investigador estima erróneamente: y = X 0 β0 + µ0 X 0 es una matriz de dimensión Txp β 0 es una matriz de dimensión px1. µ 0 es una matriz de dimensión Tx1 La estimación MCO de este modelo será:. βˆ0 = ( X 0 ' X 0 ) −1 X 0 ' y = ( X 0 ' X 0 ) −1 X 0 ' ( Xβ + µ ) = ( X 0 ' X 0 ) −1 X 0 ' Xβ + ( X 0 ' X 0 ) −1 X 0 ' µ Tomando esperanzas:. E( βˆ 0 ) = E(( X 0 ' X 0 ) −1 X 0 ' Xβ + ( X 0 ' X 0 ) −1 X 0 ' µ ) = ( X 0 ' X 0 ) −1 X 0 ' Xβ Por tanto, concluimos que el estimador es sesgado. Entonces, en el caso general tendremos que cuando se cometen errores de especificación (de los tipos mencionados) el estimador MCO será un estimador sesgado. En caso de no haber cometido errores de especificación X 0 = X , el estimador será insesgado (resultado visto anteriormente):. E( βˆ0 ) = ( X 0 ' X 0 ) −1 X 0 ' Xβ = ( X ' X ) −1 X ' Xβ = β Con errores de especificación, la varianza de los errores también será sesgada. Veamos:. µˆ 0 ' µˆ 0 = y' M 0 y = ( Xβ + µ )' M 0 ( Xβ + µ ) = µ ' M 0 µ + β ' X ' M 0 Xβ + µ ' M 0 Xβ + β ' X ' M 0 µ. 36.

(37) Econometría I. Rodrigo Paniagua. Donde, de manera similar:. M 0 = I T − X 0 ( X 0 ' X 0 ) −1 X 0 ' Tomando esperanzas:. E ( µˆ 0 ' µˆ 0 ) = E ( µ ' M 0 µ + β ' X ' M 0 Xβ + µ ' M 0 Xβ + β ' X ' M 0 µ ) = E ( µ ' M 0 µ ) + E ( β ' X ' M 0 Xβ ) = E ( µ ' M 0 µ ) + β ' X ' M 0 Xβ = σ 2Tr ( M 0 ) + β ' X ' M 0 Xβ = σ 2 (T − p) + β ' X ' M 0 Xβ Por tanto, la varianza estimada de los errores (cometiendo errores de especificación) es sesgada. µˆ ' µˆ β ' X ' M 0 Xβ 1 E( 0 0 ) = E ( µˆ 0 ' µˆ 0 ) = σ 2 + T−p T−p T−p Si los errores de especificación no hubieran sido cometidos:. T − p =T −k Y. β ' X ' M 0 Xβ = 0 ya que:. β ' X ' ( I − X ( X ' X ) −1 X ' ) Xβ = β ' X ' ( X − X ( X ' X ) −1 X ' X ) β = β ' X ' ( X − X ) β = 0 Por tanto la varianza estimada de los errores será insesgada cuando no se cometen errores de especificación. Se puede demostrar que el término β ' X ' M 0 Xβ es una matriz semidefinida positiva. Ello implica que además de ser sesgada la varianza (cuando se cometen errores de especificación), será ineficiente respecto a una situación en la cual no se hubieran cometido errores de especificación.. Omisión de variables relevantes Sea la matriz X particionada de la siguiente manera. [. X = X0 ;Z. ]. Y se estima el modelo: y = X 0 β0 + µ0 37.

(38) Econometría I. Rodrigo Paniagua. En lugar de estimar el modelo verdadero:. y = Xβ + µ E (µ ) = 0 Var( µ ) = σ 2 I Donde: X 0 es una matriz de dimensión Txr Z es una matriz de dimensión Tx(k-r) X es una matriz de dimensión Txk Habíamos visto que: βˆ0 = ( X 0 ' X 0 ) −1 X 0 ' Xβ + ( X 0 ' X 0 ) −1 X 0 ' µ Si: ( X 0 ' X 0 ) −1 X 0 ' X = ( X 0 ' X 0 ) −1 X 0 ' X 0 ; Z Que es, por propiedad de matrices particionadas es igual a: ( X 0 ' X 0 ) −1 X 0 ' X = ( X 0 ' X 0 ) −1 X 0 ' X 0 ; Z = ( X 0 ' X 0 ) −1 X 0 ' X 0 ; ( X 0 ' X 0 ) −1 X 0 ' Z. [. [. ]. ] [. [. ]. ]. ( X 0 ' X 0 ) −1 X 0 ' X = I r ; ( X 0 ' X 0 ) −1 X 0 ' Z Por tanto: βˆ0 = I r ; ( X 0 ' X 0 ) −1 X 0 ' Z β + ( X 0 ' X 0 ) −1 X 0 ' µ Pero: β ' = β 0' ; β z' Tomando valor esperado y utilizando propiedades de matrices particionadas:. [. ]. [. ([. ]. ][. ]. E ( βˆ 0 ) = E I r ; ( X 0 ' X 0 ) −1 X 0 ' Z β 0' ; β z' '+( X 0 ' X 0 ) −1 X 0 ' µ. ). E ( βˆ 0 ) = β 0 + ( X 0 ' X 0 ) −1 X 0 ' Zβ z Donde el sesgo es: ( X 0 ' X 0 ) −1 X 0 ' Zβ z La varianza estimada de los errores también será sesgada: µˆ ' µˆ β ' X ' M 0 Xβ β ' Z ' M 0 Zβ z 1 E( 0 0 ) = E ( µˆ 0 ' µˆ 0 ) = σ 2 + =σ2 + z T −r T −r T −r T −r Donde: β ' X ' M 0 Xβ β z ' Z ' M 0 Zβ z = T −r T −r. 38.

(39) Econometría I. Veamos:. Rodrigo Paniagua. β ' X ' M 0 Xβ = [β 0' ; β z' ]X ' M 0 X [β 0' ; β z' ]'. β ' X ' M 0 Xβ = [β 0' ; β z' ][X 0 ; Z ]' M 0 [X 0 ; Z ][β 0' ; β z' ]'. β ' X ' M 0 Xβ = [β 0' ; β z' ][X 0 ; Z ][ ' M 0 X 0 ; M 0 Z ][β 0' ; β z' ]'. β ' X ' M 0 Xβ = [β 0' ; β z' ][X 0 ; Z ][ ' 0; M 0 Z ][β 0' ; β z' ]' = [0; β z ' Z ' M 0 Zβ z ] β ' X ' M 0 Xβ = β z ' Z ' M 0 Zβ z Por tanto, la varianza será sesgada (como vimos anteriormente con sesgo positivo). Es decir, ineficiente. Ejemplo: sea el modelo verdadero: Yi = β 1 + β 2 X 2i + β 3 X 3i + µ i. y se estima: Yi = α 1 + α 2 X 2i + µ 0i. La estimación MCO de α 2 es:. αˆ 2 = Pero si:. ∑x y ∑x 2i. i. 2 2i. y i = β 2 x 2 i + β 3 x 3i + ( µ i − u ). Entonces:. αˆ 2 =. ∑x. 2i. ( β 2 x2i + β 3 x3i + ( µ i − u )). ∑x. 2 2i. = β2 +. ∑β. 3. x2i x3i + x2i ( µ i − u )). ∑x. 2 2i. Tomando esperanzas:. El sesgo es:. ⎛ ∑ β 3 x2i x3i + x2i (µ i − u )) ⎞⎟ = β + β 3 ∑ x2i x3i E (αˆ 2 ) = E ⎜ β 2 + 2 ⎜ ⎟ ∑ x22i ∑ x22i ⎝ ⎠. Sesgo(αˆ 2 ) =. β 3 ∑ x2i x3i. ∑x. 2 2i. Aplicando el operador plim, también se puede demostrar que el estimador es inconsistente. Recordar que la varianza también es sesgada (ineficiente).. 39.

(40) Econometría I. Rodrigo Paniagua. ¿Cómo detectar el problema de variables omitidas? Prueba de Ramsey-Reset Pasos de la Prueba 1) Estimar el modelo 2) Volver a estimar el modelo e incluir términos polinómicos de la variable dependiente estimada. 3) Bajo la hipótesis nula de modelo bien especificado, el estadístico F, sigue una distribución F de Fisher con q (número de regresores adicionados en la regresión estimada en el paso 2) grados de libertad en el numerador y N − k 2) grados de libertad en el denominador: ( R22) − R12) ) / q F= (1 − R22) ) /( N − k 2) ) Donde: es el R 2 del modelo original, estimado en el primer paso. R12). R22). es el R 2 del modelo estimado en el segundo paso.. k 2). es el número de regresores en la estimación del segundo paso.. Inclusión de variables irrelevantes Sea la matriz X particionada de la siguiente manera X 0 = [X ; Z ] Y se estima el modelo: y = X 0 β0 + µ0 En lugar de estimar el modelo verdadero: y = Xβ + µ. E (µ ) = 0 Var( µ ) = σ 2 I Donde: X 0 es una matriz de dimensión Tx(s+k) Z es una matriz de dimensión T x s X es una matriz de dimensión T x k Habíamos visto que:. βˆ0 = ( X 0 ' X 0 ) −1 X 0 ' Xβ + ( X 0 ' X 0 ) −1 X 0 ' µ Si:. ( X 0 ' X 0 ) −1 X 0 ' X 0 = I s +k Entonces, la matriz puede ser particionada de la siguiente manera:. 40.

(41) Econometría I. ⎡1 ⎢0 ⎢ ⎢0 ⎢ ! −1 (X 0 ' X 0 ) (X 0 ' X 0 ) = ⎢ ⎢0 ⎢ ⎢0 ⎢! ⎢ ⎢⎣0. Rodrigo Paniagua. 0 0 ... 1 0 ... 1 ... " ... ... .... 0 0 ... 0⎤ 0 0 ! ⎥⎥ ⎥ ! ! ⎥ ⎥ = ⎡ Ik ⎢ 1 0 ... 0⎥ ⎣0 sxk ⎥ 0 1 ... 0⎥ ! ! " !⎥ ⎥ ... 0 0 ... 1⎥⎦. 0 kxs ⎤ ⎥ Is ⎦. Se tiene que:. [. ( X 0 ' X 0 ) −1 ( X 0 ' X 0 ) = ( X 0 ' X 0 ) −1 ( X 0 ' [X ; Z ]) = ( X 0 ' X 0 ) −1 X 0 ' X ; ( X 0 ' X 0 ) −1 X 0 ' Z. ]. Nótese que la primera parte de la partición ( X 0 ' X 0 )−1 X 0 ' X tiene dimensión ( s + k ) xk ,. ⎡I ⎤ que coincide con la dimensión de ⎢ k ⎥ . Por tanto: ⎣0 sxk ⎦ ⎡I ⎤ ( X 0 ' X 0 ) −1 X 0 ' X = ⎢ k ⎥ ⎣0 sxk ⎦ Reemplazando en la definición de βˆ 0 ⎡ Ik ⎤ −1 ⎥β + (X 0 ' X 0 ) X 0 ' µ ⎣0 sxk ⎦. βˆ 0 = ( X 0 ' X 0 ) −1 X 0 ' Xβ + ( X 0 ' X 0 ) −1 X 0 ' µ = ⎢ Tomando valor esperado. ⎡⎡ I ⎤ ⎤ E βˆ 0 = E ⎢⎢ k ⎥ β + ( X 0 ' X 0 ) −1 X 0 ' µ ⎥ = β ⎢⎣⎣0 sxk ⎦ ⎥⎦. [ ]. De manera extendida:. ⎡ βˆ1 ⎤ ⎡ β 1 ⎤ ⎢ ˆ ⎥ ⎢ ⎥ ⎢ β 2 ⎥ ⎢β 2 ⎥ ⎢ ... ⎥ ⎢ ... ⎥ ⎢ ⎥ ⎢ ⎥ βˆ k ⎥ ⎢ β k ⎥ ⎢ E⎢ = βˆ k +1 ⎥ ⎢ 0 ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ! ⎥ ⎢ ! ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣ βˆ k + s ⎥⎦ ⎢⎣ 0 ⎥⎦. 41.

(42) Econometría I. Rodrigo Paniagua. Se concluye que los estimadores del modelo estimado serán insesgados. El valor esperado de los estimadores que pertenecen al modelo verdadero es igual al verdadero valor poblacional en tanto que el valor esperado de los estimadores que no están en el modelo verdadero es igual a cero. La varianza estimada de los errores será insesgada:. E(. µˆ 0 ' µˆ 0 T − (k + s). )=. β ' X ' M 0 Xβ 1 E (µˆ 0 ' µˆ 0 ) = σ 2 + T − (k + s) T − (k + s). Pero:. β ' X ' M 0 Xβ T − (k + s ). =0. Demostración:. ⎡I ⎤ M 0 X = ( I − X 0 ( X 0 ' X 0 ) −1 X 0 ' ) X = X − X 0 ( X 0 ' X 0 ) −1 X 0 ' X = X − X o ⎢ k ⎥ ⎣0 s*x ⎦ ⎡I ⎤ Pero: X 0 ⎢ k ⎥ = X ⎣0 sxk ⎦ La manera más simple de verlo es a través de un pequeño ejemplo. Sea el modelo verdadero: Yt = β 1 + β 2 X t + µ t Pero se estima: Yt = α 1 + α 2 X t + α 3 Z t + µ t Las matrices serán: ⎡1 X 1 Z1 ⎤ ⎡1 X 1 ⎤ ⎡1 0⎤ ⎢ ⎥ ⎢ ⎥ ⎡ Ik ⎤ ⎢ ⎥ X 0 = ⎢! ! ! ⎥; X = ⎢! ! ⎥; ⎢ ⎥ = ⎢0 1 ⎥ 0 ⎢1 X T Z T ⎥ ⎢1 X T ⎥ ⎣ s*k ⎦ ⎢⎣0 0⎥⎦ ⎣ ⎦ ⎣ ⎦ Donde claramente se puede apreciar que: ⎡I ⎤ X0 ⎢ k ⎥ = X ⎣0 sxk ⎦ Finalmente, cabe señalar que para detectar problemas de variables irrelevantes basta considerar las pruebas t y F rutinarias.. Errores de Medida En la variable dependiente del modelo Sea el siguiente modelo verdadero: Yt = β 1 + β 2 X t + µ t. 42.

(43) Econometría I. Rodrigo Paniagua. Pero, problemas de medición, se utiliza Y t* en vez de Y t donde Yt = Yt* + ε t y ε t es una perturbación estocástica con valor esperado igual a cero, homoscedástica, con varianza igual a σ ε2 y no autocorrelacionada. Tampoco está correlacionada con la perturbación estocástica del modelo original. Reemplazando la variable dependiente, el modelo estimable se deduce de la siguiente manera:. Y t* + ε t = β 1 + β 2 X t + µ t Y t* = β 1 + β 2 X t + µ t − ε t Y t* = β 1 + β 2 X t + v t El error de medida, producirá ineficiencia de los estimadores. La varianza de la perturbación del modelo estimado tendrá dos componentes: la varianza del modelo original y la varianza derivada del error de medición. Es decir:. σ v2 = σ µ2 + σ ε2 Sin embargo, pese a esta pérdida de eficiencia, la estimación MCO genera estimadores MELI (MEI y consistentes suponiendo normalidad de los errores del modelo).. Errores de medida en la(s) variable(s) explicativa(s) del modelo Sea el siguiente modelo verdadero: Yt = β 1 + β 2 X t + µ t. Pero, problemas de medición, se utiliza X t* en vez de X t donde X t = X t* + ϑ t y ϑ t es una perturbación estocástica con valor esperado igual a cero, homoscedástica, con varianza igual a σ ε2 y no autocorrelacionada. Al igual que ε t tampoco está correlacionada con la perturbación estocástica del modelo original. Reemplazando la variable explicativa, el modelo estimable se deduce de la siguiente manera:. Yt = β1 + β 2 X t + µ t Yt = β1 + β 2 ( X t* + ϑt ) + µ t Yt = β1 + β 2 X t* + β 2 ϑt + µ t Yt = β1 + β 2 X t* + ω t En este caso el error de medida, tendrá consecuencias más serias. Además de producir ineficiencia de los estimadores, la estimación por MCO será sesgada e inconsistente. Igual que en el caso anterior, la varianza de la perturbación del. 43.

(44) Econometría I. Rodrigo Paniagua. modelo estimado tendrá dos componentes: la varianza del modelo original y la varianza derivada del error de medición. Es decir: σ ω2 = σ µ2 + β 22σ ϑ2 La variable explicativa del modelo, estará correlacionada con la perturbación estocástica del modelo, lo cual viola uno de los supuestos importantes del modelo lineal clásico. Veamos:. [. ]. [. Cov ( X t* , ω t ) = E ( X t* − E ( X t* ))(ω t − E (ω t )) = E ( −ϑ t )( β 2 ϑ t + µ t ). ]. Donde se han utilizado los siguientes resultados intermedios: X t = X t* + ϑt → X t* = X t − ϑt → E ( X t* ) = E ( X t − ϑt ) = X t → X t* − E ( X t* ) = −ϑt. ω t = β 2 ϑ t + µ t → E (ω t ) = E ( β 2 ϑ t + µ t ) = 0 → ω t − E (ω t ) = β 2 ϑ t + µ t Para resolver el problema de sesgo e inconsistencia del estimador, se recurre a otro método de estimación. Uno muy conocido es el denominado método de variables instrumentales (tema a ser visto más adelante).. PRUEBAS DE ESTABILIDAD A continuación veremos una serie de pruebas de estabilidad aplicables a los parámetros del modelo estimado. Prueba de cambio estructural de Chow Esta prueba es utilizada cuando el investigador sospecha que a partir de un momento en el tiempo o para un conjunto de observaciones, los parámetros del modelo han cambiado (son diferentes). Algunos ejemplos de estos cambios podrían ser: el consumo de la economía en períodos normales versus en períodos de guerra, la demanda diferenciada de un bien en función a cierta cualidad (sexo, educación, edad, etc.), cambios en las variables debido a cambios institucionales o en la regulación, etc. Metodología En una muestra de series de tiempo supóngase que se sospecha de un cambio estructural a partir del período t1 + 1. Para verificar la sospecha definamos el modelo restringido y no restringido:. 44.

(45) Econometría I. Rodrigo Paniagua. Modelo restringido. y t = xt β + µ. t = 1,2....t1 , t1 + 1,......T. Modelo no restringido. y t = xt α + µ y t = xt λ + µ. t = 1,2....t1. t1 observaciones. t = t1 + 1,......T. t 2 observaciones. Nótese que bajo la hipótesis nula β = α = λ . Es decir, diferencias en los vectores que conforman los parámetros del modelo serían evidencia del cambio estructural. La hipótesis nula plantea que no existe tal cambio. La verificación de la hipótesis nula a través de esta prueba comprende una serie de pasos: 1) Estimar el modelo restringido y obtener los residuos del modelo y calcular la suma de los residuos al cuadrado, denominándose al resultado SRC1 . Nótese que en este caso los grados de libertad de SRC1 son iguales a t1 + t 2 − k = T − k 2) Estimar las dos ecuaciones del modelo no restringido, cuyas sumas de residuos al cuadrado se denominan SRC 2 y SRC 3 . SRC 2 tiene t1 − k grados de libertad. En tanto que SRC 3 tiene t 2 − k . 3) Calculamos SRC 4 = SRC 2 + SRC 3 que tiene t1 + t 2 − 2k = T − 2k grados de libertad. 4) Luego, calculamos SRC 5 = SRC1 − SRC 4 que como puede comprobarse de manera simple, tiene k grados de libertad. 5) Bajo la hipótesis nula de que no existe cambio estructural, el siguiente estadístico, tiene una distribución F con k grados de libertad en el numerador y T − 2k grados de libertad en el numerador:. F=. SRC5 / k SRC4 / T − 2k 45.

(46) Econometría I. Rodrigo Paniagua. 6) La regla de decisión establece que si F > Fk ,T −2k ,α se rechaza la hipótesis nula. Otros contrastes de estabilidad Una serie de contrastes son útiles para verificar la homogeneidad temporal del modelo (es decir cuan estables son empíricamente los parámetros de los modelos presentados). Son las denominadas pruebas CUSUM y CUSUMQ, que se construyen en base a los residuos recursivos del modelo. Sea la siguiente definición del residuo recursivo:. µˆ t = y t − x't βˆ t −1 Donde µ̂ t no es más que el error de proyección en t calculado en base a la ˆ estimación del vector (fila) de parámetros que utiliza t-1 observaciones, β t −1 . y t es la observación en t de la variable dependiente y xt ' es el vector de observaciones de las variables explicativas en t. La varianza de predicción es:. Var( µˆ t ) = σˆ 2 (1 + xt' ( X t −1 ' X t −1 ) −1 xt ) Donde X t −1 es una matriz de dimensión (t-1)xk formada por las (t-1) observaciones recogidas en la muestra. Se define finalmente el residuo recursivo normalizado: µˆ t µ~t = (1 + xt' ( X t −1 ' X t −1 ) −1 xt ). µ~ → N (0, σ 2 ) y que este error es independiente de Bajo la hipótesis de estabilidad, t µ~ s ∀s ≠ t , el estadístico CUSUM ( Wt ) permite contrastar la hipótesis de estabilidad. Se construye de la siguiente manera:. Wt =. t. ∑. r = k +1. µ~r / σ~ σ~ =. T 1 ∑ (µ~r − µ ) 2 T − k r =k +1. µ=. T 1 ∑ µ~r T − k r = k +1. Se puede demostrar que bajo la hipótesis nula de estabilidad, el estadístico Wt tiene una distribución normal con valor esperado igual a cero y varianza igual al número de residuos acumulados. Se construyen bandas de confianza para Wt mediante líneas. 46.

(47) Econometría I. Rodrigo Paniagua. (. ) (. rectas que unen los puntos k ,± a T − k y T ,±3a T − k donde se ha calculado a=0.948.. ) donde al 95% de confianza. Al 99% el cálculo corresponde a a=1.143. Se rechaza la hipótesis nula si Wt traspasa las bandas. El CUSUM-Q se construye en base a los cuadrados de los residuos normalizados: t. St =. ∑ µ~. 2 r. ∑ µ~. 2 r. r T r. Cada término de la sumatoria tiene distribución Ji-cuadrado con un grado de libertad. t−k E (S t ) = T −k Dado que son independientes, se puede demostrar que El contraste consiste en dibujar S t , así como las líneas que limitan su banda de confianza. El intervalo consiste en:. st = ±c0 + Los valores de. t−k T −k.. c0 pueden encontrarse en la tabla A-10 de Novales.. Si el estadístico sale fuera de las bandas construidas, ello es señal de inestabilidad. Variables dummy Una variable dicotómica o dummy toma el valor de uno para alguna de las observaciones para indicar la existencia de un efecto o la pertenencia a un grupo y cero para las observaciones restantes que no presentan dicho efecto o no pertenecen al grupo. Las variables dummy son un medio conveniente para tomar en cuenta cambios discretos en la función estimada. Ejemplos: efecto de la educación sobre los salarios, efecto del sexo en la demanda de un bien, cambios estructurales, o fenómenos puntuales (crisis).. 47.

(48) Econometría I. Rodrigo Paniagua. En este último caso, la inclusión de la dummy tiene el efecto de borrar la observación correspondiente al valor 1 de la variable dummy utilizada en el cómputo de los estimadores y sus varianzas (no en el R2) La forma de introducir una variable dummy es:. yi = xi ' β + δDi + µ i D i es la variable dummy que toma el valor de 1 cuando se cumple la existencia de un efecto o la pertenencia a un grupo y de 0 cuando no es así.. δ es el parámetro a estimar que acompaña a la variable dummy. En un modelo, puede ser necesario introducir varias categorías (efectos o grupos). El ejemplo más conocido es aquél donde es necesario tomar en cuenta la estacionalidad de las series (trimestrales en el ejemplo dado a continuación).. C t = β 1 + β 1 Yt + δ 1 D1t + δ 2 D2 t + δ 3 D3 t + µ t Donde se define la variable dummy D it que toma el valor de 1 cuando la observación corresponde al i-avo trimestre y 0 cuando no es así (Nótese cuando todas las dummy son iguales a 0, la observación corresponde al cuarto trimestre). Otra forma alternativa de representar el modelo anterior, garantizando que no existan problemas de multicolinealidad exacta, consiste en que al introducir la variable D4 t (para representar el cuarto trimestre) se elimine la constante del modelo. En caso contrario, se producirían problemas de multicolinealidad exacta. De esta forma:. C t = β 1 Yt + δ 1 D1t + δ 2 D2 t + δ 3 D3 t + δ 4 D4 t + µ t Podemos probar la relevancia de las variables dummy llevando a cabo pruebas t y F sobre los coeficientes estimados correspondientes a dichas variables. Nótese que en el anterior ejemplo, las dummy afectan el valor del intercepto. Podrían haberse introducido afectando a la pendiente o de tal manera de afectar tanto al intercepto como a la pendiente. También podemos características.. incorporar. variables. dummy. para. representar. distintas. 48.

(49) Econometría I. Rodrigo Paniagua. Por ejemplo, una categoría para tomar en cuenta la estacionalidad de los datos y otra para considerar el nivel de educación. La incorporación de las variables dummy es flexible. Por ejemplo, para explicar el nivel de salarios Wi además del conjunto de variables explicativas, sean tres niveles de educación a ser representados por variables dummy (nivel inferior, nivel intermedio y nivel superior). Podemos definir las variables dummy de la siguiente manera: Dint con valor 1 si el máximo nivel de educación por la i-ava observación obtenido es el nivel intermedio y D cero en otro caso y sup con valor 1 si el máximo nivel de educación obtenido es educación superior y cero en otro caso. El modelo en este caso es:. Wi = x i' β + δ int Dint, i + δ sup Dsup,i + µ i Alternativamente, las variables podrían haberse definido de la siguiente manera: Dint con valor 1 si la observación tiene nivel de educación intermedia y cero en otro caso D y sup con valor 1 si la observación tiene nivel de educación superior y cero en otro caso (nótese que alguien que tiene educación superior, también tiene educación intemedia y educación inferior). El modelo en este caso es igual al anterior pero la interpretación es diferente. δ int mide el efecto incremental de tener educación intermedia y incremental de tener educación superior.. δ sup mide el efecto. En el modelo anterior, las deltas medían los efectos totales de cada nivel de educación sobre el nivel base. Utilizando variables dummy es posible construir hacer una regresión por secciones. En un modelo de regresión simple se tiene un punto de quiebre en un cambio en la pendiente y en el intercepto).. X*. (que determina. El modelo utilizando variables dummy se representa así:. Yi = β 1 + β 2 X i + δ 1 Di + δ 2 X i Di + µ i Donde D i es una dummy que toma el valor 1 a partir de X * .. 49.

(50) Econometría I. Rodrigo Paniagua. Se tiene que en el punto X * se cumple que:. β1 + β 2 X * = β1 + δ 1 + β 2 X * + δ 2 X * Por tanto, Reemplazando en el modelo original:. δ 1 = −δ 2 X *. Yi = β 1 + β 2 X i − δ 2 X * Di + δ 2 X i Di + µ i Yi = β 1 + β 2 X i + δ 2 Di ( X i − X * ) + µ i Este ejemplo también nos da pautas de que las variables dummy pueden ser utilizadas para probar la existencia de cambios estructurales. Finalmente, se pueden construir modelos combinando varias características. Por ejemplo, en el modelo de salarios presentado anteriormente (en su primera versión), incluimos la variable dummy sexo S i que toma el valor de 1 si la observación i-ava es mujer y 0 en otro caso:. Wi = xi β + δ int Dint,i + δ sup Dsup,i + λ1 Si + µi En este modelo, el efecto incremental del sexo es el mismo independiente del nivel de educación. Este supuesto podría no ser realista; es de esperar que cambiar de sexo tendrá mayores efectos en el salario en función al nivel de educación. Estos son efectos de interacción en el modelo, que pueden ser incorporados reformulando el modelo: 50.