Modelos no lineales
Rom ´an Salmer ´on G ´omez
Grado en Econom´ıa
Contenidos
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Introducci ´on
Modelos intr´ınsecamente lineales Modelos intr´ınsecamente no lineales
Introducci ´ on
Contenidos
Introducci ´on
Especificaciones no lineales
Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Ejemplo
Contenidos Introducci ´on
Especificaciones no lineales
Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
1 2 3 4 5 6 7 8 9 10
6 8 10 12 14 16 18 20 22
P
Q
Figura 1: Relaci ´on no lineal
Especificaciones no lineales
Contenidos Introducci ´on
Especificaciones no lineales
Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Hasta ahora, el efecto sobre
Y
de un cambio unitario enX
no depend´ıa del valor deX
. ¿Qu ´e ocurre si el efecto sobreY
de un cambio enX
depende del valor de una (o m ´as) de las variables independientes?. En este caso, la funci ´on de regresi ´on es no lineal. Una funci ´on no lineal es una funci ´on con una pendiente que no es constante. Hay distintos tipos de especificaciones no lineales:1. Modelos intr´ınsecamente lineales (se pueden estimar por los m ´etodos cono- cidos hasta ahora haciendo un simple cambio de variable y/o transformaci ´on):
y
i= β
1+ β
2x
2i+ ǫ
i, y
i= β
1+ β
21
x
i+ ǫ
i, y
i= β
1x
βi 2e
ǫi.
2. Modelos intr´ınsecamente no lineales (no se pueden estimar por los m ´etodos conocidos hasta ahora debido a la no linealidad existente en los par ´ametros):
y
i= β
1+ x
βi2+ ǫ
i, y
i= β
1x
βi2+ ǫ
i, y
i= β
11 + e
β2+β3xi+ ǫ
i.
Ejemplo
Contenidos Introducci ´on
Especificaciones no lineales
Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Supongamos la siguiente informaci ´on acerca de precios,
P
, y cantidades,Q
,demandadas:
Q P ln Q ln P
5 10 1.609 2.302
6 8 1.791 2.079
7 6 1.945 1.791
9 4 2.197 1.386
12 3 2.484 1.098
15 2 2.708 0.693
18 1.5 2.890 0.405 22 1.2 3.091 0.182
En la Figura 1 se obervaba que la relaci ´on entre
P
yQ
no es lineal, sin embargo, haciendo una transformaci ´on sencilla (aplicando logaritmos) se puede obtener dicho tipo de relaci ´on (Figura 2).Ejemplo
Contenidos Introducci ´on
Especificaciones no lineales
Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
0 0.5 1 1.5 2 2.5
1.6 1.8 2 2.2 2.4 2.6 2.8 3
ln P
ln Q
Figura 2: Relaci ´on lineal
Modelos intr´ınsecamente lineales
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales
El modelo Box-Cox Modelos
intr´ınsecamente no lineales
El modelo Box-Cox
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales El modelo Box-Cox Modelos
intr´ınsecamente no lineales
La transformaci ´on de Box-Cox permiten corregir la no linealidad en la relaci ´on entre variables (tambi ´en pueden ser usadas para solucionar problemas de nor- malidad y heterocedasticidad). A partir de la transformaci ´on de Box-Cox:
y
(λ1)=
y
λ1− 1
λ
1λ
16= 0 ln y λ
1= 0
, x
(λ2)=
x
λ2− 1
λ
2λ
26= 0 ln x λ
2= 0
modelos en principios no lineales podr ´an expresarse linealmente como sigue:
y
(λ1)= α + βx
(λ2)+ ǫ.
Algunos casos particulares interesantes son los siguientes:
Modelo lineal:
λ
1= λ
2= 1
.Modelo doblemente logar´ıtmico:
λ
1= λ
2= 0
.Modelo semilogar´ıtmico (log-lineal):
λ
1= 0
yλ
2= 1
.Modelo semilogar´ıtmico (lineal-log):
λ
1= 1
yλ
2= 0
.Modelo hiperb ´olico:
λ
1= 1
yλ
2= −1
.El modelo Box-Cox: casos particulares
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales El modelo Box-Cox Modelos
intr´ınsecamente no lineales
Modelo lineal:
λ
1= λ
2= 1
.En este modelo,
β
representa el efecto marginal, es decir, una variaci ´on uni- taria en la variablex
provoca un cambio en la variabley
igual aβ
:β = ∂y
∂x → △y = β △ x.
Modelo doblemente logar´ıtmico:
λ
1= λ
2= 0
.En este caso, Box–Cox coincide con el modelo no lineal:
y = Ax
βe
ǫ. Aqu´ı,β
representa la elasticidad dey
respecto dex
(es decir, qu ´e incremento por- centual dey
se tendr ´a si se produce un incremento porcentual dex
):∂y
∂x = Aβx
β−1= Aβx
βx
−1= βyx
−1= β y
x → β = ∂y
∂x
x
y .
El modelo Box-Cox: ejemplos gr ´aficos
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales El modelo Box-Cox Modelos
intr´ınsecamente no
lineales a) 0.5 1 1.5 2
1 2 3 4 5 6 7
b) 0.5 1 1.5 2
0.2 0.4 0.6 0.8 1 1.2 1.4
c) 0.5 1 1.5 2
0.5 1 1.5 2
d) 0.5 1 1.5 2
1 2 3 4
Figura 3: Modelo doblemente logar´ıtmico con a) β = −0.6 , b) β = 0.6 ,
c) β = 1 y c) β = 2 .
El modelo Box-Cox: ejemplos gr ´aficos
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales El modelo Box-Cox Modelos
intr´ınsecamente no
lineales a) 0.5 1 1.5 2
1.25 1.5 1.75 2 2.25 2.5 2.75
b) 0.5 1 1.5 2
4 5 6 7 8 9
Figura 4: Modelo semilogar´ıtmico en y con a) β = −0.6 y b) β = 0.6 .
c)
0.5 1 1.5 2
0.75 1.25 1.5 1.75 2 2.25
d)
0.5 1 1.5 2
-6 -5 -4 -3 -2 -1
Figura 5: Modelo semilogar´ıtmico en x con c) β = −0.6 y d) β = 0.6 .
El modelo Box-Cox: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales El modelo Box-Cox Modelos
intr´ınsecamente no lineales
Dados los siguientes datos ajustar un modelo doblemente logar´ıtmico:
x 1 2 3 4 5
y 4 50 200 740 3000
El modelo doblemente logar´ıtmico responde a la expresi ´on
y = Ax
βe
ǫ, el cualse puede linealizar sin m ´as que considerar logaritmos (
y
∗= ln y
yx
∗= ln x
):ln y = ln A + β ln x + ǫ ln e ⇒ y
∗= A
∗+ βx
∗+ ǫ.
Por tanto, se ha llegado a un modelo lineal que se puede estimar por el m ´etodo de M´ınimos Cuadrados Ordinarios:
A b
∗= 1
′2257 ⇒ b A = e
1′2257= 3
′4066 β = 3 b
′9856, R
2= 0
′865
El modelo estimado es
y = 3.4066 · x b
3.9856.x
∗y
∗0 1’386
0’693 3’912 1’099 5’298 1’386 6’607 1’609 8’006
Ajustar un modelo del tipo
y = Aβ
xe
ǫ y decidir cu ´al es el mejor.El modelo Box-Cox: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales El modelo Box-Cox Modelos
intr´ınsecamente no lineales
−1000
−500 0 500 1000 1500 2000 2500 3000
1 1.5 2 2.5 3 3.5 4 4.5 5
y
x
y con respecto a x (con ajuste mínimo−cuadrático) Y = −1.21e+003 + 668.X
Figura 6: Representaci ´on gr ´afica de los datos originales.
El modelo Box-Cox: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales El modelo Box-Cox Modelos
intr´ınsecamente no lineales
1 2 3 4 5 6 7 8 9
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6
ly
lx
ly con respecto a lx (con ajuste mínimo−cuadrático) Y = 1.23 + 3.99X
Figura 7: Representaci ´on gr ´afica de los datos transformados.
Modelos intr´ınsecamente no lineales
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Modelos intr´ınsecamente no lineales
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Dentro de este apartado, estudiaremos expl´ıcitamente las situaciones en las cuales no es posible transformar el modelo de manera que pueda estimarse con las t ´ecnicas de estimaci ´on correspondientes al modelo lineal general.
Aun as´ı, en primer lugar, se aborda la aproximaci ´on lineal de Taylor que consiste en obtener una versi ´on lineal aproximada del modelo. Es decir, se recupera la idea de aplicar las t ´ecnicas conocidas aunque el modelo no sea linealizable de forma natural y sencilla.
En segundo lugar, asumiendo que la naturaleza de las relaciones son no lineales, se aborda el uso de los m ´etodos de m´ınimos cuadrados y m ´axima verosimilitud en este tipo de modelos. Recordemos, que la idea de partida en ambos casos no exige en ning ´un momento la linealidad del modelo. Sin embargo, como se ver ´a, la resoluci ´on anal´ıtica del mismo se complica bastante cuando el modelo no es lineal, siendo necesario recurrir a m ´etodos distintos a los usados hasta el momento para obtener las estimaciones buscadas.
Aproximaci ´ on lineal de Taylor
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Supongamos que pretendemos estimar una relaci ´on entre una magnitud
y
y unconjunto de variables explicativas recogidas en el vector
X
t. Representaremos tal relaci ´on mediante el modelo econom ´etrico:y
t= f (X
t, β) + ǫ
t, t = 1, 2, ..., T,
donde
f
representa una funci ´on no lineal cualquiera. Podemos tomar una aproxi- maci ´on lineal de la funci ´on en un entorno de un punto cualquiera, pudiendo elegir inicialmente el valorβ ˆ
0. El modelo quedar´ıa:y
t= f (X
t, ˆ β
0) +
∂f (X
t, β)
∂β
′β= ˆβ0
(β − ˆ β
0) + ǫ
t, t = 1, 2, ..., T.
Operando:
y
t− f (X
t, ˆ β
0) +
∂f (X
t, β)
∂β
′β= ˆβ0
β ˆ
0=
∂f (X
t, β)
∂β
′β= ˆβ0
β + ǫ
t,
con
t = 1, 2, ..., T
.Aproximaci ´ on lineal de Taylor
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
RSG Modelos no lineales – 19 / 38
Si denotamos:
y
t∗= y
t− f (X
t, ˆ β
0) +
∂f (X
t, β)
∂β
′β= ˆβ0
β ˆ
0,
el modelo puede reescribirse como
y
t∗=
∂f (X
t, β)
∂β
′β= ˆβ0
β + ǫ
t, t = 1, 2, ..., T.
El modelo as´ı transformado es un modelo lineal general donde la nueva variable dependiente es
y
∗ y el vector de variables explicativas es∂f (X
t, β)
∂β
′β= ˆβ0
. Aplicando M´ınimos Cuadrados Ordinarios:
β = ˆ
"
∂f (X
t, β)
∂β
β= ˆβ0
∂f (X
t, β)
∂β
′β= ˆβ0
#
−1∂f (X
t, β)
∂β
β= ˆβ0
y
∗.
Esta estimaci ´on dar ´a buenos resultados si los valores iniciales
β ˆ
0 son pr ´oximos a los verdaderos valores, lo cual no es conocido.Aproximaci ´ on lineal de Taylor: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Dado el modelo
y
t= β
1e
β2xt+ ǫ
t vamos a obtener una aproximaci ´on lineal del mismo.Puesto que
f (X
t, β) = β
1e
β2xt depende deβ
1 yβ
2 en este caso se verifica que:∂f (X
t, β)
∂β =
∂β
1e
β2xt∂β
1∂β
1e
β2xt∂β
2= e
β2xtβ
1x
te
β2xt.
Por tanto, dado un valor inicial
β ˆ
, se tiene:y
t= f (X
t, ˆ β) +
∂f (X
t, β)
∂β
′β= ˆβ
(β − ˆ β) + ǫ
t= β b
1e
βb2xt+
e
βb2xtβ b
1x
te
βb2xt· β
1− b β
1β
2− b β
2!
+ ǫ
t= β b
1e
βb2xt+ e
βb2xt· (β
1− b β
1) + b β
1x
te
βb2xt· (β
2− b β
2) + ǫ
t.
Aproximaci ´ on lineal de Taylor: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Operando de forma conveniente:
y
t− b β
1e
βb2xt+ e
βb2xt· b β
1+ b β
1x
te
βb2xt· b β
2= e
βb2xt· β
1+ b β
1x
te
βb2xt· β
2+ ǫ
t.
Como se puede observar esta expresi ´on es intr´ınsecamente lineal, es decir, ha- ciendo un cambio de variable puede estimarse por MCO.
En efecto, llamando:
y
t∗= y
t+ b β
1x
te
βb2xt· b β
2, x
∗1t= e
βb2xt,
x
∗2t= β b
1x
te
βb2xt,
se obtendr´ıa la aproximaci ´on lineal
y
t∗= x
∗1tβ
1+ x
∗2tβ
2+ ǫ
t.En tal caso, para el valor inicial
β b
1= 1 = b β
2 se obtendr´ıa el modelo linealizado:y
t∗= β
1x
∗1t+ β
2x
∗2t+ ǫ
t,
donde
y
t∗= y
t+ x
te
xt,x
∗1t= e
xt yx
∗2t= x
te
xt.Aproximaci ´ on lineal de Taylor: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
As´ı, por ejemplo, a partir de los siguientes datos:
y x y
∗x
∗1tx
∗2t0.3 2.2 20.15503 9.025013 19.85503 1.1 3.8 170.96450 44.701184 169.8645 3.4 5 745.46580 148.413159 742.0658 10 5.1 846.51173 164.021907 836.51173
Se obtienen las siguientes estimaciones por MCO para el modelo original y linea- lizado por Taylor:
b
y = −6.033 + 2
′418x
t, R
2= 0
′5523
y b
∗= −0.08252x
∗1t+ 1
′02501x
∗2t, R
2= 1
Aproximaci ´ on lineal de Taylor: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
0 1 2 3 4 5 6 7 8 9 10
2.5 3 3.5 4 4.5 5
y
x
-100 0 100 200 300 400 500 600 700 800 900
0 100 200 300 400 500 600 700 800
y_trans
x2_trans
y_trans con respecto a x2_trans (con ajuste mínimo-cuadrático) Y = -0.329 + 1.01X
Figura 8: Representaci ´on gr ´afica de los originales y transformados.
M´ınimos cuadrados no lineales
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Supongamos que pretendemos estimar un modelo cuya especificaci ´on gen ´erica es:
y
t= f (X
t, β) + ǫ
t, t = 1, 2, ..., T,
donde
X
t es el vector de variables independientes,β
es el vector de par ´ametros del modelo a estimar yf
es una funci ´on no lineal de las componentes de los vectoresX
t yβ
, y cuya primera derivada vamos a suponer que es no lineal enβ
.El m ´etodo de m´ınimos cuadrados no lineales, al igual que su hom ´ologo lineal, trata de minimizar la suma de los residuos al cuadrado, es decir, minimizar la siguiente expresi ´on:
SRC(β) =
X
Tt=1
e
2t=
X
Tt=1
(y
t− f (X
t, β))
2.
Derivando la expresi ´on anterior obtenemos las condiciones de primer y segundo orden necesarias y suficientes para la obtenci ´on del m´ınimo.
M´ınimos cuadrados no lineales
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
As´ı, derivando una primera vez se obtiene:
∂SRC(β)
∂β = −2 X
Tt=1
(y
t− f (X
t, β)) · ∂f (X
t, β)
∂β , ∀t
e igualando a cero dicha derivada parcial se obtienen las ecuaciones normales del modelo:
X
Tt=1
(y
t− f (X
t, β)) · ∂f (X
t, β)
∂β = 0, ∀t.
M´ınimos cuadrados no lineales: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Obtener el sistema de ecuaciones normales del modelo
y
t= β
1+ x
βt2+ ǫ
t.El objetivo es minimizar la suma de cuadrados de los residuos, esto es,
SRC(β) = P
T t=1y
t− β
1− x
βt22,
dondeβ
′= (β
1β
2)
.Por tanto, habr ´a que derivar la expresi ´on anterior (usando que si
f (x) = a
xentonces
f
′(x) = a
xln a
) con respecto a cada uno de los elementos deβ
:∂SRC(β)
∂β
1= −2 · X
Tt=1
y
t− β
1− x
βt2,
∂SRC(β)
∂β
2= −2 · X
Tt=1
y
t− β
1− x
βt2· x
βt2· ln x
t.
Igualando a cero estas derivadas se obtendr ´a el sistema de ecuaciones normales:
X
Tt=1
y
t− β
1− x
βt2= 0,
X
Tt=1
y
t− β
1− x
βt2· x
βt2· ln x
t= 0.
Estimaci ´ on por m ´axima verosimilitud
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Sabemos que la funci ´on de verosimilitud del modelo
y
t= f (X
t, β) + ǫ
t, ǫ
t∼ N (0, σ
2I
T),
viene dada por la expresi ´on:
L(β, σ
2|y, X) = 1
(2πσ
2)
T /2exp
− 1
(2σ
2) (y − f (X
t, β))
′(y − f (X
t, β))
,
y aplicando logaritmos neperianos:
ln L(β, σ
2|y, X) = − T
2 ln (2π) − T
2 ln σ
2− 1
2σ
2SCR(β).
Los posibles estimadores m ´aximo veros´ımiles ser ´an obtenidos tras derivar la ex- presi ´on anterior con respecto a
β
yσ
2 e igualando el resultado a cero.En el primer caso, se obtiene la derivada:
∂ ln L(β, σ
2|y, X)
∂β = ∂
∂β
−1
2σ
2SCR(β) = 1 σ
2X
Tt=1
(y
t−f (X
t, β))· ∂f (X
t, β)
∂β ,
Estimaci ´ on por m ´axima verosimilitud
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
que igualada a cero queda:
X
Tt=1
(y
t− f (X
t, β)) · ∂f (X
t, β)
∂β = 0, ∀t.
Advi ´ertase que los resultados obtenidos coinciden con el estimador por m´ınimos cuadrados no lineales, por tanto, al igual que antes, no es posible dar una soluci ´on anal´ıtica para las soluciones de este sistema de ecuaciones (y una vez m ´as se hace necesario un m ´etodo iterativo para obtener los valores de los par ´ametros).
Sin embargo, s´ı que es posible dar una expresi ´on para la varianza de las perturbaciones. Derivando parcialmente con respecto a
σ
2 e igualando a 0, ob- tenemos:− T 2
1 ˆ
σ
2+ 1
2(ˆ σ
2)
2SCR(β) = 0.
Despejando:
σ ˆ
2= SCR(β)
T .
Algoritmos de b ´ usqueda
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
En la presente secci ´on veremos los procedimientos num ´ericos que ser ´an utiliza- dos para resolver las ecuaciones normales obtenidas que no pueden ser resueltas de forma directa mediante procedimientos algebraicos.
Dado el modelo:
y
t= f (X
t, β) + ǫ
t,
la suma de cuadrados de los residuos vendr ´a dada por la expresi ´on:
SCR(β) =
X
Tt=1
(y
t− f (X
t, β))
2,
siendo la condici ´on necesaria de m´ınimo para esta funci ´on la dada por la ecuaci ´on normal:
X
Tt=1
(y
t− f (X
t, β)) · ∂f (X
t, β)
∂β = 0.
Veremos a continuaci ´on dos m ´etodos para resolver este tipo de ecuaciones.
Algoritmo de Newton-Raphson
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Este algoritmo se basa en minimizar la suma de cuadrados de los residuos.
En primer lugar se toma como aproximaci ´on a dicha suma el desarrollo del poli- nomio de Taylor de segundo orden en un entorno del valor inicial
β b
0:SCR(β) ≃ SCR( b β
0) +
∂SCR(β)
∂β
β= bβ0
(β − b β
0)
+ 1
2 (β − b β
0)
′∂
2SCR(β)
∂β∂β
′β= bβ0
(β − b β
0),
Derivando respecto
β
:∂SCR(β)
∂β ≃
∂SCR(β)
∂β
β= bβ0
+
∂
2SCR(β)
∂β∂β
′β= bβ0
(β − b β
0).
Igualando a cero la primera derivada:
∂SCR(β)
∂β
β= bβ0
+
∂
2SCR(β)
∂β∂β
′β= bβ0
(β − b β
0) = 0,
Algoritmo de Newton-Raphson
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
y despejando
β
:β = b β
0−
∂
2SCR(β)
∂β∂β
′ −1β= bβ0
∂SCR(β)
∂β
β= bβ0
.
Siempre que exista dicha inversa, a partir de la expresi ´on anterior se puede plantear el siguiente procedimiento iterativo:
β b
n+1= b β
n−
∂
2SCR(β)
∂β∂β
′ −1β= bβn
∂SCR(β)
∂β
β= bβn
.
Este procedimiento se repite hasta que converja, es decir, has ta que exista
h
talque
β b
h+1= b β
h. En tal caso se tendr´ıa entonces que∂SCR(β)
∂β
β= bβh
= 0,
de donde se deduce que
β b
h minimiza aSCR(β)
.Algoritmo de Newton-Raphson: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Dado el modelo
y
t= x
βt+ ǫ
t,t = 1, . . . , T
, obtener la estimaci ´on iterativa proporcionada por el algoritmo de Newton–Raphson.En este caso
SCR(β) = P
T t=1y
t− x
βt 2, por lo que:
∂SCR(β)
∂β = −2
X
Tt=1
y
t− x
βtx
βtln x
t,
∂
2SCR(β)
∂β
2= ∂
∂β −2 X
Tt=1
y
t− x
βtx
βtln x
t!
= ∂
∂β −2 X
Tt=1
y
tx
βtln x
t+ 2 X
Tt=1
x
2βtln x
t!
= −2 X
Tt=1
y
tx
βt(ln x
t)
2+ 4 X
Tt=1
x
2βt(ln x
t)
2.
Donde se ha usado que
∂
∂β x
βt= x
βtln x
t.Algoritmo de Newton-Raphson: Ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Por tanto:
β
n+1= β
n+
P
T t=1y
tx
βtnln x
t− P
T t=1x
2βt nln x
tP
Tt=1
y
tx
βtn(ln x
t)
2− 2 P
T t=1x
2βt n(ln x
t)
2.
Para el valor inicial
β
0= 0
, la primera iteraci ´on corresponde a:β
1=
P
T t=1y
tln x
t− P
T t=1ln x
tP
Tt=1
y
t(ln x
t)
2− 2 P
T t=1(ln x
t)
2=
P
T t=1(y
t− 1) ln x
tP
Tt=1
(y
t− 2)(ln x
t)
2.
Algoritmo de Gauss-Newton
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Partiendo de la aproximaci ´on lineal del desarrollo en serie de Taylor para la funci ´on no lineal
f
en un entorno del puntoβ ˆ
0 se obtiene:f (X
t, β) = f (X
t, ˆ β
0) +
∂f (X
t, β)
∂β
β= ˆβ0
(β − ˆ β
0).
La expresi ´on iterativa correspondiente al algoritmo de Gauss-Newton es:
βˆn+1 = ˆβn +
T
X
t=1
∂f (Xt, β)
∂β
∂f (Xt, β)
∂β
′!−1
β= ˆβn
T
X
t=1
∂f (Xt, β)
∂β
β= ˆβn
ˆǫt,
donde
ˆ ǫ
t= y
t− f (X
t, ˆ β
n)
es el residuo obtenido en la estimaci ´on realizada.Esta expresi ´on es similar al de algoritmo de Newton-Raphson, con la ventaja a ˜nadida que la matriz a invertir es sim ´etrica y definida positiva.
Algoritmo de Gauss-Newton: ejemplo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Dado el modelo no lineal
y
t= x
βt+ ǫ
t se tiene que:f (X
t, β) = x
βt⇒ ∂f (X
t, β)
∂β = x
βtln x
t.
En tal caso es claro que:
β ˆ
n+1= ˆ β
n+ P
T t=1x
βtnln x
t(y
t− x
βtn) P
Tt=1
x
2βt n(ln x
t)
2.
Para el valor inicial
β ˆ
0= 0
, la primera iteraci ´on del algoritmo de Gauss–Newton corresponde a:β ˆ
1= P
T t=1(y
t− 1) ln x
tP
Tt=1
(ln x
t)
2.
Criterios de finalizaci ´ on del algoritmo
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Estos m ´etodos iterativos no siempre son convergentes. Por ello, se requiere es- tablecer a priori unos criterios que permitan finalizar el proceso iterativo cuando no se alcanza dicha convergencia. Estos criterios son:
1. Los valores de los par ´ametros se estabilizan.
2. El valor de la funci ´on objetivo se estabiliza.
3. El vector gradiente est ´a pr ´oximo a cero.
4. Se alcanz ´o el n ´umero m ´aximo de iteraciones.
5. Se alcanz ´o el l´ımite m ´aximo de tiempo de c ´alculo.
Contraste de restricciones sobre los par ´ametros
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
RSG Modelos no lineales – 37 / 38
Supongamos que queremos plantear cualquier hip ´otesis que implique una combi- naci ´on de los p ´ar ´ametros del modelo de regresi ´on. El sistema de restricciones se puede expresar como:
R
q×kβ = r
q×1, q ≤ k.
El modelo sobre el que se imponen las restricciones se denomina “modelo restringido” y el modelo sobre el que no se imponen las restricciones se llama
“modelo sin restricciones”.
Contraste F:
F = (e
′re
r− e
′e )/q
e
′e /(n − k) ∼ F
q,n−k,
donde
e
′re
r es la SCR del modelo restringido;e
′e
es la SCR del modelo sin restringir yq
es el n ´umero de restricciones.Contraste de raz ´on de verosimilitudes:
−2(ln L
R− ln L) = n ln
σ ˆ
2ˆ σ
R2∼ χ
2q,
donde y son la funciones de verosimilitud evaluadas para el estimador
Contraste de restricciones sobre los par ´ametros
Contenidos
Introducci ´on Modelos
intr´ınsecamente lineales Modelos
intr´ınsecamente no lineales
Aproximaci ´on lineal de Taylor
M´ınimos cuadrados no lineales
Estimaci ´on por m ´axima verosimilitud
Algoritmos de b ´usqueda:
Newton–Raphson y Gauss–Newton Contraste de
restricciones sobre los par ´ametros
Contraste de Wald:
W = (Rβ − r)
′"
∂R( ˆ β)
∂ ˆ β
! ˆ
σ
2(X
′X)
−1∂R( ˆ β)
∂ ˆ β
!
′#
−1(Rβ − r) ∼ χ
2q.
Esta expresi ´on no requiere estimar el modelo con y sin restricciones.