Estimación máxima verosimilitud - Modelos logit y probit

Capítulo 3 Modelos de probabilidad: lineal, probit y logit

3.3 Modelos logit y probit

3.3.3 Estimación máxima verosimilitud

Teniendo en cuenta la definición de las metodologías logit y probit, en esta sección se discute la técnica utilizada en la estimación de modelos probabilísticos. La derivación de estimadores muestrales de estos modelos, se realiza a través de de máxima verosimilitud (MV). Este es un procedimiento estadístico, que tiene como objetivo la derivación de estimadores para un vector β de parámetros desconocidos, a través de funciones f( , )X β que definan Xi y permitan encontrar

la probabilidad máxima para la función de densidad probabilística. Para los modelos logit y probit se considera una función conjunta de la siguiente forma:

1 ( ) ( | ; ) n i i L G Y  



β X β (3.13)

114

La ecuación 3.13 es una función de verosimilitud definida como la productoria de funciones de densidad de variables independientes, donde G Y( | ; )_i X β  f( , )X β y está caracterizada por una ecuación binomial (véase ecuaciones 3.14 y 3.15):

1 ( | ; ) [ ( 1| )] [ (Yi 0 | )] Yi i i i G Y X β  P Y  X P Y  X  (3.14) 1 ( | ; ) [ ( )] [1Yi ( ] Yi i G Y X β  F Xβ F Xβ)  (3.15)

Cuando se cuenta con observaciones independientes, el cálculo de la función de verosimilitud, donde interviene el producto de las probabilidades individuales, habitualmente se toma el logaritmo de la función, puesto que se transforman los productos en sumas y los cocientes en restas (véase ecuaciones 3.16 y 3.17). Teniendo en cuenta que se trabaja con el producto de probabilidades, la función de verosimilitud será siempre menor que 1 y por tanto su logaritmo será negativo.

1 1 ln( ( )) ln( [ ( )] [1i ( )] i) n Y Y i L F F   



 β Xβ Xβ (3.16)





1 ln( ( )) ln( ( )) (1 ) ln(1 ( )) n i i i L Y F Y F  



   β Xβ Xβ (3.17)

Las ecuaciones 3.16 y 3.17 son la transformación logarítmica de la ecuación 3.13. Por consiguiente, para encontrar los estimadores de MV es necesario derivar

ln( ( ))L β respecto a β para encontrar estimadores (βˆ) de mínima varianza, insesgados y consistentes. Para esto, la función de verosimilitud necesita ser estrictamente cóncava (Gourieroux, 2000, 12), puesto que se desea encontrar un único máximo global de ln( ( ))L β .

De acuerdo a lo anterior, es posible utilizar la técnica expuesta para llevar a cabo la estimación de modelos probabilísticos. Teniendo en cuenta la ecuación 3.17, se utiliza la función de densidad asociada a los métodos logit y probit. Dado que las ecuaciones de máxima verosimilitud asociadas con éstos no son lineales en los parámetros, no es trivial encontrar expresiones analíticas que deriven los estimadores de interés. Por tanto, es necesario utilizar algoritmos numéricos o métodos matemáticos para encontrar los parámetros del modelo que se pretenden estimar(Gourieroux, 2000, 13).

115

Después de encontrar estimaciones por MV se hace necesario enfatizar el las particularidades originas de ésta técnica. En primera instancia, el resultado que se obtiene es distante a lo que se ha trabajado bajo la técnica de mínimos cuadrados, puesto que la distribución de los errores de los modelos logit y probit exige la utilización del estadístico Z para análisis de significancia individual. Asimismo para probar la significancia global se utiliza el estadístico de razón de verosimilitud que sigue una distribución q2 con q número de restricciones. En

segunda instancia, MV para modelos probabilísticos no soluciona el problema de hetoroscedasticidad identificado en MPL, por tanto es importante que éste se corrija usando el método de mínimos cuadrados generalizados (MCG) que, por medio de la transformación del modelo inicial, consigue mejorar la eficiencia de los estimadores.

Por otro lado, cuando se utilizan por separado los modelos logit y probit se pueden obtener estimadores similares, dado que las funciones de distribución acumulada son parecidas. En relación con lo anterior, para hacer comparaciones entre las dos metodologías hay que tener en cuenta que la distribución logística muestra variación de 2

 , por tanto la equivalencia de los ˆLogit respecto a los ˆprobit es

ˆ _1.6 ˆ

Logit probit

   (Greene, 1999, 755).

3.3.4 Pruebas de significancia

Con respecto a las estimaciones de MV, es posible hacer análisis estadísticos después de encontrar los estimadores, en especial, esta técnica permite comparar modelos y corroborar la existencia de dependencia global entre las variables explicativas y la variable dependiente dicótoma de un modelo de interés. Para ello es indispensable especificar los dos modelos que se quieren contrastar, si se tiene en cuenta un modelo con dos variables explicativas (Xi1 y Xi2) la prueba seria:

Modelo sin restricción: Yi 01Xi12Xi1ui (3.18)

116

La ecuación 3.18 muestra el modelo inicial que se estimaría a través de máxima verosimilitud, mientas tanto la ecuación 3.19 representa un modelo caracterizado por no contar con las variables explicativas. Para realizar la comparación entre los estimadores, se utiliza una prueba de hipótesis que compare las funciones lineales de los parámetros de cada uno de los modelos (véase ecuación 3.20).

0: 0 1 ... k 0

H      Los coeficientes no son significativos conjuntamente

(3.20)

1: j 0

H   Los coeficientes son

significativos conjuntamente

Dado que las funciones de densidad de probabilidad no se distribuyen normal, como en los modelos de regresión lineal, los estadísticos de la prueba de hipótesis deben ser distintos a las pruebas t o F . Por tanto el estadístico de prueba que se utiliza es una razón de verosimilitud (RV) (véase ecuación 3.21)

2( _NR _R) _q

RV  l l  (3.21)

En la ecuación 3.21, RVse conoce como el cociente de verosimilitud (likelihood ratio en inglés); lNR es el logaritmo natural del modelo no restringido31 ; lR es igual

al logaritmo natural del modelo restringido32_; _q_{de la distribución} 2

hace referencia al número de restricciones del sistema. Seguidamente, la forma de interpretar la prueba es comparar RVcon el 2

 de las tablas. Si 2

RV  entonces se dice que se rechaza la hipótesis nula, en otras palabras, las variables independientes en conjunto son importantes para el modelo que se está estimando. En las siguientes secciones se trataran temas relacionados con pos estimaciones de MV. 31 _{ln( ( )} ₎ NR L  32 _{ln( ( ) )} R L 

117

In document libro econometria.pdf (página 116-120)