• No se han encontrado resultados

Análisis probit generalizado

N/A
N/A
Protected

Academic year: 2020

Share "Análisis probit generalizado"

Copied!
10
0
0

Texto completo

(1)ANA LlSIS PROBIT GENERALlZADO* Luis F. Forero R.". 1. INTRODUCCION. En muchos trabajos de orden. experimental y socioeconómico se tiene la necesi.dad· de desarrollar pruebas, ensayos y análisis cuya variable de;Jendiente es discreta. Es decir, la variable de pendiente ¡:,uede ser O y 1, o tomar los valores O, 1, 2, .. hasta J- Estos últimos valores podemos organizarlos de tal forma que j valores sean O y k valores sean l de tal forma que [ + k = j. Por lo tanto el contexto de probabilidad (Hogg y Carig, 1970), es de tomar o no una acción, de aquí que necesariamente a una observación Y pueda dársele el valor 1 para el .::aso en que la decisión resul ta en tomar la acción o el valor O, si la decisión es de no tomar la acción. Como se observa, la deciSión de tomar una acción se caractertza por una selección dIcotómica entre dos alternativas mutuamente excluyentes (Hill y. Kau, 1973). La naturaleza dicotómica de tal decisión implica que existe un "punto crítico" o valor de umbral en todo el dominio de la variable explitacita (o las variables explicativas). Así, para un est Ímulo inferior al punto crítico no se presenta respuesta, en tanto que para un estímulo superior si se observa respuesta. Tal valor en farmacología y toxicología se le denomina Tolerancia (Finney, 1962). El tópico anterior es considerado como un esq uerna "est ímulo-sujetorespuesta" .. Por la definición de la variable dependiente, su valor esperado debe estar . comprendido en el intervalo (O, 1), para cualquier valor de las variables independientes. Esta condición cuando se emplea como modelo explicativo del modelo de regresión múltiple, en muchas oca-. Contribución de la Se cción de Métodos Estadl'sticos, Instituto Colombiano Agropecuario, ICA.. División de. Estadistica y. BlOmema.. Economista, M.S., Di rec tor de la Secci ón de Métodos EstiJeJi'stlcos, Centro Experimp.ntal Tibaita· ta, Apartado Aéreo 151123, Bogotá. Revista ICA . Bogotá (Colombia) Vol. XII· No. 3· pp. 315·324 Septiembre 1977· CK. ISSN 0018-894.. 315.

(2) siones no se cumple, debido a que E(Y) ó E(Y)< l : además el modelo está sujeto a heterocedasticidad en los errores (Goldberger , 1964), debido a la naturaleza binomial de las observaciones. El método propuesto por Goldberger (1964) para resolver el problema de estimación de tal modelo, obvia las dificultades ocasionadas por la heterocedasticidad, pero tiene una seria limitación, la condición del intervalo para los valores esperados de las observaciones no se realiza porque Ec"Y) > 1 ó E(Y) <O. >1. Para manejar estos problemas se han desarrollado técnicas de análisis estad ística como la logit (Berkson, 1944), gompit (Brennan, 1949) y la de Zellner y Lee (1965), entre otras . Hill y Kau (1973) citan varios estudios socio-económicos realil.ados ror diferent es autores cuyas investigaciones IJan siuo uirigiUJS hacia la obtención de estimadores. Sin embargo, de una u otra forma estas investigaciones entre las que podemos citar a Dagenais (1969), Rosett (1<.)59), Tobin (1955) Y TOlllek (196¡)), no hacen relación entre la teoría de la deCisión, el concepto del umbral y las técnicas est Id íst icas.. En el campo sicológico, HiJI y Kau (1973) , citan a Heckel y Jordan , [saacson, Hut y Blum, quienes describen las relaciones entre el concepto del umbral y las relaciones humanas o de la conducta .. En. el. campo. bioquímico. Finney. (! 962), introd ujo bisicamente la técll ica. probit: Ashford y Sowden (1970) han utilizado la técnica anterior, en tanto que Cornfield y Mantel (! 950) han empleauo y descrito técnicas alternativas. 316. Es inmediato observar ue la discusión anterior, que cierta investigación se requería para atacar problemas similares. ASI, el objetivo de este trabajo, además de resolver el problema sobre los valores esperados (los cuales deben estar comprenu ¡uos en el intervalo (O, 1») y la heteroeedasticidad de los errores, es el de establecer una metodología para encontrar los estimadores de máxima verosimilitud y los criterios de prueba de hipótesis del modelo. Con la metoctología a desarrollar es posible identificar los factores determinantes y causantes de la decisión , cuando la variable dependiente toma los valores O y l.. ;. Con el propllsito de cumplir este objetivo, se describirá a continuación la técnica probit, y las implicaciones matemáticas y estadísticas del modelo probit.. 2. ESTlMACION. POR. MAXIMA. VEROSIMILITUD Se describirá el uso del método de máxima verosimil itud para estimar los par'~metros del modelo con respuesta dicotómica. El procedimiento de estimación emplea la transformación probit ampliamente discutida por Finney (1962). Con el uso de esta transforma ción, maxlma verosimilitud produce valores estimados de las E(y), comprendidos en el intervalo (O, 1). Por otra parte, el problema de la heterogeneidad de varianzas que surge de un modo natural en esta clase de modelos, se elimina automáticamente. Se desarrollará en lo que sigue la teoría matemática que fundamenta a esta técnica y se darán los criterios de prueba de hipótesis Por el hecho de que la aplicación del método de máxima verosimilitud envuelve el uso de la transformación probit, nos referiremos en lo sucesivo con este nombre, al propio método de estimación.. •.

(3) 3. DESCRIPCION. DEL. METODO PROBIT. Si se considera el índice It dado por la siguiente relación: It =~ o x to + ~I. X. ti. + ... + f\ x tk-. t. = 1,2, ... n. donde las\tJ son constantes conocidas y las 0j , j = 1, 2, , ... , k, los pará metros desconocidos, y sea It* una variable aleatoria distribuida como una normal estándar. Si se tiene en cllenta una v<lriable aleatoria Yt , definida como sigue:. y t. ={. I para lt~ 't * (si la decisión resulta de tomar una accic\n) O para It< 't* (si la decisión resulta de no tomar la acci6n).. donde tt'" se considera como el punto crítico de la respuesta y además desempeña el papel de error en el modelo siendo i3s varianzas de los mismos homogéneas (Finney, 1962). Así, dado el valor lt la variable aleatoria Y t se distribuye como IJna binomial puntual. Esto puede verse fáctlmente como sigue: l. Yt toma solamente dos valores, O ó 1, ") la probabilidad de que Y t viene dada por. = O,. que denotaremos como P { Yt. O I Jt } ,. ( 1) y,. 3. la probabilidad de que Yt viene dada por. 1_ yue l!enot<lremos como P { Y t. P{Y t =1 1 I1 }=P{ l't. = 1I. lt} ,. e -u ~ '2 du. (2). Introduciremos la notación. (3) y t. (4) 317.

(4) Con esta notación, la función de densidad de Yt conocido 't' es C( - F t YI Glt - Yt, Y l' Y t t. • (5). O, 1: 0< F t < I. Cuando la variable Yt toma los valores O ci 1, puede interpretarse como f( 1). = F". c¡ue representa la probabilidad de un éxito en un ensayo: '!. f(O). = Gt ,. que represen ta la rrohabilidad de un fracaso en un ensayo. Debido a la estructura funcional de las probabilidades en los modelos expuestos, las cuales depen de n de los p:H 3.me tros ~i ' podemos aplicar el método de máxima verosimilitud para hallar los estimadores de estos parámetros. Si ordenamos una muestra de observaciones Yt de tamaño n, t = 1, 2, ... , s, s + 1 , ... , n, de tal forma que las primeras, observaciones correspondan al valor de Y t = 1 Y las restantes (n-s) observaciones correspondiendo al valor de Yt - O, la verosimilitud de tal muestra es:. •. n. Ft. 1f. t. =s. + 1. Gt (6). Tomando el logaritmo de (6), resulta Log ex, = L = log F 1 + .. + log Fs + log Gs + 1 + . . . + log Gn ;. (7). de donde. s I log Ft +. t=J. 1=. n I. s+ J. log G I. (8). Derivando (8 ) con respecto a los Pi e Igualando :1 cero c§...tas derivadas , se obtienen las ecuaciones normales para determinar los estimadores ~. de máxima verusimilitllll ele los par:ímetros 1 318. •.

(5) ()L 1. él~1. L'. 1. n. t= ~. f I. II 1. ". Ali. lo. FI. (= 1. = O,. 1". () Pi. ¿. +. I = :i + I el. 1I. 11. ¿. (le;. 11. (0Fr. L' = ¿. AII. I ~+ I. 1. él{31. (9). O. O,. ( 10). (;1. ,k. ( 1 1). ht as CClI;ICi():lC S Illlllnales sun un con1unto de (k + 1) ecuaciones no lin eale s en los IXlrjlllctl'oS {3. Para resolvel este sistema tendremos que usar un procedimiento Itl'l:i1ivu, hl~ uhletivu se Illgra aplicando la expansión de Taylor 31 sistema (10) de la si~'lIil'nlc 1l1;lnl'l;l: Si L_'i l'S dil crl: l1ci~lhlc so bre un intervalo pUlltO IU + IU qlle C'SLí en. P. (íp. r. ry. PJo está en. r. entonces, para cualquier. iJi. i. = O,. 1" " k. El sistCIll;1 ;111tcriur de k + I CClI;lciolles line:llcs, en. ( 12). fUl1ción de los nuevos valores,. ( 13) 319.

(6) nos queda de la siguiente manera:. L'!, (Po o ". (3 10 '". '". Ch) + •L :5 'JI; e 1<0 J:::O. ({3 00'. ¡" ~ IJ. -.". (1,'KO ). = o'. 0,1,2,. donde. o;;. 82 L. o{3J. ó{3ij O{3j. Para llegar a (14), derivamos (10) con respecto. s L" .. IJ. L: t=1. (,Z;: t Xti X tJ. F2 t. It). F,,. :1 laS. {3¡ y obtenemos:. il. ¿;. ". /', i Xtj. (=Si,. lt. --'. 7\. -( - I /. \" t. 1. /. Definiremos lassigLlIcntcs canti(ial1c:' Z( , ! 6). Ft Zt , l.. \7). Gt L.. Dt. Z2t • -- , Ft. ~t'. , ¡ () j. y. !lJ ). G2r utilízam:.:\ como estimadores teni.!llVOS los \ {3·o (r:)::hICJl1CIltc los que obtienen mínimos ;-ados), \ reemp];¡/''''10S ·kn los Io:cs cJcfin 'y, en lél: relacIoncs (16) a (19) inclusive, podemos reescribir a (10) y a (.15) de la sigUlclllC manera.

(7) s L'. I (~uu· ~ 10. O.. .. n. ;:-. ~o). ". (=1. Al. Xti. z:. Xti. Dt. ¿. t~+l. (20). Ct '. l .. .. , k. Y. L" ,. (~uu· i3 .. 11 lO I.¡=. O.. 11. .. ~(). ¿. Xli. Xli. t=[. Xli. Xl.!. Et ,. nI). t=S-t I. 1,. Lus v,¡Jures de L' i y dc L"ij' son sistCIl1:1 de k + I Cl.:lI:ICi\1II<:\ ( 14 l. 'j)cpnH\S 1,,·1,. aqucllos que se requieren rara construir. (16)ye. 1". notación. el. cial,. ¡le. (22). L" (L'· l, una IILllli/ (k + 1) x (k + 1), ¡j {3 == I!. \ 1. (L'I)' UIl. I • ') P,I ra (\. ,1. (k + 1) \. l.. ). hit,. q. (cSf3J. ) a. la matriz l'. un vector (k + 1) x 1. simétrica, la. de. ¡3 es ' (23). 111. a pI icando. e'ma (23). d"llldc I cs el. !c.. pasn iterat. /\........ Po' ~I'. Al. ..... uí, la. ,. m6todo iteratlvCl. SOIU.211"¡¡i. ue N\'wton. las:. Ivamente las. IId,l los valores ( _,:30 l l t l ' (5¡3 IO )¡+I' este c\ l'l ClbU, Ill$ va~H(,s (31)1, (~I)I' Il1líxinw-verusímiles. OPj (i. :Iccn por lo,. el.:\1aCIOlh'·; = 15\ ~ I 0= .. él. sistema (2::. Icne. ,( cS~ku)¡+1 ((\lIvergen él rldo (~k)l' convergcn J los estimadores. .1\, rcspectivamcnte.. Describiremos en IJ iente SCVi'.'lil. Ids implicacionl::'1 I,'fli) apropiadD. IgaLlor a t0111111 ,','I"iuncs con. al. 321.

(8) 4.. CRITERIOS DE PRUEBAS DE HIPOTESIS PARA EL METODO PROBIT. ,. Donde. Nuestro propósito es prohar la hipótesis. y. cI. ex(0(), . 0, ... Puesto que no e~ posible lograr una solución exacta para realizar esta prucba de hipótesis, se recurre a un procedimiento aproximado, válido para muestras grandes,. se oh-. k. tiene cuando. contra la. ¡-llnción. iJ. los esti·. IICI)IIII. madores de el procedilT anterior.. 1-;(,. 1.0. "jI'. fI. IlIdll.LI.1. ,l)j,:' PI> 1" I:i scu: i('lll. En tonces el -2 log. A de (33) es A. ,. log \. log ex({3o ) + .2. A. Sea ex (Y) el maXlmo de la [unción de verosimilitud bajo la hipótesis Ha: 01 = {32. = O.. =.,,=. maximo de la. sea. ex. A. (f) el i1itud. "* O, como. ¡JI. , 110. interesa haeer respecto al p:1I notación, la queda definida. con. 11,'. Si dcseamnll tesis. A. A=. 1111\1 ·tc~is. con un nív.' z3r,j Ho ,\ tahulado ele contr,nio,. Ii" ;c rcclid' e! VI:!" 1 11 el CdS,'. 1·111. 111. t:li"Ilhi':i1. 1'11. I. 1I1 1111\·.1.. o,ey) 0,(. (24 ). Para muestras grandes, el TeoremJ 12,7 de Mood y Graybill (12) establece que [a v:J1iahle aleatoria -2 log A., donde A es d<lcla por la relación (24), se distribuye como con k grados de libert:ld En nuestro. 11". (()ntr:1 1:1. :!Ikrllllliva. i3 i O'. 11"1. , 1. i =. 1.2 .. , " k,. podelllo~. !! I -, l.s 1 cilla nos Mood y G I 13, el ¡. \ l' parámcg3r3ntiza q () jl(JI 1¡¡11\lllIil verosilllitros, cs est 1"1 muestra es litud y el : gla nd e, en tonee,1. A. a (Y) = ex (0 0 ). A. A. )-. 0,(00,01 , , , ' , Pk ) 322. o. f'I,. N (P,. N (P, r -L" ] -1) denota a la el isl ribucíón normal multívariaela con vector de medias 0 y matriz de covarianza [- L". JI.

(9) "-. El error estándar ;J.smtótico para ~i es. [(-L"fll *. y la. urucba. realizar. = U, e\. f [')-. 1. e. ~!Ilruximada para hipótesh. : ~.. J. iJ. clonde te se distribuye él[lroximadamente como la t de StuJcnt con n·(!" + le libertal!, entonec se J) recha/! J un nivel Si!~Ilifica[I.\ sí y solo sí, t c 2: tO' , n.(k+l)' la hipótesis 11" se acepta en CISO contrario.. 5. RESUMEN Y DISCUSIuf\. Ln trabajl) Jiscute ratamientl) ']'sudístin" [)(\¡ v;¡rios J\ltorc,-, para cstirn;¡¡ los purámetros en un modelo con respuesta dicotómica. T~¡[c, modelo<; ocurren COI1 frecuencia en p robl."n;)') econorn2 t CiliOS de ..llv.2rsa ínJolc. Istituye:1 valioso.i \iliar par:l el cconoJlletrista, quien al examinar ulla I)oblaciéln Jada, ObSC[\11 una cJasifi· C3Clón (h' ~llS clcmcrt0\ cn do:; c2tegorías. \'lcIl1[llo de !JI::, s:tua· so(ionce, UCUHC en LL Invcst cioecunómicas, donde el ohlctivo es esu blrccr las fa/ones dc la adopción o no ,¡dope de una ,.'rminad,: íC,.IIO[O¡lía, pUl Iloblaci(l[¡ tllral. LoS mode l", dicotómiclls de tan sencilla t''':trnclura, han ~id() JT1!I\' roeo comprl' Idos por Ius IlIvcstigad!)!! Las ralon.1 tid incl\ ¡¡Jr\cllsióll flsan sobrc' las bases ,'stadísticas que definen a lus modelos prupiamcnte dichGs. SU LISO ha rc,ultado hasL: IlHa con dehid· ¡ull..lamen! te, a 13s. I·L"). -L. Jldades aritméticas derivadas de su apiicadón. Sin embargo, las ventajas que representan los medios de cómputo elec¡ir nico, son na razón !1cderosa r·bviar tales r fí\tI! tades. Probil La desel del es otra sino 12 cstrmaciór WCión del mt;.udu de maXíi11a verOSirllllítud al modelo dicotómico transformado, de acuerdo con la transformación Prr'bit. El c\;í'lico de cioncs normales, t Icnen que resolverse por aproximaciones sucesivas. Así. se ha lbeJo una ilu«ración del proceso itcrJtivu de soll.ción del sisterna de ecuaCiones :lü¡malc~. der¡'.adas del modelo. Se estJblccen adicionalmente, los criterios de prueba aproximados que son objeto de investigJJ,,¡ en esta ¡teneióll problcnrZls. énLtsis (1 se ha con res[lccto a la aplicación del \1étodo Prob it, queda ampliamente J ust iticado. Si el modelo hipotético razonablp. verosirn;' Imaciones de mlÍx ;;0H suficientes para los parámetros, ~¡en do además. asintóticamcnte eficientes. Así, si cne (n) es relativamente f!rande, estim:.lCIi..lIWS derivad del m(·tod . hrán la informa~.lón posible respecto a los parámetros.. SUMM.. Generaliud Probit analysis. file pL Illcthod. a stat by ~cvcral authors COI cstim;¡tinl_~ parameters in discrete models. Mally cxamples of such models occurr llrticular! :n reS(';il ere the [arget oí study. d0nota el elemento dp la hilera i, columna i de la matriz (_L"I'l.

(10) mating p8r¡l[neter~ by using lhe probit transformation. The rcsHlt is a tvpical case uf no lin~;¡r c:stimatíon which involvcs interative processcs. Additional iSCU';:i!On ¡neludes sevclal t.erios r(lr hipothesis testing for the prohit method. determine whlch social or eCOllomlC factors are responsable for the adoption of a speelfio practice. h i s papel discuss ! of maximum likelihood method for esti-. 7. BIBUOGRAFlA 1. ,ASHFORD, J.R. and SOWDEN, Biofllp.trics 26:535-54él.. 2. BF.:RKSON, J. 1944.. R.R.. applícation of. 1970.. the. Multivariate. luc.¡í~tíc lliilct¡CJiI. Probit. Analvsis.. to BiOAs:,z;y .. 1 I\m. Stat. Assoc. 39: 35 7 -365. 3. BRENNAN, J.F. 1949. Evaluatíon of parameters in the Gornpertz and Makehan equations . ..l. Am Sta! Assoc.44.116-121. 4. CORNFIED. J. and MANTEL, N. 1950. Sorne New aspects of the application of rnaxirnurTI ikehood to the ca1culation the closage response CUt ve. J. Arn. Stat. Assoc. 45:181-210. 5. DAGtNAIS, M.G.J969. A thresho,d regression rnodel. Econornetríca 37: 193·203.. 6.. INN. D.J. 962. Problt Cambridge, England.. Analysis.. The. Unlversity. Press,. 3r(1.. EcJition.. 7. GOLDBERGER, A.S. 1964. Econornetríc Theory. John Wiley and Sonso Ine. New York. 8. HILL, L. and K/\U, P. 1973. App!ication of rnult1varíate pro hit to 2 Threshold rnodel ot grain dryer purchasing decisions. Am. J. of Agr ic. Econ. 55: 19-27. 9. HOGG,. R. V. and CAR I G, A. T. 1970. I ntroductíon to rnathernatical statistics McM lan Publis!llng CO. In, 31d. Edltioll. New York. 10. ROSETT, R.N.. 9[)9.. Stal ís I ical !nodel of trietion in Eeonornics. Ecollornetrica. 27:263-267. 11. TOBIN, J. 1955. The application of multivariate probít analysís to Econornic surVf~y Data. Cowles Foundation Discussion. Paper No. 1. 12. TOMEK, W.G. 1968. Rewession analysis with a limited dependt variable. J. Farm. Ecoll. 50:445-447. 13. ZELLNER, A. TONG-H NG LEE. 965 Joínt e"l.lation of rciationsnips Involving discrete random variables. Econometrica 33:382-394. 324.

(11)

Referencias

Documento similar

Período de realización (indicar meses ou períodos posibles de realización e xornada laboral: tempo completo ou parcial).. Do 01 de abril ao 30 de setembro en horario de

Conocido es el caso de Mortimer Ternaux, autor de una Historia de la Revolución, publicada en el siglo XIX, o el todavía más significativo de Edgar Quinet, quien hace «la crítica de

Esta formación se produce mediante el doctorado (13 alumnos, lo que significa el 32% de los encuestados), diferentes másteres entre los que destacan de nuevo el de Profesorado

neuroléptico maligno que puede representar un riesgo muy importante para la salud. Si interrumpe el tratamiento o reduce la dosis de Pramipexol Sandoz también puede sufrir

Resolución do 16 de outubro de 2017, conxunta da Consellería de Educación e Ordenación Universitaria e da Consellería de Economía, Emprego e Industria, pola que

Más que los programas tradicionales de liderazgo, responder estas tres preguntas determinará tu efectividad como líder del siglo XXI.. Son mujeres y hombres que no

4.- Másteres del ámbito de la Biología Molecular y Biotecnología (9% de los títulos. Destaca el de Biotecnología Molecular de la UB con un 4% y se incluyen otros

• Sólo se devolverá el IVA soportado y deducido por la Universidad de Málaga en sus correspondientes declaraciones fiscales por facturas con cargo al proyecto de investigación