• No se han encontrado resultados

Regresión lineal múltiple

N/A
N/A
Protected

Academic year: 2020

Share "Regresión lineal múltiple"

Copied!
15
0
0

Texto completo

(1),,rgr"/-r. I X . , R E G R E S ILOI N NE A M L ULTIPLE L a r e g r e s i ó nd e Y s o b r eu n a s o l a v a r i a b l e ' i n d e p e n d i e n tpeo d r f a s e r i n a d e c u a d ap a r a e x p l i c a r c l a r a m e n t eu n a r e l a c i ó n d e d e p e n d e n c i a .D o so m á s v a r i a b l e s i n d e p e n d i e n t epsu e d e ne s t a r d i s p o n i b i e sp a r a p r o p o r c i o n a ri n formaciónadicional acerca de las variaciones de Y.. La metodologfaes. u n a e x t e n s i ó na l u s o d e l a r e g r e s i d nl i n e a l s i m p l e ; c q n oe l p r o c e s os e incrementa e n c u a n t oa v a r i a b l e s , 1 a i n t e r p r e t a c i ó ny m é t o d od e c á l c u 1 o c o m or e s u l t a d ol ó g i c o , s e i n c r e m e n t a tan¡bién. E n e s t a s n o t a s s o l a m e n t se e p r e s e n t a r áe l c a s o d e d o s v a r i a b l e s i n d e p e n d i e n t e s , e s d e c i r , X r J X z y l a v a r i a . b l ed e p e n d i e n t e Y . E l m o d e l od e r e g r e s i 6 ne n t a l c a s oe s t á d e f i n i d o p o r :. t = B o * B r x , +B r x r +e. lr \. donde:. Y=. v a r i a b le s a l e a t o r i a. X : , X z = c o n s t a n t e sc o n o cdi a s B o , B¡ , B z = p a r á m e t r odse l m o d eol -2. e - N ( 0 , u ) , n o c o r r e la ci o n a d a T a l c o m os e e x p r e s óe n r e g r e s i ó nl i n e a l s i m p l e r s ep u e d e na g r e g a ry q u i t a r los términos erX, V nrl, de tal forma que el modeloqueda: Y = B o +8 1 ¡ ¡ + B 2 X 2 + B,(x,- x¡)+Br(xr- xr)+ e. Y = Y+ Br(x,- xr) + B"(xr- 4) + e. (2). Este último modeloperrnite una metodologlade cálculo más sencilla que el Drimero..

(2) ,161. INTERPRETACION y coeficientes de regresión parcial A Br J 82 se les conocecomolos es simi'lar al "b" de regrese estiman por b, V br; su interPretacidn en una unidad' Y se sión lineal simple, por tanto si Xr se incrementa en una unidad Y se inincrerentará en b, unidades, si X. se incrementa ones anterioen b. unidades. Sin embargo'las i nterpretaci crenrentará los modeloseconométricos' res cambianen ciertos casoscomoocurre en úttimos se discutirá o tambiéncon modelospo1inomiales' sobre estos ÍBs tarde. para realizar ]a esEl rnodelOescrito en 2' es másfáci l ESTIMACI0N: t os c o m os i g u e ' p e r o a n t e s t i m a c i ó nd e B o , B r Y t s r , e l p r o c e s a m i e n e asl: o a r a f a c i l i d a d s e e s t a b l e c e na l g u n a si d e n t i d a d e s. scXr = txi-FC S C X Z= X X i - F C SCY = TY2-FC SPYX'= [XrY-FC SPYX'= IX2Y-FC S P X T X Tt= X ¡ X z - F C FC. =. Factor de corrección, segúnel caso'. Enel modelo y -y. +Br(xr -\). *e". (x. -D. + e. Parutu estimaciónde B o , B ¡ , B , s e P r o c e d e : b ¡ x SCX! + b 2 x S P X ' X 2 = S P X ¡ Y b r x sPXI X2 + b , x S C X ,= S P X z Y.

(3) 164. Estas,seconocen normal coÍiolas ecuaciones es. por los nétodosa'lgebraf cos conunesconLa soluciónde estas ecuacjones d u c ea l a s i g u i e n t es o l u c i ó n . x SPX"Y SCX.x SPX'Y- SPXTX2 br. b2. SCf,,x SPX'Y- SPXTXa x SPX'Y l). D. = . S C X ¡X S C X ,. ( S P X i X " ) ,. bo =Y-brT¡-bri', S e i l u s t r a r á e l c á ' l c u l od e b s , b r y b" nrediante e'l s'iguíente conjunto de observaciones: X¡. x2. Y. 77. 62. 1 .4 0. 7t. 55. t.47. 78. 62. r.5t. 43. 1 .1 5. 95. 57. L.2?. 96. 5l. 1.48. 7t. 41. l. 31. 63. 40. 7.27. 6?. 45. t.22. 67. JY. t. 36.

(4) 165. X, =. E d a di n i c i a ' l e n d í a s. X2 =. P e s oe n l i b r a s. =. Y. Incrementode peso libras/dtla. s c x r = 7 7 2 + . . , + 6 7 2- F C = 1 2 8 8 = 1 . 4 0 2+ . . . + 1 . 3 6 2- F C= 0 . 1 0 9 8. scY. S P X r Y= 7 7 x 1 . 4 0 + . . . + 6 7 x 1 . 3 6 - F C= 3 . 5 4 SCX2 =. 622+...+ 3g2 - FC = 736. S P X T X=27 7 x 6 2 + . . , + 6 7 x 3 9 - F C= 5 4 5 s P x 2 Y= 6 2 x 1 . 4 0 + . . . + 3 9 x 1 . 3 6 - F C : 3 , 6 4. 60 4 9 4 36. ?U1. U . 6!4J U 'u l = _ - -7-3- -6-x- - 3. 6. 5540 -9 -5E4' -5-x- =36. 5 - , U^ ^ ^ ^ o E. D. = 1288x 736 - 545'?= 650943. '¡2.. =f1 f i 2 8 8x 3 . 6 4 5 4 5 x 3 . 5 4 = u - u ú + ¿. bo =. 1.33-0.00096x75-. 0.0042x49.5. LU't. bO. =. Y. = 1 . 0 4 + 0 . 0 0 0 9 6X , + 6 . 9 6 4 2 ¡ ,. E s t o i n d i c a q u e p o r c a d ad í a d e e d a d i n i c i a l m á s ,s e e s p e r au n i n c r e m e n t o promedioen el pesode 0.00096libras/día y por un incrementoen el peso 'libra de una se esperaun aumentopromediode 0.0042Iibras de peso/dia' PRUEBAS DEHIPOTESIS:AnáIogamente a comose estudió en regresión lineal s i m l l T e x i s t e n d i v e r s a sp r u e b a sd e h i p ó t e s i s , s i n e m b a r gsoó l o s e p r e s e n t a ran dos..

(5) 166. L a p r i m e r ad e é l l a s c o n s i s t ee n H o : B r = 8 . = 0 , é s t a e s u n a p r u e b ag l o b a l d e s i g n i f i c a c i ó n o p r u e b ad e s i g n i f i c a n c i a p a r a l a r e g r e s Í ó n . E l c r i t e r i o de pruebaes el de F y se conocecoÍlo el análisis de variancia para la reg r e s i ó n , l a t a b l a e s c o n ns i g u e : T a b l ad e a n á l i s i s d e v a r i a n c i a p a r a l a r e g r e s i ó n F. de V.. i ón Regres. ca. G .L .. 2. b r s P x r Y+ b 2 s P X 2 Y. Error. n-3. Diferencia. Total. n- 1. SCY. ll. = S . c .R E G / 2 CMREG. u. C M E R R 0=RS . C . E R R O R / ( n - 3 ). 'al. Fc = CMREG/CMERROR. c.H.. t!. Fc 3/. 2/. es un estimadorde o2 y se denota por S2. El valor de Fc se El CMERROR c o m p a r cao n F p a r a n i v a ' l o d e s i n i f i c a n c i a c o n 2 y n - 3 g r a d o sd e l i b e r t a d Si Fc es mayorque F, se rechazaHo y s e a c e p t aH a : g Í B z f 0 , s i e s é s t a 'la cuál de los coeficientes son los diferentes a cero. situación no sabemos Existe el criterio de T para probar si cada coeficiente es igual a cero (ó a u n a c o n s t a n t eK ) y e l d e s a m o l l od e ésta es comos igue:. Tc=+. b, -0. -sb-;-.

(6) 52. = CMERR0R. ttol = s2cl1. s'bz = s' cz? Crr = sCxe/D cZZ = sCxl/D S i T c e s m a y o rq u e T , s e a c e p t aH a : B r l 0. ó Ho: Bz l0. s e g ú nc a d ac a s o .. Se ilustrarán a continuaci6nambaspruebaspara los datos del ejenp'lo: + ba SPX,Y S , C . R E G= b ¡ S P X ¡ Y S . C . R E G= 0 _ . 0 0 0 9x6 3 . 5 4 + 0 . 0 0 4 2x 3 . 6 4 S ' C . R E G= 0 . 0 1 8 8 S.C.TOTAL=SCY=0.1098 S . c . E R R 0 R= S . C . T 0 T A L- S C R T=G0 . 1 0 9 8- 0 . 0 1 8 8 = 0 . 0 9 1 0. Tabla de anáIisis de variancia para la regres'idn F. de V.. t. S.C.. C.M.. Fc. 0.72. 2. 0.0188. 0.0C94. Emor. 7. 0.'0910. 0.0230. Total. 9. 0.1098. Regresión. .. G. L.. =4.74aI 5%,2y7g.1 ..

(7) 1ó8. Por tanto se aceptaHo: Br = B, = 0, por consiguienteno existe suficiente evidenciacomoparaconclufr de que las edadesiniciales y pesosiniclade peso, les influyan sobreel incremento propuesta,se ilustrará como A pesarde que se aceptdla Ho anteriormente se probarfasi cadacoeficientees diferente de cero o no. C r¡. scx, /D. Crt. = 0.0011 736/6s0943. C,,. = SCXr/D. Czz. = 0.0020 = 1288/650943. O.IERROR= 0 . 0 1 3. s'bl. = CMERROR x Crr. ,tb,. = 0 . 0 1 3x 0 . 0 0 1 1= 0 . 0 0 0 0 1 4. stb,. = CI'|ERR0R x Czz. S,b?. = 0 . 0 1 3x 0 . 0 0 2 0= 0 . 0 0 0 0 2 6. sut =. 0.0038 ;. 5 6 2= 0 . 0 0 5 1. Para. Tc. = 308. 2 5 0.C009610.00. Para. Tc. 0 . 0 0 4 2 / 0 . 0 0 5 1= 0 . 8 2 amboscasos los coeficientes no difieren de cero, para la regresi6n ya era claro en ta] sentido. A s f c o m oe n e l c a s o d e r e g r e s i ó nl i n e a l s i m p l eo c u c o m ou n g r a d od e a s o c r a c i ó ne n t r e X , y X r .. tn.

(8) -16? correlaci6n múltiple' se Presentael caso de én tambi múltiple negresi6n X2' entre Y y el coniuntoX1' asociaci6n de grado ésta expresael máximo. .. . ,xk. corre'lapor mediodel coeficiente de expresa se El grado de asociación ca que lo define es: matemáti ción múltip'le R, la exPresión. que cero y m ú l t i p l e R ' s i e m p r ee s m a y o r c o r r e l a c i ó n d e El coefÍciente nenor a la unidad' como m ú i t i p ] e R 2 ' s e le conoce c o r r e l a c i ó n d e c o e f i c i e n t e A l c u a d r a d od e l de éste R2 se expresaen términos Si determinación' de el coeficiente i cada variación de Y que es exPl la de porciento e1 porcentaie' expresa p o r l a s v a r i a b l e sX 1 , X z ' " '. xk'. de regresión i'lustrando la metodología que está ejemplo del Para el caso se ti ene:. R=ffi-. =o'4138. R2= 0'1707 de peso se la variación del incremento de L7% e1 sólo Por consiguiente d e b ea l a s e d a d e sy p e s o si n i c i a l e s '.

(9) -,to s i m p l e ' b á s i c a m e n tsee e s t a R E G R E SC I OUNR V I L i N E AE. n r e g r e s i ó nl i n e a l puede blece que la ecuaci6nde una llnea recta en ciertos tipos de experinpdelar un fen6nenoen cuestion' Sinembargo' Ia producciónde un cultivo rentos agrícolas o pecuarÍoscomopor ejemplo la papaa la aplicación de fósforo' de mangosen el tiempo, la respuestade d e u n e n e r g é t i c o 'e t c " l a l í n e a l a r e s p u e s t ad e l g a n a ó a 1 a a p l i c a c i ó n de respuesta' Unaalternativa recta puedeno proporcionar un buenmodelo curvilinea ó un polinomio de sería postular la que se denominaregresién e s t a d í s t i c os e r í a ; s e g u n dgor a d o , e l m o d e 1 o y = Bo+Br+ XB z X 4 e donde:. Y = V a r i a b l ea l e a t o r i a o b s e r v a b l e X=. Constanteconocida N(0, o'z). lo B o,8r ,8 z Parámetrosdel mode linea es un caso particular de Se observaque el nndelo 'le regresión curvi r e e m p l a z a mao sX p o r X r Y x 2 ' r e g r e s i 6 nm ú 1 t i p l e c o n d o s v a r i a b l e s ' S i del capítulo' El polip o r X 2 , e l n n d e ' l oe s i g u a l a l p r o p u e s t oa l i n i c i o se conocetambiéncomoel nomio de segundogrado ó regresión curvilínea rrnde]ocuadráticoyhasidodeampliousoeninvestigaciónagrícolaypec u a r ia . cuadrático para evaluar 1a Se jlustrará, el uso y ap'licación del modelo aolicación del nitrógeno aI arroz' a toneiaciaspor hectárea Los datos que se dan a continuacióncorresponden.

(10) 171. diferentes dosfs (kiloaplican se cuando 8, Cica variedad Paddy de arroz fueron tomadosde la Revlsgrarrospor hectárea)de nitrógeno' Los valores y Dario de Luis F' Sánchez ta ICAVo'lunnnXIII, página498, publicación Leal.. Y. x 2( N 2). I1Q. JU. 900. 4.9s0. 2n. 900. 5 .4 1 9. 30. 900. E, A^?. 30. 900. 6.075. 60. 3600. 5.83r. 60. 3600. 6.206. 60. 3600. s.737. 60. 3600. s.699. 45. 2025. 4. 4 5 6. 0. 0. 6 .0 9 3. 30. onn. 5.325. 30. 900. 5.943. 90. 8100. E. I. x' (ll). 5.719 6.018. 3600. ,60 60. 3600. se ti ene: Al reali iar las sumasde cuadradosy productos. scY. 3.384. sPxtY. to7.25. SCXr. 6750.0. stx2Y. ¿ Jtj\J . ¿. SCX¿. 60446250.0sPXrX2 6 0 7 5 0 0 . 0.

(11) I 172. L a e c u a c i ó nd e r e g r e s i ó ne s c o m os i g u e : Y = 4.4933+ 0.0404N- 0.00027N2 E ' l a n á i i s i s d e v a r i a n c i a p a r a 1 a r e g r e s i ó ns e r í a : T a b l a d e a n á ' l i s j sd e v a r i a n c i a p a r a l a r e g r e s i ó n F. de V.. G.L.. S.C.. C.M.. Regresión. 2. 2.132. 1.066. Error. 12. 1.251. 0.104. Total. 14. 3' 384. 70.?2**. 0 t r o s e s t a d í s t i c o sd e i m p o r t a n c i as o n : R. = 0.63. .^. Sst =1.60x10-'. si, =1.7744x10-8 una interpretac.ióna la ecuaciónde regresi6n anteriomlenteestimadaes d e q u e l a r e s p u e s t ad e l a r r o z a 1 n i t r ó g e n os i g u e l a L e y d e l o s r e n d i 'la e c u a c i ó ne i g u a l a r a c e r o e n c o n t r a m i e n t o sd e c r e c i e n t e s . A I d e r i v a r ríamosel nivel de nitrógeno, que produceel máximorendimientoy al d e r i v a r l a e c u a c i ó ne i g u a l a r a l a r e l a c i ó n i n v e r s a d e p r e c i o s s e o b t i e n e co el óptimo económi.

(12) 173.. si. s e p o st u l a un modelode regresi6n lineal simple la ecuaciónserfa: Y = 4 . 9 2 2 4+ 0 . 0 1 5 9 N. Al graficar (se deia al lector) los dos modelos:Lineal y cuadrático' se 'tos datosque el lineal' o cuadráticoaiusta meior observaráque el model E.]ERCiCIOS 1.. papa' en La respuestaen incrementode peso (Y) al uso de harina de p o r c i n o ss e e x p r e s ae n l o s s i g u í e n t e sd a t o s :. v. I harina. 3.67. 10. 12.40. 20. 2 0 .8 3. JU. 24.50. 40. 24.73. EN. 3 0 .6 3. 60. 26.80. 70. a.. Ajuste una ecuaciónde regresi6n simple. b.. A j u s t e u n m o d e l oc u r v i l i n e o. ic.. Ias ecuacionegobteGrafique los datos originales y sobreponga el resultado. , nldas en a y b, Comente. d.. Realice tabla de análisis de variancfa para el modelocurvilfneo Y concluYa.. 'la. regresiónsegún.

(13) 174. e. Pruebe Ho: B, = 0. vs.. Ha: 3rl 0, use c = 0.05. Pruebe Ho: B¿= 0. vs.. Ha: B.l 0, use o = 0;05. f.. ffsico y R2, S. Obtengael máximo 2.. Los datos que se dan a continuacióncorrespondena malcesde clima frfo, se expresael rendiniento y dos de sus componentes:. Pesode granos. a.. 176.1. t56.2. 202.0. 183.1. 210.I. 184.4. 1 9 1. 8. 170.0. 188.6. 169.7. 1 7 7. L. 157.0. 179.6. 158.4. 193.6. 173.3. 111.6. 97.9. 130.5. L77.2. 1?n o. 115.3. 120.4. 106.9. 120.5. 107.2. 106.6. 9 4 .I. 119.8. 105.2. 125.6. 111.1. Proli fi ci dad. Asu¡na el modeloY = Bo+BrXr + g, X, + e y determinelos estimad o r e sn l n i m o sc u a d r á t i c opsa r a g o , S ¡ r B z ..

(14) :. 1:S. = E s I a r e g r e s i 6 ng l o b a ls i g n i f i c a t i v a ? ( u s ea 0 . 0 5 ) . r E s u n ad e 1 a sd o sv a r i a b l e sm á sú t i l q u e1 a otra para Predeci. b. c.. ento? el rendimi 3.. a longitud de hoias Los datos que se dan a continuacióncorresponden en mafz a diferente tiempode crecimiento.. Semanas. Cund.431. ntl e Cacahuaci. ICA H556. 4. 1 0 ,5 6. 11.59. 12.32. 6. 7 7. 9 9. t9.29. 2L.25. 8. 2 7. 4 2. 2 5 .8 1. 29.09. IU. 3 4 .1 6. 34.78. 3 8 .6 6. t2. 38.23. 40.30. 44.52. 14. 41.85. 54.72. 52.88. lo. 4 5 .1 4. 58.42. 57.48. l8. 49.07. 56.12. 5 6 .7 3. 20. 48.22. s8.62. 58.44. 22. 4 3 .5 1. 54.77. 5 5 .1 0. P a r a c a d a v a r i e d a dó h i b r í d o : A j u s t e u n a e c u a c i ó nd e r e g r e s i ó ns i m p l e A j u s t e u n m o d e l oc u r v Í l í n e o. b. c.. '. las ecuacionesobteniGrafique los datos originales y sobreponga das en a y b.. los resultae interprete agronómicamente Comente. dos. A. Realiceunatabladeanálisjsdevarianciaparalaregres.i6n' s e g ú ne l m o d e l oc u r v iI í n e o ..

(15) 116. e.. P r u e b e H o :B ¡ = 0. vs. Ha: S, I 0, use a = 0.05. f.. P r u e b e H o :g " = 0. vs. Ha: S, I 0, use o = 0.05. BIBLIOGRAFIA -. 195?. Statistiol Theory In R.L and T.A. BANCRoFT. ANDERSoN, l l o o kC o m p a n y . R e s e a r c hN . . Y, McGraw-HiB. -. D M P E RN , . R . a n d H . S M I T H . 1 9 6 6 . A p p l i e dr e g r e s s i o na n a l y s i s ' J o h n t , I i l e y& S o n s , I n c . N . Y . HUA¡{G, 0.S. 1970, Regressionand EconofietricMethods. John tliley & S o n s ,I n c . I l . Y ..

(16)

Figure

Tabla de anáIisis  de variancia para la  regres'idn

Referencias

Documento similar

¿Cómo se traduce la incorporación de ésta en la idea de museo?; ¿Es útil un museo si no puede concebirse como un proyecto cultural colectivo?; ¿Cómo puede ayudar el procomún

Para ello se estimó un modelo de 2 etapas, donde la primera etapa se orienta a determinar si los factores: edad, nitrógeno, número de corte, tipos de suelo y

Se estima una distancia de más de 11 millones de años luz hablando de una cantidad de sistemas solares que no tendrían espacio en nuestra mente y esto solo hablando del grupo

“La unificación de la clasificación de empresas otorgada por las CC.AA.”, “La unificación de criterios en la acreditación de los servicios de prevención de riesgos

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

En el capítulo de desventajas o posibles inconvenientes que ofrece la forma del Organismo autónomo figura la rigidez de su régimen jurídico, absorbentemente de Derecho público por

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

A la hora de realizar el análisis de regresión mediante SPSS existen diferentes métodos para seleccionar los predictores a incluir en el modelo de regresión. Las opciones