• No se han encontrado resultados

Métodos de Regresión

N/A
N/A
Protected

Academic year: 2021

Share "Métodos de Regresión"

Copied!
10
0
0

Texto completo

(1)

Métodos de Regresión

Ciencias y Técnicas Estadísticas

Soluciones ejercicios: Regresión Lineal Simple

Versión 3

Emilio Letón

1. Demostrar quejCov(X1; X2)j D(X1)D(X2)y quejbsx1x2j bsx1bsx2.

SOLUCIÓN:

Sea la funciónm(x) =V[xX1+X2] con

m(x) =x2V[X1] +V [X2] + 2Cov(xX1; X2) =x2V [X1] +V [X2] + 2xCov(X1; X2)

que veri…ca quem(x) 0 (al serm(x)una varianza, que es siempre mayor o igual que cero).

Por lo que el discriminate de la ecuación anterior de segundo grado veri…ca que es menor o igual que cero, es decir:

4Cov2(X1; X2) 4V [X1]V [X2] 0

Cov2(X1; X2) V [X1]V[X2]

jCov(X1; X2)j D[X1]D[X2]

La demostración de quejsbx1x2j sbx1bsx2 es análoga.

2. Demostrar quej j 1, jbrj 1, j Sj 1 yjbrSj 1. SOLUCIÓN: Al ser r= Cov(X; Y) D(X)D(Y) se tiene que jrj= jCov(X; Y)j D(X)D(Y) D(X)D(Y) D(X)D(Y) = 1

El resto de las demostraciones son análogas.

3. Si el seno hiperbólicosenhy el coseno hiperbólicocosh están de…nidos como

senh(x) = e x e x 2 cosh (x) =e x+e x 2

(2)

(a) Demostrar que la tangente hiperbólica y la aroctangente hipérbolica están dadas por tghx= e 2x 1 e2x+ 1 arctghy=1 2Ln 1 +y 1 y

(b) Demostrar que el intervalo de con…anza del (1 ) %para el coe…ciente de correlación poblacional de Pearson viene dado por

IC(1 ) % ( ) = e 2li 1 e2li+ 1; e2ls 1 e2ls+ 1 conli =arctghbr z =2 q 1 n 3 yls=arctghbr+z =2 q 1

n 3, sabiendo quearctghrb N arctgh ;

q

1

n 3 :

SOLUCIÓN:

(a) Por de…nición de la tangente hiperbólica, se tiene que

tghx= senhx coshx

Por tanto, en primer lugar:

tghx= senhx coshx = ex e x 2 ex+e x 2 = e x e x ex+e x = ex 1 ex ex+ 1 ex = e 2x 1 e2x+ 1

Y en segundo lugar, si se despejaxen la ecuacióntghx=y, se tiene que:

tghx= e 2x 1 e2x+ 1 =y e2x 1 =e2xy+y e2x(1 y) = 1 +y 2x=Ln 1 +y 1 y x= 1 2Ln 1 +y 1 y Por lo que arctghy=tgh 1y= 1 2Ln 1 +y 1 y

(b) Sabiendo quearctghbr N arctgh ;qn13 , se tiene que

arctghrb arctgh q 1 n 3 N(0;1) P 0 @ z =2< arctghrb arctgh q 1 n 3 < z =2 1 A= (1 )

(3)

P z =2 r 1 n 3 < arctghrb arctgh < z =2 r 1 n 3 ! = (1 ) P z =2 r 1 n 3 > arctgh arctghbr > z =2 r 1 n 3 ! = (1 ) P z =2 r 1 n 3 < arctgh arctghbr < z =2 r 1 n 3 ! = (1 )

Por lo que el intervalo de con…anza del(1 ) %paraarctgh es

IC(1 ) % (arctgh ) = arctghrb z =2 r 1 n 3; arctghrb+z =2 r 1 n 3 ! Si se llamali=arctghbr z =2 q 1 n 3 yls=arctghbr+z =2 q 1

n 3 y se deshace el cambio tomando

tangente hiperbólica, se tiene que

IC(1 ) % ( ) = e

2li 1 e2li+ 1;

e2ls 1 e2ls+ 1

4. El coe…ciente de correlación calculado a partir de una muestra de tamaño n = 28 es de br = 0;71. Determinar un intervalo de con…anza al 95% para el coe…ciente de correlación de la población.

SOLUCIÓN:

xxx.

5. Contrastar que H0 : = 0;5 vsHa : 6= 0;5 si n= 28y br= 0;71. ¿Qué valores de se aceptan en la

H0? Poner de mani…esto la equivalencia con el ejercicio anterior.

SOLUCIÓN:

xxx.

6. ¿Es bueno elegir el criterio de tomar como recta de regresión aquella que cumpla que

n P i=1b i= 0? SOLUCIÓN: xxx.

7. A partir del criterio mínimo cuadrático determinar las ecuaciones normales de la recta de regresión. Es decir a partir de min b0;b1 n X i=1 b2i = min b0;b1S b0;b1 = minb0;b1 n X i=1 yi b0 b1xi 2

deducir las ecuaciones que veri…can que

(I) @ @b0S b0;b1 = 0 (II) @ @b1S b0;b1 = 0 SOLUCIÓN: xxx.

(4)

8. Demostrar que las ecuaciones normales de la recta de regresión se simpli…can mediante (I) y=b0+b1x (II) n X i=1 xiyi=b0 n X i=1 xi+b1 n X i=1 x2i

y que explícitamnete estas ecuaciones se resuelven como

b1= sxy

s2

x

b0=y b1x

9. Demostrar que el criterio de mínimos cuadrados garantiza que: (a) n P i=1b i= 0. (b) n P i=1 xibi= 0. (c) sxb= 0. (d) n P i=1b yibi = 0. (e) sybb= 0. SOLUCIÓN: xxx.

10. Demostrar que el criterio de mínimos cuadrados garantiza que

sb2= 1 n n X i=1 bi bi 2 =s2y s 2 xy s2 x . SOLUCIÓN: xxx.

11. En el modelo de Regresión Lineal Simple se supone que yi = 0+ 1xi+ i con i v.a.i.i.d según una

N(0; ).

(a) Determinar la función de verosimilitudl 0; 1; 2jy

1; :::yn para cadaxi …jo utilizando que siW

N( ; )se tiene quef(w) = p1 2 exp 1 2 2(w ) 2 .

(b) Determinar los estimadores máximo verosímilesb0;b1yb2(sin comprobar la condición de máximo).

SOLUCIÓN:

(a) Para cadaxi …jo, al ser yi combinación lineal de normales se tiene que será normal de media

(5)

y varianza

V[yijxi] =V [ 0+ 1xi+ i] =V [ i] = 2

Por lo que f(yi) = p12 exp 212 (yi 0 1xi)2

La función de verosimilitudl 0; 1; 2jy1; :::yn es

l 0; 1; 2jy1; :::yn = n Y i=1 1 p 2 exp 1 2 2(yi 0 1xi)2 = 1 2 2 n=2 exp n X i=1 1 2 2(yi 0 1xi)2 ! (b) La función soporteL 0; 1; 2jy 1; :::yn es

L 0; 1; 2jy1; :::yn =Lnl 0; 1; 2jy1; :::yn

= n 2Ln2 n 2Ln 2 1 2 2 n X i=1 (yi 0 1xi)2

Para determinar el estimador máximo verosímil b0 se deriva la función soporte respecto de 0 y se iguala a cero: 1 2 22 n X i=1 (yi 0 1xi) ( 1) = 0 n X i=1 (yi 0 1xi) = 0 n X i=1 yi b0 b1xi = 0 y=b0+b1x

Para determinar el estimador máximo verosímil b1 se deriva la función soporte respecto de 1 y se iguala a cero: 1 2 22 n X i=1 (yi 0 1xi) ( xi) = 0 n X i=1 (yi 0 1xi)xi= 0 n X i=1 yi b0 b1xi xi= 0 n X i=1 xiyi=b0 n X i=1 xi+b1 n X i=1 x2i 1 n n X i=1 xiyi x y=b0 1 n n X i=1 xi+b1 1 n n X i=1 x2i x b0+b1x sxy=b1 " 1 n n X i=1 x2 i x2 # =b1s2 x

(6)

b1= sxy

s2

x

Para determinar el estimador máximo verosímil b2 se deriva la función soporte respecto de 2 y se

iguala a cero: n 2 2 2 4 4 n X i=1 (yi 0 1xi)2= 0 b2= n P i=1b 2 i n

12. Demostrar que las pendientes parcialesbi, siendo las pendientes parciales las pendientes de las rectas que

unen los puntos(x; y)con cada(xi; yi); vienen dadas por

bi=

yi y

xi x

SOLUCIÓN:

La ecuación de la recta que pasa por los puntos (x; y)y(xi; yi)viene dada por

x x xi x = y y yi y con lo que x(yi y) xyi+xy=y(xi x) yxi+xy y(xi x) =x(yi y) + (yxi xyi) y= yi y xi x x+yxi xyi xi x por lo que bi= yi y xi x

Otra forma de hacerlo sería utilizando que la ecuación de una recta se puede expresar comoy=mx+n, siendomla pendiente ynla ordenada en el origen, por lo que para que pase por los puntos(x; y)y(xi; yi)

se tiene que yi=bixi+ni y=bix+ni con lo que yi y=bi(xi x) bi= yi y xi x 13. Demostrar queb1= n P i=1 pibi donde pi= (xi x)2 n P j=1 (xj x)2 =(xi x) 2 ns2 x

(7)

y quepi 0y n

P

i=1

pi= 1. Es decir, queb1se puede expresar como ponderación de las pendientes parciales.

SOLUCIÓN:

El coe…cienteb1 viene dado por

b1= sxy s2 x = 1 n Pn i=1(xi x) (yi y) 1 n Pn i=1(xi x)2 = n X i=1 (xi x) (yi y) ns2 x = n X i=1 pi yi y xi x = n X i=1 pibi Los valorespi = (xi x) 2 ns2

x veri…can que pi 0 (por ser cociente de cantidades positivas) y que

n P i=1 pi = 1; ya que n X i=1 pi= n X i=1 (xi x)2 ns2 x = Pn i=1(xi x)2 ns2 x =ns 2 x ns2 x = 1 14. Demostrar queb1= n P i=1 wiyi donde wi= (xi x) n P j=1 (xj x)2 =(xi x) ns2 x

Es decir, que b1 se puede expresar como combinación lineal de las observacionesyi. Demostrar también

que: n X i=1 wi= 0; n X i=1 wixi= 1 y n X i=1 w2i = 1 ns2 x SOLUCIÓN: Se tiene que b1= n X i=1 pibi= n X i=1 (xi x)2 ns2 x yi y xi x = n X i=1 (xi x) (yi y) ns2 x = n X i=1 (xi x) ns2 x yi n X i=1 (xi x) ns2 x y= n X i=1 (xi x) ns2 x yi y ns2 x n X i=1 (xi x) = n X i=1 (xi x) ns2 x yi 0 = n X i=1 wiyi

Los valores wi veri…can que n P i=1 wi= 0; n P i=1 wixi= 1y n P i=1 w2i = ns12 x, ya que n X i=1 wi= n X i=1 (xi x) ns2 x = Pn i=1(xi x) ns2 x = 0 n X i=1 wixi= n X i=1 wixi= n X i=1 (xi x) ns2 x xi= 1 ns2 x n X i=1 x2i x n X i=1 xi ! = ns 2 x ns2 x = 1 n X i=1 w2i = n X i=1 (xi x)2 n2s4 x = 1 n2s4 x n X i=1 (xi x)2= ns2 x n2s4 x = 1 ns2 x

(8)

15. Demostrar queb0= n P i=1 riyi donde ri= 1 n xwi

Es decir, que b0 se puede expresar como combinación lineal de las observacionesyi. Demostrar también

que: n X i=1 ri= 1; n X i=1 rixi= 0y n X i=1 r2i = 1 n 1 + x2 s2 x SOLUCIÓN: xxx.

16. Demostrar que en las hipótesisyi= 0+ 1xi+ isiendo iv.a. conE[ i] = 0, se veri…ca queE

h

b0i= 0

y queEhb1i= 1. Es decir, que b0 y b1son insesgados. Utilizar en la demostración que tanto b1 como

b0se pueden expresar como combinación lineal de las observaciones yi.

SOLUCIÓN:

xxx.

17. Demostrar que en las hipótesis yi = 0+ 1xi+ i siendo i v.a. conE[ i] = 0, E[ i j] = 0si i6=j y

E 2 i = 2 se veri…ca que Vhb0i= 2 n 1 + x2 s2 x Vhb1i= 2 n 1 s2 x

Utilizar en la demostración que tanto b1 como b0 se pueden expresar como combinación lineal de las observacionesyi.

SOLUCIÓN:

xxx.

18. Demsotrar que en las hipótesis yi = 0+ 1xi+ i siendo i v.a. conE[ i] = 0, E[ i j] = 0si i6=j y

E 2 i = 2 se veri…ca que Cov y;b1 = 0 Cov b0;b1 = 2 n x s2 x SOLUCIÓN: xxx.

19. Demostrar quebi= ( i ) b1 1 (xi x)y usando dicho resultado que

b1 1=

n

X

i=1 wiyi

(9)

donde wi= (xi x) n P j=1 (xj x)2 =(xi x) ns2 x SOLUCIÓN: xxx.

20. Demostrar que en las hipótesis yi = 0+ 1xi+ i siendo i v.a. conE[ i] = 0, E[ i j] = 0si i6=j y

E 2 i = 2 se veri…ca que E " n X i=1 b2i # = 2(n 2) E bsb2 = 2 E s2b =n 2 n 2 Es decir, quebs2

b es insesgado para 2 y quesb2 es sesgado.

SOLUCIÓN:

xxx.

21. Demostrar que en las hipótesisyi= 0+ 1xi+ i siendo i v.a.i.i.d N(0; )se veri…ca que

b0 N 0 @ 0;p n s 1 + x 2 s2 x 1 A b1 N 1;p n s 1 s2 x ! n 2 2 bs 2 b 2n 2 SOLUCIÓN: xxx.

22. Deducir que en las hipótesisyi= 0+ 1xi+ i siendo i v.a.i.i.d N(0; )se veri…ca que

b0 0 b sbp1 n q 1 + xs22 x tn 2 b1 1 b sbp1n q 1 s2 x tn 2 N 1;p n s 1 s2 x ! n 2 2 bs 2 b 2n 2 SOLUCIÓN: xxx

(10)

23. A partir de los resultados inferenciales anteriores deducir IC95% para 0; 1y 2:

SOLUCIÓN:

xxx

Referencias

Documento similar

Entre los modelos de elección binaria, que sirven para explicar una variable dependiente binaria (0/1), se encuentra la Regresión Logística, que se utiliza

La escala de frustración de las necesidades psicológicas básicas en contextos educativo obtuvo valores significativos en el análisis de regresión lineal para los factores

• Ejemplo: Con los datos del ejemplo anterior determina la recta de regresión de Test sobre Edad, el coeficiente de correlación lineal de Pearson y. Coeficiente

El análisis de Regresión es una técnica estadística que estudia la naturaleza de las relaciones entre un conjunto de variables con el objetivo de hacer predicciones; tra-

Nuestra prueba prueba experimental consiste en medir el error cuadrático medio de los árboles CART y los bosques aleatorios con su nueva implementación multi-objetivo

En el estudio de regresión lineal por pasos se intenta calcular una ecuación predictiva tomando como variable independiente las variables de crecimiento

A la hora de realizar el análisis de regresión mediante SPSS existen diferentes métodos para seleccionar los predictores a incluir en el modelo de regresión. Las opciones

– Regresión Lineal, Análisis Discriminante, Regresión logística, Análisis de Varianza, Análisis Conjunto, Análisis de Supervivencia, Análisis de.. Estructuras de