EJERCICIOS
EJERCICIOS - REGR- REGRESIÓN LINESIÓN LINEAL SIMPLEEAL SIMPLE
1.
1. En una muestra de 10 adultos se registraron las siguientes medicioEn una muestra de 10 adultos se registraron las siguientes mediciones de edadnes de edad en años (X) y la
en años (X) y la hipertensión arterial (HTA) (Y):hipertensión arterial (HTA) (Y):
X
X 38 38 42 42 43 43 46 46 48 48 50 50 54 54 60 60 65 65 6767 Y
Y 120 120 124 124 135 135 138 138 135 135 140 140 143 143 150 150 160 160 170170 a.
a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función deIndique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables?
la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables?
b.
b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiadoCompruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años.
pronostique la HTA de un adulto de 70 años.
c.
c. De seguir la tendencia, cuánto se espera aumente la HTA para el próximo año.De seguir la tendencia, cuánto se espera aumente la HTA para el próximo año.
a.
a. Indique la tendencia y Indique la tendencia y obtenga la línea recta de obtenga la línea recta de regresión de la HTA regresión de la HTA enen función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables
variables??
Y=A+BX Y=A+BX B
B = = 1.48691.4869 A =
A = 65.221465.2214 Y=65.2214+1.4869X Y=65.2214+1.4869X PERSONAS
PERSONAS EDAD(X) EDAD(X) HTA(Y) HTA(Y) XY XY XX XX YYYY 1
1 38 38 120 120 4560 4560 1444 1444 1440014400 2
2 42 42 124 124 5208 5208 1764 1764 1537615376 3
3 43 43 135 135 5805 5805 1849 1849 1822518225 4
4 46 46 138 138 6348 6348 2116 2116 1904419044 5
5 48 48 135 135 6480 6480 2304 2304 1822518225 6
6 50 50 140 140 7000 7000 2500 2500 1960019600 7
7 54 54 143 143 7722 7722 2916 2916 2044920449 8
8 60 60 150 150 9000 9000 3600 3600 2250022500 9
9 65 65 160 160 10400 10400 4225 4225 2560025600 10
10 67 67 170 170 11390 11390 4489 4489 2890028900
∑
∑ 513 513 1415 1415 73913 73913 27207 27207 202319202319
N
N = = 1010 MEDIA DE
MEDIA DE X
X = = 51.351.3 MEDIA DE
MEDIA DE Y
Y = = 141.5141.5
b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años.
COEFICIENTE DE COREELACION DE
PIRSON r= 0.9689
COEFIECIENTE COVARIANZA = 1323.5
r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y
r = 0.9689 ˃0.60, POR LO TANTO LA RECTA DE REGRESION
ES CONFIABLEPARA PREDICIR
SI X=70, ENTONCES
Y= 169.305247
% VARIANZA TOTAL = 100%
% EXPLICADA POR LA
RR= 94%
%VAR NO
EXPLICADA= 6%
c. de seguir la tendencia, cuánto se espera aumente la hta para el próximo año.
la variación del siguiente año es =1.5
y = 1.4869x + 65.221 R² = 0.9387
0 20 40 60 80 100 120 140 160 180
0 10 20 30 40 50 60 70 80
Chart Title
Series1
Linear (Series1) Linear (Series1)
2. Un estudio de mercado trata de averiguar si es efectiva la propaganda televisada de un producto que salió a la venta con relación al tiempo de publicidad (horas/semana). Se recopilaron datos a partir de la segunda semana de iniciada la publicidad resultando la tabla siguiente. No se pudo recopilar datos de la cuarta semana.
Semana 2 3 4 5 6 7
Tiempo de propaganda 20 25 22 28 36 40 Venta del producto S/. 300 310 - 320 350 420
Semana Tiempo de Venta XX YY XY
Propaganada (X)
del producto (Y)
2 20 300 400 90000 6000
3 25 310 625 96100 7750
4 22 297 484 88209 6534
5 28 320 784 102400 8960
6 36 350 1296 122500 12600
7 40 420 1600 176400 16800
∑ Total 171 1997 5189 675609 58644
n=6
Media X =28.5 Media Y =332.8 y = a + bx
b=5.5 a=176.6
a. Es efectiva la publicidad del producto Y = 176.6 +5.5X
COEFICIENTE DE CORRELACION DE PIRSON r= 0.9309 COEFIECIENTE COVARIANZA = 1729.5
r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y
r = 0.9309 ˃0.60, por lo tanto la recta de regresion es confiable para predicir
b. En cuanto estimaría las ventas para la semana 4?
hallamos la venta para la semana cuarta utilizando la formula siguiente:
Media = Y Media= X (Y)= y
(X)= x
y - Y = b (x-X)…….. 1
Reemplazando datos ala ecuación 1 del cuadro anterior.
m -(1700+)/6= b (22-28.5)
Ahora calculamos la b.
= (6(52110+22) −171 (1700+))/ (6(5189) − (〖171)〗^2))
= (21960−3)/1893
(6−1700−)/6=(21960−39)/1893(−6.5)
(6−1700−)/2=(21960−39)/631(−6.5)
3155m-631*1700 = (2(21960)-78m) (-6.5m)
3155m-631*(1700) = -285480+507m 2648m = 787220
m = 297.3 = 297.
3. Un editor tomó una muestra de 7 libros, anotando el precio y el número de páginas respectivo, si los resultados:
Nro. de Pago. 630 550 400 250 370 320 610
Precio S/. 10 8 7 4 6 6 9
a. Obtenga el modelo de regresión lineal simple entre el precio y el número de páginas, con el fin de predecir precios. ¿Qué porcentaje de la varianza total de precios se explica por esta función?.
b. Estime el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 páginas en una segunda edición. En cuento se incrementaría su precio.
c. Cuántas páginas debería tener un libro cuyo precio se estima en 12.27 soles.
N° DE N° de Pagina Precio S/. (Y) XX YY XY
a. Obtenga el modelo de regresión lineal simple entre el precio y el número de páginas, con el
Fin de predecir precio. ¿Qué porcentaje de la varianza total de precios se explica por esta función?
Y = 1.216+0.01326X
b. Estima el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 paginas en una segunda edición. En cuanto se incrementara su precio.
COEFICIENTE DE CORRELACION DE PIRSON r= 0.9723 COEFIECIENTE COVARIANZA =1772.857143
y = 0.0133x + 1.2157 R² = 0.9454
0 2 4 6 8 10 12
0 100 200 300 400 500 600 700
PRECIO
LIBROS (X)1 630 10 396900 100 6300
2 550 8 302500 64 4400
3 400 7 160000 49 2800
4 250 4 62500 16 1000
5 370 6 136900 36 2220
6 320 6 102400 36 1920
7 610 9 372100 81 5490
∑ Total 3130 50 1533300 382 24130
r = 0.9723 ˃0.60, por lo tanto la recta de regresion es confiablepara predicir
SI X=300, ENTONCES Y= 5.19
Si incrementa en 20 paginas entonces seria 320 hojas, entonces x=320 y= 5.46
y ahora la diferencia es = 0.27 RPTA.
% VARIANZA TOTAL = 100%
% EXPLICADA POR LA RR =95%
%VAR NO EXPLICADA= 5%
c. Cuántas páginas debería tener un libro cuyo precio se estima en 12.27 soles.
SI Y = 12.27, ENTONCES X= 833.93
4. Una muestra de 5 varones adultos de quienes se observaron las estaturas (X en pies, pulgadas) y los pesos (Y en libras) ha dado los siguientes resultados:
X 5´1´´ 5´2´´ 5´3´´ 5´4´´ 5´5´´
Y 125 130 140 145 160
a. Realice una regresión lineal y utilice los datos para verificar que la varianza total de Y es igual a la varianza residual más la varianza explicada por la recta de regresión.
b. Usando la descomposición de la varianza calcule r 2 e interprete el resultado.
Varones Publicidad (X) Ventanas (Y) XX YY XY
1 0.039 125 0.001521 15625 4.875
2 0.077 130 0.005929 16900 10.01
3 0.116 140 0.013456 19600 16.24
4 0.154 145 0.023716 21025 22.33
5 0.193 160 0.037249 25600 30.88
∑Total 0.579 700 0.081871 98750 84.335
Publicidad (X) 5´1´´= 0.0385 5´2´´= 0.077 5´3´´=0.1155 5´4´´=0.154 5´5´´= 0.1925
0.579
1pies*pulg = 7.7*(10*-3) n=5
Media X =0.12 Media Y =140.0 y = a + bx
b= 220.94 a=114.41
a. Realice una regresión lineal y utilice los datos para verificar que la varianza total de Y es igual a la varianza residual más la varianza explicada por la recta de regresión.
Y = 114.41+ 220.94 X
b. Usando la descomposición de la varianza calcule r 2 e interprete el resultado.
COEFICIENTE DE CORRELACION DE PIRSON r= 0.982235323 COEFIECIENTE COVARIANZA =3.275
r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y
r = 0.98224 ˃0.60, POR LO TANTO LA RECTA DE REGRESION ES
CONFIABLEPARA PREDICIR
R² = 0.5332 y = 220.94x - 114.41
0 20000 40000 60000 80000 100000 120000
0 1 2 3 4 5 6 7
PESO
Ventanas (Y) XX YY
XY Linear (YY) Linear (YY)
5. Una compañía de alimentos maneja una cadena de tiendas al menudeo. Para medir la eficiencia de las tiendas se estudió la relación del número de empleados (X) y el promedio del volumen de ventas mensuales (Y) en cientos de dólares para todas las tiendas durante el año pasado. La gráfica de los datos sugiere una relación lineal entre las variables. Se tiene la siguiente información:
n=100, ∑X=600, ∑Y=1600, ∑XY=13600, ∑X2=5200, ∑Y2=37700
a. Obtenga el modelo de regresión lineal simple para predecir las ventas a partir del número de empleados. ¿En cuánto se estiman las ventas para una tienda de 8 empleados?
b. ¿Qué porcentaje de las varianzas de las ventas es explicada por la variabilidad del número de empleados?
c. ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en 1100 dólares.
EMPLEADOS N.
EMPL.(X)
P. VENT.
(Y) XY XX YY
∑ 600 1600.00 13600 5200 37700
N = 100
MEDIA DE X =6.000 MEDIA DE Y =16.000 Y=A+BX
B =2.50 A =1.00
Y=2.50X-1.00
Covarianza COVxy=4000
coef. Correlación de Pearson r =0.9091 copef. De determinación r*r = 0.8264
r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y
y = 155.31x - 184.68 R² = 0.9813
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00
1.54 1.56 1.58 1.6 1.62 1.64 1.66
VENTAS
r=0.9723>0.60, por lo tanto la recta de regresion es confiable para predecir.
a. Obtenga el modelo de regresión lineal simple para predecir las ventas a partir del número de empleados. ¿En cuánto se estiman las ventas para una tienda de 8 empleados?
si, X=8, entonces Y=21.000
el precio incremento se le aumenta 20pag mas si, X=320, entonces Y= 801.000
b. ¿Qué porcentaje de las varianzas de las ventas es explicada por la variabilidad del número de empleados?
% varianza total= 100%
% var. Explicada por la RR= 82.6%
% var. No explicada= 17.4%
c. ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en 1100 dólares.
El número de empleados que tiene la tienda, si su venta promedio es 1100 dólares es:
440.4
6. Sea Y el índice de precios al consumidor, tomando como base al año 2000 (es decir 2000=100). Para los datos que siguen:
Año 2001 2002 2003 2004 2005 2006 2007
Y 106.0 111.1 117.2 121.3 125.2 128.0 132.6
a. Obtenga la recta de mínimos cuadrados que se ajuste a los datos.
b. Realice la predicción del índice de precios para el año 2008, y compararlo con el valor verdadero (144.4). ¿En qué año podemos esperar que el índice de precios sea 150.57, suponiendo que las tendencias presentes continúen?.
N AÑO(X) IND.
CONS.(Y) XY XX YY
1 2001 106.0 212106 4004001 11236
2 2002 111.1 222422.2 4008004 12343.21 3 2003 117.2 234751.6 4012009 13735.84 4 2004 121.3 243085.2 4016016 14713.69 5 2005 125.2 251026 4020025 15675.04
6 2006 128.0 256768 4024036 16384
7 2007 132.6 266128.2 4028049 17582.76
N = 7
MEDIA DE X =2004.000 MEDIA DE Y =120.200 Y=A+BX
B =4.3429 A =-8582.9
Y=4.33429X-8582.9 covarianza COVxy=121.6
coef. Correlación de Pearson r = 0.9942 copef. De determinación r*r = 0.9885
r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y
r=0.6337>0.60, por lo tanto la recta de regresión es confiable para predecir.
si, Y=150.57, entonces X=2011
% varianza total =100%
% var. Explicada por la RR =98.8%
% var. No explicada =1.2%
y = 4.3429x - 8582.9 R² = 0.9885
0.0 20.0 40.0 60.0 80.0 100.0 120.0 140.0
2000 2001 2002 2003 2004 2005 2006 2007 2008