Ejercicios Unidad IV
12. En el ejercicio 4 se muestran los datos de X = carga masica de DBO y
y=eliminación de DBO. Los valores de cantidades de resumen relevantes son
n=14 Σxi = 517 Σy=346 Σxi2=39095 Σyi2=17454 Σxiyi=25825
a. Obtenga la ecuación de la recta de mínimos cuadrados.
b. Prediga el valor de la eliminación masica de DBO para una sola observación hecha cuando la carga masica de DBO es 35 y calcule el valor del residuo correspondiente. c. Calcule la SSE y a continuación una estimación puntual de σ.
d. ¿Qué proporción de la variación de eliminación observada se explica mediante la relación lineal aproximada entre las 2 variables?
e. Los 2 últimos valores de x, 103 y 142, son mucho mayores que los demás. ¿Cómo la eliminación de las 2 observaciones correspondientes de la muestra afecta a la ecuación de la recta de mínimos cuadrados y al valor de r2? Ajuste los valores de las
cantidades y utilice el hecho de que el nuevo valor de SSE es 311.79
Sxy= 13047.7142
Sxx= 20002.929
Bi= 0.652
Bo= 0.626
Y= 0.626 + 0.652X
Y’(35)= 0.626 + 0.652(35)= 23.446 Y – Y’= 21 – 23.446= -2.456
Syy= 8902.857
SSE= 8902.857 – (0.652)(13047.714)= 395.747 r2= 5.743
13. Los datos siguientes de x=densidad actual (mA/cm2) y y=rapidez de deposición
(μm/min) aparecieron en el articulo “Plating of 60/40 Tin/Lead Solder for Head Termination Metallurgy” (Plating and Surface Finishing, enero de 1997: 38-40). ¿Esta de acuerdo con la afirmación del autor del artículo de que “se obtuvo una relación lineal para la rapidez de deposición de estaño-plomo en función de la densidad de corriente”? Explique su razonamiento.
X 20 40 60 80
Y 0.24 1.20 1.71 2.22
n= 4, Σxi=200, Σyi=5.37, Σxi2=12000, Σyi2 = 9.3501, Σxiyi=333
Sxx = 12000 – (2002/4) = 2000 Sxy = 333 – (200*5.37 / 4) = 64.5
Syy = 9.3501 – (5.372/4) = 2.140875
ß1 = Sxy/Sxx = 64.5 / 2000 = 0.03225 ß0 = (5.37/4) – (0.03225)(200/4) = -.27
r2 = 1 – (SSE/SST) = 1 – (0.060750/2.140875) = 0.972
El resultado es de un 97.2%, por lo que es un muy buen resultado, lo cual concuerda con lo dicho en el articulo.
14. Refiérase a los datos de la relación temperatura-eficiencia del tanque proporcionados en el ejercicio 1.
a. Determine la ecuación de la recta de regresión estimada.
b. Calcule una estimación puntual para la relación de eficiencia promedio real cuando la temperatura del tanque es 182.
c. Calcule los valores de los residuos de la recta de mínimos cuadrados para las 4 observaciones en las que la temperatura es 182. ¿Por qué no todos tienen el mismo signo?
d. ¿Qué proporción de la variación observada de la relación en eficiencia se puede atribuir a la relación de regresión lineal simple entre las 2 variables?
Syy= 9.915
Sxy= 45.8246
Sxx= 504.0
Bi= 0.09092
Bo= -14.6497
Y= -14.6497 + 0.09092X
Y’= -14.6497 + 0.09092(182)= 1.89774
15. Se determinaron los valores del modulo de elasticidad (MOE, la relación del
esfuerzo, es decir, fuerza por unidad de área, a la deformación, es decir, la deformación por unidad de longitud, en GPa) y la resistencia a la flexión, en MPa) para una muestra de vigas de concreto de cierto tipo, y se obtuvieron los siguientes datos (leídos de una grafica del articulo “Effects of Aggregates and Microfillers on the Flexural Properties of Concrete”, Magazine of Concrete Research, 1997:81-98).
MOE 29.8 33.2 33.7 35.3 35.5 36.1 36.2
Resistencia 5.9 7.2 7.3 6.3 8.1 6.8 7.0
MOE 36.3 37.5 37.7 38.7 38.8 39.6 41.0
Resistencia 7.6 6.8 6.5 7.0 6.3 7.9 9.0
MOE 42.8 42.8 43.5 45.6 46.0 46.9 48.0
Resistencia 8.2 8.7 7.8 9.7 7.4 7.7 9.7
MOE 49.3 51.7 62.6 69.8 79.5 80.0
Resistencia 7.8 7.7 11.6 11.3 11.8 10.7
a. Elabore un diagrama de tallo y hojas de los valores del modulo de elasticidad y comente acerca de algunas características interesantes.
b. ¿El valor de la resistencia se determina por completo y de manera única mediante el valor del modulo de elasticidad? Explique.
y, luego, prediga la resistencia para una viga cuyo modulo de elasticidad es 40. ¿Confiaría en usar la recta de mínimos cuadrados para predecir la resistencia cuando el modulo de elasticidad es 100? Explique.
Desv. Relación
Predictor Coef. Est. T p Constante 3.2925 0.6008 5.48 0.000 Mod. De
Elast. 0.10748 0.01280 0.40 0.000
S=0.8657 R cuadrada=73.8% R cuadrada (ajustada)=72.8%
Análisis de varianza
FUENTE GL SC CM F P Regresión 1 52.870 52.870 70.55 0.000
Error 25 18.736 0.749 Total 26 71.605
d. ¿Cuáles son los valores de SSE, SST y el coeficiente de determinación? ¿Estos valores indican que el modelo de regresión lineal simple describe de manera eficaz la relación entre las 2 variables? Explique.
2 9 3 33
3 5566677889 4 1223
4 56689 5 1 5 6 2 6 9 7 7 9 8 0
No, los valores de Resistencia no estan unicamente determinados por los valores de MoE, por ejemplo, si se observa, los 2 valores de 42.8 tienen diferentes valores de MoE.
La línea de los mínimos cuadrados es y=3.2925 + .10748x.
Y=3.2925 + .10748 (40) = 7.59. El valor de x=100 es un valor muy alejado comparado con las demás x, por lo que seria peligroso incluir este dato.
Desde la salida, SSE = 18.736, SST = 71.605 y el coeficiente de determinación r2
= .738.
16. En el articulo “Characterization of Highway Runoff in Austin, Texas, Area” (J. of Envir. Engr., 1998: 131-137) se ilustra un diagrama de dispersión, junto con la recta
de mínimos cuadrados, de x=volumen de lluvia (m3) y y=volumen de escurrimiento
(m3) para determinado lugar. Los valores siguientes se tomaron de la grafica.
X 5 12 14 17 23 30 40 47
Y 4 10 13 15 15 25 27 46
X 55 67 72 81 96 112 127
Y 38 46 53 70 82 99 100
a. ¿El diagrama de dispersión de los datos respalda el uso del modelo de regresión lineal simple?
b. Calcule las estimaciones puntuales de la pendiente y la ordenada al origen de la recta de regresión poblacional.
c. Calcule una estimación puntual del volumen de escurrimiento promedio real cuando el volumen de lluvia es 50.
d. Calcule una estimación puntual de la desviación estándar σ.
e. ¿Qué proporción de la variación observada en el volumen de escurrimiento se puede atribuir a la relación de regresión lineal simple entre escurrimiento y lluvia?
Obs. X X² Y Y² XY
1 5 25 4 16 20
2 12 144 10 100 120
3 14 196 13 169 182
4 17 289 15 225 255
5 23 529 15 225 345
6 30 900 25 625 750
7 40 1600 27 729 1080
8 47 2209 46 2116 2162
9 55 3025 38 1444 2090
10 67 4489 46 2116 3082
11 72 5184 53 2809 3975
12 81 6561 70 4900 5670
13 96 9216 82 6724 7872
14 112 12544 99 9801 11088
15 127 16129 100 10000 12700
Total 798 51750 643 41999 40411
Si, ya que es una manera de visualizar si los datos obtenidos “sirven” para lo que se busca, es decir, si el experimento fue exitoso dependiendo de que tan dispersos esten los puntos de la recta.
β1 = Sxy/Sxx = (40411-((798)(643)/15)) / 51750-((798²)/15) = 6203.4 / 9296.4 =
0.6672905641
β0 = ӯ - β1 X = 42.86666667 – (0.6672905641 * 53.2) = 7.366808657
y = 7.3668086574 + 0.6672905641X
Y = 7.3668086574 + 0.6672905641(50) = 40.73133686
r² = 1 – SSE/SST = 1 – 10296.26305/14435.73333 = 1-0.7132483549 = 0.2867516451
17. En el articulo: Use of Fly Ash or Silica Fume to Increase the Resistance of
Concrete to Feed Acids” (Magazine of Concrete Research, 1997:337-344) se describe
una regression de y=contenido de calico (g/L) en x-material disuelto (mg/cm2). La
ecuación de la recta de regresión fue y=3.678 + 0.144x, con r2=0.860, basada en
n=23.
a. Interprete la pendiente estimada 0.144 y el coeficiente de determinación 0.860. b. Calcule una estimación puntual del contenido promedio real de calcio cuando la cantidad de material disuelto es 50 mg/cm2.
c. El valor de la suma total de cuadrados fue SST=320.398. Calcule una estimación de la desviación estándar del error σ en el modelo de regresión lineal simple.
My50= 3.6 + 0.44(50)
r2= 0.86= 1 - (SSE/SST)
SSE= (SST)(1-0.85) SEE= (320.398)(0.14) SSE= 44.85572
S= 1.46
18. Las siguientes estadísticas de resumen se obtuvieron de un estudio en el que se
utilizo el análisis de regresión para investigar la relación entre la flexión del pavimento y la temperatura superficial en varios lugares de una carretera estatal. Aquí x=temperatura (F) y y=factor de ajuste de flexión (y > 0):
n=15 Σxi=1425 Σyi=10.68 Σxi2=139037.25 Σxiyi=987.645 Σyi2=7.8581
(Se hicieron mas de 15 observaciones en el estudio; la referencia es “Flexible Pavament Evaluation and Rehabilitation”, Transportation Eng. J., 1977: 75-85)
a. Calcule ß1, ß0 y la ecuación de la recta de regresión estimada. Dibuje la recta
estimada.
b. ¿Cuál es la estimación del cambio esperado en el factor de ajuste de flexión cuando la temperatura aumenta 1 F?
c. Suponga que la temperatura se midió en C y no en F. ¿Cuál seria la recta de regresión estimada? Conteste el inciso (b) para un aumento de 1C (Sugerencia: F=(9/5)C + 32; ahora sustituya la “x anterior” en términos de la “x nueva”.)
d. Si fuera posible una temperatura superficial de 200 F, ¿utilizaría la recta estimada del inciso (a) para pronosticar el factor de flexión para esta temperatura? ¿Por qué si o por que no?
Sxx= ∑ x2 – ((∑ x)2 )/n
Sxx= 139037.25- ((1425)2)/15)
Sxx= 139037.25 - 135375 Sxx= 3662.251902500
Sxy= ∑ xy – ((∑ x)( ∑ y))/n
Sxy= 26.955
Bi= Sxy/Syy = 26.955/3662.25 Bi= 0.00736
Bo= (∑ y - Bi ∑ x)/n
Bo= (10.68 – (-0.00736)(1425))/15 Bo=1.4112
Y= 1.4112 – 0.00736X
19. Los datos siguientes son representativos de lo que aparece en el articulo “An Experimental Cprrelation of Oxides of Notrogen Emissions from Power Boilers Base don Filed Data” (J. Eng for Power, Julio de 1973: 165-170), con x=rapidez de
liberación de calor del área del quemador (MBtu/h-pie2) y y=proporción de emisiones
de NOx (ppm):
X 100 125 125 150 150 200 200
Y 150 140 182 210 190 320 280
X 250 250 300 300 350 400 400
Y 400 430 440 390 600 610 670
a. Suponga que es valido el modelo de regresión lineal simple y obtenga la estimación de mínimos cuadrados de la recta de regresión verdadera.
b. ¿Cuál es la estimación de la proporción de emisiones de NOx cuando la cantidad de
calor liberada del área del quemador es igual a 225?
c. Estime cuanto cambiaria la cantidad de emisiones de NOx cuando la rapidez de
liberación del área del quemador disminuye en 50.
d. ¿Utilizaría la recta de regresión estimada para pronosticar la proporción de emisiones para una rapidez de liberación de 500? ¿Por qué si o por que no?
observaciones X Y XY X2 Y2
1 100 150 15000 10000 22500
2 125 140 17500 15625 19600
3 125 180 22500 15625 32900
4 150 210 31500
5 150 190 28500
6 200 320 64000
7 200 280 56000
8 250 400 100000
9 250 430 107500
10 300 440 13200
11 300 390 11700
12 350 600 21000
13 400 610 24400
14 400 670 26800 160000 448900
∑ 3300 ∑ 5010 ∑ 1413500 ∑ 913750 ∑ 2202100
Sxx= ∑ x2 – ((∑ x)2 )/n
Sxx= 913750- ((3300)2)/14)
Sxy= ∑ xy – ((∑ x)( ∑ y))/n
Sxy= 1413500- ((3300)(5010))/14) Sxy= 3256000
Bi= Sxy/Syy = 3256000/1902500 Bi= 1.711432
Bo= (∑ y - Bi ∑ x)/n
Bo= (5010 – (0.711432)(3300))/14 Bo=190.1624
20. En varios estudios se ha demostrado que los líquenes (ciertas plantas
compuestas de un alga y un hongo) son excelentes indicadores biológicos de la contaminación del aire. En el articulo “The Epiphytic Lichen Hypogymnia Physodes as a Biomonitor of Atmospheric Nitrogen and Sulphur Deposition in Norway” (Envir. Monitoring and Assassement, 1993: 27- 47) aparecen los siguientes datos (obtenidos
de una grafica) de x=deposito en húmedo de x=NO3- en (gN/m2) y y= N de liquen
(% de peso en seco):
X 0.05 0.10 0.11 0.12 0.31 0.37 0.42
Y 0.48 0.55 0.48 0.50 0.58 0.52 1.02
X 0.58 0.68 0.68 0.73 0.85 0.92
Y 0.86 0.86 1.00 0.88 1.04 1.70
El autor utilizo la regresión lineal simple para analizar los datos. Utilice el resultado de MINITAB para contestar las siguientes preguntas:
a. ¿Cuáles son las estimaciones de mínimos cuadrados para ß0 y ß1?
b. Prediga el N de liquen para un valor de depósito de NO3- de 0.5.
c. ¿Cuál es la estimaron de σ?
d. ¿Cuál es el valor de la variación total y cuanto de esta se puede explicar mediante la relación de modelo?
Observaciones X Y XY X2 Y2
1 0.05 0.48 0.024 0.0025 0.2304
2 0.10 0.55 0.055 0.01 0.3025
3 0.11 0.48 0.0528 0.2304
4 0.12 0.50 0.06
5 0.31 0.58 0.1798
6 0.37 0.52 0.1924
7 0.42 1.02 0.4284
8 0.58 0.86 0.4988
9 0.68 0.86 0.5848
10 0.68 1.00 0.68
11 0.73 0.88 0.6424
12 0.85 1.04 0.884
13 0.92 1.70 1.564 0.8464
Syy= ∑ y2 – (( ∑ y)2 )/n
Syy= 9.8857 - ((10.47)2)/13)
Syy= 9.8857 – 8.4323 Syy= 1.4534
Sxy= ∑ x2 – (( ∑ x)2 )/n
Sxy= 3.8239 - ((5.92)2)/13)
Sxy= 3.8239 – 2.6958 Sxy= 1.1156
Bi= Sxy/Syy = 1.0786/1.1156 Bi= 0.9668
Bo= (∑ y - Bi ∑ x)/n
Bo= (10.47 – (0.9668)(5.92))/13 Bo= 0.3651