UNIVERSIDAD NACIONAL DEL ALTIPLANO
FACULTAD DE INGENIERÍA AGRÍCOLA
ESCUELA PROFESIONAL DE INGENIERÍA AGRÍCOLA
MÉTODOS ESTADÍSTICOS PARA LA
PROBLEMAS RESUELTOS
UNIVERSIDAD NACIONAL DEL ALTIPLANO
FACULTAD DE INGENIERÍA AGRÍCOLA
ESCUELA PROFESIONAL DE INGENIERÍA AGRÍCOLA
MÉTODOS ESTADÍSTICOS PARA LA
INVESTIGACIÓN
PROBLEMAS RESUELTOS
POR:
EDUARDO FLORES CONDORI
EDUARDO LUIS FLORES QUISPE
PUNO – PERÚ
2011
UNIVERSIDAD NACIONAL DEL ALTIPLANO
FACULTAD DE INGENIERÍA AGRÍCOLA
ESCUELA PROFESIONAL DE INGENIERÍA AGRÍCOLA
SUMATORIA
Al presentarse la suma de una secuencia numérica, en donde destaquemos cierta
secuencia u orden en los sumandos que se van a sumar, podemos esa suma
abreviarla bajo un signo, el que denominaremos sumatoria.
Tenemos por lo tanto que
la
sumatoria,
∑
= n m kk
a
es una forma de expresar la
suma de los términos de una sucesión, términos que se obtienen dando a la
variable k valores enteros comprendidos entre dos límites escritos en la
parte superior del símbolo
∑
de sumatoria
Identificación,
∑
=
n
i
i
x
1
Ejemplos:
n n i i i i
x
x
x
x
x
x
x
x
x
x
x
x
+
+
+
+
+
=
+
+
+
+
=
∑
∑
= =...
4 3 2 1 1 5 4 3 2 1 5 1Exprese las siguientes sumas mediante el símbolo
sumatoria.
a)
S=1
2+ 2
2+ 3
2+ 4
2+ .... + n
2b)
S= 1.2 + 2.3 + 3.4 + ... + n(n+1)
c)
nn
S
2
...
2
3
2
2
2
1
3 2+
+
+
+
=
d)
S
n
n2
...
2
3
2
2
2
1
3 2+
+
+
+
=
d)
S
=
21
+
32
+
43
+
....
+
n+1n
Signo
sumatoria
Valor donde termina la sumatoria
Término a sumar
SUMATORIA-PROPIEDADES
1.
La sumatoria de la suma de dos o más términos, es igual a la suma de las
sumatorias separadas de los términos.
∑
(
)
∑
∑
= =+
=
=+
n i i n i n i i i iy
x
y
x
1 1 12.
La sumatoria de la diferencia de dos o más términos es igual a la diferencia de las
sumatorias separadas de los términos.
∑
(
)
∑
∑
= = =−
=
−
n i i n i i n i i iy
x
y
x
1 1 13.
La sumatoria de una constante multiplicada por una variable es igual a la constante
multiplicada por la sumatoria de la variable.
∑
∑
= ==
n i i n i ia
x
x
a
1 1.
.
4.
La sumatoria de una constante es igual a la constante multiplicada por el número
que indique los límites de la sumatoria.
a
n
a
n x.
1=
∑
=En la práctica frecuentemente se comenten algunos errores, los cuales los
cuales mencionaremos para que no se incurra en ellos.
Es falso el tomar a
2 1 1 2
=
∑
∑
= = n i n ix
x
ya que son valores completamente diferentes
Otro error se comete es decir que
∑
∑
∑
=
=
= = n i n i i n i i i iy
x
y
x
1 1 1EJERCICIOS.
1.—Escribe los términos de cada una de las siguientes sumatorias.
(
)
(
)
4 5 2 1 1 1 4 2 1 1)
(
2) )
)
6
)
4 )
4
n i i i i i i i i N K i i K ia
X
b
f X
c
U U
d
Y
e
X Y
= = = = =+
+
−
∑
∑
∑
∑
∑
2.-- Dadas dos variables X e Y toman los valores X
1= 2, X
2= -5, X
3= 4, X
4= -8 y Y
1= -3, Y
2=-8,
Y
3=10, Y
4= 6. Calcula :
(
)
4 4 4 4 4 2 2 1 1 1 1 1 4 4 4 2 1 1 1 1)
b)
c)
d)
e)
)
.
g)
.
h)
(
)
i i i i i i i i i i i n i i i i i i i i i i i ia
X
Y
X Y
X
Y
f
X
Y
X Y
X
Y
X
Y
= = = = = = = = =
+
−
∑
∑
∑
∑
∑
∑
∑
∑
∑
3.—Si
6 6 2 1 14 y
10
i i i iX
X
= == −
=
∑
∑
,
Halle:
6 6 6 2 1 1 1)
(2
i3) b)
i(
i1) c)
(
i5)
i i ia
X
X X
X
= = =+
−
−
∑
∑
∑
4.—Dos variables U y V toman los valores U
1= 3, U
2= -2, U
3= 5 y V
1= -4, V
2= -1, V
3= 6,
respectivamente. Calcule:
(
)(
)
2 3 3 3 3 2 1 1 1 1 1 3 n 2 2 2 i i 1 1 i=1)
b)
U +3
4 c)
d)
U
)
f)
(
2
2) g)
V
n i i i i i i i i i i i i n i i i i i ia
U V
V
V
U
V
e
U V
U
V
= = = = = = =
−
−
+
∑
∑
∑
∑
∑
∑
∑
∑
5.—Dado
4 4 4 1 1 17
3 y
5
i i i i i i iX
Y
X Y
= = ==
= −
=
∑
∑
∑
Halle:
(
)(
)
4 4 1 1)
(2
i5 ) b)
i i3 2
i1
i ia
X
Y
X
Y
= =+
−
+
∑
∑
6.-- Desarrolle las siguientes sumatorias.
(
)
(
)
(
−
)
=
(
+
)
=
=
(
+
−
)
=
(
+
)
=
=
+
=
−
=
=
=
=
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
= = = = = = = = = = = 2 1 2 1 4 0 7 1 3 1 2 3 1 3 1 3 1 5 1 2 3 1 4 1)
6
2
)
5
)
4
2
)
20
)
)
)
3
)
)
.
)
)
j j i i i i i i i i i i i j j j j m i i x i i i i ij
Ay
k
z
y
x
j
x
i
x
h
x
f
g
y
x
f
y
x
m
e
d
x
c
x
f
b
x
a
SUMATORIA----EJERCICIOS
Desarrolle las siguientes sumatorias
(
)
(
)
(
)
(
)
∑
∑
∑
∑
∑
∑
∑
− = = = − = = = − =+
+
−
+
−
4 3 2 6 0 5 2 3 3 7 3 4 1 1 5 03
)
2
1
3
)
5
)
1
2
)
4
2
)
12
)
)
k k k k k k K k kk
g
k
f
k
e
k
d
k
c
k
b
k
a
(
)(
)
(
)(
)
(
)(
)
(
)
(
)
(
)
∑
∑
∑
∑
∑
∑
∑
− = − = − = − = − = − = =−
+
−
−
+
+
−
+
−
−
+
−
+
+
−
3 2 2 2 3 2 3 4 1 2 5 3 3 6 2 5 1 8 31
2
9
5
3
)
3
5
3
)
7
3
)
)
4
3
)
1
4
)
2
1
)
k k k k k k kk
k
k
m
k
k
k
ll
k
k
l
k
k
k
k
k
j
k
k
i
k
k
h
( )
(
)( )
(
)( )
(
)
(
)
(
)
(
)
∑
∑
∑
∑
∑
∑
∑
− − = + = = = − = = =+
−
+
+
−
+
−
−
−
1 2 2 3 4 2 1 3 4 0 4 2 9 0 5 03
2
)
7
)
1
)
5
)
1
3
)
1
2
20
)
1
)
n k n k n k k k k k k k kk
s
k
r
k
q
k
p
k
o
k
ñ
k
n
Desarrolle las siguientes sumatorias
(
)
(
)
(
)
(
)
( )
(
)
( ) (
(
)
)
(
)(
)
(
+
)(
−
)
=
+
+
+
=
=
=
+
=
+
+
−
=
+
−
=
+
=
+
−
+
=
−
=
+
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
= + − = = = = = = − = = − = − = = − = m k n k k n k m k k n k k k n k k k n k kx k k k k n k kx N Kk
k
ll
k
k
k
l
k
k
k
Sen
j
k
Sen
k
i
k
k
k
h
k
k
g
k
Lg
f
k
e
e
k
d
k
c
Senkx
e
b
K
a
3 1 2 2 3 0 1 3 2 1 4 1 1 2 2 2 0 4 1 6 1 4 5 0 2 2 0 21
2
1
2
1
)
1
4
3
)
)
4
)
2
)
2
1
2
1
)
1
1
)
1
)
1
)
1
(
)
3
2
)
3
2
)
)
1
)
π
π
HOJA DE EJERCICIOS Nº 1
1.
El valor de dos (2) variables X e Y, de una población es de 50 y 70 respectivamente.
i.
¿Cuál es la razón entre X e Y?
ii.
¿Cuál es la proporción de cada variable?
iii.
¿Cuál es el porcentaje de cada variable?
2.
En una población de 240 datos y de dos variables X e Y el porcentaje de X [P(X) ] es de
35%.
i.
¿Cuál es valor de cada variable?
ii.
¿Cuál es la proporción de cada variable?
iii.
¿Cuál es la razón entre X e Y?
3.
En una población de tres (3) variables X, Y y Z el valor de cada una de ellas es: 60,
40 y 80 respectivamente.
i.
Halle la razón entre X e Y; entre Z y X y entre Y y Z.
ii.
Halle la proporción de cada variable.
iii.
Halle el porcentaje de cada variable.
4.
En una población de cinco (5) variables el valor de cada una de ellas es: X1 = 150; X2 =
200; X3 = 180; X4 = 160 y X5 = 300.
i.
Calcule la razón entre: X3 y X1; X4 y X2 y X5 y X1
ii.
Verificar que la suma de las proporciones es igual a uno (1)
iii.
Calcule el porcentaje de cada variable.
5.
En una población de dos (2) variables X e Y la razón entre X e Y es de 5 a 3 y el total
de ellas es 240.
i.
Halle el valor de cada variable.
ii.
Calcule la proporción de cada variable.
iii.
Calcule el porcentaje de cada variable.
6.
En una población de tres (3) variables X, Y y Z, la razón entre X y Z es de 5 a 9 y la
proporción de Y es 0,3, sí el total de la población es de 720.
i.
¿Cuál es el valor de cada variable?
ii.
Halle la razón entre X e Y, entre Z e Y.
iii.
¿Cuál es la proporción de cada variable?
iv.
¿Cuál es el porcentaje de cada variable?
7.
Dada la siguiente tabla
i
1
2
3
4
5
6
7
8
Xi
3
5
7
8
0
9
1
4
Yi
5
7
2
9
3
0
6
3
8.
Hallar el valor de las siguientes sumatorias:
∑
∑
∑
∑
= = = =+
+
+
−
6 2 i i 2 8 2 i 2 i i 6 2 i i 4 1 i i i)
4
X
.
2
(
)
Y
X
(
)
i
)
4
X
.
2
(
)
e
)
Y
X
3
(
)
a
∑
∑
∑
= + − = =−
+
−
7 3 i 1 i 1 i 6 2 i 2 3 2 i 8 1 i i i)
Y
X
(
)
j
)
Y
X
(
)
f
)
Y
X
(
)
b
∑
∑
∑
= − + = =−
+
7 4 i 2 1 i 1 i 7 2 i i 2 5 2 i i i)
Y
X
(
)
k
1
X
)
g
Y
.
X
)
c
∑
∑
= =+
−
4 1 i 2 i 7 3 i 2 i 2 i3
X
)
h
)
Y
X
(
)
d
(
) (
) (
)
(
4
x
7
) (
4
x
7
) (
4
x
7
) (
4
x
7
)
)
e
y
cx
y
cx
y
cx
)
c
x
x
x
x
)
a
3 3 3 3 0 5 0 4 0 3 3 3 2 1+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
(
x
x
x
x
x
)
6
)
f
5
x
x
x
x
x
)
d
x
x
x
x
x
)
b
2 2 2 2 2 2 6 5 4 3 2 2 5 2 4 2 3 2 2 2 1+
+
+
+
+
+
+
+
+
+
+
+
+
+
10.
Sabiendo que:
n
X
X
n i i i∑
==
y
n
Y
Y
n i i∑
==
1. Demostrar que:
( )
(
)
(
)
(
)
(
)
( )
−
−
=
−
−
=
−
−
−
=
−
−
=
−
−
=
−
−
=
−
−
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑ ∑
= = = = = = = = = = = = = n 1 i 2 i 2 i n 1 i i 0 0 i n 1 i i n 1 i 2 n 1 i i i n 1 i 2 i n 1 i 2 n 1 i i i n 1 i 2 i n 1 i n 1 i n 1 i n 1 i i i i i i iY
n
1
Y
1
n
1
1
n
Y
Y
)
F
0
X
X
.
n
X
X
)
E
0
X
X
)
D
n
X
X
X
X
)
C
n
Y
Y
Y
Y
)
B
n
Y
.
X
Y
.
X
)
Y
Y
(
),
X
X
(
A)
PROBLEMAS DE APLICACIÓN
(APLICACIONES: EXCEL SAS Y MINITAB)
1.
Dada la serie histórica de descargas medias (m
3/s) del rio Huancané, para el periodo
1959-2008. Calcule las frecuencias absolutas, relativa, acumulada, función de densidad y función
acumulada.
año
Q=m
3/s
año
Q=m
3/s
año
Q=m
3/s
año
Q=m
3/s
año
Q=m
3/s
1959
25.00
1969
17,00
1979
24,00
1989
19,00
1999
23,00
1960
20,00
1970
11,00
1980
21,00
1990
29,00
2000
10,00
1961
13,00
1971
14,00
1981
18,00
1991
24,00
2001
14,00
1962
26,00
1972
28,00
1982
20,00
1992
23,00
2002
23,00
1963
29,00
1973
28,00
1983
19,00
1993
24,00
2003
21,00
1964
22,00
1974
21,00
1984
17,00
1994
15,00
2004
27,00
1965
29,00
1975
16,00
1985
21,00
1995
27,00
2005
27,00
1966
20,00
1976
7,00
1986
17,00
1996
19,00
2006
28,00
1967
19,00
1977
28,00
1987
21,00
1997
26,00
2007
26,00
1968
26,00
1978
9,00
1988
8,00
1998
23,00
2008
19,00
Solución problema 1
Número de intervalos de clase
m =
7
min =
7
max =
29
Ancho =
3
m
xi
<=xi+1
o frec. Relat. frec. Re. Acu.
1
7
10
4 0.08
0.08
2
10
13
2 0.04
0.12
3
13
16
4 0.08
0.2
4
16
20
12 0.24
0.44
5
20
23
10 0.2
0.64
6
23
26
8 0.16
0.8
7
26
29
10 0.2
1
Total =
50 1
4 2 4 12 10 8 10 0 2 4 6 8 10 12 14 1 2 3 4 5 6 7 F re cu e n ci a a b so lu ta Intervalo de clase
Histograma de frecuencia absoluta
0.08 0.04 0.08 0.24 0.2 0.16 0.2 0 0.05 0.1 0.15 0.2 0.25 0.3 1 2 3 4 5 6 7 F re cu e n ci a r e la ti v a Intervalo de clase
Histograma de frecuencia relativa
0.08 0.12 0.2 0.44 0.64 0.8 1 0 0.2 0.4 0.6 0.8 1 1.2 1 2 3 4 5 6 7 F re cu e n ci a r e la ti v a a cu m u la d a Intervalo de clase
2.
Dado los datos de precipitación anual, en mm. De la Estación Ayaviri, para el periodo
1959-2008. Calcular su media, varianza, desviación estándar, coeficiente de variación, coeficiente
de sesgo y coeficiente de curtosis.
año
pp
(mm) año
pp
(mm) año
pp
(mm) año
pp
(mm) año
pp
(mm)
1959 650.00 1969 158,00 1979 139,00 1989 155,00 1999 239,00
1960 752,00 1970 81,00 1980 686,00 1990 601,00 2000 512,00
1961 536,00 1971 793,00 1981 531,00 1991 149,00 2001 97,00
1962 777,00 1972 635,00 1982 105,00 1992 485,00 2002 370,00
1963 127,00 1973 279,00 1983 369,00 1993 193,00 2003 545,00
1964 505,00 1974 251,00 1984 519,00 1994 724,00 2004 751,00
1965 499,00 1975 354,00 1985 515,00 1995 404,00 2005 460,00
1966 552,00 1976 494,00 1986 316,00 1996 514,00 2006 798,00
1967 701,00 1977 770,00 1987 79,00 1997 608,00 2007 124,00
1968 156,00 1978 726,00 1988 211,00 1998 75,00 2008 416,00
Solución problema 2
Media
429.72
Varianza
54181.88
Desvest
232.77
CV
54.17
Coef Sesgo -0.06
Curtosis
-1.29
3.
Los gastos máximos anuales registrados en la estación hidrométrica Las Perlas en el
Coatzacoalas se muestran en la tabla siguiente:
a)
¿Cuál es la probabilidad de que, en un año cualquiera, el gasto sea mayor o igual a 7500
m
3/s?
b)
Se planea construir cerca de este sitio un bordo para protección contra inundaciones.
¿Cual debe ser el gasto de diseño si se desea que el periodo de retorno sea de 60 años?
Supóngase que los datos de la tabla siguen una distribución normal.
Resolver usando las funciones de distribución:
Distribución Lognormal
Distribución Pearson III o Gamma de tres parámetros, y
Distribución Gumbel
año
m
3/s
año
m
3/s
año
m
3/s
año
m
3/s
año
m
3/s
1954 2500 1959 2070 1964 2489 1969 5971 1974 5565
1955 3220 1960 3682 1965 2350 1970 4744 1975 3130
1956 2246 1961 4240 1966 3706 1971 6000 1976 2414
1957 1804 1962 2367 1967 2675 1972 4060 1977 1796
1958 2737 1963 7061 1968 6267 1973 6900 1978 7430
Solución a) Distribución Normal
Media
3886.16
Desvest
1825.91
x
7500
Z
1.9792
F(x)=P(X<7500)=
0.9761
P(X>7500)
0.0239
P(X>x)
0.0167
P(X<x)
0.9833
F(z)
0.9833
z =
2.1280
x (gasto de diseño m
3/s) =
7771.7717
b) Distribución Lognormal
P(X>x)
0.0167
P(X<x)
0.9833
F(z)
0.9833
z =
2.1280
ln(x) =
9.1221
x =
9155.0451
Distribución Pearson III
Gamma
0.6778
bheta1
8.7057
alpha1
618.8364
delta1
-1501.2647
P(X>x)
0.0167
gl
17
2y
31.6415
y
15.8208
x
8289.2060
Distribución Gumbel
alpha
0.00059773
beta
2997.96706
T
60
x
9833.7448
4.
Dada la serie histórica de descargas medias (m
3/s) del rio Huancané, para el periodo
1959-2008. Realizar las pruebas de bondad de ajustes de Chi-cuadrado (X
2) y
Smirnov-Kolmogorov, para ver si se ajustan a una distribución normal.
AÑO Q=m
3/s AÑO Q=m
3/s AÑO Q=m
3/s AÑO Q=m
3/s AÑO Q=m
3/s
1959 28.00
1969 17,00
1979 24,00
1989 14,00
1999 23,00
1960 21,00
1970 11,00
1980 21,00
1990 29,00
2000 10,00
1961 13,00
1971 14,00
1981 18,00
1991 24,00
2001 14,00
1962 28,00
1972 28,00
1982 20,00
1992 23,00
2002 23,00
1963 29,00
1973 28,00
1983 19,00
1993 24,00
2003 25,00
1964 23,00
1974 21,00
1984 16,00
1994 15,00
2004 27,00
1965 29,00
1975 16,00
1985 21,00
1995 27,00
2005 17,00
1966 20,00
1976 7,00
1986 7,00
1996 19,00
2006 28,00
1967 19,00
1977 28,00
1987 21,00
1997 26,00
2007 26,00
1968 26,00
1978 9,00
1988 8,00
1998 23,00
2008 16,00
5.
Se desea saber si en una cierta región el gasto máximo medio anual, el área de la cuenca y la
altura media de precipitación máxima en 24 horas se pueden correlacionar linealmente, y que
tan bueno es el ajuste. Los datos se presentan en la tabla siguiente:
Estación
Meteorológic
a
Y=gasto máx. medio
anual
10
2m
3/s
X1=área de la
cuenca,
10
3km
2X2=altura media de pp.
máx.
En 24 h. cm
1
45.2
1.23
2.9
2
9.1
5.25
1.8
3
48.3
8.55
2.2
4
35.8
7.99
1.1
5
74.9
7.36
3.9
6
26.7
5.78
2.7
7
12.1
5.98
2.5
8
6.8
8.11
2.3
9
69.7
2.23
2.8
10
57.0
6.77
1.1
11
33.7
7.02
2.1
12
71.4
3.04
3.9
13
88.2
6.78
3.2
14
26.6
1.23
3.3
15
16.0
2.22
2.7
Estadísticas de la regresión
Coeficiente de correlación múltiple
0.4618
Coeficiente de determinación R^2
0.2132
R^2 ajustado
0.0821
Error típico
25.0735
Observaciones
15.0000
F. de V.
GL
SC
CM
Fc
Valor crít de F
Regresión
2
2044.4866
1022.243
1.6260
0.2372
Residuos
12
7544.1667
628.6806
Total
14
9588.6533
Coeficientes
Error típico
Estadístico t
Probabilidad
Intercepción
-11.5288
32.9915
-0.3494
0.7328
Variable X 1
2.2847
2.8637
0.7978
0.4405
Variable X 2
15.9144
8.8250
1.8033
0.0965
Y = - 11.5288 + 2.2847 X1 + 15.9144 X2
PROGRAMA DE SAS 9.2
data regresion;
input X1 X2 Y;
CARDS;
1.23 2.9 45.2
5.25 1.8 9.1
8.55 2.2 48.3
7.99 1.1 35.8
7.36 3.9 74.9
5.78 2.7 26.7
5.98 2.5 12.1
8.11 2.3 6.8
2.23 2.8 69.7
6.77 1.1 57
7.02 2.1 33.7
3.04 3.9 71.4
6.78 3.2 88.2
1.23 3.3 26.6
2.22 2.7 16
PROC PRINT;
PROC REG;
MODEL Y=X1 X2;
PROC GLM;
PROC PLOT;
RUN;
Obs X1 X2 Y 1 1.23 2.9 45.2 2 5.25 1.8 9.1 3 8.55 2.2 48.3 4 7.99 1.1 35.8 5 7.36 3.9 74.9 6 5.78 2.7 26.7 7 5.98 2.5 12.18 8.11 2.3 6.8 9 2.23 2.8 69.7 10 6.77 1.1 57.0 11 7.02 2.1 33.7 12 3.04 3.9 71.4 13 6.78 3.2 88.2 14 1.23 3.3 26.6 15 2.22 2.7 16.0 The REG Procedure Model: MODEL1 Dependent Variable: Y Analysis of Variance Sum of Mean
Source DF Squares Square F Value Pr > F Model 2 2044.48663 1022.24332 1.63 0.2372 Error 12 7544.16670 628.68056
Corrected Total 14 9588.65333
Root MSE 25.07350 R-Square 0.2132 Dependent Mean 41.43333 Adj R-Sq 0.0821 Coeff Var 60.51529
Parameter Estimates Parameter Standard
Variable DF Estimate Error t Value Pr > |t| Intercept 1 -11.52882 32.99154 -0.35 0.7328 X1 1 2.28473 2.86373 0.80 0.4405 X2 1 15.91441 8.82500 1.80 0.0965
Y = - 11.5288 + 2.2847 X1 + 15.9144 X2
6.
Se realizaron siete (07) pruebas de la resistencia a la compresión en cuatro muestras de
concreto. La fuerza que fractura cada muestra de forma cilíndrica, medida en kilogramos,
está dada en la siguiente tabla:
Muestras
Pruebas
m1
m2
m3
m4
Prueba 1
45
42
43
48
Prueba 2
90
100
102
104
Prueba 3
40
45
56
58
Prueba 4
89
25
98
25
Prueba 5
105
125
87
103
Prueba 6
111
121
120
109
Prueba 7
80
85
86
88
Pruebe con un nivel de significancia de 0.01 si estas muestras son diferentes en su resistencia a
la compresión, y efectuar la prueba de rango múltiple de Duncan a la probabilidad de 0.01.
SOLUCIONARIO MANUAL
1)
Hipótesis
Ha:µi
≠
0
2)
Nivel de significación
α
= 0.05 y 0.01
3)
Estadística de Prueba
Fc=(CMtratam/CMerror)
4)
Regla de decisión
Si Fc
≤
F0.05, no se rechaza la Ho. Se representa (NS)
Si F0.05< Fc < F0.01, se rechaza la H0, representando con un asterisco (*)
Si Fc > F0.01; se rechaza la H0, representándose por dos asteriscos (**)
5)
Cálculos
a)
=
.. ×=
×= 177603.571
b)
= ∑
∑
−
"..# ×= $45'
+ ⋯ + $88'
−
177603.571
= 202998.000 − 177603.571 = 25394.42857
c)
.=
∑23.−
.. ×=
$34'5⋯5$6'−
= 36. 47
d)
= ∑
3∑
838−
.= 76. 47 −
19424.42857
=
5970.0000
6)
Análisis de varianza
Cuadro 44. Análisis de varianza de los resultados
F.de V.
GL
SC
CM
Fc
Ft
Pr>F
Niv. Sig.
Pruebas
6
19424.42857 3237.40476 11.3878559
2.57
1.109E-05
**
Error
21
5970.00000 284.285714
Total
27
25394.42857
C.V. = 21.1705 %
SOLUCIONARIO CON EL PAQUETE DEL SISTEMA PARA EL ANALISIS
ESTADISTICO
data trabajo;
input x$ y@@;
datalines;
p1 45 p2 90 p3 40 p4 89 p5 105 p6 111 p7 80 p1 42 p2 100 p3 45 p4 25 p5 125 p6 121 p7 85 p1 43 p2 102 p3 56 p4 98 p5 87 p6 120 p7 86 p148 p2 104 p3 58 p4 25 p5 103 p6 109 p7 88proc print;
proc anova;
class x;
model y=x;
means x/duncan alpha=0.01;
run;
RESULTADOS UTILIZANDO EL SAS
Obs x y 1 p1 45 2 p2 90 3 p3 40 4 p4 89
5 p5 105 6 p6 111 7 p7 80 8 p1 42 9 p2 100 10 p3 45 11 p4 25 12 p5 125 13 p6 121 14 p7 85 15 p1 43 16 p2 102 17 p3 56 18 p4 98 19 p5 87 20 p6 120 21 p7 86 22 p1 48 23 p2 104 24 p3 58 25 p4 25 26 p5 103 27 p6 109 28 p7 88 The ANOVA Procedure Class Level Information Class Levels Values
x 7 p1 p2 p3 p4 p5 p6 p7 Number of observations 28 The ANOVA Procedure Dependent Variable: y
Sum of
Source DF Squares Mean Square F Value Pr > F Model 6 19424.42857 3237.40476 11.39 <.0001 Error 21 5970.00000 284.28571
Corrected Total 27 25394.42857
R-Square Coeff Var Root MSE y Mean 0.764909 21.17048 16.86077 79.64286
Source DF Anova SS Mean Square F Value Pr > F x 6 19424.42857 3237.40476 11.39 <.0001 The ANOVA Procedure
Duncan's Multiple Range Test for y
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.01 Error Degrees of Freedom 21 Error Mean Square 284.2857
Number of Means 2 3 4 5 6 7 Critical Range 33.76 35.21 36.17 36.87 37.41 37.85 Means with the same letter are not significantly different.
Duncan Grouping Mean N x A 115.25 4 p6 A 105.00 4 p5 A 99.00 4 p2 B A 84.75 4 p7 B C 59.25 4 p4 B C 49.75 4 p3 C 44.50 4 p1
7. Se diseñó un experimento para estudiar el rendimiento de seis (06) detergentes
diferentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo
especialmente diseñado para 24 cargas de lavado distribuidas en cuatro (04)
modelos de lavadoras:
Detergente Lavad 1 Lavad 2 Lavad 3 Lavad 4 Detergente A 100 102 101 104 Detergente B 25 46 52 55 Detergente C 45 58 62 66 Detergente D 47 50 63 65 Detergente E 49 54 68 67 Detergente F 99 95 98 99
Considerando los detergentes como tratamientos y las lavadoras como bloques,
efectuar el análisis de variancia y su prueba con un nivel de significación de 0.05 si
existen diferencias entre los detergentes y entre las lavadoras. Además, efectuar la
prueba de Rango Múltiple de Tukey a la probabilidad de 0.05.
Cuadro 45. Análisis de varianza
F. de V.
GL
SC
CM
Fc
Ft
Sig
bloque
3
849.5000 283.166667 8.78490176
tratamiento
5
11506.8333 2301.36667 71.3971044
error
15
483.5000 32.2333333
total
23
12839.8333
SOLUCIONARIO UTILIZANDO EL SISTEMA PARA ANALISIS ESTADISTICO (SAS)
RESULTADO UTILIZANDO EL SAS
data detergente;
input lavadoras detergente rdto;
cards;
1
1
100
1
2
25
1
3
45
1
4
47
1
5
49
1
6
99
2
1
102
2
2
46
2
3
58
2
4
50
2
5
54
2
6
95
3
1
101
3
2
52
3
3
62
3
4
63
3
5
68
3
6
98
4
1
104
4
2
55
4
3
66
4
4
65
4
5
67
4
6
99
proc print;
proc anova;
class lavadoras detergente;
model rdto= lavadoras detergente;
means detergente/tukey alpha =0.05;
run;
Obs lavadoras detergente rdto
1 1 1 100 2 1 2 25 3 1 3 45 4 1 4 47 5 1 5 49 6 1 6 99 7 2 1 102 8 2 2 46 9 2 3 58 10 2 4 50 11 2 5 54 12 2 6 95 13 3 1 101 14 3 2 52 15 3 3 62 16 3 4 63 17 3 5 68 18 3 6 98 19 4 1 104 20 4 2 55 21 4 3 66 22 4 4 65 23 4 5 67 24 4 6 99
The ANOVA Procedure Class Level Information Class Levels Values lavadoras 4 1 2 3 4 detergente 6 1 2 3 4 5 6 Number of observations 24 The ANOVA Procedure Dependent Variable: rdto
Sum of
Source DF Squares Mean Square F Value Pr > F Model 8 12356.33333 1544.54167 47.92 <.0001 Error 15 483.50000 32.23333
Corrected Total 23 12839.83333
R-Square Coeff Var Root MSE rdto Mean 0.962344 8.159196 5.677441 69.58333
Source DF Anova SS Mean Square F Value Pr > F lavadoras 3 849.50000 283.16667 8.78 0.0013 detergente 5 11506.83333 2301.36667 71.40 <.0001
Tukey's Studentized Range (HSD) Test for rdto
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II
error rate than REGWQ.
Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 32.23333 Critical Value of Studentized Range 4.59474 Minimum Significant Difference 13.043
Means with the same letter are not significantly different. Tukey Grouping Mean N detergente
A 101.750 4 1 A 97.750 4 6 B 59.500 4 5 B 57.750 4 3 C B 56.250 4 4 C 44.500 4 2
8.
Evaluar el sistema de riego por exudación utilizando cuatro variedades de melón, bajo
modalidad de siembra, SIMPLE HILERA. Se desea probar el comportamiento de tres
variedades híbridas de melón y uno estándar:
V1 : Híbrido Mission V3 : Híbrido Topfligth.
V2 : Híbrido Mark. V4 : Híbrido Hales Best Jumbo.
Hipótesis : Ho : Efecto de variedades de melón en estudio es nulo.
H1 : Al menos dos variedades tienen efectos distintos.
Datos: Rendimiento en Kg. por parcela.
C1
C2
C3
C4
F1
36V1
50 V2
43 V3
35 V4
F2
29 V4
53 V3
41 V2
63 V1
F3
37 V2
41 V4
41 V1
63 V3
F4
38 V3
40 V1
35 V4
41 V2
F. de V.
GL
SC
CM
Fc
Ft
sig.
Hilera
3
170.75
56.92
1.3445
Columna
3
552.75
184.25
4.3524
Tratamiento
3
430.25
143.417
3.3878
Error
6
254.0000
42.3333
Total
15
1407.7500
SOLUCIONARIO APLICANDO EL SAS DISEÑO DE CUADRADO LATINO
DATA OCHO;
INPUT FILA COLUMNA TRAT $ RDTO;
CARDS;
1
1
V1
36
1
2
V2
50
1
3
V3
43
1
4
V4
35
2
1
V4
29
2
2
V3
53
2
3
V2
41
2
4
V1
63
3
1
V2
37
3
2
V4
41
3
3
V1
41
3
4
V3
63
4
1
V3
38
4
2
V1
40
4
3
V4
35
4
4
V2
41
PROC PRINT;
PROC ANOVA;
CLASS FILA COLUMNA TRAT;
MODEL RDTO= FILA COLUMNA TRAT;
MEANS FILA COLUMNA TRAT/DUNCAN;
RUN;
RESULTADOS UTILIZANDO EL SAS
Obs FILA COLUMNA TRAT RDTO 1 1 1 V1 36 2 1 2 V2 50 3 1 3 V3 43 4 1 4 V4 35 5 2 1 V4 29 6 2 2 V3 53 7 2 3 V2 41 8 2 4 V1 63 9 3 1 V2 37 10 3 2 V4 41 11 3 3 V1 41 12 3 4 V3 63 13 4 1 V3 38 14 4 2 V1 40 15 4 3 V4 35 16 4 4 V2 41 The ANOVA Procedure
Class Level Information Class Levels Values FILA 4 1 2 3 4 COLUMNA 4 1 2 3 4 TRAT 4 V1 V2 V3 V4 Number of observations 16 The ANOVA Procedure
Dependent Variable: RDTO Sum of
Source DF Squares Mean Square F Value Pr > F Model 9 1153.750000 128.194444 3.03 0.0954 Error 6 254.000000 42.333333
Corrected Total 15 1407.750000
R-Square Coeff Var Root MSE RDTO Mean 0.819570 15.17529 6.506407 42.87500
Source DF Anova SS Mean Square F Value Pr > F FILA 3 170.7500000 56.9166667 1.34 0.3456 COLUMNA 3 552.7500000 184.2500000 4.35 0.0596 TRAT 3 430.2500000 143.4166667 3.39 0.0949 Duncan's Multiple Range Test for RDTO
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.05 Error Degrees of Freedom 6 Error Mean Square 42.33333
Number of Means 2 3 4 Critical Range 11.26 11.67 11.87 Means with the same letter are not significantly different. Duncan Grouping Mean N FILA
A 46.500 4 2 A 45.500 4 3 A 41.000 4 1 A 38.500 4 4 The ANOVA Procedure
Duncan's Multiple Range Test for RDTO
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.05 Error Degrees of Freedom 6 Error Mean Square 42.33333 Number of Means 2 3 4 Critical Range 11.26 11.67 11.87 Means with the same letter are not significantly different. Duncan Grouping Mean N COLUMNA
A 50.500 4 4 B A 46.000 4 2 B A 40.000 4 3 B 35.000 4 1 The ANOVA Procedure
Duncan's Multiple Range Test for RDTO
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.05 Error Degrees of Freedom 6 Error Mean Square 42.33333 Number of Means 2 3 4 Critical Range 11.26 11.67 11.87 Means with the same letter are not significantly different. Duncan Grouping Mean N TRAT
A 49.250 4 V3 B A 45.000 4 V1 B A 42.250 4 V2 B 35.000 4 V4
9.
Supóngase que se efectúan dos repeticiones del experimento de soldadura, empleando el
cuadrado latino, los resultados que señalan el número de libras fuerza de tensión requerida
para separar los puntos soldados, fueron como se indica a continuación:
REPETICIÓN I Fundentes F1 F2 F3 F4 A 20.0 B 17.5 C 14.0 D 14.0 D 24.0 A 21.0 B 18.0 C 14.1 C 12.0 D 18.0 A 23.0 B 19.0 B 20.0 C 15.0 D 13.0 A 22.0
REPETICIÓN II
Fundentes
F1
F2
F3
F4
C 12.0
D 10.0
A 24.2
B 22.1
B 19.5
C 13.0
D 10.5
A 22.3
A 23.5
B 17.2
C 20.4
D 14.0
D 11.0
A 22.2
B 20.5
C 14.5
Analice el experimento como un cuadrado latino y pruébese con un nivel de significancia de
0.05 si existen diferencias en los métodos (A, B, C y D), en los operadores (filas), los fundentes
(columnas) y, entre las producciones. Utilizar la prueba de rango múltiple de Tukey
α
= 0.01, si
es que es significativo.
F. de V.
GL
SC
CM
Fc
Sig
Pr > F
repetición
1
1.8528125
1.8528
0.181683
NS
0.6742
hilera
3
12.1609375
4.0536
0.3974922
NS
0.7562
columna
3
7.2009375
2.4003
0.2353697
NS
0.8707
tratamiento
3
365.545937
121.85
11.948229
**
0.0001
error
21
214.159062
10.198
Total
31
600.919688
SOLUCIONARIO MEDIANTE EL SAS
data fundente;
input repet hilera columna trat$ rdto;
cards;
1
1
1
A
20
1
1
2
B
17.5
1
1
3
C
14
1
1
4
D
14
1
2
1
D
24
1
2
2
A
21
1
2
3
B
18
1
2
4
C
14.1
1
3
1
C
12
1
3
2
D
18
1
3
3
A
23
1
3
4
B
19
1
4
1
B
20
1
4
2
C
15
1
4
3
D
13
1
4
4
A
22
2
1
1
C
12
2
1
2
D
10
2
1
3
A
24.2
2
1
4
B
22.1
2
2
1
B
19.5
2
2
2
C
13
2
2
3
D
10.5
2
2
4
A
22.3
2
3
1
A
23.5
2
3
2
B
17.2
2
3
3
C
20.4
2
3
4
D
14
2
4
1
D
11
2
4
2
A
22.2
2
4
3
B
20.5
2
4
4
C
14.5
PROC PRINT;
PROC ANOVA;
CLASS REPET HILERA COLUMNA TRAT;
MODEL RDTO= REPET HILERA COLUMNA TRAT;
MEANS HILERA COLUMNA TRAT/TUKEY ALPHA=0.01;
RUN;
RESULTADOS DEL PROGRAMA DE SAS
Obs repet hilera columna trat rdto 1 1 1 1 A 20.0 2 1 1 2 B 17.5 3 1 1 3 C 14.0 4 1 1 4 D 14.0 5 1 2 1 D 24.0 6 1 2 2 A 21.0 7 1 2 3 B 18.0 8 1 2 4 C 14.1 9 1 3 1 C 12.0 10 1 3 2 D 18.0 11 1 3 3 A 23.0 12 1 3 4 B 19.0 13 1 4 1 B 20.0 14 1 4 2 C 15.0 15 1 4 3 D 13.0 16 1 4 4 A 22.0 17 2 1 1 C 12.0 18 2 1 2 D 10.0 19 2 1 3 A 24.2
20 2 1 4 B 22.1 21 2 2 1 B 19.5 22 2 2 2 C 13.0 23 2 2 3 D 10.5 24 2 2 4 A 22.3 25 2 3 1 A 23.5 26 2 3 2 B 17.2 27 2 3 3 C 20.4 28 2 3 4 D 14.0 29 2 4 1 D 11.0 30 2 4 2 A 22.2 31 2 4 3 B 20.5 32 2 4 4 C 14.5 The ANOVA Procedure
Class Level Information Class Levels Values repet 2 1 2 hilera 4 1 2 3 4 columna 4 1 2 3 4 trat 4 A B C D Number of observations 32
Dependent Variable: rdto Sum of
Source DF Squares Mean Square F Value Pr > F Model 10 386.7606250 38.6760625 3.79 0.0048 Error 21 214.1590625 10.1980506
Corrected Total 31 600.9196875
R-Square Coeff Var Root MSE rdto Mean 0.643615 18.19947 3.193439 17.54688
Source DF Anova SS Mean Square F Value Pr > F repet 1 1.8528125 1.8528125 0.18 0.6743 hilera 3 12.1609375 4.0536458 0.40 0.7562 columna 3 7.2009375 2.4003125 0.24 0.8707 trat 3 365.5459375 121.8486458 11.95 <.0001 Tukey's Studentized Range (HSD) Test for rdto
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II
error rate than REGWQ.
Alpha 0.01 Error Degrees of Freedom 21 Error Mean Square 10.19805 Critical Value of Studentized Range 4.98557 Minimum Significant Difference 5.629
Means with the same letter are not significantly different. Tukey Grouping Mean N hilera
A 18.388 8 3 A 17.800 8 2 A 17.275 8 4 A 16.725 8 1
Tukey's Studentized Range (HSD) Test for rdto
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II
error rate than REGWQ.
Alpha 0.01 Error Degrees of Freedom 21 Error Mean Square 10.19805 Critical Value of Studentized Range 4.98557 Minimum Significant Difference 5.629
Means with the same letter are not significantly different. Tukey Grouping Mean N columna
A 17.950 8 3 A 17.750 8 4
A 17.750 8 1 A 16.738 8 2
Tukey's Studentized Range (HSD) Test for rdto
NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II
error rate than REGWQ.
Alpha 0.01 Error Degrees of Freedom 21 Error Mean Square 10.19805 Critical Value of Studentized Range 4.98557 Minimum Significant Difference 5.629
Means with the same letter are not significantly different. Tukey Grouping Mean N trat
A 22.275 8 A B A 19.225 8 B B 14.375 8 C B 14.313 8 D
10.
Se desea determinar los efectos de la temperatura de la caldera (1600 y 1900 °F) y del
ancho del horno (4, 8 y 12 pulgadas) para el experimento; supóngase que cinco
repeticiones de ese experimento dan los siguientes tiempos requeridos para la producción
del coque (en horas):
A A(4) Pulgadas A(8) Pulgadas A(12) Pulgadas T T1=1600 T2=1900 T1=1600 T2=1900 T1=1600 T2=1900 I 12.5 8.2 17.1 5.2 17.8 7.6 II 14.0 9.3 16.9 4.6 15.6 9.1 III 12.7 6.4 17.5 8.8 17.8 7.9 IV 13.5 7.8 17.3 5.9 16.8 8.1 V 14.4 10.7 20.2 8.3 22.4 10.2
Explíquese un análisis de variancia basado en este experimento con dos factores y pruébese la
significancia de los efectos factoriales, empleando un nivel de significancia de 0.05. Aplicar la
prueba de Duncan
α
= 0.05, si es que es significativo al nivel de ANOVA.
RESULTADO UTILIZANDO EL PAQUETE DE SISTEMA DE ANALISIS ESTADISTICO
data flores;
input ancho temp hr;
cards;
1
1
12.5
1
1
14
1
1
12.7
1
1
13.5
1
1
14.4
1
2
8.2
1
2
9.3
1
2
6.4
1
2
7.8
1
2
10.7
2
1
17.1
2
1
16.9
2
1
17.5
2
1
17.3
2
1
20.2
2
2
5.2
2
2
4.6
2
2
8.8
2
2
5.9
2
2
8.3
3
1
17.8
3
1
15.6
3
1
17.8
3
1
16.8
3
1
22.4
3
2
7.6
3
2
9.1
3
2
7.9
3
2
8.1
3
2
10.2
proc print;
proc anova;
class ancho temp;
model hr=ancho temp ancho*temp;
means ancho temp ancho*temp/duncan;
run;
RESULTADO RESULTADO RESULTADO RESULTADO
Obs ancho temp hr 1 1 1 12.5 2 1 1 14.0 3 1 1 12.7 4 1 1 13.5 5 1 1 14.4 6 1 2 8.2 7 1 2 9.3 8 1 2 6.4 9 1 2 7.8 10 1 2 10.7 11 2 1 17.1 12 2 1 16.9 13 2 1 17.5 14 2 1 17.3 15 2 1 20.2 16 2 2 5.2 17 2 2 4.6 18 2 2 8.8 19 2 2 5.9 20 2 2 8.3 21 3 1 17.8 22 3 1 15.6 23 3 1 17.8 24 3 1 16.8 25 3 1 22.4 26 3 2 7.6 27 3 2 9.1 28 3 2 7.9 29 3 2 8.1 30 3 2 10.2 The ANOVA Procedure Class Level Information Class Levels Values ancho 3 1 2 3 temp 2 1 2