Manual de aplicación de los diseños experimentales básicos en el paquete NCSS

81  11 

Texto completo

(1)

U

niversidad

V

eracruzana

________________ ___________________________________________ L

FACULTAD DE E ST A D IST IC A E IN FO R M ATICA ESPECIALIZACIÓN EN M É T O D O S ESTADÍSTICOS

M A N U A L D E A P L IC A C IÓ N D E L O S D IS E Ñ O S E X P E R IM E N T A L E S B Á S IC O S E N E L

P A Q U E T E N C S S .

TRABAJO RECEPCIONAL

(P R A C T IC O E D U C A T IV O )

QUE COMO REQUISITO P A R C IA L P A R A O BTEN ER EL D IPLOM A DE ESTA E SP E C IA LIZA C IÓ N

PRESEN TA:

Mercedes\León Salazar

TUTOR:

L.E. JULIÁN FELIPE D ÍAZ CAM ACHO

(2)

El Comité Académico de la Especialización en Métodos Estadísticos y el Tutor de este trabajo recepcional, autorizan la impresión y la constitución del jurado para la defensa.

COMITÉ ACADÉMICO

ESPECIALIZACIÓN

M. C. C. Alma Rosa García Gaona DIRECTORA DE LA FACULTAD DE

(3)

D A T O S D EL A U T O R

(4)

G ENER ACIÓ N :2002 SEDE: Xalapa

TÍTU LO :

Manual de aplicación de los diseños experimentales básicos en el

paquete NCSS.

A U TO R :

Mercedes León Salazar TU TOR:

L.E. Julián Felipe Díaz Camacho TIPO DE T R A B A JO :

Reporte Monografía o TPE Desarrollo

RESUMEN:

En este trabajo se presenta una breve descripción de la aplicación del paquete NCSS en los diseños experimentales básicos, com o son: el diseño completamente al azar, bloques al azar y cuadrado latino. Así mismo se expone el tema de comparación múltiple de medias para cada unos de los diseños mencionados. En cada uno de los temas mencionados se presenta una breve descripción del diseño y se presenta un ejemplo manual acompañado de los resultados que nos proporciona el paquete NCSS. Realizándose encada caso las conclusiones pertinentes.

M E T O D O L O G ÍA ESTAD ÍSTIC A: a) Diseño

Muestreo Experimento

Estudio observacional

b) Análisis Exploratorio Descriptivo básico Inferencia Básica Métodos multivariados Regresión

A N O V A y M ANO V A Control de calidad Métodos no paramétricos Modelos especiales Técnicas avanzadas Series de tiempo

(5)

A G R A D E C IM IE N T O S

A DIOS:

Por que nunca me abandonaste y me diste la oportunidad de llegar hasta este momento.

A MI HIJO:

Por ser el tesoro más grande de mi vida y por hacerme muy feliz. Te quiero mucho Rolis.

A MIS PADRES:

Por haber creído en mi dándome la oportunidad de seguir adelante y por ese gran esfuerzo, dedicación y amor que me han brindado. Los quiero mucho.

A MIS HERMANAS:

Por que en las buenas y en las malas nunca nos abandonamos. Sigan adelante.

A MI NOVIO:

Por haberme acompañado en esta etapa de mi vida, por haberme motivado para seguir adelante y por tu cariño.

AL MAESTRO:

Julián Felipe Díaz Camacho por su incondicional dedicación y apoyo, por su gran y bonita amistad y por ser un gran maestro y amigo. Mil gracias.

A MIS AMIGOS:

(6)

C O N T E N I D O

Pag.

[INTRODUCCIÓN 1

II. PRINCIPIOS BÁSICOS DEL DISEÑO DE EXPERIMENTOS 3

1.1 Introducción 3

1.2 Elementos básicos de un diseño experimental 9

II. DISEÑOS COMPLETAMENTE AL AZAR (D.C.A.) 14 II. 1 Diseño Completamente al azar con igual número de

repeticiones. 14

11.1.1 Descripción 15

11.1.2 Análisis de varianza 16

II. 1.3 Ejemplo. 17

11.2 Diseños completamente al azar con desigual numero de

repeticiones 22

11.2.1 Descripción 22

11.2.2 Análisis de varianza 23

11.2.3 Ejemplo 24

[II. DISEÑOS DE BLOQUES COMPLETAMENTE AL AZAR (D.B.C.A.) 28

111.1 Descripción 28

111.2 Análisis de varianza 29

111.3 Ejemplo 31

IV. DISEÑOS CUADRADO LATINO (D.C.L.) 39

IV .l Descripción 39

IV.2 Análisis de varianza 40

IV. 3 Ejemplo 42

V. COMPARACIONES MÚLTIPLES (ANÁLISIS DE MEDIAS DE

TRATAMIENTOS) ' 48

V. I Diferencia mínima significativa (D.M.S.) 48 V .l .l Descripción para un D.C.A. con Igual número de 48

repeticiones por tratamiento

V.1.2 Ejemplo 50

V.2 Prueba de Tukey

(7)

V.2.2 Ejemplo 52

V.3 Prueba de Duncan

54

V.3.1 Descripción para un D.C.A. con igual número de repeticiones por

tratamiento.

54

V.3.2 Ejemplo

55

REFERENCIAS ANEXOS

Tabla 1. Distribución F 63

Tabla 2. Distribución t de Student 69

Tabla 3. Prueba de Tukey 70

(8)

INTRODUCCIÓN

En años recientes la computadora ha tenido un gran afecto en casi todos los aspectos de la vida. El campo de la estadística no es la excepción, en la estadística se emplean técnicas repetitivas: fórmulas utilizadas para calcular magnitudes estadísticas descriptivas, procedimientos para obtener representaciones gráficas de datos, métodos para formular inferencias estadísticas. La computadora es muy útil en la realización de tales operaciones repetitivas. Es muy común que alguien que necesite analizar un conjunto de datos busque la ayuda de otra persona que sepa emplear una computadora. Si en esa computadora esta instalado algún programa de análisis estadístico, será fácil llevar acabo los cálculos deseados mediante algunos de los programas (en paquetes) más conocidos, tales como: MINITAB, SYSTAT,tSTATA, STATISTICA, NCSS, SPSS Y SAS.

No obstante, los análisis estadísticos deseados serán fáciles de realizar si se tiene conocimiento de la operatividad del paquete que se pretende utilizar. En este sentido, y con el propósito de ilustrar el uso del paquete NCSS en una introducción a los Diseños Experimentales Básicos, se elabora el presente trabajo.

El presente trabajo esta compuesto de cinco capítulos. En el primer capítulo, se presentan los principios básicos del diseño de experimentos donde se mencionan los elementos más importantes que describen a los diseños experimentales. En el segundo capítulo se presenta el diseño completamente al azar con igual número de repeticiones y desigual número de repeticiones, estos diseños se presentan con una pequeña introducción cada uno, se da una descripción sobre el desarrollo y se ilustra mediante un ejemplo con su respectiva salida en el paquete NCSS. En el tercer capítulo se presenta el diseño de bloques completamente al azar co n la misma presentación del segundo capitulo. En el

(9)

cuarto capitulo se presenta el diseño cuadrado latino con igual desarrollo que los capítulos dos y tres. En el ultimo capítulo cinco se presenta el tema de comparación múltiple de medias. Entre ellas la diferencia mínima significativa, Tukey y Duncan. Estas pruebas se presentan con una pequeña descripción y desarrollo, se ilustran mediante la elaboración de ejemplos con sus respectivos resultados en el paquete NCSS. Finalmente se incluye un apéndice que contiene las tablas de la distribución F, t de Student, Tukey y Duncan, así como la bibliografía consultada para la realización del presente trabajo.

(10)

I. PRINCIPIOS BÁSICOS DEL DISEÑO DE EXPERIMENTOS

I .l Introducción

Antes de comenzar el experimento se debe especificar claramente el problema y las preguntas que la investigación debe contestar; es decir, lo que podría denominarse las “pruebas de interés” . Por otro lado, es necesario hacer una reflexión sobre los aspectos anteriores estructurándolos mediante una serie de preguntas cuyas respuestas ayudan a diseñar correctamente el experimento. Diversos autores han presentado su visión sobre este tema, de modo que un conjunto mínimo de ellas citan a continuación:

1. ¿Qué uariables(s) identifican el problema? Se debe decir cuantas y que variables definen el problema propuesto. En primer lugar, cuántas; es decir, si se trata de un problema de una o varias variables. Si, por ejemplo, se está haciendo una tipología de las mieles de una cierta región del estado de Veracruz en relación a su calidad, la variable “calidad” se identificará con varias variables, como color, humedad, acidez libre, presencia de azúcares, etc. En otro caso, podría definirse un caso univariado el resultado de un panel de degustadores. Si se está estudiando la gravedad de un ataque de hongos sobre una fruta, debe decidirse si se medirá el diámetro, área o el número total de lesiones mayores de un cierto grado.

(11)

establecer sobre el valor observado de un pocilio en una placa con objeto de hacerlo comparable a otros pocilios de otras placas. Si la variable es categórica, deben definirse sin ambigüedad el número y características de las clases; si es cuantitativa, las condiciones experimentales en las que se efectúa la medición, así como la precisión deseada.

3. ¿Qué factores influyen sobre la variable? Este es un punto fundamental dentro del proceso. En él, el experimentador debe hacer una lista lo más exhaustiva posible de todos y cada uno de los factores (causas) que pueden tener influencia sobre la variable (medición) que se va a estudiar. Posteriormente se clasificarán en los tres puntos siguientes.

a) ¿Cuáles de ellos son importantes e interesantes para la investigación? Esto es sencillo, pues es el objetivo de la investigación tal como se ha definido en la fase de concepción.

b ) . ¿Cuáles son importantes, pero no interesantes para la investigación? En este punto el investigador reconoce la existencia de una serie de causas que influyen de forma importante sobre la variable, pero en principio no está interesado en estudiarlas, pues no es un objetivo prioritario de su investigación, o no puede evaluarlas experimentalmente, o son demasiado costosas, etc.

c) ¿Cuáles no son importantes? Estos factores no están considerados en el diseño, pues se sabe que su influencia s pequeña. Sin embargo, es necesario reconocer que pueden representar un ruido de fondo relativamente importante que no permita detectar estadísticamente la influencia de los diferentes niveles de los factores definidos en a).

(12)

datos para que puedan ser considerados como una muestra representativa de la población bajo estudio.

6. ¿Cuántas veces y de que forma repetirá el experimento? Esta suele ser una pregunta muy repetida en la conversación investigador estadístico. Es necesario determinar el tamaño mínimo del experimento con objeto de que el diseño sea eficiente. Sin embargo, la contestación ansiada por el investigador no es siempre fácil. A esta pregunta contesta el estadístico, a su vez con una serie de preguntas: cuál es la variabilidad de los datos, que diferencia mínima se quiere detectar, conque probabilidad, cual es la comparación de mayor interés o más critica. Después de esa lluvia de preguntas, el investigador, queda descorazonado, pues a una sencilla y vital pregunta no le da una respuesta concreta a no ser que, a su vez, haya contestado de forma concreta a la que le han planteado a él. Si el investigador conoce las respuestas, el cálculo es sencillo. Si no dispone de respuestas, lo normal es llegar a un compromiso basado en el número máximo de unidades experimentales que es capaz de manejar de forma homogénea, siempre que el presupuesto del proyecto lo permita. Dentro de este apartado es oportuno hacer un par de matizaciones. Primero, cuando se está hablando de número de repeticiones puede interpretarse como 2 conceptos totalmente diferentes. Por un lado, se trata de repetir el conjunto del experimento varias veces: esta definición está unida al concepto de bloques o tandas. Por otro lado, tal como, lo entendemos aquí, se refiere a obtener más de una observación por unidad experimental igualmente tratada. La repetición permite interpretar las diferencias entre unidades tratadas de forma diferente al compararlas con la variación entre unidades igualmente tratadas. No debe confundirse esta interpretación con el hecho de tomar submuestras dentro de las unidades experimentales. Por ejemplo, si se está estudiando diversos factores que afectan la presencia de

(13)

microorganismos en el champiñón enlatado al repetir la determinación a base de tomar 2 muestras de un mismo bote, no debe considerarse como una repetición. La segunda matización se refiere a una llamada de atención para los experimentos que estén basados en mediciones expresadas en porcentajes. Supongamos que se está estudiando el porcentaje de botes que han resultado contaminados después de haber aplicado dos tratamientos distintos. Si se parte de 10 botes por tratamiento, un simple bote contaminado en más en menos en u tratamiento dado, se traduce en un salto de un 10% en el valor medido. Ello implica que el error de medida es como mínimo del 10%. En esta situación, cómo se puede pretender detectar diferencias pequeñas entre los tratamientos si partimos de un error intrínseco del 10%. Si se hubieran tomado, por ejemplo, 100 muestras por tratamiento, este error sería sólo del 1%.

7. ¿ Que trascendencia tendrán las conclusiones? De acuerdo con la importancia de rechazar la hipótesis nula cuando es cierta el investigador debe fijar el nivel de significación con que realizará las pruebas estadísticas. Esta decisión ha de ser previa a la adquisición de cualquier dato, no posterior a la vista de lo que más interese. Si por ejemplo, se está estudiando el nivel de contaminación de un alimento, uno debería tener una lata probabilidad de no equivocársela decir que no está contaminado, cuando sí que lo está, aunque casos de no-contaminación fueran diagnosticados como contaminados. En este supuesto habría que elegir un nivel de significación muy bajo (1 ó 0.1%). En otras situaciones experimentales interesa aumentar el nivel de significación al 10 ó 15% para protegerse contra el error de aceptar la hipótesis nula cuando es falsa.

(14)

8.

¿Cómo se tom arán los datos?

Aun que podría pensarse que la adquisición de los datos es una tarea sencilla y sin problemas, esto no es así. Debe tenerse en cuenta que los análisis estadísticos se realizan sobre datos y la presencia de una dato erróneo puede dar al traste con una buena realización del experimento. Hay que evitar el trasiego y copia de datos de un documento (cuaderno de campo) a otro. Deben diseñarse las hojas de adquisición de forma que inequívocamente identifiquen la unidad experimental que se esté registrando y que sea utilizada directamente para introducir los datos en el ordenador. Más aún, existen en el equipo de computo disponible.

El objetivo final de todo experimento es proporcionar el máximo de información sobre el problema estudiado. Sin embargo, esta información debe ser obtenida de una forma eficiente tanto practica como estadísticamente. Mediante un buen diseño se puede maximizar la cantidad de información con un mínimo uso de recursos. Una forma de mejorar la eficiencia es considerar el análisis de los datos incluso antes de haber sido obtenidos. Un conocimiento previo de qué se va a hacer con los resultados del experimento conducirá a evitar un diseño absurdo.

Una vez decidido el experimento se describirá en forma matemática mediante un modelo estadístico que dará lugar a un análisis de los datos. Tal como se ha indicado anteriormente, este análisis retroalimentará la fase de diseño para probar su eficiencia. Por tanto, existe una cadena fundamental problema-diseño- modelo-análisis-diseño. Por ello se ha de señalar el peligro que encierra la utilización “a ciegas” tanto de los diseños clásicamente descrito (bloques al azar, cuadrado latino, etc.) como de los programas enlatados de ordenador. Cada investigación trata de resolver un problema muy especifico, y tan especifico como

8

(15)

es el problema será sü diseño. Si el problema coincide en su estructura con alguno de los que originó un diseño clásico, debe usarse tal diseño, de lo contrario, no.

1.2 Elementos básicos de un diseño experimental

Las tres columnas básicas de los diseños experimentales son:

1. Repetición

2. Control de la variación 3. Aleatorización

4. Confusión

Este último surge de la consideración conjunta de los dos últimos.

A continuación se presenta brevemente una descripción de cada uno de ellos.

Repetición

Por repetición se entiende obtener más de una observación por combinación de tratamiento; es decir que la combinación de tratamientos más amplia se aplica a más de una unidad experimental. Otra forma de entender “repetición” es que se repite el experimento entero (en otro bloque, localidad, año, etc.), no es éste el enfoque de este apartado. Las razones por las que es recomendable la repetición son las siguientes:

(16)

1. Permite tener una estimación de la varianza del error experimental. Esta varianza actúa como unidad de medida de la variación no controlada con la que, en general, comparar la variación controlada por los factores del diseño. De todas formas, hay veces en que no es necesaria la repetición, sin embargo, esos casos implican un conocimiento previo del problema que se está estudiando.

2. Permite obtener estimaciones más precisas de las medias de los tratamientos y, por tanto, de las diferencias entre los tratamientos que es, en definitiva, el objetivo final del estudio. Recordemos que la varianza de una media esta dada por =0 p = o y /n por lo que cuanto mayor sea n, menor será Op.

3. Aunque ya se ha hecho hincapié en el error experimental al hablar de tipos de causas que influyen en una variable, sería conveniente aclarar más lo que implica el concepto de error experimental. Este error expresa el hecho que dos unidades igualmente tratadas (las dos han recibido la misma combinación de

c

tratamientos) no produzcan exactamente el mismo resultado. En el error experimental se incluye una serie de causas (que no necesariamente errores) entre la que se pueden citar:

a) Errores de medida b) Errores de observación c) Las causas tipo 3

d) Aquellas causas tipo 2 que se decidió actuar por aleatorización

e) El conjunto de causas que desconocemos que influyen sobre la variable y, por tanto, fueron incluidas en la lista inicial.

El error experimental se puede reducir de diferentes formas, siendo estas las siguientes

a) Usando material más homogéneo

(17)

b) Teniendo cuidado en la obtención de los datos

c) Utilizando un diseño más eficiente; por ejemplo empleando bloques para controlar la variación de unidades experimentales (fertilidad, inclinación de terreno, insolación, etc.)

d) Utilizando información de variables concomitantes. Por ejemplo, el rendimiento final de un cultivo puede estar influenciando por el porcentaje de nascencia.

Control de la variación

Representa el “diseño” del experimento en lo que se refiere a la localización, asignación y disposición especial de las unidades experimentales. En si representa las agrupaciones, bloques y el equilibrio del diseño.

Por agrupación se entiende la colocación de las unidades experimentales en grupos de modo que cada grupo de unidades recibe una combinación diferente de tratamientos. Por ejemplo, si se tienen 14 parcelas y queremos efectuar 4 tratamientos diferentes de herbicidas, efectuaremos cuatro lotes o grupos por sorteo de forma que dos tendrán tres parcelas y tros dos, cuatro parcelas; por sorteo se asignarán al primer lote un tipo de herbicida; al segundo, otro, y así sucesivamente.

Cuando se hacen bloques, se quiere indicar que se asignan las unidades experimentales a unos lotes o bloques de tal manera que dentro de cada bloque las condiciones experimentales son más homogéneas y la mayor parte de la variación de las unidades experimentales se encuentra en variación entre los bloques. Con ello, se reduce el error experimental, teniendo un diseño más eficiente. Supongamos, por ejemplo, que una industria farmacéutica esta estudiando la facilidad de asimilación y efecto de un cierto medicamento. El

(18)

experimento consistió en inyectar cuatro dosis diferentes del m ismo a unas ratas. Si se dispone de 12 ratas y se sabe que cuatro de ellas pertenecen a una camada; otras cuatro a otra, y otras cuatro a una tercera, sería natural efectuar tres bloques de cuatro rayas de modo que las camadas actuaran como bloques. Posteriormente, se asignarían al azar las dosis a las ratas dentro de cada bloque.

El equilibrio im plica que después de efectuar las agrupaciones y bloques, el esquema del diseño tiene una configuración compensada. El ejemplo de los herbicidas presentaba un diseño desequilibrado; por otro lado, el de las camadas era equilibrado con respecto a los bloques, si en cada bloque había las mismas cuatro dosis, era completamente equilibrado. En lo posible es recomendable un diseño equilibrado; sin embrago, con la disponibilidad de herramientas de cálculo, es cada vez menos preocupante el desequilibrio.

Aleatorización.

La suposición más importante para que las pruebas que hemos citado y se verán en próximos temas, sean validas es que las observaciones sean independientes. ¿Cómo podremos asegurar que las observaciones, y por tanto, los errores experimentales, sean independientes?. En general no se puede asegurar pues, como mínimo, comparten u mismo terreno, mano de obra, etc. Sin embargo, si se aleatoriza la toma de muestra y se asignan aleatoriamente los tratamientos a las unidades, las pruebas actúan como si la anterior suposición fuera cierta. No es que la aleatorización asegure la independencia sino que permite actuar como si lo fuera.

Hay casos que la total aleatorización del experimento no solo es imposible sino, además no recomendable. Los grave no es restringir la aleatorización si no

(19)

tenerla en cuenta en el análisis de los datos y en las conclusiones que se obtengan del análisis. Una gran parte de los diseños clásicamente empleados y ampliamente descritos en las publicaciones como los bloques al azar, parcela dividida “cross-over”, etc., tienen algún tipo de falta de aleatorización; incluso existen diversos diseños totalmente sistemáticos. Estos últimos, los análisis basados en la descomposición de la variación y la posterior prueba de significación mediante la distribución F, no son aplicables.

Confusión

Como consecuencia de las agrupaciones, bloques y aleatorización puede ocurrir que algún efecto clasificado con el diseño esté “fundido” o confundido con otra causa no diseñada que puede invalidar los resultados de los diseños. Por ejemplo si se está estudiando diversos tipos de cubierta de invernadero sobre el crecimiento de unas plantas y se utiliza un solo invernadero por cada tipo de cubierta, se estará confundiendo el efecto “cubierta” no solo con el efecto “invernadero” si no también con las circunstancias experimentales de ubicación, riego, etc.

Como consecuencia de las contestaciones obtenidas en las tres fases definidas anteriormente, se decidirá un diseño optimo que responda eficientemente a las preguntas intrínsecas al problema. El diseño se plasmara de acuerdo con unas normas que más adelante se explicaran, en un modelo matemático. Este modelo dictará de forma sencilla el proceso de análisis matemático a seguir. Este análisis servirá para cuestionar la eficiencia del diseño. Por lo tanto, se puede decir que: “Para cada problema un diseño, para cada diseño un modelo y para cada modelo un análisis”

(20)

II. DISEÑOS COMPLETAMENTE AL AZAR (D.C.A.)

Los tratamientos en un diseño completamente al azar son asignados aleatoriamente a las unidades experimentales y esto también se da en caso contrario. En la distribución de los tratamientos a las unidades experimentales, el diseño no pone restricciones. El diseño completamente al azar es ampliamente usado gracias a que es un diseño simple de realizar, su aplicasión se da cuando se estudian más tratamientos y su uso se limita a las siguientes situaciones:

> Donde las unidades experimentales son relativamente homogéneas, tal como laboratorios, invernaderos, etc.,

> En caso de que una parte del experimento se pierda y puede decirse que las unidades experimentales deben tener la misma capacidad de respuesta.

> Si se tiene un experimento pequeño y donde la mayor presición de otras distribuciones no compensan la perdida de grados de libertad del error.

En este diseño puede probarse cualquier número de tratamientos, pero no es obligatorio asignar el mismo número de de unidades experimentales a cada tratamiento, ya que puede ser un diseño con igual número de repeticiones o con desigual número de repeticiones.

Cabe aclarar que las fórmulas de la suma de cuadrados medios cambia para cada caso.

(21)

Es aquel diseño en el que el número de unidades experimentales por tratamiento es igual para todos los tratamientos, esto es en n¡ = n.

I I .l .l Descripción

El modelo lineal de un diseño completamente al azar esta dado por

Yij = p + x i + eij

para i = 1, 2, ...,t

j = 1, 2, ...,ni

donde

yij = Observación correspondiente a la j-ésim a unidad experimental que recibió el i-ésimo tratamiento

p = Media general

x i = Efecto del i-ésimo tratamiento eij = Error aleatorio

La hipótesis de interés en este diseño se plantea como:

H0: Tl= X2 =...= Tk

H l: Al menos uno de los tratamientos es diferente.

La aplicación de un D.C.A. requiere que se cumplan los siguientes supuestos:

S Normalidad S Independencia ✓ Homocedasticidad

(22)

En la Tabla 2.1 se presentan las fuentes de variación, los grados de libertad, la suma de cuadrados, el cuadrado medio y el estadístico de la distribución F para un análisis de varianza de un diseño completamente al azar con igual número de repeticiones.

I I .l .2 A n á lisis de v a ria n z a

Tabla 2.1. Análisis de varianza para un diseño completamente al azar.

F u en te de v a r ia c ió n

G ra d o s de lib e r ta d

Sum a d e c u a d r a d o s C u a d r a d o m e d io

Fc

Tratamientos t-1

SC Tra, = Z « . ( i 7,. - y - f i - l

C M t„,

C M e

Error N-t

s c , = i t ( y u - y , )

<=1 7=1

C M , = 5 C ‘ N - t

Total N -l ' / \2

SCTol

,=1 v=l

Regla de decisión:

Si Fc > FiTa hipótesis nula Ho se rechaza.

Para fines prácticos se recomiendan las fórmulas siguientes:

S C m = £ £ y , ; -¡= ' 7 = 1

(23)

donde

SC

°Wra( - J.T

¡-i «, N

se

error

= scri - se

Tot trat

,,

,

2 2

N = t , n , 1=1

fi X . ' V

í=\

FC =

y

■ ■ • t t y t

>•=1 2=1

II. 1.3 E je m p lo

E je m p lo 2.1 Considere el problema de un ingeniero, que desea comparar los efectos relativos de cuatro tratamientos respecto a la vida activa de un tipo particular de baterías térmicas. Suponga que se dispone para la experimentación de 20 baterías relativamente homogéneas obteniéndose los datos que se presentan en la Tabla 2.2.

Tabla 2.2 Tiempo de activado de veinte baterías térmicas. R e p e t ic io n e s T ra ta m ie n to s

1 2 3 4 T o ta l

1 73 • 74 68 71

. 2 73 74 69 71

3 73 74 69 72

4 75

/ 74 69 72

5 75 75 70 73

T o ta l 369 ' 371 345 359 1.444

BIBLIOTECA

UNIDAD ACADEMICA ECONOMIA

ESTADISTICA E INFORMATICA

ENE. 2003

(24)

Solución

Las hipótesis a probar son:

Ho = TI = T2 —X3 = t4 = 0

Hi = Al menos un ti * 0

Cálculo de la suma de cuadrados:

F = (144f ) - = 104256.8

c 20

SC„ = [(73)2 + (73 )2 +... + (73)2

j -

Fc = 95.2

5C,ra( = M 2 +(37l)2 + (345)2 + (359)2l ^ = g4 g

SCError = 9 5.2-84.8 = 10.4

Cálculo de los cuadrados medios:

CMrrat =— = 28.27

CMe = - ^ 1 = 43.29 £ .65

(25)

Tabla 2.3. Análisis de varianza del tiempo de activado de veinte baterías térmicas

Fuente De Grados de Suma de Cuadrado Fc F a

Variación libertad cuadrados medio

Variedades 3 84.8 28.27 43.49 3.24

Error 16 10.4 0.65 .65

total 19 95.2

Regla de decisión

Puesto que Fc = 43.49 > F.o5(3.i6) = 3.24, la hipótesis nula Ho se rechaza y se concluye que existe diferencia en el tiempo de activado en, por lo menos, una batería térmica con una significancia del 5%.

□ Solución con el paquete NCSS

En la Figura 2.1 se aprecia la forma como se crea la base de datos

(26)

El análisis de varianza de un diseño completamente al azar se obtiene ubicándonos en Análisis y seleccionamos G LM ANOVA, tal como se muestra en la Figura 2.2

Figura 2.2

(27)

En F a c to r s - 1 ubicándonos en Response Variable(s) se selecciona la variable respuesta y en Factor 1 Variable (A) la variable de los tratamientos.

En R ep o rte, como se muestra en la Figura 2.4, se puede seleccionar el tipo de prueba o estudio que se desea, en nuestro caso solo ANOVA

Figura 2.4

Damos Run y obtendremos los resultados que se presentan en la Tabla 2.4.

Tabla 2.4. Análisis de varianza del tiempo de activado de veinte baterías térmicas

Analysis of Variance Table

Source- Sum of Mean Prob Power

Term DF Squares Square F-Ratio Level (Alpha=0.Q5)

A (C2) 3 84.8 28.26667 43.49 0.000000*

S 16 10.4 0.65

Total (Adjusted) 19 95.2

Total 20

* Term significant at alpha = 0.05

(28)

Regla de decisión

La probabilidad level de 0.000000 indica que la hipótesis nula Ho se rechaza y se concluye que existe diferencia en el tiempo de activado en, por lo menos, una batería térmica con una significancia del 5%.

II. 2 Diseños completamente al azar con desigual número de repeticiones

1

En este diseño las n¡ unidades experimentales se sujetan al enésimo tratamiento (i = 1... t), es decir que el número de unidades experimentales por tratamiento no es el mismo.

II.2.1 Descripción

El modelo lineal de un diseño completamente al azar esta dado por:

para

Yij = [i. + x i + Cij

i = 1, 2,..., t

j = 1, 2,..., m

donde

yij = Observación correspondiente a la j-ésima unidad experimental que recibió el i-ésimo tratamiento.

p = Media general

(29)

La hipótesis de interés en este diseño se plantea como:

Hc>: T1= X2 =... = Xk

Hi: Al menos uno de los tratamientos es diferente.

En la aplicación de un D.C.A. es necesario que se cumplan los siguientes supuestos:

S Normalidad

S Independencia

S Homocedasticidad

II.2.2 A n á lisis d e v a ria n za

En la Tabla 2.9 se muestra la fuente de variación, los grados de libertad, la suma de cuadrados, el cuadrado medio y el estadístico de la distribución F para un análisis de varianza de un diseño completamente al azar con desigual número de repeticiones.

Tabla 2.5 Análisis de varianza para un diseño completamente al azar.

F u en te de v a r ia c ió n

G ra d o s de lib e rta d

S u m a d e c u a d ra d o s C u a d ra d o m e d io

Fe

Tratamientos t-1

SCTra, ~ y - f

i- 1 CA^ ' = 7 f f

C M Trat

C M e

Error N-t

s c e = H (y& - y i ) ,=i j=\

C M S = SCe

e N - t

Total N -l

SCTo, = É Z k - J 7,") (=1 j =1

(30)

Regla de decisión:

Si Fc > Ft por lo tanto la hipótesis nula Ho se rechaza

Para fines prácticos se recomiendan las fórmulas siguientes:

donde

S C „ = ± ± y , ' - y

s e

N

SCTm= t ^ - ^ r

m nt N

error ~ Tot ~ SC ¡rai

N = ' ¡ r n¡ i = 1

> v = ¿ y¡j

f c = N

¡ = 1

>- =

2

Z

y,

II.2.3 Ejemplo

Ejemplo 2.2 Se desea evaluar sí para una zona dada existen diferencias

(31)

Tabla 2.6 Crecimiento en altura de cinco variedades de plantas de Pinus

Montezumae.

Repeticiones Tratamientos

1 2 3 4 5 Total

1 8.4 12.3 4.3 8.2 5.1

2 7.6 15.2 5.6 10.1 7.2 3 8.2 10.6 4.7 10.4 6.7 4 10.8 11.7 4.9 12.6 6.5

5 12.5 6.1 9.8 6.3

6 15.6 5.2 11.7

Total 35 77.9 31.1 62.8 31.8 238.6

Solución

Las hipótesis a probar son:

Ho = T l = T2 = 1 3 = X4 = X5 = 0

Hi = Al menos un ti * 0

Cálculo de la suma de cuadrados:

Fr =

(238.ó)2 _

27

= 2108.52

S C „

= [ M ! + (7.6)2 +... + (6.3)! ] - F„ = 272.3

SC,„,

=

(35>2 '

, (31.8)’

- F

’ =229.59

S C Error =

272.3 - 229.59 == 42.71

BIBLIOTECA

UNIDAD ACADEMICA ECONOMIA| ESTADISTICA E INFORMATICA

(32)

Cálculo de los cuadrados medios:

CMTrat 229.59

4 57.39

CMe 42.71

22 1.94

Sustituyendo los cálculos antes realizados en la Tabla 2.5 obtenemos la Tabla 2.7

Tabla 2.7 Análisis de varianza para del crecimiento en altura de cinco variedades de plantas de Pinus Montezumae.______________________ ____________

Fuente De Grados de Suma de Cuadrado

Fc

F a Variación libertad cuadrados medio

Variedades 4 229.59 57.39 29.58 2.82

Error 22 42.71 1.94

total 26 272.30

Regla de decisión:

Puesto que Fc = 29.58 > F 0.05(4,22) = 2.82 la hipótesis nula Ho se rechaza y

concluimos que por lo menos existe una variedad de pino diferente a las demás, con una significancia del 5%.

(33)

El análisis de varianza y la captura de la base de datos de un diseño completamente al azar con desigual número de repeticiones se obtiene de manera similar a la de un diseño completamente al azar con igual número de repeticiones.

Los resultados obtenidos para el Ejemplo 2.2 se presentan en la Tabla

2

.

8

.

Tabla 2.8 Análisis de varianza para del crecimiento en altura de cinco variedades de plantas de Pinus Montezumae. _______ ________________________

Analysis o f

Variance Table

Source

Sum of

Mean

Prob

Power

Term

DF

Squares

Square

F-Ratio

Level

(Alpha=0.05)

A (VARIEDADES)

4

229.891

57.47274

29.81

0.000000*

1

S

22

42.412

1.927818

Total (Adjusted)

26

272.3029

Total

27

* Term significant

at alpha = 0.05

Regla de decisión:

El p-level de 0.000000 indica que Ho se rechaza y concluimos que por lo menos existe una variedad de pino diferente a las demás, con una significancia del 5%.

(34)

III. Diseño en bloques completamente al azar (D.B.C.A.)

Es el diseño experimental de mayor uso ya que tiene grandes ventajas si él número de tratamiento no excede de 15, se pueden agrupar las unidades experimentales en estratos o bloques uniformes logrando que la variabilidad de las unidades experimentales sea mínima a un que la variabilidad entre los estratos y bloques sea alta, en este diseño el número de unidades experimentales dentro de un bloque tiene que ser igual al número de tratamientos por investigar.

El diseño en bloques completamente al azar se usa en los casos siguientes:

> Cuando el número de tratamientos es de 3 a 15.

> Cuando el número de tratamientos es de 3 a 5, en cuyo caso deben tenerse como mínimas seis repeticiones para contar con suficientes grados de libertad del error experimental.

> Cuando se conoce el gradiente de la variabilidad, en cuyo caso los bloques deben orientarse perpendicularmente al gradiente y las unidades experimentales deben tener su mayor dimensión en la misma dirección y sentido que dicho gradiente.

III. 1 Descripción

El modelo lineal de un diseño en bloques completamente al azar esta dado por

(35)

para

i = 1, (tratamientos) j = 1, 2,..., b(bloques)

donde

yij = Es la observación o respuesta del i-ésimo tratamiento asociada al j-ésimo bloque.

p = Media general.

x i = Es el efecto del i-ésimo tratamiento. Bj = Efecto del j-ésimo bloque,

eij = Error aleatorio.

La hipótesis de interés en este diseño se plantea como:

H o • Ti= T2 =...= X x

H l: Al menos uno de los tratamientos es diferente.

III.2 Análisis de varianza

En la Tabla 3.1 apreciamos el análisis de varianza de un diseño de bloques completamente al azar, se presentan las fuentes de variación, los grados de libertad, la suma de cuadrados, el cuadrado medio y el estadístico de la distribución F con sus respectiva fórmulas.

(36)

Tabla 3.1. Análisis de uarianza para un diseño p or bloques completamente al azar Fuente de variación Grados de libertad

Suma de cuadrados Cuadrado medio

Fc

Tratamientos t-1

s ç „ , = b t l {ÿ r -ÿ -Y i-4

C A Í „ , = ^ ' CMTral CMc

Bloques b-1

5 Q , ^ = í ¿ ( p . j - r - ) 2 i-l

CMmoq CMe

Error (t-l)(b -l)

s c e = Y L f a - ÿ r - ÿ - j - ÿ - ) /=! 7=1

CM

-' ( < - # - ! )

Total tb-1

SC Tot

«=1 y=l

Regla de decisión:

Si Fc < Ft por lo tanto Ho no se rechaza

Para fines prácticos se recomiendan las fórmulas siguientes:

t b

s c lol = ' Z T . y , j 2 - F c

i=1 7=1

SCr r « = t r r - F c /-i b

b y . S C „ „ = t , ^ — F c

7-1

(37)

donde

* = I » .

y

I b

II J-

<=1 J=I V

I II .3 Ejemplo

Ejemplo 3.1 Una química desea probar el efecto que tienen cuatro agentes

químicos sobre la resistencia de un tipo particular de tela. Como puede haber variabilidad entre un rollo de tela y otro, decide utilizar un diseño aleatorizado por bloques, considerándolos rollos de telas como bloques. Ella selecciona 5 rollos y les aplica los cuatro agentes químicos en orden aleatorio. A continuación, se proporcionan los resultados de la resistencia a la tensión.

Tabla 3.2 Efecto que tienen cuatro agentes químicos sobre lá resistencia en cinco rollos de un tipo particular de tela._________________________ _______

T ra ta m ie n to s B lo q u e s T ota l M ed ia

A g e n te s q u ím ic o s Ì IÎ III IV V (T I) ( ñ

1 ( A ) 73 68 74 71 67 353 70.6

2 ( B ) 73 67 75 72 70 357 71.4

3 ( C ) 75 68 78 73 68 362 72.4

4 ( D ) 73 71 75 75 69 363 72.6

Total bloque (Tb) 294 274 302 291 274 1435 71.8

Media del bloque ( T ) 73.5 68.5 75.5 72.75 68.5

9

(38)

Solución

Las Hipótesis a probar son:

Ho = TI = t2 —X3 = X4 = 0 Hi = Al menos un n * 0

Cálculo de la suma de cuadrados:

= (1435) =1Q2961 3

c 20

SC,ot =

[(73)2

+

(73)2

+

...

+

(69)2

J- FC = 1

03

1

53

- 1

0296

1

.3

= 1

9

1

.7

S C ^ = (353

y

+ (357

y

+...+(363

)2

5 - F C = 102742 - 102961 . = 129

SCüloq ~ (294)2 + (274)2 +... + (2743Ó3)2

4 - F C = 103118.3 -102961.3 = 157

SCError = 191.7-12.9-157 = 21.8

Cálculo de los cuadrados medios:

12 9

CMTral = ^ = 4.3 CMBhg= - ^ - = 393157

CM = — = 1.82

(39)

Fc

4 3

F0(l) = — = 2.36

0(,) 1.82 F o ( b )

-39.3

1.82

21.6

Sustituyendo los cálculos obtenidos en la Tabla 3.1, se obtiene la Tabla 3.3.

T abla 3.3. A n á lis is d e va ria n za p a r a un d ise ñ o d e b lo q u e s c o m p le ta m e n te a l a z a r d e l efe c to q u e tien en c u a tro a g e n tes q u ím ic o s s o b r e la r e siste n c ia en c in co r o llo s d e un tip o p a r tic u la r d e tela._____________ ______________ ______________ ______________________

-F u e n te D e G ra d o s de Sum a d e C u a d ra d o Fc F a V a r ia c ió n lib e rta d c u a d ra d o s m e d io

Tratamientos 3 12.9 4.3 2.36 3.49

bloques 4 157 39.3 21.6

Error 12 21.8 1.82

total 19 191.7

Regla de decisión:

Ya que Fc = 21.6 > Fo.o5(3.i2) = 3.49, por lo tanto Ho se rechaza y concluimos que al menos uno de los tratamientos químicos son diferentes con un a = 0.05

□ Solución con el paquete NCSS

En la Figura 3.1 se aprecia la forma como se crea la base de datos.

BIBLIOTECA

UNIDAD ACADEMICA ECONOMIA - ■ 33

(40)

Figura 3.1

(41)

Al dar Run en MANOVA obtenemos la ventana que se presenta en la Figura 3.3.

Figura 3.3

En esta ventana, seleccionaremos nuestras variables, Respofase Variables nos indica seleccionar nuestra variable respuesta, en Factor Variable (A) nos pide nuestra variable factor 1, es decir, de los tratamientos y en Factor Variable (B) nuestra variable del segundo factor, es decir, de los bloques.

Donde aparece la opción Type hay que seleccionar Random, ya que al no seleccionarlo no aparecerán los valores de F-Ratio y Prob. Level

En la opción M od el, Write model in no se tomara en cuenta al igual que Custom model, solo en Which model seleccionamos Full model como se aprecia en la Figura 3.4

(42)

Figura 3.4

Posteriormente la opción R e p o r ts nos promociona una variedad de pruebas que se deseen realizar ver Figura 3.5.

(43)

Üna vez que se han seguido las indicaciones anteriores, damos Run y obtendremos los resultados de la Tabla 3.4

Otra manera de obtener un diseño de bloques completamente al azar es ubicándonos en Analysis e irnos a ANOVA y seleccionar Analysis o f Variance apareciendo la ventana que se presenta en la Figura 3.6.

Figura 3.6

Si seleccionamos en Type, Random en los tratamientos, y Randorn en los bloques del efecto que tienen los cuatro agentes químicos sobre la resistencia en cinco rollos de un tipo particular de tela, se obtienen los resultados que se presentan en la Tabla 3.4.

(44)

Tabla 3.4 Análisis de Varianza del efecto que tienen los cuatro agentes químicos sobre la resistencia en cinco rollos de un tipo particular de tela. _______

Analysis of Variance Table

for R E S IS T E N C IA

\

Source Sum of M ean Prob Power

Term D F Squares Square F-Ratio Level (Alpha=0.05)

A (A G E N T E .Q J 3 12.95 4 .3 1 6 6 6 7 2 .3 8 ^ 0 .37 1 72 4

B (ROLLOS)

J 4 157 3 9.2 5 21.61 o .o o o o g i* ) 0 .9 9 9 9 8 2

2 1 .8 ■ - 1.81 6 66 7

S C ^ o ~ 0

-Total (A d ju ste d ^ 19 191.75

Total 20

* Term significant at alpha =

0 .05

Regla de decisión: (

(45)

IV. DISEÑO CUADRADO LATINO (D.C.L.)

Este diseño tiene grandes aplicasiones en la industria y en la agricultura, es muy eficiente cuando el número de tratamientos está entre 4 y 10. Nos permite delimitar con segurirdad los efectos relativos de varios tratamientos, esto cuando se impone a las unidades experimentales una restricción de tipo doble bloqueo. Desde este punto de vista el diseño cuadrado latino es una extensión lógica del diseño en bloques al azar.

IV. 1 Descripción

El modelo lineal de un diseño en cuadrado latino esta dado por

yijk = p + ai + 6j + x ¡k +eijk

para

i = j = k = l , 2,...,t

donde

y^k = La respuesta al i-ésimo renglón, de la j-ésima columna del k-ésimo tratamiento,

p = Media general

cti = Efecto de i-ésimo renglón Bj =. Efecto de la j-ésim a columna

x i = Es el efecto del k-ésimo tratamiento, eijk = Error aleatorio.

(46)

La hipótesis de interés en este diseño se plantea como:

H0: x i= X2 = ...= Tik= 0 H l: x k ^ 0

IV.2 Análisis de varianza

%

En la Tabla 4.1 se presenta el análisis de varianza para un diseño cuadrado latino y nos muestra las fuentes de variación, grados de libertad, la suma de cuadrados, el cuadrado medio y el estadístico de la distribución F

Tabla 4.1 Análisis de varianza para un diseño cuadrado latino Fuente de

variación

Grados de libertad

Suma de cuadrados Cuadrado

medio

Fc

Hileras t-1

t h - y - ' f j

CMTrat

c m£

Columnas t-1

£ ¡ » - y J i

CMcot = SCco! C0‘ t - 1

Tratamiento t-1

i

CM _ SCtra¡ trat t - 1

Error (t-l)(t-2)

Z Z Z J V + 2*") i j k

CM

-K (t~ 1X/-2)

Total t2-l

(47)

Regla de decisión:

Si Fc > Ft por lo tanto Ho se rechaza

Para fines prácticos se recomiendan las fórmulas siguientes

Suma de cuadrados:

■ s c „ = ¿ t í y » ~ Fc

i j k t

S C e r r o r ~ S C tQt S C Mera

-scC

0

l-sctrat

donde

* = 2 > ,

1=1 í=i j=i y i

Cuadrados medios:

C M ulera~ S Ç iile ra s

t - 1 c " » ' = 7 r f

CM = -~ 'raI- tra' t - 1

CMc

(48)

CM

Trat

Fc =- CMr nos permite probar la hipótesis de igualdad de efectos de tratamientos.

IV .3 E jem p lo.

E je m p lo 4.1 Un experimentador quiere estudiar el efecto de cinco fórmulas diferentes de la mezcla de dinamita sobre la fuerza explosiva observada. Cada fórmula se prepara usando un lote de materia prima, lo suficientemente grande para que solo de hagan cinco mezclas. Más a un, las mezclas las preparan varios operadores, pudiendo existir una diferencia sustancial en habilidad y experiencia entre ellos. El diseño apropiado para este problema consiste en probar cada fórmula exactamente una vez, utilizando cada lote de materia prima, y en que cada fórmula sea preparada exactamente una vez por cada uno de cinco operadores.

Tabla 4.2. Efecto cTe cinco fórmulas diferentes de la mezcla de dinamita sobre la fuerza explosiva observada

/ L otes de m a te ria p rim a

(h ilera s)

O p e ra d o re s (co lu m n a s)

1 2 3 4 5

T o ta l d el tra ta m ie n to

(Tx)

\ ' A = 24 B = 20 C = 19 D = 24 E = 24 111

2

B = 17 C = 24 Ö i¡ 00 o E = 27 A = 36 134 ' 3'

■'A /' C = 18

0000

II

Q

E = 26 A = 27 B = 21 130 / 4 D = 26 E = 31 A = 26 B = 23 C = 31 128 ' .5' . E = 22

---1

> ii 00 o B = 20 C = 29 D = 31 132

T o ta l d e la h ile ra (Th)

(49)

Solución

Las Hipótesis a probar son:

Ho = XI = T2 =T3 = U = X5 = 0 Hi = Xk * 0 para al menos un k

Cálculo de la suma de cuadrados:

SC,„ = + (l 7 ) 2 + ... + (31)2 ] - FC = 1 6 8 0 5 - 1 6 1 2 9 = 67 6

s c u =

5Cco, =

(lll )2 + (134 ) 2 + ... + (132 )2 5

(107)2 +(143)2 +... + (l34)2

- FC = 16197 - 16129 = 68

- F C = 16279-16129 = 150

Tabla 4.3. Totales de los tratamientos.

Tratamientos Total de tratamientos A y.i. = 143 B y.2. =101,

C y.3. -112

D y .4=149

E y .5=130

SC., (l43)2 + (l 07 )2 +... + (l30)2

5 - F C = 16459 -16129 = 330 SCerror = 6 7 6 - 6 8 - 1 5 0 - 330 = 128

(50)

Cálculo de los cuadrados medios:

, . . . - 1 5 0 - V 7 <

CM ¡ - -3 7 .5

4

C M = — = 82.5

C M e = — = 10.7

e 12

82.5 Fe: 10.7

= 7.7

Sustituyendo los cálculos obtenidos en la Tabla 4.1 obtenemos los resultados de la Tabla 4.4

Tabla 4.4. Análisis de varianza del efecto de cinco fórmulas diferentes en cinco mezclas de dinamita sobre la fuerza explosiva observada.______________________

TABLA ANVA PARA UN D.C.L.

Fuente De Grados de Suma de Cuadrado Fe F a Variación libertad cuadrados medio

Lotes(hileras) 4 68 17 1.59 3.26

Operadores(coL) 4 150 37.5 3.5

Tratamientos 4 330 82.5 7.7

Error 12 128 10.7

total 24 676

Regla de decisión:

Como Fe = 7.7 > F 0.05 (4.12) = 3.26, la hipótesis nula Ho se rechaza y

(51)

En la Figura 4.1 podemos observar como crear la base de datospara un diseño cuadrado latino

□ Solución con el paquete NCSS

Una ves creada la base de datos, damos un click a Analysis y seleccionamos GLM ANOVA y veremos la ventana que se presenta en la Figura 4.2.

(52)

En la Figura 4.2 elegiremos nuestras variables, en Response Variable(s) seleccionamos la variable respuesta, en Factor 1 Variable (A) elegimos a los tratamientos, Factor 2 Variable(B) nos pide la variable columna, en nuestro caso OPERADORES y en Factor 3 Variable(C) la variable hileras en nuestro caso LOTES.

Si damos click en M od el, en Which Model Terms seleccionaremos la opción Custom Model y en Custom Model, abajo, daremos el modelo que se aprecia en la figura 4.3

Figura 4.3

(53)

Tabla 4.5 Análisis de varianza del efecto de cinco fórmulas diferentes en cinco mezclas de dinamita sobre la fuerza explosiva observada ________ ___________

R e s p o n s e F U E R Z A

A n a ly s is o f V a r ia n c e T a b le

S o u rc e S u m o f M e a n P r o b P o w e r

T e r m D F S q u a r e s S q u a r e F -R a tio L e v e l (A lp h a = 0 .0 5 )

A (FO RM ULA) 4 3 3 0 82.5 7.73 0 .0 0 2 5 3 7 * 0 .8 7 1 3 9 5

B (O PERAD O RES) 4 150 37.5 3.52 0 .0 4 0 3 7 3 * 1 0 .5 0 9 8 4 3

C (LOTES) 4 68 17 1.59 0 .2 3 9 0 5 9 0 .2 4 4 7 6 5

S 12 128

1 10.6 6 66 7

Total (Adjusted) 24 6 7 6

-Total 25

* Term significant at alpha = 0 .0 5

Regla de decisión:

Se concluye que con p-level = 0.002537* Ho se rechaza y podemos concluir que existe diferencia significativa entre la fuerza explosiva media en por lo menos una de las cinco fórmulas diferentes.

(54)

V. COMPARACIONES MÚLTIPLES. (ANÁLISIS DE MEDIAS

DE TRATAMIENTOS)

Cuando la prueba del ANOVA resulta significativa, es decir, que Ho: Los efectos de los tratamientos son iguales, no se acepta, quiere decir que se tienen medias iguales y diferentes, ya que se puede dar el caso que en una serie de tratamientos la prueba nos indique diferencias en el conjunto, pero igualdad en un par en particular.

Cuando Ho se rechaza y se utilizan varios tratamientos, es necesario realizar una comparación de las medias de los tratamientos para poder elegir el mejor de ellos.

Para identificar que tratamientos deben considerarse iguales o diferentes, se realizan pruebas de significancia de diferencias entre las medias de los tratamientos, para lo cual estudiaremos los métodos siguientes.

> Diferencia mínima significativa D.M.S. > Prueba de Tukey

> Prueba de Duncan

V .l Diferencia mínima significativa (D.M.S.)

(55)

Esta prueba es una alternativa de la prueba t de estudent, se aplica cuando las medias son independientes y las comparaciones son planeadas antes de ser examinados los datos, es adecuada para hacer comparaciones de tratamientos con un tratamiento estándar.

El número de comparaciones se obtiene aplicando la expresión aja - 1)

2

donde a es él número de tratamientos.

Suponga que interesa probar la siguiente hipótesis de medias de tratamientos por pareja:

Ho: = |ij Ha: pi ^ pj

para toda i í j ; i,j = 1,2,3,...t

La fórmula para calcular la D.M.S. esta dada por:

donde

D .M .S. 2 5 2 n

* t

a g.l. error

t = Es un valor de tablas. Se obtiene con el nivel de significancia y el número de grados de libertad del error.

S2 = Varianza o cuadrado medio de error experimental n = Número de repeticiones

(56)

La regla de decisión para este tipo de pruebas es la siguiente:

1. Sí IY¡ ~YJ/> DMS, las medias de los tratamientos son estadísticamente diferentes

2. Sí /Y¡-Yj / < DMS, las medias son estadísticamente iguales.

Si tenemos igual número de repeticiones por tratamiento aplicaremos la siguiente fórmula:

t g.l. error a / 2 * S d

donde

Sd = ^ S 2(l/n,. + 1 / « , ) = ^ S 2(ni + n J/nixnj )

Ejemplo 5.1 Realizar la comparación de medias para los datos del Ejemplo 2.1.

Solúción:

Del Ejemplo 2.1 se tienen los datos siguiente:

n — 5 G.L.error = 16 S 2error = 0.65 a = 4 t.05(i6) = 2 .120 (Tabla A2)

por lo tanto se obtiene que

D . M . S . ~ j * t a g.l. error = = 0 .5 0 9 9

(57)

D .M .S. = 0.599 * 2.120 = 1.081

El número de comparaciones que se tienen que realizar para los datos del ejemplo 5.1 resulta ser igual a

A continuación se presentan los resultados de las seis comparaciones para el presente ejemplo:

x 4 - x 3 = 71.8 - 6 9 = / 2.8 / > 1.081, entonces son estadísticamente diferentes x 4 - x 2 = 71.8 -7 4 .2 = /-2.4 / > 1.081, entonces son estadísticamente diferentes x 4 - x, = 71.8 - 73.8 = 1-21 > 1.08, entonces son estadísticamente diferentes x 3 - x 2 = 69 - 74.2 = /-5.2 / > 1.081, entonces son estadísticamente diferentes x 3 - = 69 - 73.8 = / -4.8 / > 1.081, entonces son estadísticamente diferentes x 2 - x¡ = 74.2 - 73.8 = /.4 / < 1.081, entonces son estadísticamente iguales

Conclusión:

Se concluye que las medias de los tratamientos 1 y 2 con respecto a la vida activa de un tipo particular de batería térmicas son estadísticamente iguales resultando ser diferentes en las comparaciones restantes.

V.2 Prueba de Tukey

V.2.1 Descripción para un D.C.A. con igual número de repeticiones por tratamiento

(58)

Para realizar todas las posibles comparaciones con a tratamientos se aplica la siguiente fórmula:

D = q S j = w ; w = q a ( P, m )S¿ donde

S2 = Varianza del error experimental, n = Número de repeticiones.

q = Valor de tablas que se busca con el número de tratamientos a = P y los grados de libertad del error experimental = n2 para un Q igual al nivel de significancia.

El número de comparaciones se obtiene aplicando la expresión a{a - 1)

2 '

donde con a es el número de tratamientos

La regla de decisión para este tipo de prueba es la siguiente:

1. Sí /Yl■ - Yj / > q.osS j, entonces la diferencia entre las medias es significativa

2. Sí /Y¡-Yj/> q.oiS j, entonces la diferencia entre las medias es altamente significativa

3. Sí /Y¡-Yj /< q.oi S j , entonces la diferencia entre las medias se consideran iguales y es estadísticamente no significativa

E je m p lo 5.2 Realizar la comparación de medias para los datos del Ejemplo 2.1

~~~ C1 5 ~~ ~

(59)

Solución

Del Ejemplo 2.1 se tienen los datos siguientes:

P = a = 4 n2= l 6 n = 5 S 2error = 0 . 6 5'error a = 0.05

X , = 73.8 A2= 7 4 .2 X 3= 6 9 X 4=71.8 qo.o5(4, i6) = 4.05 ( Tabla A3)

D = q Sjp= 4.05 * .361 = 1.46

El número de comparaciones que se tienen que realizar para los datos, del ejemplo 5.1 resulta ser igual a:

A continuación se presentan los resultados de las seis comparaciones para el preste ejemplo:

x 4 — x 3 = 71.8 - 69 = / 2.8 / > 1.46, entonces son estadísticamente diferentes x 4 - x 2 = 71.8 -7 4 .2 = /-2.4 / > 1.46, entonces son estadísticamente diferentes x 4 — x x = 71.8 - 73.8 = 1-21 > 1.46, entonces son estadísticamente diferentes J3 - J2 = 69 - 74.2 = /-5.2 / > 1.46, entonces son estadísticamente diferentes

* 3 — x { = 69 - 73.8 = / -4.8 / > 1.46, entonces son estadísticamente diferentes por tanto

2

2

(60)

x 2 - X\ = 74.2 - 73.8 = /.4 / < 1.46, entonces son estadísticamente iguales

tratamientos 1 y 2 respecto a la vida activa de un tipo particular de baterías térmicas y se detecta diferencia significativa en las comparaciones restantes.

V.3 Prueba de Duncan.

V.3.1 Descripción para un D.C.A. con igual número de repeticiones por tratamiento.

puede aplicarse aún cuando la prueba F no sea significativa. En su apliación se usa un valor t tabulado por Duncan para a = 0.05 y a = 0.01 y n2 grados de libertad del error experimental.

El procedimiento para este tipo de prueba es el siguiente:

1. Ordenar las medias de los tratamientos de manera ascendentes. 2. Calcular Sj por medio de

En conclusión no hay diferencia significativa entre las medias de los

La prueba de Duncan permite efectuar

donde

S2 = Cuadrado medio del error, n = Es el número repeticiones

(61)

= Es el error estándar de las medias

ta = t múltiple obtenida de las tablas de Duncan para a = 0.05 y a = 0.01, se obtiene con los grados de libertad del error = n2 y él número de tratamientos. 3. Se calcula el número de medias en la serie que separan a las dos medias que

se están comparando.

4. Calcular t múltiple (tablas) a = 0.05 y a = 0.01 5. Calcular L.S,. aplicando la fórmula siguiente

L.S. = t a ^

-6. Regla de decisión para este tipo de prueba es el siguiente:

1. Se consideran diferentes o significativas dos medias cuando su diferencia es mayor que el L.S. calculado.

2. Se consideran estadísticamente iguales o no significativas en caso contrario (N.S.)

Para el caso de desigual número de repeticiones por tratamientos se realiza lo siguientes: 1 2

1. Se calculan los valores de t múltiple (Tabla A4)

2. Se multiplican por S en lugar de para el tratamiento i con el j y finalmente por -J\/2{\/n¡ +1 /n j ) es decir:

L.S. = t a * S * V 1/2 (l/w i y )

E je m p lo 5.3 Realizar la comparación de medias para los datos del Ejemplo 2.1.

(62)

Del Ejemplo 2.1 se tienen los datos siguientes:

P = a = 4 n2 =g.l.= 16 n = 5 S2error = 0.65 a = 0.05

Siguiendo el procedimiento descrito se tiene que:

1. Ordenamiento de medias de los tratamientos de manera ascendente

Tratamientos 3 4 1 2

X 69.0 71.8 73.8 74.2

2. Se calcula S^ , resultando

3. Cálculo del número de medias en comparación

« M ) 4 (4 -1 )

2

2

Una vez que se tiene el número de comparaciones a realizar se procede a obtener el número de medias que se para a cada comparación. Para saber cuantas medias separan a la comparación 2 y 3, contamos, en la Tabla de las medias ordenas, el tratamiento 2, considerando este, hasta el tratamiento 3 el cual también se considera, dando como resultado 4 medias que las separan, de esta

(63)

forma obtenemos el número de medias que se paran a la siguiente comparación así sucesivamente obteniéndose los resultados que se presentan en la tabla siguiente:

C o m p a r a c ió n d e m e d ia s

N ú m e ro d e m e d ia s q u e la s sep a ra n

2 y 3 4

2 y 4 3

2 y 1 2

1 y 3 3

l y 4 2

4 y 3 2

4. Cálculo de los valores de t múltiple (Tabla A4)

t.o5(4,16) ( Tabla A4 ) = 3.23 t.05(3,16) (Tabla A4 ) = 3.15 t.05(2,16) (Tabla A4 ) = 3.00

5. Calculo de L.S.

L.S. = t a S ¿= 3.23 * .361 = 1.16 L.S. = t a S ¿= 3.15 * .361= 1.13 L.S. = t a = 3.0 * .361= 1.08

6. Para decidir en las comparaciones correspondientes se realizan los cálculos siguientes

BIBLIOTECA

UNIDAD ACADEMICA ECONOMIA

ESTADISTICA E INFORMATICA

2 4 EN

E. 2003

(64)

N ú m e r o d e m e d ia s

4 3 2

t m ú ltip le (ta b la s ) a = 0.05

3.23 3.15 3

L.S. e n tr e d o s m e d ia s

1.16 1.13 1.08

x 2 - x 3 = 74.2 - 6 9 = I 5.2 / > 1.16, entonces son estadísticamente diferentes x 2 - x 4 = 74.2 - 71.8 = / 2.4 / > 1.13, entonces son estadísticamente diferentes x 2 - x x = 74.2 -7 3 .8 = / 0.4 / < 1.08, entonces son estadísticamente iguales x { - x 3 = 73.8 - 69 = / 4.8 / > 1.13, entonces son estadísticamente diferentes J 1-Jé4 = 7 3 . 8 - 7 1 . 8 = / 2 / >1.08, entonces son estadísticamente diferentes x 4 - x 3 = 71.8 - 69 = / 2.8 / > 1.08, entonces son estadísticamente diferentes

En conclusión podemos decir que no hay diferencia significativa entre las medias de los tratamientos 1 y 2 respecto a la vida activa de un tipo particular de baterías térmicas y son estadísticamente diferentes las demás comp ar aciones.

□ S o lu c ió n c o n e l p a q u e te NCSS

En la Figura 5.1, se observa la base de datos del Ejemplo 2.1.

Figure

Actualización...

Referencias

Actualización...