• No se han encontrado resultados

UNIVERSIDAD NACIONAL DE CORDOBA

N/A
N/A
Protected

Academic year: 2021

Share "UNIVERSIDAD NACIONAL DE CORDOBA"

Copied!
35
0
0

Texto completo

(1)

UNIVERSIDAD NACIONAL DE CORDOBA

FACULTAD DE CIENCIAS EXACTAS, FISICAS Y NATURALES

DEPARTAMENTO DE MATEMATICA

BIOESTADÍSTICA II

GUIA DE TRABAJOS PRACTICOS

2016

(2)

2 Indice Programa analítico….………... 3 Reglamento interno….………..………... 4 Trabajos prácticos….………... 5 Trabajo práctico no 1.………... 5 Trabajo práctico no 2.………...………... 5 Trabajo práctico no 3.……….………..………….……... 9 Trabajo práctico no 4.………...….………... 11 Trabajo práctico no 5.………..………..………….……...… 13 Trabajo práctico no 6.………...……….……… 15 Trabajo práctico no 7.………..………..……… 17 Trabajo práctico no 8.……….……… 20 Trabajo práctico no 9.………..………..……… 21 Trabajo práctico no 10.………...……….……..….……… 22 Trabajo práctico no 11.………...……….……..……….………… 23 Trabajo práctico no 12.………..……….……..……… 25

Lineamientos del TRABAJO FINAL ……….………..………….………….. 25

Bibliografía ………..……….……..………….……….…. 26

Anexos ………...………..………. 27

Anexo 1: Descripcion Bases de datos ………..……… 27

(3)

PROGRAMA ANALITICO

Unidad 1. Conceptos básicos

La ciencia, construcción de teorías y modelos. Objetivos e hipótesis en la investigación biológica. Datos experimentales y observacionales. Preguntas biológicas. Conversión de Hipótesis en Hipótesis Estadísticas.

Hipótesis Nula y Alternativa. Predicciones. Supuestos estadísticos y biológicos. El diseño de experimentos. Principios: aleatorización, repetición, y control local. Unidad experimental u observacional. Factores y niveles del factor. Variable respuesta y variables independientes.

Unidad 2. Introducción

Estimación por intervalos para diferentes parámetros. Pruebas de Hipótesis. Errores. Pruebas para la media y la varianza poblacional. Pruebas para la diferencia de medias y el cociente de varianzas. Valor p.

Unidad 3. Diseño completamente aleatorizado a un factor

El modelo del Análisis de la varianza (Anova) a efectos fijos. Hipótesis. Supuestos. Suma de cuadrados, Cuadrados Medios, Esperanza y valor p. Contrastes, Comparaciones múltiples. Conclusiones.

Verificación del modelo: Supuestos. Transformaciones.

Análisis de la Varianza No Paramétrico: Test de Kruskal-Wallis. Unidad 4. Diseño aleatorizado a un factor con bloques

Las restricciones a la aleatorización. El efecto bloque como representante de un gradiente. Modelo, hipótesis, supuestos. Comparaciones múltiples. Conclusiones.

Análisis de la Varianza No Paramétrico con Bloques: Test de Friedman. Unidad 5. Diseños factoriales

Diseño a dos factores con interacción. Modelo, hipótesis, supuestos. Suma de cuadrados, Cuadrados Medios y Esperanza. Comparaciones múltiples.

Conclusiones. Modelos anidados.

Unidad 6. Diseño a efectos aleatorios y mixtos

Modelo. Hipótesis. Suma de cuadrados, Cuadrados Medios, Esperanza. Diseños que incluyen seudorréplicas.

Unidad 7. Regresión

Modelo de la regresión lineal simple. Método de los mínimos cuadrados. Hipótesis Supuestos. Verificación de los supuestos. Ajuste. R2. Regresiones múltiples. Conceptos. Hipótesis Supuestos. Verificación de los supuestos. Ajuste. R2.

Método de stepwise. Variables categóricas. Transformaciones. Introducción a Regresiones no lineales.

Unidad 8. Análisis de la Covarianza

(4)

4

Unidad 9. Análisis Multivariado de la Varianza

Modelo de Manova. Supuestos. Hipótesis. Lambda de Wilks. T2 de Hotelling. Conceptos de Análisis multivariado de la Covarianza (Mancova).

Unidad 10. Análisis Multivariados de Clasificación y Ordenación

Clasificación: Objetivos. Medidas de similitud y distancia. Dendrogramas. Ordenación: Objetivos. La combinación lineal de variables. Análisis de componentes principales (ACP). Biplot. Análisis de Correspondencia.

Unidad 11. Modelos Lineales Generalizados.

Modelos. Función de distribución. Variable dependiente. Predictor lineal. Variables independientes. Función de Enlace. Estimaciones por método de máxima verosimilitud.

REGLAMENTO INTERNO

El alumno que curse la Asignatura podrá optar por las siguientes condiciones: REGULAR

Para obtener la Regularidad en Bioestadística II deberá tener regularizada o aprobada Bioestadística I, asistir al 80 % de las clases (Teórico-prácticos) y obtener en cada una de las 3 evaluaciones parciales una nota mayor o igual a 40 % (nota 4). PROMOCIONADO

Para obtener la Promoción en Bioestadística II deberá tener regularizada

Bioestadística I, pero aprobada antes de la fecha de Examen, asistir al 80 % de las clases (Teórico-prácticos). Obtener en cada una de las 3 evaluaciones una nota mayor o igual a 40 % (nota 4) y como promedio una nota igual o mayor a 70 % (nota 7). Evaluaciones.

Las evaluaciones 1 y 2 consistirán de un examen teórico-práctico individual, a libro abierto, pero NO se permitirá el uso de fotocopias ilegales, sólo apuntes personales o libros.

La tercera evaluación es una exposición oral sobre un trabajo en grupo que será guiado por los Profesores. Este trabajo en grupo es una defensa oral de una publicación (en español o inglés) donde se presenten modelos estadísticos y

resultados obtenidos. La evaluación y calificación de este trabajo será individual y se evaluará tanto la presentación como la participación en el rol crítico de la audiencia. Existirá un recuperatorio para los parciales 1 ó 2.

Casos Particulares.

(5)

asignatura ó bien al correo electrónico: [email protected] TRABAJO PRÁCTICO Nº 1

MÉTODO CIENTÍFICO - CONCEPTOS BÁSICOS DE DISEÑO ESTADISTICO En un grupo de 2 a 4 integrantes, diagramar un problema de índole biológica, en el cual se deberá especificar correctamente:

a) problema, objetivos, hipótesis biológicas y estadísticas, b) población,

c) unidad estadística,

d) muestra y forma de obtenerla, e) variable/s de respuesta, f) variable/s independiente/s

g) forma de medir y analizar dichas variables, h) factores controlados y no controlados; i) supuestos biológicos y estadísticos.

TRABAJO PRÁCTICO Nº 2

A. DISEÑO AL AZAR SIMPLE A UN FACTOR. COMPARACIONES MÚLTIPLES

Ejercicio Nº 2.1: Elegir cuidadosamente sólo una de las cuatro opciones (A, B, C ó D), Buscar los datos en Anexos.

Ejercicio Nº 2.1A: En un estudio se desea investigar sobre la capacidad colonizadora de una especie vegetal introducida. Para ello se decide, a campo, contar el número de semillas en parcelas de un m2. Además se tomaron otras variables: Porcentaje de cobertura, Altura promedio de las plantas, Desmalezado el año anterior (No desmalezado, 50% ó 100%), Especie de árbol dominante (5 categorías), Exposición al sol (Ladera oriental, occidental o llano), Efecto riego (sin riego, una vez a la semana, dos veces a la semana). ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable desmalezado?

Ejercicio Nº 2.1B: En un estudio se desea investigar sobre la capacidad de un insecto homóptero para transformarse en una especie plaga debido a su abundancia. La capacidad que poseen las hembras de colocar huevos es una variable interesante para medir, por eso es que en un campo se colectaron hembras y se contabilizó el número de huevos viables colocados por cada una de ellas en 24 horas. Además se tomaron otras variables: Peso de la hembra, Longitud, Lugar donde fue colectada (Hoja, Pecíolo o Tallo principal), Zona del campo donde se realizó la colecta (N, S, E, W, Centro), Época de la colecta (Fecha 1, 2 ó 3), Tamaño de la planta donde se hallaba la hembra (<40 cm, 50 a 60 cm ó >80 cm). ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Lugar de la colecta? Ejercicio Nº 2.1C: En un estudio se desea investigar la capacidad de una promisoria especie vegetal de producir aceites esenciales. Se sembraron semillas en bandejas y

(6)

6

se las cultivó en cámaras de cultivo. Se obtuvo la concentración de aceites por bandeja. Además se tomaron otras variables: Biomasa por bandeja, Número de semillas germinadas, Fotoperiodo (12L/12O, 10L/14O ó 8L/16O), Concentración de salinidad (Control, 1, 2, 3 y 4), Posición en la cámara (Superior, Media o Inferior) y Condiciones de Riego (1, 2 y 3).

¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Fotoperiodo?

Ejercicio Nº 2.1D: El comportamiento de freezing en ratas es una de las maneras de evaluar el estrés. Para esto se colocan a ratas en cajas especiales y se controla durante 10 minutos el tiempo que éstas permanecen quietas (freezadas) en un ambiente desconocido para ellas. En estudios previos se demostró que en ratas sometidas a pequeñas dosis de alcohol y luego con una abstinencia de alcohol antes del experimento, se presentaba un mayor tiempo de freezing. Ahora se está queriendo probar si distintas concentraciones de una droga consiguen disminuir el estrés del período de abstinencia alcohólico. Se tomó el tiempo de freezing de cada rata. Además se tomó el peso de cada rata, la edad (en días), Alcohol en la dieta materna (No, Concentración A ó Concentración B), Concentración de alcohol inyectado en las ratas (0, 1, 2, 3 ó 4), Hora del día en que fue realizada la experiencia (Mañana, Siesta, Tarde) y Concentración de la droga antiestrés (A, B ó Control)

¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Alcohol en la dieta materna?

Ejercicio Nº 2.2: Supongamos que un investigador desea determinar la temperatura óptima de almacenamiento para la conservación de manzanas. La variable de respuesta es el número de manzanas podridas en cada cajón, para lo cual decide tomar 5 lotes como repeticiones y de cada uno seleccionar 180 manzanas que las divide en 6 grupos: 0°C 5°C 10°C 15°C 20°C 30°C 2 3 3 9 7 16 3 7 3 8 9 8 6 7 10 12 5 10 9 4 6 10 8 14 7 6 5 13 6 8

¿A qué temperatura es aconsejable el almacenamiento? (α = 0,05)

Ejercicio Nº 2.3: Un productor agropecuario desea saber qué técnica de cultivo conviene aplicar, para ello dispone de 3 de ellas y la variable elegida para evaluarlas es el rendimiento en qq/ha. Al lote lo divide en 15 parcelas, asignando los tratamientos al azar en cada una de ellas:

Técnica 1 Técnica 2 Técnica 3

23 30 28

20 32 36

22 29 31

(7)

21 33 34

¿Qué técnica le recomendaría al productor? Justifique su respuesta trabajando con un α = 0,05

Ejercicio Nº 2.4: Los siguientes datos muestran los resultados de un experimento sobre los efectos de aplicaciones de azufre (en 4 concentraciones diferentes) para reducir el ataque de un cierto virus:

Conc. A 13 12 14 12

Conc. B 7 8 7 6

Conc. C 12 13 14 12

Conc. D 9 10 11 8

Si la variable de respuesta es el número de manchas virósicas, ¿qué concentración recomendaría, con un nivel del significación del 5%?

Ejercicio Nº 2.5: Un experimento diseñado para comparar 3 métodos preventivos contra cierta enfermedad contagiosa arrojó los siguientes valores de fórmula leucocitaria:

Método A: 77 54 67 74 71 66

Método B: 60 41 59 65 62 64 52

Método C: 49 52 69 47 56

¿Son indiferentes los tres métodos para diagnosticar la enfermedad?

Ejercicio Nº 2.6: Las pruebas de Franklin se aplicaron para determinar las propiedades de ciertos compuestos químicos en 5 atmósferas diferentes. Se sometió a un compuesto a dichas pruebas, con los siguientes resultados:

Atmósfera I 0.58 0.61 0.69 0.79 0.61 0.59 0.37 Atmósfera II 0.37 0.4 0.58 0.4 0.28 0.44 0.35 Atmósfera III 0.29 0.19 0.26 0.17 0.29 0.16 Atmósfera IV 0.81 0.69 0.75 0.72 0.68 0.85 0.57 0.77 Atmósfera V 0.39 0.34 0.37 0.35 0.41 0.42

¿Pueden suponerse diferencias entre las atmósferas?

Ejercicio Nº 2.7: Los siguientes datos provienen de un estudio realizado para comparar los efectos de un insecticida sintético y de un insecticida natural sobre la población de cierto insecto en plantas de habichuela. Se aplicaron 3 tratamientos diferentes (1=control, 2=insecticida natural, 3=insecticida sintético) a 30 parcelas homógeneas plantadas con la misma variedad de habichuela. La asignación de los tratamientos a las parcelas se hizo según un diseño completamente aleatorizado con 10 repeticiones de cada tratamiento. Para evitar contagios, cada parcela se rodeó con un pasto no

(8)

8

susceptible al insecto. Las observaciones son los recuentos de insectos en un área de 1 m2 ubicada al azar en cada parcela. (Ejercicio_2-6.idb2)

A efectos de verificar los supuestos bajo distintas transformaciones, vamos a transformar cada observación Y en ln(Y+1) y en Y . (Las transformaciones se pueden hacer en forma muy sencilla en Infostat usando el menú Datos>Fórmulas). Si la variable recuento es la que tiene los recuentos, Ud. puede crear dos variables nuevas: en la ventana de la fórmula, escriba logrecuento=ln(recuento+1) o y raizrec=(recuento)ˆ0.5).

¿Cuál de las transformaciones le parece más apropiada?

Complete la siguiente informacion

Diagnóstico Recuentos ln(Recuentos+1)

Gráfico de Cajas ANOVA (prueba F) Q-Q Plot Shapiro-Wilks Residuos vs. Predichos Levene

B. ANÁLISIS DE VARIANZA No Paramétrico (de distribución libre) Prueba de KRUSKAL – WALLIS

Ejercicio Nº 2 .8: Se estudiaron los efectos de dos medicamentos sobre el tiempo de reacción de un cierto estímulo en tres grupos de animales experimentales. El grupo III sirvió de control, mientras que los animales del grupo I fueron tratados con el medicamento A y los del grupo II con el medicamento B, antes de la aplicación del estímulo. El tiempo de reacción (en seg.) de los animales fue:

Tiempo de reacción Rangos

Grupos Grupos I II III I II III 17 8 2 9 6.5 1 20 7 5 10 5 4 40 9 4 13 8 3 31 8 3 11 6.5 2 35 12

(9)

Rj = 55 26 10

Puede concluirse que los tres grupos difieren con respecto al tiempo de reacción? Estadístico de prueba:

H = 12 Σ R j 2- 3 (n + 1) Donde K = número de grupos

n(n +1) n j

nj = número de obs. del grupo

j n = número total de obs. Rj = total de rangos del grupo j

Cuando se tienen 3 grupos con 5 o menos obs. en cada uno, la significación del estadístico H se busca en la tabla para valore de K-W

Cuando hay más de 5 obs., la estadística H puede aproximarse a χ2 con (k-1)

gl.-Ejercicio Nº 2 .9: Una agencia publicitaria está investigando a qué tipo de avisos le prestan más atención los adolescentes. Se observan a 11 niños, a 6 se les muestra avisos sobre comida y a los 5 restantes se les muestra avisos sobre bebidas. Todos los avisos tienen duración similar. Se registra el tiempo de atención (en segundos) de los 11 niños.

TRABAJO PRÁCTICO Nº 3

DISEÑO AL AZAR SIMPLE A UN FACTOR: B: Test a priori

Ejercicio Nº 3.1A: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Especie de árbol dominante?¿ Hay diferencias entre los árboles autóctonos vs. Introducidos?

Ejercicio Nº 3.1B: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Zona del Campo donde se realizó la colecta? ¿Hay diferencias entre el centro y borde?

Ejercicio Nº 3.1C: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Concentración de Salinidad? ¿Hay diferencias significativas entre las concentraciones 1 y 2 de salinidad vs. el resto?

Ejercicio Nº 3.1D: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Concentración de Alcohol inyectado? ¿Hay diferencias entre las concentraciones 0 y 1 vs. el resto?

(10)

10

Ejercicio Nº 3.2: A 50 terneros se les administran diferentes dietas para engorde. Se divide el potrero en 5 parcelas y a cada una se asigna en forma aleatoria 10 terneros y la dieta correspondiente. Si se mide la diferencia en peso al mes (en Kg.) y los resultados

son:

A B C D E

Testigo Mineral Proteínas Energía Mezcla

28 31 52 27 55 31 30 50 35 45 25 26 38 30 38 23 34 43 36 33 17 24 45 39 44 25 28 36 43 40 22 31 40 45 52 30 35 48 38 42 18 38 55 39 37 21 40 45 42 35

¿Qué dieta recomienda, si interesa saber si éstas son mejores, y si es preferible puras o mixtas?

Ejercicio Nº 3.3: Se desea estudiar el comportamiento de un fertilizante de acuerdo al momento y tipo de aplicación. Se seleccionaron 30 parcelas homogéneas a las que se les adjudicó al azar un tratamiento

Los datos corresponden a rendimiento en Kg/Ha(Archivo Ejercicio_3-3.IDB2) y se desea saber si existen diferencias entre el tiempo y el método empleado.

Ejercicio Nº 3.4: Se está estudiando las ganancias en peso de ratas machos bajo 6 condiciones de alimentación. Los factores a analizar son:

A: nivel de proteínas a 2 niveles: alto y bajo;

B: fuente de la proteína a 3 niveles: carne vacuna, cereal y carne de cerdo. Para cada combinación de tratamientos se asignaron 10 ratas aleatoriamente y los resultados en las ganancias de peso fueron:

Proteína Alta Proteína Baja

Carne Cereal Carne de Carne Cereal Carne de

Vacuna Cerdo Vacuna Cerdo

73 98 94 90 107 49 102 74 79 76 95 82 118 56 96 90 97 73 104 111 98 64 80 86 81 95 102 86 98 81 107 88 102 51 74 97 100 82 108 72 74 106 87 77 91 90 67 70 117 86 120 95 89 61

(11)

111 92 105 78 58 82 Se desea saber

a. si existen diferencias significativas en los promedios de aumentos de peso, según el nivel de proteínas.

b. si existen diferencias significativas en los promedios de aumentos de peso, según el origen de las proteínas (animal o vegetal).

TRABAJO PRÁCTICO Nº 4

A. DISEÑO EN BLOQUES AL AZAR

Ejercicio Nº 4.1A: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Efecto riego, bloqueando por Exposición al sol? Ejercicio Nº 4.1B: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Tamaño de la planta, bloqueando por Época de la colecta?

Ejercicio Nº 4.1C: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Riego, bloqueando por la Posición en la Cámara? Ejercicio Nº 4.1D: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Concentración de Droga, bloqueando por la Hora de la Experiencia?

Ejercicio Nº 4.2: Para experimentar el efecto de una droga que genera resistencia a una enfermedad que aumenta el tiempo de coagulación sanguínea, se utilizaron 18 ratas. La experiencia consistió en asignar aleatoriamente ratas a tres tratamientos: Testigo, Tratamiento A (Dosis fuerte de la droga) ó Tratamiento B (Dosis débil de la droga). Es de destacar que la edad de las ratas produce mucha variabilidad en la variable respuesta, por lo que no se la debe ignorar. Los resultados se encuentran en el archivo Ejercicio_4-2.IDB2. Cree que hay diferencias significativas entre los tratamientos?

Ejercicio Nº 4.3

Se condujo un experimento para comparar los efectos de tres diferentes insecticidas en habichuela. Se usaron cuatro bloques, cada uno con 3 hileras (una hilera = una parcela = una unidad experimental) a una distancia adecuada. Cada hilera se plantó con 100 semillas y se mantuvo bajo uno de los tratamientos con insecticida. Los insecticidas se asignaron aleatoriamente a las hileras de forma tal que cada insecticida se aplicó a una hilera de cada bloque, como indicado en el siguiente diagrama. El diagrama incluye el número de plántulas emergidas en cada hilera (la variable de interés) entre paréntesis. Complete los datos en el archivo “Ejercicio_4-3.IDB2”.

(12)

12

Bloque 1 Bloque 2 Bloque 3 Bloque 4

Insect. A (56) Parcela 101 Insect. B (78) Parcela 201 Insect. A (65) Parcela 301 Insect. C (85) Parcela 401 Insect. C (80) Parcela 102 Insect. A (49) Parcela 202 Insect. B (94) Parcela 302 Insect. B (93) Parcela 402 Insect. B (84) Parcela 103 Insect. C (72) Parcela 203 Insect. C (83) Parcela 303 Insect. A (60) Parcela 403

En un DBCA, ¿se espera que el efecto de bloque sea significativo (o sea, que haya diferencias entre medias de bloques)? ¿Por qué o por qué no? Analice los datos como si fuera un DCA y compare estos resultados con los del ANOVA de un DBCA . Se puede utilizar la tabla abajo para comparar los resultados. ¿Qué desventaja tiene un DBCA si el efecto de bloques no es significativo?

Datos analizados como DBCA

GL en DBCA

Datos analizados como DCA GL en DCA SCtotal = SCtotal =

SCtrat = SCtrat =

SCerror = SCerror =

SCbloque = No aplica No aplica

SCerror + SCbloque = No aplica No aplica

Valor de Ftabular para probar

tratamientos en un DBCA= Valor de Fun DCA = tabular para probar tratamientos en

Ejercicio Nº 4.4 Se efectúa un experimento para estudiar el efecto de la hormona de

crecimiento en ratas jóvenes. Se prueba, en forma inyectable, una dosis baja, una dosis alta y un tercer tratamiento, que sería el testigo, consistente en la inyección de solución fisiológica. Se toman 6 camadas de ratas al azar, y al azar tambien se seleccionan tres animales de cada una. Se asignan los tratamientos al azar dentro de cada camada y al cabo de 15 días se mide el aumento de peso, en decigramos, con los siguientes resultados

(13)

B. ANÁLISIS DE VARIANZA No Paramétrico (de distribución libre) a un Factor con bloques. Prueba de FRIEDMAN

Ejercicio Nº 4.4: Se solicitó a nueve fisioterapeutas que clasificaran tres modelos de estimuladores eléctricos de bajo voltaje, en orden de preferencia (1=primera preferencia):

Rangos Asignados

Terapista Modelo A Modelo B Modelo C

1 2 3 1 2 2 3 1 3 2 3 1 4 1 3 2 5 3 2 1 6 1 2 3 7 2 3 1 8 1 3 2 9 1 3 2 Rj = 15 25 14

¿Hay uniformidad en la preferencia? I

Estadístico de prueba:

12

χ2 = nk (k +1) Σ (Rj)2 – 3n (k + 1) Donde K = número de tratamientos

n = número de bloques Rj = total de rangos del grupo j

A valore altos de k o n, la estadística χ2 puede aproximarse a χ2 con (k-1)

gl.-Ejercicio Nº 4.5. Supóngase que en 12 laboratorios se prueba la eficiencia de 4 tipos de sistemas para calefaccionar estufas. Cada laboratorio reportó la eficiencia en horas de cada sistema. Los datos se encuentran en el archivo “Ejercicio_4-5.IDB2”.

TRABAJO PRÁCTICO Nº 5

DISEÑO A DOS FACTORES

Ejercicio Nº 5.1A: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a las Variables Efecto riego y Desmalezado?

(14)

14

respuesta con respecto a la Variable Tamaño de la planta y Lugar de la Colecta?

Ejercicio Nº 5.1C: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Riego y Fotoperiodo?

Ejercicio Nº 5.1D: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Concentración de Droga y Alcohol en dieta materna?

Ejercicio Nº 5.2: Para un estudio sobre el arrastre de glucoproteínas en una cromatografía a distintos tiempos de centrifugado y con distintas cantidades de emoliente, se llevó a cabo una experiencia que arrojó los resultados que figuran en el archivo correspondiente.

¿Pueden las diferencias entre corridas de glucoproteínas deberse a diferencias en las concentraciones de emoliente o tiempos de centrifugado, o se deben al azar?

Ejercicio Nº 5.3: Se han tomado muestras de agua de canilla de 5 zonas diferentes y se analizaron según 3 organismos potabilizadores, buscando detectar la presencia de contaminantes. Los resultados (en ppm) fueron:

Lugar de Muestreo

A B C D E

1 23.8 7.6 15.4 10.6 4.2

2 19.2 6.8 13.2 22.5 3.9

Organismo 3 20.9 5.9 14 27.1 3

¿Existe alguna razón para creer que los organismos no son en sus mediciones, consistentes entre sí? ¿Difiere el agua de una zona a otra?

Ejercicio Nº 5.4: Los siguientes datos corresponden a medias de peso seco (en mg.) de tres genotipos de coleópteros Trilobium castaneum, criados a una densidad de 20 coleópteros por gramo de harina en cuatro medios diferentes.

¿Existe alguna relación entre el genotipo de los coleópteros, el medio y el peso de los mismos?

Ejercicio Nº 5.5: Un microbiólogo desea determinar la precisión de 4 tipos distintos de máquinas de conteo de colonias bacteriales. Para ello anota el número de colonias detectadas cada día de la semana (ya que es imposible más de una por día) en 20 cápsulas de Petri seleccionadas al azar:

¿Existen diferencias importantes entre cada una de las máquinas? Y entre los dias? Ejercicio Nº 5.6: Se ha medido la producción de ácido láctico en 6 estadios evolutivos de embriones de rana. Los embriones procedían de 4 nidadas diferentes. ¿Demuestra la medida de la variable (producción de ácido láctico) que es diferente en alguno de los 6 estadios?

(15)

toman la misma cantidad de agua en lugares con diferentes concentraciones de sal. Ejercicio Nº 5.8: Para estudiar el efecto de la dieta sobre la ganancia en peso de ratas, se seleccionaron al azar 60 ratas de laboratorio y cada una fue asignada, también en forma aleatoria, a una dieta (I, II y III y a un suplemento proteico (Suplemento y Testigo). Realice los análisis necesarios para determinar el efecto de la dieta y el suplemento sobre la ganancia en peso de las ratas.

Ejercicio Nº 5.9: Se realizó un experimento para estudiar los efectos de tres niveles de ácido sórbico (0, 100 y 200 ppm) y seis niveles de actividad de agua (AW) en la supervivencia de Salmonella typhimurium en placas Petri. Se usó un diseño en bloques completos utilizando una cámara de incubación para cada uno de tres bloques. Los datos que se muestran son el logaritmo de la densidad de la bacteria por ml, medida a los siete días del tratamiento (datos tomados de Mead, Curnow y Hasted (2003), Statistical Methods in Agriculture and Experimental Biology, 3ra. Ed., Chapman & Hall). Realice el análisis en Infostat. Use α=.05. Indique sus conclusiones claramente. Prepare gráficos que le permitan interpretar los resultados obtenidos.

TRABAJO PRÁCTICO Nº 6

DISEÑO A MAS DE DOS FACTORES: ARREGLO FACTORIAL A) Factores fijos

Ejercicio Nº 6.1A: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a las Variables Efecto riego, Desmalezado y Especie del Árbol Dominante?

Ejercicio Nº 6.1B: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Tamaño de la planta, Lugar de la Colecta y Zona de la Colecta?

Ejercicio Nº 6.1C: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Riego, Fotoperiodo y Salinidad?

Ejercicio Nº 6.1D: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Concentración de Droga, Alcohol en dieta materna y Alcohol inyectada a las ratas?

Ejercicio Nº 6.2: En un experimento sobre tiempos de intoxicación con cianuro debido a exceso de alimento en el estanque de cría de un foxino para comercialización, se han utilizado dos concentraciones diferentes de cianuro, dos de oxígeno y dos temperaturas diferentes. La variable de respuesta es el tiempo (en minutos) hasta la muerte por intoxicación del pez. Seleccione el tratamiento más conveniente. Justifique su respuesta a un nivel de significación del 5%.

Ejercicio Nº 6 .3: Se desea determinar el efecto de la temperatura en el consumo de oxígeno en cangrejos. Para ello se colectaron cangrejos de ambos sexos, de tres especies distintas y se registró consumo de oxígeno (O2/h) a tres temperaturas.

(16)

16

Fueron empleados para realizar la experiencia 36 individuos de cada sexo elegidos al azar.

Plantee el modelo y las hipótesis. En base a los resultados obtenidos explique para cada especie si existen diferencias entre sexos a temperatura baja. Si quisiera comparar todos los tratamientos posibles de a pares, ¿Cómo procedería? Realice este análisis con el InfoStat, explique los resultados y mencione la limitación del mismo.

B) Factores Aleatorios y mixtos

Ejercicio Nº 6.4: Con el objetivo de determinar si el tipo de un humedal (dos tipos: alimentado con agua de precipitación o con agua subterránea) influía sobre las tasas de producción de metano, se muestrearon tres humedales de cada tipo de agua (precipitación o agua subterránea). Estos tres humedales se eligieron aleatoriamente de un conjunto grande de humedales que tenían el tipo de agua deseada. En cada humedal seleccionado, se obtuvieron 3 muestras de suelo (en lugares aleatoriamente elegidos dentro de cada humedal). Estas muestras se transportaron al laboratorio y se incubaron a temperatura constante. Las tasas de producción de metano que se obtuvieron se encuentran en el archivo correspondiente

Ejercicio Nº 6.5 El Departamento de Transportación desea realizar un estudio para evaluar la erosión del suelo en áreas con pendiente cercanas a futuras autopistas. Entre las posibles especies a ser usadas, se tomó una muestra aleatoria de 6 especies vegetales nativas que podrían servir como coberturas (es decir que crecen en forma rastrera y podrían controlar la erosión). En un área con pendiente cercana a una futura autopista se dispusieron 36 parcelas. En el mes de enero se sembraron 12 de estas parcelas aleatoriamente escogidas (dos parcelas con cada especie), en el mes de mayo se sembraron otras 12 parcelas aleatoriamente escogidas (dos parcelas con cada especie), y finalmente en el mes de septiembre se sembraron las 12 restantes (dos con cada especie). Se midió el porcentaje de cobertura del suelo a los dos años de implantadas las parcelas.

(17)

Para cada una de las siguientes situaciones:

a. decida cuáles son los factores en estudio, y los niveles de cada uno. b. decida cuál es el diseño experimental usado.

c. decida si cada factor constituye un efecto fijo o aleatorio.

d. decida si los factores están anidados (diseño anidado) o cruzados (experimento

factorial).

e. realice un esquema de la tabla de ANOVA que incluya fuentes de variación, grados

de libertad y estadísticos F.

1. Con el objeto de comparar las tres marcas más comúnmente usadas de aceite para

automóvil, se tomaron 24 motores, 12 de cada uno de dos fabricantes (estos dos fabricantes son los dos que normalmente proveen este tipo de motores. Cada marca de aceite se usó en cuatro motores de cada fabricante (elegidos aleatoriamente) y luego de esto los motores se vaciaron y se hicieron funcionar sin aceite. Se registró el tiempo en que cada motor dejó de funcionar.

2. Una compañía farmacéutica desea examinar la potencia de un medicamento

líquido que se mezcla en tambores grandes antes de ser embotellado. Para ello se eligen aleatoriamente 4 plantas de producción, y en cada planta se escogen 5 tambores (también aleatoriamente). De cada tambor se analizan cuatro muestras aleatoriamente tomadas del líquido.

3. Después de realizar un cruzamiento de varias líneas de maíz, se desea evaluar la

variabilidad genética generada por estos cruzamientos. Para ello se seleccionan al azar 10 líneas (de las 250 disponibles) y se siembran de acuerdo a un diseño en bloques completos al azar con 4 repeticiones.

4. Se desea comparar la calidad de naranjas de tres variedades cosechadas en tres

épocas diferentes (20 de diciembre, 20 de enero y 20 de febrero) en una estación experimental. Para ello se analizan 10 naranjas de cada variedad tomadas aleatoriamente en cada una de las fechas y se determina la concentración de azúcar en cada una.

5. Se estudió el consumo de oxígeno de dos especies de ostras bajo distintos niveles

de concentración de agua de mar (50%, 75% y 100%). Para ello se usaron 24 piletas, que se llenaron con agua destilada y de mar en la concentración respectiva (8 con 50% de agua de mar, 8 con 75%, y 8 con 100%; seleccionadas aleatoriamente). Se colocaron ostras de la especie A en 12 piletas (cuatro con cada concentración, elegidas aleatoriamente), y ostras de la especie B en las otras 12 piletas. Se registró el consumo (l O2 / mg de peso corporal seco / min) a 22C.

TRABAJO PRÁCTICO Nº 7

REGRESIÓN SIMPLE

Ejercicio Nº 7.1A: ¿Cree Ud. que la variable respuesta presenta una dependencia con la Variable Porcentaje de Cobertura?

(18)

18

Ejercicio Nº 7.1B: ¿Cree Ud. que la variable respuesta presenta una dependencia con la con la Variable peso?

Ejercicio Nº 7.1C: ¿Cree Ud. que la variable respuesta presenta una dependencia con la con la Variable Biomasa por bandeja?

Ejercicio Nº 7.1D: ¿Cree Ud. que la variable respuesta presenta una dependencia con la con la Variable Peso?

Ejercicio Nº 7.2: Se condujo un experimento con el fin de estudiar el efecto de cierto medicamento en bajar la rapidez de los latidos del corazón en los adultos. Se obtuvieron los siguientes datos:

Dosis (mg) 0.5 0.75 1 1.25 1.5 1.75 2 2.25 2.5 2.75 3 3.25 3.5 Reducción

delatidos (lat./min.)

10 8 12 12 12 14 16 17 18 18 20 20 21

Obtener la ecuación de regresión y probar las hipótesis correspondientes.

Ejercicio Nº 7.3: Se sabe que la cantidad de bacterias (medidas por densidad óptica registrada por un espectofotómetro) de una disolución se relaciona con la concentración del ATB tetraciclina. A partir de los siguientes datos:

Disolución Dens. Ópt. [ ATB]

1 0.245 0.12

2 0.235 0.16

3 0.215 0.24

4 0.185 0.32

5 0.170 0.40

Estimar la concentración de ATB que correspondería a una densidad óptica de 0,225 y la de 0.32. Realizar los cálculos a través del método de los mínimos cuadrados.

Ejercicio Nº 7.4: Un botánico desea estudiar la forma de las hojas de una determinada especie y para ello utiliza las medidas de longitud y ancho (ambas en mm.) de una muestra de 16 plantas. Los resultados fueron:

Hoja Ancho Longitud Hoja Ancho Longitud

1 2.1 4.1 9 5.9 7.2 2 2.4 6 10 6.6 13.1 3 3.6 5.5 11 7.4 11.3 4 3.7 8.2 12 8.2 15.6 5 4.3 7.5 13 8.8 13.4 6 5.1 12.6 14 9 19

(19)

7 5.5 8.1 15 9.1 15.8

8 5.8 10.8 16 9.8 14.6

¿Cuál es el valor de la longitud esperada para hojas que miden 5 mm de ancho? ¿Cuál es el ancho esperado para hojas que miden 10 mm de longitud?

Ejercicio Nº 7.5: En el estudio de una población de Ceratium se estudia el comportamiento de las variables y = sen α y x = log X´; siendo α el ángulo formado por los ejes I y II y X´ la distancia entre el vértice y el surco. Determinar la recta de regresión. Ind Y X Ind Y X 1 0.83 0.23 25 0.69 0.49 2 0.5 0.88 26 0.8 0.25 3 0.35 0.97 27 0.66 0.65 4 0.65 0.49 28 0.74 0.37 5 0.65 0.46 29 0.82 0.14 6 0.65 0.6 30 0.76 0.46 7 0.72 0.49 31 0.67 0.41 8 0.67 0.47 32 0.57 0.6 9 0.54 0.71 33 0.61 0.51 10 0.64 0.53 34 0.55 0.7 11 0.7 0.44 35 0.65 0.49 12 0.78 0.27 36 0.64 0.6 13 0.5 0.72 37 0.52 0.81 14 0.37 0.99 38 0.7 0.54 15 0.88 0.32 39 0.7 0.51 16 0.58 0.68 40 0.73 0.17 17 0.73 0.55 41 0.66 0.6 18 0.68 0.57 42 0.5 0.8 19 0.72 0.51 43 1.76 0.6 20 0.68 0.53 44 0.64 0.57 21 0.69 0.64 45 0.43 0.75 22 0.69 0.67 46 0.84 0.25 23 0.66 0.49 47 0.95 0.07 24 0.43 0.85 48 0.73 0.5 49 0.82 0.39

Ejercicio Nº 7.6: Los siguientes datos corresponden al tiempo de secado de cierto esmalte y la cantidad de aditivo con que se intenta reducir el tiempo de secado:

Cantidad de aditivos (gr) Tiempo de secado (horas)

(20)

20 1 10.5 2 10 3 8 4 7 5 8 6 7.5 7 8.5 8 9

Ajuste una función polinómica de segundo grado que le permita predecir el tiempo de secado del esmalte cuando se han utilizado 6.5 gr de aditivo.

Ejercicio Nº 7.7: En un estudio sobre el comportamiento de un picaflor, se registró el tiempo transcurrido en un vuelo y la altura máxima que logra durante el mismo; para esto se filmó diferentes aves durante su vuelo y de la filmación se logró determinar el tiempo de vuelo y la altura (en cm.) desde el suelo, según se detalla a continuación:

Tiempo Altura Tiempo Altura

0 0 6 391 1 140 7 325 2 265 8 250 3 350 9 151 4 383 10 5 5 412

Describir la relación entre las variables. TRABAJO PRÁCTICO Nº 8

REGRESIÓN MULTIPLE

Ejercicio Nº 8.1: Se quiere predecir la Biomasa total de una producción en función de variables ambientales del suelo. Entonces se miden en 45 diferentes parcelas: Biomasa, pH, Zinc, Potasio y Salinidad.

Los datos son los siguientes:

# Biomasa pH Salinidad Zinc Potasio # Biomasa pH Salinidad Zinc Potasio

1 765,28 5 33 16,45 1441,67 10 664,6 3 31 23 552,39 2 954,02 4,7 35 13,99 1299,19 11 502,47 3 31 25 661,32 3 827,69 4,2 32 15,33 1154,27 12 496,8 3 35 23 672,12 4 755,07 4,4 30 17,31 1045,15 13 2270,29 7 29 0,4 525,65 5 896,18 5,55 33 22,33 521,62 14 2332,22 7 35 0,3 563,13 6 1422,84 5,5 33 12,28 1273,02 15 2162,53 7 35 0,3 497,96 7 821,07 4,25 36 17,82 1346,35 16 2222,59 7 30 0,3 458,38 8 1008,8 4,45 30 14,35 1253,88 17 2337,33 7 30 0,2 498,25 9 1306,49 4,75 38 13,68 1242,65 18 1349,19 5 26 19 936,26 19 1039,64 4,6 30 11,76 1282,95 32 1058,98 5 29 21 894,79 20 1193,22 4,1 30 9,88 553,69 33 1408,21 5 25 24 941,36 21 777,47 3,45 37 16,68 494,74 34 1491,28 5 26 20 1038,8 22 818,13 3,45 33 12,37 526,97 35 1254,87 5 26 21 898,05 23 1203,57 4,1 36 9,41 571,14 36 1152,34 5 25 24 989,87

(21)

24 977,51 3,5 30 14,93 408,64 37 568,46 4 26 31 951,28 25 369,82 3,25 30 31,29 646,65 38 612,45 4 26 27 929,83 26 509,87 3,25 27 30,17 514,03 39 654,83 4 27 28 925,42 27 448,31 3,2 29 28,59 350,73 40 991,83 4 27 22 954,11 28 615,09 3,35 34 17,88 496,29 41 1895,94 6 24 20 720,72 29 545,54 3,3 36 18,51 580,92 42 1346,88 5 27 20 782,09 30 436,55 3,25 30 22,13 535,82 43 1482,79 6 26 20 773,3 31 465,91 3,25 28 28,61 490,34 44 1145,64 6 28 20 829,26 45 1137,19 5 28 19 856,96

Ejercicio Nº 8.2 Los zorros que habitan ambientes urbanos, viven en grupos sociales que defienden un territorio, dentro del cual buscan su alimento (que incluye basura doméstica, larvas y lombrices). Un investigador quiere evaluar los factores que afectan la supervivencia invernal de zorros (determinada por el peso de los zorros adultos) que habitan este tipo de ambiente. Para ello, estudió a 30 "grupos sociales" de zorros, durante un período de tres años, registrando las siguientes variables en cada uno de los 30 grupos estudiados: 1) el número de zorros por grupo, 2) el peso promedio de los zorros adultos del grupo, 3) el área del territorio, y 4) una estimación de la abundancia de alimento en el territorio [ ejemplo a partir de Grafen & Hails 2002].

TRABAJO PRÁCTICO Nº 9

ANALISIS DE LA COVARIANZA

Ejercicio Nº 9.1A: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Especie de árbol dominante, descontado el efecto de la Altura promedio de las plantas?

Ejercicio Nº 9.1B: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Zona del Campo donde se realizó la colecta, descontando el efecto de la Longitud del insecto?

Ejercicio Nº 9.1C: ¿Cree Ud. que existen diferencias significativas en la variable respuesta con respecto a la Variable Concentración de Salinidad, descontando el efecto del número de semillas germinadas?

Ejercicio Nº 9.1D: ¿Cree Ud. Que cambia la variable respuesta con respecto a la Variable el efecto de la edad de las ratas? existen diferencias significativas en la variable Concentración de Alcohol inyectado, descontando el efecto covariable?

Ejercicio Nº 9.2: Con el fin de comparar el incremento del diámetro a la altura del pecho (DAP) en un período de 5 años para tres especies de algarrobo, se realizó un estudio observacional sobre un total de 39 árboles, seleccionados al azar de un monte en el que estaban representadas las especies P. nigra, P. flexuosa y P. chilensis. Además se contó el número de individuos de algarrobos (sin distinción de especie) que crecían en un radio de 15 metros (vecinos). Los resultados fueron:

(22)

22

P. flexuosa P. chilensis P. nigra

incremento vecinos incremento vecinos incremento vecinos

14,53 3 14,11 3 32,65 0 25,03 1 3,51 5 17,08 3 14,88 3 19,52 2 11,43 4 5,96 5 4,92 5 16,57 3 20,38 2 14,97 3 12,98 4 14,76 3 20,88 2 24,07 2 23,72 1 6,01 5 26,91 1 14,66 3 10,32 4 16,74 3 10,72 4 11,97 4 14,86 3 7,71 5 19,36 2 23,72 2 14,85 3 7,88 5

Considera que el incremento del tamaño de las tres especies difiere significativamente?

Ejercicio Nº 9.3: Se quiere establecer si existen diferencias significativas en el volumen del alimento entre machos y hembras de la especie G. chilensis, pero es necesario tener en cuenta el tamaño de cada individuo. Se capturaron 17 individuos de ambos sexos, se les obligó a regurgitar su contenido estomacal, se los sexó y midió. Los resultados se encuentran en el archivo correspondiente

TRABAJO PRÁCTICO Nº 10.

ANALISIS MULTIVARIADO DE LA VARIANZA (MANOVA)

Ejercicio Nº 10.1: El siguiente ejercicio plantea encontrar diferencias entre tres tratamientos a los que son sometidas ratas. La idea es saber si difieren los

tratamientos en función del número de veces que se repiten 3 comportamientos (3 variables). Se destaca que se utilizaron 4 ratas en cada tratamiento.

Tratamiento Comport 1 Comport 2 Comport 3

1 23 11 78 1 36 12 76 1 54 24 65 1 65 35 56 2 43 30 65 2 48 33 56 2 59 46 54 2 70 76 43 3 22 21 22 3 24 14 27 3 24 11 22 3 26 13 15

(23)

Ejercicio Nº 10.2:

Se desea saber si son significativamente diferentes las 3 especies de Lirio, en función de las 4 variables.

Especie largoSepalo anchoSepalo largoPetaloanchoPetalo

1 5,1 3,5 1,4 0,2 1 4,9 3 1,4 0,2 1 4,7 3,2 1,3 0,2 1 4,6 3,1 1,5 0,2 1 5 3,6 1,4 0,2 1 5,4 3,9 1,7 0,4 1 4,6 3,4 1,4 0,3 1 5 3,4 1,5 0,2 …. …. ….. ….. ….. 3 6,2 3,4 5,4 2,3 3 5,9 3 5,1 1,8 TRABAJO PRÁCTICO Nº 11.

ANALISIS MULTIVARIADOS DE CLASIFICACION Y ORDENACIÓN Ejercicio Nº 11.1: El siguiente ejercicio plantea la siguiente situación. Un

investigador visita 7 sitios y en cada uno de ellos coteja si se encontraban o no 9 especies vegetales. ¿Puede clasificar a los sitios mediante el análisis de

conglomerados? Utilice una distancia simple matching y ligamiento promedio como método de unión.

sitios sp1 sp2 sp3 sp4 sp5 sp6 sp7 Sp8 Sp9 A 1 1 1 1 0 1 0 0 1 B 1 1 1 0 1 1 0 1 0 C 1 1 0 1 1 0 1 0 0 D 1 0 1 1 1 0 1 0 0 E 1 0 0 1 1 0 1 1 1 F 0 0 0 1 1 1 1 1 1 G 0 0 0 1 1 1 1 1 1

Ejercicio Nº 11.2: En 10 parcelas se realizaron análisis de suelos, tomando 6 variables. ¿Podría establecer la similitud entre las parcelas mediante un Análisis de

componentes principales?. Además observe las correlaciones entre variables y si alguna variable se asocia a algún sitio

(24)

24 1 22 2 350 0,10 7,0 0,6 2 34 3 480 0,30 7,4 0,9 3 38 4 560 0,40 7,9 1,0 4 55 5 570 0,43 8,5 2,3 5 80 7 680 0,23 8,3 1,5 6 56 5 570 0,12 18,0 1,2 7 32 3 453 0,32 8,5 0,2 8 13 2 130 0,22 8,8 1,1 9 35 4 300 0,29 7,8 2,0 10 56 5 500 0,27 8,7 0,7

Ejercicio Nº 11.3. El archivo plantea el consumo de proteína per cápita en países Europeos. ¿Podría UD definir países similares en función del consumo de proteínas?

País CarneVacuna CarneCerdo ‐‐‐‐‐‐‐‐‐‐ FrutosSecos Frutas yVegetales

Albania 10,1 1,4 ‐‐‐‐‐‐‐‐‐‐ 5,5 1,7 Austria 8,9 14 ‐‐‐‐‐‐‐‐‐‐ 1,3 4,3 Bélgica 13,5 9,3 ‐‐‐‐‐‐‐‐‐‐ 2,1 4 Bulgaria 7,8 6 ‐‐‐‐‐‐‐‐‐‐ 3,7 4,2 ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐ AlemaniaO 11,4 12,5 ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐ Yugoslavia 4,4 5 ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐‐‐‐

Ejercicio Nº 11.4: El siguiente ejercicio plantea la siguiente situación: Un grupo de investigadores eligió 10 lugares (sitios) de muestreo. Concurrieron a los lugares y en cada uno de ellos se realizó el mismo esfuerzo de búsqueda sobre una comunidad de insectos acuáticos. Fueron encontradas 8 especies de insectos. Las preguntas son: ¿algunos de los insectos estará asociado a algunos de los sitios?, ¿habrá “gradientes” de sitios?, ¿se formarán grupos de especies de insectos en función de sus similitudes de composición en los sitios? Realice un análisis de correspondencia a los fines de intentar contestar esas preguntas.

Sitio sp1 sp2 sp3 sp4 sp5 sp6 sp7 sp8 Total A 1 6 6 166 6 5 2 6 198 B 4 3 7 134 45 4 4 7 208 C 6 4 23 256 34 6 6 5 340 D 3 3 34 3456 65 5 7 4 3577 E 8 8 54 342 8 23 9 5 457 F 6 6 3 543 98 24 8 4 692 G 7 3 2 456 76 34 6 78 662 H 9 2 4 34 12 54 5 98 218 I 10 1 12 22 13 89 0 6 153 J 8 1 14 34 13 98 0 7 175 Total 62 37 159 5443 370 342 47 220 6680

(25)

TRABAJO PRÁCTICO Nº 12.

MODELOS LINEALES GENERALIZADOS

Ejercicio Nº 12.1. Un grupo de investigadores desea probar si la aplicación de dosis de insecticidas influirá sobre la mortalidad de insectos. Se colocaron 30 individuos en cada cápsula de Petri, con 10 cápsulas en cada tratamiento y con 4 niveles del factor Insecticida (Trat 1 control y el resto 3 dosis) . Los datos figuran en el archivo Ejercico12-1. Se observa una variable con distribución Poisson y sería necesaria una función de enlace Log.

Ejercicio Nº 12.2. El archivo Ejercicio12-2 presenta una base de datos de enfermos de

cáncer de pulmón donde se consigna la Edad al momento de la detección, Pérdida de peso inicial (PPI), medida del estado general del paciente (PSPI) y como respuesta mortalidad (1: muerto; 0: vivo). Se observa una variable con distribución Binomial y sería necesaria una función de enlace Logit.

Ejercicio Nº 12.3

El archivo Ejercicio12-3 presenta una base de datos donde a 160 parcelas se las sometió a un factor (tipo de protección al cultivo), se tomó una covariable en 8 períodos de tiempo y la variable respuesta es el número de plantas enfermas. Se observa una variable con distribución Poisson y sería necesaria una función de enlace Log.

Lineamientos de las EVALUACIONES 1 y 2

Las evaluaciones 1 y 2 consistirán de un examen teórico-práctico individual, a libro abierto, pero no se permitirá el uso de fotocopias ilegales, sólo apuntes personales o libros. Consistirá de 4 preguntas con diferentes modelos. La equivocación en el modelo estadístico implicará un error grave y significará la no aprobación del parcial

Lineamientos del TRABAJO FINAL

En grupos de 2 a 4 integrantes, deberá seleccionar una PUBLICACION CIENTIFICA exclusivamente de los años 2015 ó 2016 que posea el desarrollo de al menos un modelo estadístico.

Se presentará por escrito y de manera oral se definirá:

• Título

• Planteo del problema • Objetivos

(26)

26

• Hipótesis • Población

• Muestra (definición, tamaño, forma de obtenerla, etc.) • Unidad estadística

• Variable de Respuesta (definición, medición) • Factor / es - Niveles del Factor

• Repeticiones (si existiera)

• Análisis de datos correspondientes (razones, supuestos, etc.)

• Resultados • Bibliografía

Dicha evaluación del Trabajo deberá ser entregado por escrito y expuesto por el grupo. Tanto de la exposición como de la presentación por escrito se evaluarán los siguientes ítems (en forma grupal e individual):

a) Exposición oral (tiempo, claridad, coordinación, medios, oratoria) b) Puntualidad (en entrega y en exposición)

c) Coherencia interna (título / planteo del problema / objetivos / hipótesis / verificación / resultados / conclusiones)

d) Aportes del resto de los compañeros y solvencia en las respuestas

BIBLIOGRAFÍA:

Armitage, P. y G. Berry. 1997. Estadística para la Investigación Biomédica. Harcourt Brace. 593 pp. Crawley, Michael. 1993. GLIM for Ecologists. Ed. Blackwell Sci. Pub. Oxford. 379 pp.

Di Rienzo, J; Casanoves, F. González, L.; Tablada, E; Díaz, M.; Robledo, C. y Balzarini, M.

2001. Estadística para las Ciencias Agropecuarias. 4ta. Ed. Triunfar. Córdoba. Argentina.

Johnson, Richard & Dean Wichern. 1998. Applied multivariate statistical analysis. Prentice-Hall. New

Jersey. 816 pp.

Kuehl, Robert. 2001. Diseño de Experimentos. Principios estadísticos para el diseño y análisis de

investigaciones. Ed. Thomson Learning. Mexico. 666 pp.

Macchi, R. 2001. Introducción a la Estadística en Ciencias de la Salud. Ed. 128 pp

Mangeaud. A. 2014. Bioestadística I. Ferreyra Ed. Córdoba, Argentina. 237 pp

Mason, Robert, Richard Gunst & James Hess. 1989. Statistical design and Analysis of Experiments.

With applications to engineering and Science. Ed. John Wiley & Sons. New York. 692 pp.

Mead, R., R. Curnow & A. Hasted. 1993. Statistical Methods in Agriculture and Experimental

Biology. Ed. Chapman & Hall. London. 415 pp.

Montgomery, M. C. 1991. Diseño y Análisis de Experimentos. Grupo Editorial Iberoamericana Morton, R, J. Hebel y R. McCarter. 1993. Bioestadística y Epidemiología.

Interamericana-McGraw-Hill. 184 pp.

(27)

Scheffe, Henry. 1959. The analysis of variance. Ed. John Wiley & Sons. New York. 477 pp.

Scheiner, Samuel & Jessica Gurevich. 1993. Design and analysis of Ecological Experiments. Chapman

& Hall. New York. 445 pp.

Sokal, R y J. Rohlf. 1984. Introducción a la Bioestadística. Ed. Reverté. Spiegel, M. 1991. Estadística. Ed. Mc.Graw Hill

Tabachnick, Barbara & Linda Fidell. 1996. Using multivariate statistics. HarperCollins College Publishers.

New York. 880 pp.

Zar, Jerrold. 1984. Biostatistical analysis. Prentice-Hall. New Jersey. 718 pp.

ANEXOS:

Anexo 1: Bases de datos Ejercicio Nº 2.1A: Variables:

Y: Número de semillas de maleza por parcela de un m2. X1: Porcentaje de cobertura,

X2: Altura promedio de los 10 individuos de maleza más cercanos, X3: Desmalezado el año anterior (No desmalezado, 50% ó 100%),

X4: Especie de árbol dominante (Algarrobo, Tala, Pino, Siempreverde y Olmo). X5: Exposición al sol (Ladera oriental, occidental o llano),

X6: Efecto riego (sin riego, una vez a la semana, dos veces a la semana). Ejercicio Nº 2.1B: Variables:

Y: número de huevos viables colocados por cada una de ellas en 24 horas.

X1: Peso de la hembra, X2: Longitud,

X3: Lugar donde fue colectada (Hoja, Pecíolo o Tallo principal), X4: Zona del campo donde se realizó la colecta (N, S, E, W, Centro), X5: Época de la colecta (Fecha 1, 2 ó 3),

X6: Tamaño de la planta donde se hallaba la hembra (<40 cm, 50 a 60 cm ó >80 cm) Ejercicio Nº 2.1C: Variables:

Y: Concentración de aceites por bandeja. X1: Biomasa por bandeja,

X2: Número de semillas germinadas,

X3: Fotoperíodo (12L/12O, 10L/14O ó 8L/16O), X4: Concentración de salinidad (Control, 1, 2, 3 y 4), X5: Posición en la cámara (Superior, Media o Inferior) y X6: Condiciones de Riego (1, 2 y 3).

(28)

28

Ejercicio Nº 2.1D: Variables: Y: Tiempo de freezing, X1: Peso de cada rata, X2: Edad (en días),

X3: Alcohol en la dieta materna (No, Concentración A ó Concentración B), X4: Concentración de alcohol inyectado en las ratas (0, 1, 2, 3 ó 4),

X5: Hora del día en que fue realizada la experiencia (Mañana, Siesta, Tarde) X6: Concentración de la droga antiestrés (A, B ó Control)

Anexo 2: Listado de Modelos e Hipótesis

Modelo 0. Ninguna Variable explica a y yi = u +εi

Donde:

yij es cada una de las observaciones

u es la media poblacional

ε i es el error (diferencia entre el valor observado y la media poblacional)

Modelo 1. Anova a un factor yij = u + τ i +εij

Donde:

yij es cada una de las observaciones

u es la media poblacional

τ i es el efecto del nivel del factor, entonces:ui es la media de cada nivel del

factor

εij es el error (diferencia entre el valor observado y la media de cada nivel del

Factor)

además: i es el iésimo nivel del factor; j es la jotaésima repetición del nivel de cada factor

Modelo 2. Anova a un factor con bloques yij = u + τ i + β j +εij

(29)

yij es cada una de las observaciones

u es la media poblacional

τ i es el efecto del nivel del factor, entonces:ui es la media de cada nivel del

factor

β j es el efecto del bloque, entonces:uj es la media de cada bloque, uij es la

media de cada bloque en cada nivel del factor

εij es el error además: i es el iésimo nivel del factor; j es la jotaésima repetición del

nivel de cada factor

Modelo 3. Anova a 2 factores sin repeticiones yij = u + τ 1i + τ 2j +εij

Donde:

yij es cada una de las observaciones

u es la media poblacional

τ 1i es el efecto del nivel del Factor 1

τ2j es el efecto del nivel del Factor 2 εij

es el error

además: i es el iésimo nivel del Factor 1; j es el jotaésimo nivel del Factor 2

Modelo 4. Anova a 2 factores e interacción yijk = u + τ 1i + τ 2j + (τ 1τ 2 ) ij +εijk

Donde:

yij es cada una de las observaciones

u es la media poblacional

τ 1i es el efecto del nivel del Factor 1 τ 2 j es el efecto del nivel del Factor 2

1τ 2)ij es la interacción entre el Factor 1 y 2

εijk es el error

además: i es el iésimo nivel del factor 1; j es el jotaésimo nivel del factor 2; k es la kaésima repetición de cada combinación ij.

Modelo 5. Anova a 3 (ó más) factores

yijkl = u + τ 1i + τ 2j + τ 3k + (τ 1τ 2 ) ij + (τ 1τ 3) ik + (τ 2τ 3 ) jk + (τ 1τ 2τ 3 ) ijk +εijk

Donde:

yij es cada una de las observaciones

u es la media poblacional

τ 1i es el efecto del nivel del Factor 1 τ 2 j es el efecto del nivel del Factor 2

(30)

30

1τ 2)ij es la interacción entre el Factor 1 y 2

1τ3)ik es la interacción entre el Factor 1 y 3

2τ3) jk es la interacción entre el Factor 2 y 3

1τ 2τ3)ijk es la interacción entre los Factores 1, 2 y 3

εijk es el error

además: i es el iésimo nivel del factor 1; j es el jotaésimo nivel del factor 2; k es el kaésimo

(31)

Modelo 6. Regresión lineal simple

yi = β 0 + β 1 Xi +εi

Donde:

yi es cada una de las observaciones

β 0 es la ordenada al origen β 1 es la pendiente

Xi es la variable independiente

εi es el error (diferencia entre cada valor observado y el estimado por la recta)

Modelo 7. Regresión lineal múltiple yij = β 0 + β 1 X 1 + β 2 X 2 +εij

Donde:

yij es cada una de las observaciones

β 0 es la ordenada al origen

β 1 es la pendiente para la Variable X1 β 2 es la pendiente para la Variable X2 X1 es la variable independiente 1

X2 es la variable independiente 2

εij es el error

Modelo 8. Regresión con variables categóricas. yij = β 0 + β 1 X 1 + β 2 X 2 +εij

Donde:

yij es cada una de las observaciones

β 0 es la ordenada al origen

β 1 es la pendiente para la Variable X1 β 2 es la pendiente para la Variable X2 X1 es la variable independiente 1

X2 es la variable independiente 2, pero sólo adquiere valores “0 ó 1” εij es

el error

(32)

32

yij = β 0 + β 1 X 1 + β 2 X 2 + β 3 ( X 1 X 2) +εij

Donde:

yij es cada una de las observaciones

β 0 es la ordenada al origen

β 1 es la pendiente para la Variable X1 β 2 es la pendiente para la Variable X2

β 3 es la pendiente para la interacción entre X1 y X2 X1 es la variable independiente 1

X2 es la variable independiente 2, pero sólo adquiere valores “0 ó 1” εij es

el error

Modelo 10. Ancova yi = u + τ i + β 1( Xi − X ) +εi

Donde:

yi es cada una de las observaciones

u es la media poblacional

τ i es el efecto del nivel del factor, nótese que ambas (ui ) funcionan

como:

β0 (ordenada al origen)

β1 es la pendiente para la Variable X

X1 es la variable independiente 1, pero en realidad en el modelo se utiliza la diferencia con su media ( Xi − X )

εi es el error

Modelo 11. Ancova con interacción yi = u + τ i + β 1 X 1 + β 2 ( X 1τ)i +εi

Donde:

yi es cada una de las observaciones

u es la media poblacional

τ i es el efecto del nivel del factor,

β 1 es la pendiente para la Variable X X1 es la variable independiente 1,

β2 es la pendiente de la interacción entre la variable independiente y el nivel

del factor

( X 1τ)i es la interacción entre la variable independiente y el nivel del factor εi es

(33)

Bioestadística II – 2013 Pág. 62

Modelo 12. Anova con factores anidados yijk = u + τ 1i + τ 2j(i)(ij)k

Donde:

yijk es cada una de las observaciones

u es la media poblacional

τ 1i es el efecto del nivel del Factor 1

Τ2j(i) es el efecto del nivel del Factor 2 anidado dentro del Factor 1

ε( ij )k es el error

Modelo 13. Manova (a un factor)

y 1ij u 1 τ 1i y 2ij = u 2 + τ 2i ... ... ... yki u k τ ki Donde: e1ij + e 2ij ... ekij

(34)

34

y 1ij

y2ij es el vector de observaciones

...

yki

u 1

u 2

es el vector de medias poblacionales

...

uk

τ 1i

τ 2i

es el vector de efectos del nivel del Factor ... τ ki e1ij e2ij es el vector de errores ... ekij

Anexo 4: Ejemplos de Hipótesis 1) Efectos fijos

Recordemos que E (CMF ) = σ 2 +φ y que E (CME) =σ2 , siendo

σ

2 la varianza poblacional y

φ

un representante de la distancia existente entre las medias poblacionales (en efectos fijos.)

Hipótesis para los factores principales: A)

H0: u1= u 2=...= uk

H1: u i uj para al menos un par (i,j)

B)

H0: τ1= τ 2=...= τk

H1: al menos un τi ≠ 0

Hipótesis para la Interacción H0: 1τ2)ij=0

H1: al menos un 1τ2)ij≠0

(35)

Recordemos que E (CMF ) = σ 2 +σt2 y que E (CME) =σ2 , siendo

σ

2

la varianza poblacional y σt2 la varianza entre las medias poblacionales (en efectos

aleatorios).

Factores principales A)

H0: u1= u 2=...= uk

H1: u i uj para al menos un par (i,j)

B) H0: σt2=0 H1: σt2≠0 Interacción H0: σ2ij = 0 H1: σ2ij ≠ 0

Referencias

Documento similar

Nosotros, en este estudio, constatamos la existen- cia de una diferencias significativas entre los hombres y las mujeres en determinadas variables de la personali- dad,

dentata, fue la especie que más As acumuló en esta parte de la planta (presentando diferencias significativas en comparación con el resto de especies) y, junto con

En los ensayos de Riego Deficitario Sostenido (RDS) en brócoli las diferencias de los rendimientos no fueron significativas entre los tratamientos (ver Tabla 4). Este ensayo ha

La investigación Victimización de violencia entre novios, gravedad percibida en las conductas de violencia entre novios, mitos del amor romántico, y dependencia emocional

H 0 - No existen diferencias significativas entre los criterios ofrecidos por los encuestados de la sede central y la sede Varela respecto a los conocimientos, las

Existen diferencias estadísticas significativas en el grado de “planteamiento de la profesión como un servicio” debido al efecto de la asignatura de Responsabilidad Social,

Si atendemos directamente a las medias de los diferentes estilos de apego inseguro (véase Tabla 3 y Gráfico 5 y 6) se observan diferencias significativas con respecto

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de