Este libro explora los primeros pasos del programa R, como la lectura de archivos, la instalación y carga de paquetes, el análisis descriptivo, las pruebas de normalidad y homogeneidad de varianzas, el análisis de varianza, las pruebas comparativas de medias y una introducción a los modelos lineales generalizados para datos. grafico. Este trabajo surgió de la experiencia diaria con cursos de extensión sobre R para entomólogos. Así, el presente trabajo, si bien tiene un carácter introductorio, es en gran medida resultado de la colaboración de varios colegas, profesores y colaboradores, a quienes expresamos nuestro más sincero agradecimiento.
R tiene una variedad de herramientas como pruebas paramétricas y no paramétricas, análisis de regresión lineal y no lineal, análisis de supervivencia, análisis multivariado y producción de gráficos. Las dificultades que encuentran los estudiantes e investigadores de entomología al utilizar la inferencia estadística parecen ser el resultado de la falta de libros de texto escritos en un lenguaje adecuado para ellos, libre de los algebraísmos comúnmente utilizados por los estadísticos matemáticos. Para llenar ese vacío, este libro tiene como objetivo presentar los comandos básicos para el análisis descriptivo, el análisis de varianza y el análisis de desviación, con datos entomológicos en lenguaje R.
Fue desarrollado en 1996 por los profesores de estadística Ross Ihaka y Robert Gentleman, quienes trabajaron y fueron colegas en el Departamento de Estadística de la Universidad de Auckland, quienes compartían un interés en la estadística computacional y vieron la necesidad de un mejor entorno para la estadística informática. software para el área. El software es un entorno de investigación y desarrollo colaborativo internacional mantenido formalmente por la Fundación R, que ofrece una amplia gama de técnicas estadísticas y gráficas, que incluyen modelado lineal y no lineal, pruebas estadísticas clásicas, análisis de series temporales, clasificación, agrupación y otros.
Cargando un paquete
Leer un archivo
Visualización de un Plot
Personaliza tu RStudio
Buscando ayuda
Algunas funciones y comandos básicos
Análisis descriptivo y pruebas de supuestos para análisis de varianza
- Lectura de archivos en R
- Análisis descriptivo con bloxplot
- Prueba de los supuestos del modelo ANOVA
- Prueba t
- Prueba de Tukey
- Referencias de los paquetes utilizados
- Referencias recomendadas
Luego de seleccionar un directorio, es posible ver qué archivos existen en él, para esto usamos la función:list.files(), que mostrará una lista de archivos en su directorio. El signo de exclamación indica un rechazo, por lo que la línea de comando anterior se traduce como: "si el paquete requerido (readxl) no está instalado, instale el paquete y luego cárguelo". En este ejemplo didáctico se analizó el efecto de dos tratamientos sobre el peso de los insectos (Cuadro 1).
Para ver el encabezado usamos la función: head(df) Para ver la base de datos usamos la función: View(df). Para exportar la imagen en el formato deseado, una sugerencia es el formato tiff con 300 dpi, que suele ser el formato solicitado por las publicaciones científicas. Diagrama de caja que representa el efecto de dos tratamientos sobre el peso (g) de una especie de insecto hipotética.
Usando la línea de comando a continuación, es posible ver los mismos valores expresados en el diagrama de caja, es decir, valor mínimo (Min), primer cuartil (1er Qu.), mediana (Median), media (Mean), tercer cuartil (3er Qu. .) y máximo (Max), por lo que se mostrará un resumen del análisis descriptivo del peso (g) de una hipotética especie de insecto sometida a cada uno de los dos tratamientos. Usaremos la misma base de datos que usamos antes, así que lea el archivo: BD1.xls (Tabla 1) usando el script disponible haciendo clic aquí. Como se muestra en la Tabla 1 y se comentó anteriormente, en este ejemplo didáctico se analizó el efecto de dos tratamientos sobre el peso de los insectos.
Continuaremos usando la misma base de datos utilizada anteriormente, pero con el script modificado, al que puede acceder haciendo clic aquí y luego leyendo el archivo: BD1.xls (Tabla 1). Dado que existen más de dos tratamientos, utilizaremos una prueba de comparación múltiple, en este caso la prueba de Tukey. Para enviar los comandos escritos (marco de datos) a la memoria: adjuntar(df) La prueba se realizó en un DCA, por lo que usaremos la función crd.
Análisis de variables continuas de experimentos en arreglos factoriales
- Importación de base de datos
- Pruebas de suposición ANOVA
- ANOVA con dos factores (two-way ANOVA)
- Otros ejemplos
- Cuando necesita transformación
- Referencias de paquetes usados
- Referencias recomendadas
Ahora exploremos otra forma de leer la base de datos, pero con el mismo paquete. Ver (df): para ver la base de datos en otra ventana adjuntar (df): para guardar la base de datos en la memoria. Para probar la homogeneidad de las varianzas usaremos la prueba de Bartlett, con la función bartlett.test.
Cuando las variables son independientes es necesario convertir, para eso necesitamos usar la función as.factor y convertir cada variable a un factor. Antes de realizar las pruebas de normalidad y homogeneidad, es necesario verificar si las variables independientes son factores. Nota: El nombre de la variable debe ser idéntico al escrito en la base de datos.
NOTA: Si los datos no se ajustan a la normalidad y homogeneidad es necesario transformarlos, consulta cómo hacerlo a continuación. NOTA: Cuando la interacción no es significativa, no es necesario dividir la interacción entre insecticida y fungicida. Bartlett” para verificar que los datos se ajusten a los supuestos de normalidad y homogeneidad (TENGA CUIDADO AL ESCRIBIR EL COMANDO PORQUE AHORA LOS DATOS ESTÁN GIRADOS POR LO QUE ES NECESARIO AGREGAR . “cuadro”).
Aplicaciones de Modelos Lineales Generalizado (GLM) para datos de conteo
- Análisis descriptivo
- Prueba de ajuste del modelo
- Importación de base de datos - Ejemplo 2
- Prueba de ajuste
- Fraccionamiento de la interacción
- Referencias de paquetes usados
- Referencias recomendadas
Luego necesitamos usar el comando para cargar el paquete que lee la hoja de Excel, que es el paquete readxl[1]: require(readxl). Para esto es necesario cargar el paquete MASS [3] para trabajar con la función glm.nb. Luego es necesario cargar el paquete "hnp" para analizar la calidad de ajuste de los modelos a los datos, y usamos: require(hnp).
Se puede observar que el modelo Binomial Negativo (BN) fue el modelo que mejor se ajustó a los datos de conteo S. Ahora comparemos los tratamientos usando el paquete "multcomp" [7], para esto ejecutaremos la línea de comando: search( multicomp ). Ejemplo 2 – Contar datos en una prueba de clasificación factorial que contó el número de larvas de Spodoptera frugiperda (Lepidoptera: . Noctuidae) en diferentes plantas hospedantes (factor 1) en tres estadios larvarios (factor 2).
Para leer archivos de Excel necesitamos el paquete "readxl" [1], para lo cual usamos el comando: biblioteca(readxl). Ejecutemos la línea de comando a continuación, el paquete se instalará si es necesario.