• No se han encontrado resultados

Taller de R. 5 al 7 de Enero de 2017

N/A
N/A
Protected

Academic year: 2021

Share "Taller de R. 5 al 7 de Enero de 2017"

Copied!
5
0
0

Texto completo

(1)

Taller de R

Benjam´ın Mu˜

noz

5 al 7 de Enero de 2017

1.

Objetivo

El curso busca introducir a los alumnos en el lenguaje de programaci´on R, abordando los contenidos esenciales para su utilizaci´on como usuario. Lo fundamental es lograr que los alumnos sean capaces de usar el software estad´ıstico de manera aut´onoma, dominando los aspectos b´asicos y siendo capaces de consultar/investigar sobre el modo de utilizar las aplicaciones m´as avanzadas. Producto de lo anterior, se proponen como objetivos espec´ıficos: Conocer los principios de funcionamiento de R como “lenguaje” orientado a objetos, como software abierto y como interfaz con l´ınea de comandos.

Aprender los aspectos fundamentales de la sintaxis y operaciones b´asicas para la ma-nipulaci´on de objetos (con distintas estructuras).

Introducir los conceptos b´asicos de elaboraci´on de funciones y programaci´on en R. Introducir buenas pr´acticas en el flujo de trabajo para el manejo de datos.

Conocer como importar datos desde distintas fuentes.

Realizar an´alisis descriptivos sencillos de un conjunto de datos con R.

Conocer los comandos b´asicos para implementar t´ecnicas de inferencia estad´ıstica. Introducir la noci´on de “reproducibilidad” y documentaci´on de c´odigos y su relevancia en el trabajo emp´ırico.

Introducir el uso de paquetes para el trabajo con c´odigos din´amicos.

2.

Metodolog´ıa de Trabajo

El curso tiene una estructura de taller, utilizando R y R-Studio1 y bases de datos reales para el desarrollo de actividades. Se enfatizar´a el uso de herramientas para la investigaci´on reproducible (Markdown y Knitr).

Se recomienda que los alumnos asistan con un computador personal el cual tenga ins-talado R y R-Studio. En caso contrario, las instalaciones de la Escuela proporcionar´an computadores para el desarrollo de las actividades pr´acticas.

(2)

3.

Contenidos

1. M´odulo 1: Introducci´on a R. Jueves 5 de Enero,9:30-13:00

a) Introducci´on: filosof´ıa de R y su instalaci´on. b) Sintaxis: Operaciones aritm´eticas b´asicas. c) Sintaxis: asignaci´on y combinaci´on.

d) Manejo de errores frecuentes y b´usqueda de ayuda.

e) Estructura de datos: vectores, matrices, factores, marcos de datos y listas. f) Funciones y paquetes en R.

g) Principios de programaci´on (loops, familia apply y c´odigos propios). 2. M´odulo 2: Importaci´on y Manejo de Datos.Jueves 5 de Enero,13:30-17:30

a) Importaci´on desde archivos planos (read.txt, read.csv, etc.). b) Importaci´on desde Excel.

c) Importaci´on desde otros programas estad´ısticos: SPSS y Stata. d) Exploraci´on de datos brutos y filosof´ıa “tidy”.

e) Manejo de datos con funciones b´asicas.

f) Manejo de datos con paquetes dplyr, stringr, reshape2, etc.

3. M´odulo 3: An´alisis Exploratorio de Datos.Viernes 6 de Enero,9:30-13:00

a) Comandos para estad´ıstica descriptiva b´asica.

b) Funciones para el cambio de unidad de an´alisis y agrupamiento de datos. c) Generaci´on de tablas.

d) Sistema de graficaci´on en R. e) Opciones avanzadas para gr´aficos.

4. M´odulo 4: Estad´ıstica Inferencial.Viernes 6 de Enero,13:30-18:00

a) Comandos para el trabajo con variables aleatorias.

b) Inferencia cl´asica: test de hip´otesis e intervalos de confianza. c) An´alisis de regresi´on lineal (MCO).

5. M´odulo 5: Investigaci´on Reproducible.S´abado 7 de Enero,10:00-13:30

Principios y buenas pr´acticas. Documentaci´on de scripts.

(3)

4.

Bibliograf´ıa

Hay una infinidad de manuales de R2 de alt´ısima calidad. Ac´a se incluyen algunas

refe-rencias ´utiles:

Referencias

Cotton, R. (2015). Learning r. a step-by-step function guide to data analysis.(1st Edition ed.). O’Reilly.

Fox, J., y Weisberg, S. (2012). An r companion to applied regression. SAGE.

Gandrud, C. (2015). Reproducible research with r and rstudio (2nd Edition ed.). CRC Press.

Heiss, F. (2016). Using r for introductory econometrics.

Kabacoff, R. (2015). R in action: Data analysis and graphics with r (2nd Edition ed.). Manning Publications.

Monogan, J. (2016). Political analysis using r (1st Edition ed.). Springer. Peng, R. (2015). Report writing for data science in r. Leanpub.

Peng, R. (2016a). Exploratory data analysis with r. Leanpub. Peng, R. (2016b). R programming for data science. Leanpub.

van der Loo, M. P., y de Jonge, E. (2012). Learning rstudio for r statistical computing. Packt Publishing.

Wickham, H. (2016).ggplot2. elegant graphics for data analysis(2nd Edition ed.). Springer. Wickham, H., y Grolemund, G. (2016). R for data science. O’Reilly.

Xie, Y. (2015). Dynamic documents with r and knitr (2nd Edition ed.). CRC Press.

4.1.

Lecturas Sugeridas

Lo ´unico necesario para el curso-taller es ganas de aprender y acceso a un computador e internet. No son necesarias lecturas previas para el curso. De todos modos, ac´a les sugiero algunas lecturas (disponibles en el Drive de la Escuela) que pueden servir para repasar los contenidos y utilizar R en sus propios proyectos:

1. M´odulo 1: Introducci´on a R.

Kabacoff, R. (2015).R in Action: Data Analysis and Graphics with RCap´ıtulos 1 y 2, pgs. 3-45. Sencilla introducci´on de R como software y lenguaje, con una buena explicaci´on de las estructuras de datos.

Cotton, R. (2013). Learning R Cap´ıtulos 1 al 5, pgs. 13-78. Introducci´on sistem´atica a los tipos de datos y a las operaciones fundamentales en R.

van der Loo, M. & deJonge, E. (2012).Learning RStudio for R Statistical Compu-tingCap´ıtulos 1 y 2, pgs. 5-41. Un tanto antiguo, pero muy buena introducci´on a las ventajas de Rstudio y sobre c´omo usarlo.

2Tambi´en existen otras herramientas de aprendizaje, tales como foros de discusi´on, blogs, MOOCs y documentos gratuitos.

(4)

2. M´odulo 2: Importaci´on y manejo de datos en R.

Kabacoff, R. (2015).R in Action: Data Analysis and Graphics with RCap´ıtulos 4 y 5, pgs. 71-113. Avanza progresivamente desde la definici´on de variables hasta operaciones m´as complejas relativas a la estructura de datos. De todos modos, contiene algunos temas (p. ej. sobre SQL) que no les resultar´an muy relevantes.

Monogan, J. (2016).Political Analysis Using R Cap´ıtulo 2, pgs. 13-32. Es un panorama aplicado de una sesi´on de manejo de datos t´ıpica en ciencias sociales. Cotton, R. (2013).Learning RCap´ıtulos 12 y 13, pgs. 169-206. Presenta una amplia gama de funciones para el manejo de datos.

Wickham, Hadley. (2014). Tidy Data. Journal of Statistical Software. Es una excelente introducci´on a la filosf´ıa “tidy” para el manejo de datos.

Wickham, Hadley. (2014).ggplot2: Elegant graphics for data analysis. 2nd. Edi-tion Cap´ıtulos 9 y 10, pgs. 189-220. Explicaci´on bien desarrollada de c´omo utilizar la filosof´ıa tidy en proyectos emp´ıricos.

3. M´odulo 3: An´alisis exploratorio de datos en R.

Peng, R. (2015).Exploratory Data Analysis with R.Completo. Sint´etico repaso de todos los elementos de la descripci´on de datos.

Kabacoff, R. (2015).R in Action: Data Analysis and Graphics with RCap´ıtulos 3, 6 y 7, pgs. 46-70; 117-174. Todo lo necesario para el trabajo con R de estad´ıstica descriptiva.

Monogan, J. (2016).Political Analysis Using R Cap´ıtulos 3 y 4, pgs. 33-62. Muestra como se usan las funciones b´asicas para la exploraci´on de datos. 4. M´odulo 4: Estad´ıstica inferencial en R.

Kabacoff, R. (2015).R in Action: Data Analysis and Graphics with RCap´ıtulo 8, pgs. 167-211. Buen repaso del uso de regresi´on en R. Para expandir el tra-bajo en este campo, el manual de Fox y Weisberg es excelente, no obstante su antig¨uedad.

Monogan, J. (2016). Political Analysis Using R Cap´ıtulos 5 y 6, pgs. 63-96. Condensa muchos temas en pocas p´aginas, de todos modos existen manuales especializados seg´un el tema que deseen trabajar. Pueden consultarme por fuentes espec´ıficas para distintos temas.

5. M´odulo 5: Investigaci´on Reproducible con R.

van der Loo, M. & deJonge, E. (2012).Learning RStudio for R Statistical Com-puting Cap´ıtulo 5, pgs. 75-491. Breve introducci´on al uso de RStudio y la generaci´on de reportes que integran c´odigo y texto.

(5)

Peng, R. (2015). Report Writing for Data Science in R. Texto completo. Es una buena introducci´on a la generaci´on de reportes din´amicos con una perspectiva amplia.

Kabacoff, R. (2015).R in Action: Data Analysis and Graphics with RCap´ıtulo 22, pgs. 513-531. Muy amena la introducci´on al uso de documentos din´amicos en R, con distintas plataformas. Si les interesa el tema, el texto de Xie (2015) o el de Grandud (2015) son fundamentales.

Referencias

Documento similar

2.° curso.. Castellano, l.er curso. Dibujo lineal, figura, etc. l>) Por no haberse presentado en los ordinarios y quedar suspensos en lo« extraordinarios. c) Por quedar suspensos

El primer objetivo de esta tesis consiste en el estudio de las posibilidades de un algoritmo r´apido de b´ usqueda del vecino m´as cercano, el LAESA, para obtener una disminuci´on en

Además de aparecer en forma de volumen, las Memorias conocieron una primera difusión, a los tres meses de la muerte del autor, en las páginas de La Presse en forma de folletín,

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

En nuestra opinión, las cuentas anuales de la Entidad Pública Empresarial Red.es correspondientes al ejercicio 2012 representan en todos los aspectos

La Intervención General de la Administración del Estado, a través de la Oficina Nacional de Auditoría, en uso de las competencias que le atribuye el artículo 168

La Intervención General de la Administración del Estado, a través de la Oficina Nacional de Auditoría, en uso de las competencias que le atribuye el artículo