B i o e s t a d í s t i c a I
Dr. Carlos I. Molina A. Facultad de Ciencias Puras y Naturales Carrera de Biología UMSA
Periodo de vigencia: I/2018
Dr. Carlos I. Molina A. Periodo de vigencia: II/2017
¿Qué es la estadística?
Es una disciplina que se dedica a
recoger, clasificar, resumir e
interpretación de datos
Por lo tanto la bioestadística será la disciplina aplicada a las
ciencias de la vida (salud, genética, veterinaria, agricultura, genética,
ecología entre otras ciencias)
Estadística descriptiva
Análisis exploratorio
Estadística inferencial
Análisis confirmatorio,
prueba de hipótesis
Materia prima de
la estadística
Datos- Procesos rutinarios
- Encuestas
- Experimentación
- Literatura de experimentación
Es una herramienta indispensable para la toma de decisiones
Por qué es necesaria la bioestadística?
Contribuye en el proceso de la alfabetización biológica
1) Evaluación crítica de
artículos científicos
2) Manejo apropiado de la
información
Limitaciones de la estadística
La estadística como tal es una herramienta que
posibilita el diseñar, describir y testear observaciones
de cierto evento
Indica la probabilidad de que vuelva a ocurrir cierto
evento
Nunca llega a demostrar
nada!!
Limitaciones de la estadística
La estadística como tal es una herramienta que
posibilita el diseñar, describir y testear observaciones
de cierto evento
Indica la probabilidad de que vuelva a ocurrir cierto
evento
Nunca llega a demostrar
nada!!
Bueno al menos que seas Grigori Perelman
Historia de la bioestadística:
La Revolución Industrial: 1780-1840 en Inglaterra
Cambio de un modelo
de producción manual
Modelo de producción
mecanizada
Contabilización de procesos productivos y
rendimientos de las máquinas
ESTADISTICA
Pioneros sobre el tratamientos de datos
John Graunt
(1620-1674)
William Petty
(1623-1687)
Francis Galton
(1822-1911)
Creó el concepto
estadístico de
correlación y
regresión hacia la
media
Ronald Fisher
(1890-1962)
Fue el padre de la
estadística moderna y
diseño experimental
Muestra.
Subconjunto representativo de una
población (parte de una población).
Población.
Conjunto de individuos o
e l e m e n t o s q u e c u m p l e n c i e r t a s
propiedades comunes.
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
Variable
Características y valores que pueden
tomar las personas, lugares y cosas
Cuantitativa
Aquello que se puede medir o
cuantificar
Discreta
Posee separaciones o interrupciones en la toma de datos Ej. Admisión de paciente en un determinado hospital.Continua
No posee separaciones o interrupciones en la toma de datos Ej. Estatura de hombre(se requiere instrumentos de
medición)
Cualitativa
NO se mide, pero se clasifican
por sus atributos (variable
nominal)
Nominal
Nombrar las observaciones en categorías mutuamente excluyente. (P.je. Masculino,
femenino; enfermo, sano, etc.)
Ordinal
Nombrar las observaciones en grados de categorías. (P.je. Grado sanguíneo)
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
Producto del proceso rutinario de algunos hospitales
Base de datos
Muestra de 29 pacientes a quienes de les extirpó células
cancerígenas de la laringe
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
Producto del proceso rutinario de algunos hospitales
Base de datos
Unidad de objeto
de investigación
Variables
Muestra de 29 pacientes a quienes de les extirpó células
cancerígenas de la laringe
Producto del proceso rutinario de algunos hospitales
Base de datos
Variable Cuantitativa
(Numérica) Variable Cualitativa(Categórica)
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
Producto del proceso rutinario de algunos hospitales
Base de datos
Variable Cuantitativa
(numérica) Variable Cualitativa(Categótica)
Continua Discreta
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
Producto del proceso rutinario de algunos hospitales
Base de datos
Variable Cualitativa (Categótica)
Nominal Ordinal
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
es un sistema para análisis estadísticos y gráficos
Tiene doble naturaleza: programa y lenguaje de
programación desarrollado por:
Software libre de licencia
General Public License (GNU o GPL)
Basado en el lenguaje S de programación (S-PLUS)
R consta de un sistema base y
de paquetes adicionales que
extienden su funcionalidad y
entendimiento
http://www.r-project.org/
Creado por
Ross Ihaka
y
Robert Gentleman
(1996)
Porqué los investigadores últimamente usan más R ?
• Los métodos estadísticos desarrollados recientemente son
programados primero en R.
• Existen muchas librerías disponibles para aplicar diversos
métodos estadísticos
• Crea excelente gráficas con relativa facilidad
• Es gratis
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
funciones y operadores ? “datos” objetos ?6 ⇣ ⇣ ⇣ ⇣ ) XXXXXXXz “resultados” objetos .../library/base/ /ctest/ ... librer´ıa de funciones datos archivos -internet PS JPEG. . . teclado rat´on -comandos pantalla
Memoria activa Disco duro
Figura 1: Una visi´on esquem´atica del funcionamiento de R.
comparar los coeficientes de regresi´on, R le puede mostrar ´unicamente los coeficientes estimados: de esta manera los resultados se pueden resumir en una sola l´ınea, mientras que un programa cl´asi-co le puede abrir 20 ventanas de resultados. M´as adelante, veremos otros ejemplos que ilustran y comparan la flexibilidad de R con programas de estad´ıstica m´as tradicionales.
2. Algunos conceptos antes de comenzar
Una vez instale R en su computador, el programa se puede iniciar corriendo el archivo ejecu-table correspondiente. El cursor, que por defecto es el s´ımbolo ‘>’, indica que R est´a listo para recibir un comando. En Windows, algunos comandos pueden ser ejecutados a trav´es de los menus interactivos (por ej. buscar ayuda en l´ınea, abrir archivos, . . . ). En este punto, un nuevo usuario de R probablemente estar´a pensando “Y ahora que hago?”. De hecho, cuando se utiliza R por primera vez, es muy ´util tener una idea general de como funciona y eso es precisamente lo que vamos a hacer ahora. Como primera medida, veremos brevemente como funciona R. Posteriormente, des-cribir´e el operador “asignar” el cual permite crear objetos en R, miraremos como manejar estos objetos en memoria, y finalmente veremos c´omo usar la ayuda en l´ınea, la cual a diferencia de las ayudas en otros programas estad´ısticos, es bastante ´util e intuituva.
2.1. C ´omo funciona R
R es un lenguaje Orientado a Objetos: bajo este complejo t´ermino se esconde la simplicidad y flexibilidad de R. El hecho que R es un lenguaje de programaci´on puede desaminar a muchos usuarios que piensan que no tienen “alma de programadores”. Esto no es necesariamente cierto por dos razones. Primero R es un lenguaje interpretado (como Java) y no compilado (como C, C++, Fortran, Pascal, . . . ), lo cual significa que los comandos escritos en el teclado son ejecutados directamente sin necesidad de construir ejecutables.
Como segunda medida, la sint´axis de R es muy simple e intuitiva. Por ejemplo, una regresi´on lineal se puede ejecutar con el comando lm(y ˜x). Para que una funci´on sea ejecutada en R debe estar siempre acompa˜nada de par´entesis, inclusive en el caso que no haya nada dentro de los mismos (por ej., ls()). Si se escribe el nombre de la funci´on sin los par´entesis, R mostrar´a el contenido (c´odigo) mismo de la funci´on.
En este documento, se escribir´an los nombres de las funciones con par´entesis para distinguirlas de otros objetos, a menos que se indique lo contrario en el texto.
4
Cómo funciona ?
Entorno del R:
Objeto.
Cualquier acción orientada a la entrada o salida de datosVector.
Es una colección de uno o más objetosFunción.
Instrucciones para realizar tareas específicasOperador.
Símbolo predefinidoa <- 30 a [1] 30 X<-c(1,3,6,2... mean(X) + - *
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
> 5+1
[1] 6
Resultado, objeto devuelto (en este caso es único)
Orden del comando
> x <- c(5+1) > x [1] 6 Asignación de un nombre Resultado almacenado en la memoría virtual > a <- 30 > a + x [1] 36 Asignación de un nombre a otra variable Operación Resultado > ls () [1] "a" "x" Lista de objetos almacenados > rm(x) Borrado de un objeto
> rm(list=ls()) Borrado de todo
Dr. Carlos I. Molina A. Periodo de vigencia: I/2017
> setwd("~/desktop/R")
Seleccionar folder de trabajo
Algunos comandos importantes
> getwd()
[1] "/Users/admin/Desktop/R"
Verificar folder de trabajo
> list.files(getwd())
[1] "addressbook.vcf" [2] "Introduction.rnw" [3] "Rplots.ps"
Verificar documentos del folder de trabajo
> help(mean)
> ?mean
Obtener ayuda
> help.start()
Obtener ayuda y
documentación
en linea
> q()
Salir de R
> ls.str()