ESTADÍSTICA DESCRIPTIVA CON STATA
JUAN FRANCISCO ISLAS AGUIRRE FORTINO VELA PEÓN
UAM-X
Mayo, 2010
Objetivos
• Que el participante maneje el paquete estadístico Stata a nivel básico a fin de estar en posibilidad de realizar análisis de datos para la realización de trabajos profesionales, fortaleciendo el uso de la herramienta computacional que ofrece dicho paquete en la aplicación de técnicas de estadística descriptiva y manejo de información.
J. F. ISLAS / F. VELA
Bibliografía
• Gujarati, Damodar y Dawn Porter (2009). Econometría, 5ª. ed., McGraw Hill, México.
• Sotres, Daniela y Martha M. Téllez (2007). “Regresión lineal simple” y “Regresión lineal múltiple” en Hernández Ávila, Mauricio (ed.), Epidemiologia: diseño y análisis de estudios Editorial Panamericana, México.
• Apuntes y notas de clase.
J. F. ISLAS / F. VELA
Aplicaciones
• Encuesta Nacional de Ingreso Gasto de los Hogares (ENIGH).
• Stata es una herramienta computacional diseñada para realizar análisis estadístico la cual fue creada en 1985 por StataCorp.
• El denominativo de Stata es una abreviación de las palabras “Statistics" y "data".
• Actualmente es utilizado tanto en instituciones académicas como en empresas donde sus usuarios se ubican en las áreas de la economía, sociología, ciencia política, ciencias de la salud y epidemiología.
J. F. ISLAS / F. VELA
• Sus capacidades incluyen :
J. F. ISLAS / F. VELA
.- Manejo y organización de datos - Graficación.
- Análisis estadístico . - Simulación.
- Programación de tareas.
J. F. ISLAS / F. VELA
•Actualmente, en el mercado se encuentra la versión 11.
•Su lenguaje computacional es C.
•Existen versiones para plataformas en Windows, Mac, UNIX y LINUX.
Elementos teórico-conceptuales
¿Qué es la estadística?
• Es una disciplina asociada con las matemáticas que es utilizada como herramienta en distintas áreas del conocimiento para contar con procedimientos de recolección, organización, síntesis, presentación, análisis e interpretación de datos.
• Sirve también como medio en la contrastación de hipótesis y/o teorías con la realidad, a través de modelos.
J. F. ISLAS / F. VELA
• Aunque en todo estudio estadístico el primer paso es la recolección de datos, es usual en un curso básico de estadística asumir que los datos ya han sido recolectados y que están disponibles.
• Por consiguiente, el trabajo comienza con el esfuerzo por organizar y presentar estos datos de manera significativa y descriptiva.
• Los datos deben colocarse en un orden lógico que revele rápida y fácilmente el mensaje que contienen.
J. F. ISLAS / F. VELA
J. F. ISLAS / F. VELA
Clasificación de las variables
Nivel de medición
Escala de medición
Función en la investigación
Grado de abstracción Discretas Continuas
Nominales Ordinales
Intervalo Continuas
Dependiente(s)
Independiente(s) Conceptuales o abstractas Intermedias
Empíricas u observables
J. F. ISLAS / F. VELA
Escalas de medición de las variables
Nominales: nombres o clasificaciones que se utilizan para datos en categorías distintas y separadas.
Ordinales: son las que clasifican las observaciones en categorías con un orden significativo.
Intervalo: medidas numéricas en la cual el valor cero es arbitrario pero la diferencia entre valores es importante.
Razón: medidas numéricas en las cuales el valor cero es un valor fijo y la diferencia entre valores es importante.
J. F. ISLAS / F. VELA
Tablas de contingencia
• Son distribuciones de frecuencia de dos o mas variables categóricas. También puede conceptualizarse como una clasificación cruzada de los valores (o categorías) de dos o mas variables mostrándose el número de observaciones en cada celda reportada.
• Cuando se tienen dos variables, la tabla se denomina de doble entrada (two way). Cuando son tres (three way).
• Se suelen llamar tablas cruzadas o crosstabs.
J. F. ISLAS / F. VELA CECAD-UAMX
J. F. ISLAS / F. VELA CECAD-UAMX
Tipos de tablas de contingencia
Goodman (1981) considera tres tipos de tablas:
1. Las de distribución conjunta de dos variables (i.e. peso y edad).
2. Las de relación causal entre una variable de respuesta que depende de una variable explicativa (i. e. fumar y cáncer).
3. Las de asociación entre dos variables de respuesta (i. e. actitud hacia el aborto y actitud hacia el sexo premarital).
J. F. ISLAS / F. VELA CECAD-UAMX
tabulate p3_2a p3_6a
J. F. ISLAS / F. VELA CECAD-UAMX
J. F. ISLAS / F. VELA CECAD-UAMX