ESTAD´ISTICA DESCRIPTIVA Y AN ´
ALISIS DE
DATOS CON LA HOJA DE C ´
ALCULO EXCEL
Organiza:
INSTITUTO C ´ANTABRO DE ESTAD´ISTICA
http://www.icane.es
Responsable: Francisco Parra Rodr´ıguez
Jefe de Servicio de Estad´ısticas Econ´omicas y Sociodemogr´aficas parra f@icane.es
Colabora: Ma Paz Moral Zuazo
OBJETIVOS DEL CURSO
Iniciaci´on a la Estad´ıstica Descriptiva: definici´on, metodolog´ıa y conceptos b´asicos.
Conocimiento de las herramientas que proporciona EXCEL 2003.
C´omo utilizar EXCEL 2003 para analizar datos y elaborar informes.
BIBLIOGRAF´IA
Lipschutz y Schiller, ed.Introducci´on a la probabilidad y estad´ıstica, McGraw-Hill.
Pe˜na, D. y Romo, J. Introducci´on a la Estad´ıstica para las Ciencias Sociales, McGraw-Hill.
Arnaldos, F. y otras, Estad´ıstica Descriptiva para Econom´ıa y
Administraci´on de Empresas, Thomson.
Carrascal, U. Estad´ıstica Descriptiva con Microsoft Excel 2007,
ESQUEMA DE LA SEMANA: SESI ´
ON 1
1 INTRODUCCI ´ON
1.1 ¿Qu´e es la Estad´ıstica?
1.2 Etapas de un estudio estad´ıstico.
1.3 Introducci´on a las funciones estad´ısticas en Excel.
2 DESCRIPCI ´ON GR´AFICA DE DATOS (I)
2.1 Introducci´on. Variables estad´ısticas.
ESQUEMA DE LA SEMANA: SESI ´
ON 2
2. DESCRIPCI ´ON GR´AFICA DE DATOS (II)
2.3 Variables cuantitativas discretas: representaci´on gr´afica de la distribuci´on de frecuencias.
2.4 Variables cuantitativas continuas: el histograma y el pol´ıgono de frecuencias.
2.5 Otras representaciones gr´aficas.
3. DESCRIPCI ´ON NUM´ERICA DE DATOS (I)
3.1 Descripci´on num´erica de un conjunto de datos.
ESQUEMA DE LA SEMANA: SESI ´
ON 3
3. DESCRIPCI ´ON NUM´ERICA DE DATOS (II)
3.3 Medidas de dispersi´on.
3.4 Medidas de forma.
4. MEDIDAS DE DESIGUALDAD
4.1 Medidas de concentraci´on.
4.2 Curva de Lorenz: c´alculo e interpretaci´on.
ESQUEMA DE LA SEMANA: SESI ´
ON 4
5. AN´ALISIS DE DOS VARIABLES: DISTRIBUCI ´ON CONJUNTA
5.1 An´alisis estad´ıstico de dos o m´as variables.
5.2 Variables cualitativas: distribuci´on conjunta, distribuciones marginales y distribuciones condicionadas.
5.3 Variables cuantitativas: distribuci´on conjunta, distribuciones marginales y distribuciones condicionadas. Media de la distribuci´on condicionada. Representaci´on gr´afica.
5.4 Independencia estad´ıstica.
6. MEDIDAS DE ASOCIACI ´ON ENTRE DOS VARIABLES
6.1 El gr´afico de dispersi´on y la relaci´on lineal entre variables.
6.2 La covarianza entre dos variables cuantitativas.
6.3 El coeficiente de correlaci´on entre dos variables cuantitativas.
INTRODUCCI ´
ON: ¿Qu´
e es la Estad´ıstica?
Definici´on de Estad´ıstica:
Es la ciencia que se ocupa de la recolecci´on, clasificaci´on, an´alisis, s´ıntesis e interpretaci´on de los datos.
Es una importante herramienta para generar conocimiento.
Se aplica en todas las ´areas del saber y muy especialmente, en las Ciencias Sociales para medir las relaciones entre las variables y hacer predicciones.
INTRODUCCI ´
ON: Un poco de historia
Estad´ıstica quiere decirCiencia del Estado.
Los estados necesitaban registros de sus habitantes.
Se desarrolla con el estado moderno. En los siglos XVII y XVIII comienzan los censos de poblaci´on en Europa.⇒ Recopilaci´on sistem´atica de datos.
Hasta el s/XIX se aplican medias y gr´aficos para sintetizar la informaci´on de los datos. Ciencia descriptiva.
A partir del s/XIX trata de extraer conclusiones de los datos, en t´erminos de previsiones.Ciencia normativa.
INTRODUCCI ´
ON: Un poco de historia
S/XIX: De la astronom´ıa, se desarrolla el problema de estimaci´on de cantidades desconocidas a partir de muestras. Gauss propone la distribuci´on normal como modelo para los errores de medida.
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4
-4 -2 0 2 4
z
y
INTRODUCCI ´
ON: Etapas de un estudio estad´ıstico
Etapas del m´etodo cient´ıfica:
1 Planteamiento del problema: objetivo del estudio y poblaci´on de
inter´es.
2 Recogida de informaci´on: dise˜no de muestra, encuesta.
3 An´alisis descriptivo.
4 Inferencia estad´ıstica: se propone un modelo para la poblaci´on y se
analizan los datos a la luz del modelo.
Introducci´
on a las funciones estad´ısticas en Excel
En este curso vamos a utilizar las siguientes funciones de EXCEL:
Gr´aficos.
Funciones estad´ısticas.
Tablas y gr´aficos din´amicos. Es una opci´on del men´u
EJERCICIO
Obt´en del INE datos de alumnos matriculados en el curso 2007-2008 en la
Universidad de Cantabria por sexo y tipo de estudio. El resultado debe ser el siguiente:
Matriculaci´on de estudiantes en curso 2007-2008
Total Mujeres
Total 10.428 5.319
Arquitectura e Ingenier´ıas T´ecnicas 2.206 667
Diplomaturas 2.951 1.994
Licenciaturas 3.227 1.997
Arquitectura e Ingenier´ıas 2.044 661
DESCRIPCI ´
ON GR´
AFICA DE DATOS (I)
Objetivo:
Extraer la informaci´on contenida en un conjunto de observaciones. Se resume la informaci´on con tablas, gr´aficos y n´umeros-resumen.
Algunos conceptos: poblaci´on y variable
Poblaci´on: el universo de objetos al que se refiere el estudio. Individuo: cada uno de los objetos o individuos de la poblaci´on. Se escribei
Variable: rasgo o caracter´ıstica de los elementos de una poblaci´on. Se escribeX,Y,Z, ...
Tipos de variable
Las variables pueden ser de dos tipos: cualitativas y cuantitativas.
Variables cualitativas
Son aquellas que clasifican a los individuos en categor´ıas o atributos,no
aparecen en forma num´erica.
Ejemplos: sexo, profesi´on, color.
Variables cuantitativas
Son aquellas que pueden expresarse num´ericamente. Pueden ser:
1 Variables cuantitativas discretas: son el resultado de contar. Ejemplo:
n´umero de hermanos
2 Variables cuantitativas continuas: son el resultado de medir. Ejemplo:
Tipos de variables cuantitativas
Seg´un la naturaleza y el tipo de operaciones que se pueden realizar, las variables cuantitativas se pueden dividir en:
Variables cuantitativas nominales: son variables cualitativas que se convierten en cuantitativas asignando n´umeros a las categor´ıas. Variables cuantitativas ordinales: tienen asociada una idea de orden, pero no tiene sentido realizar operaciones aritm´eticas.
Variables cuantitativas de intervalo: tienen la idea de orden y pueden realizarse operaciones de suma y resta.
Una variables cualitativa
Tenemos N observaciones de una variable cualitativa. Por ejemplo, el
medio de transporte que utilizan para ir al trabajo los 120 trabajadores de una empresa.
A pie
En transporte p´ublico En transporte privado
Combinaci´on de transporte p´ublico y privado.
Los datos se agrupan en categor´ıas o clases. Si la variable tiene K clases, representamos
n1,n2, . . . ,nK
el n´umero de datos que aparecen en cada una de las clases. Entonces
ni es el n´umero de datos en la clase i-´esima y se llamafrecuencia
absoluta de la clase i-´esima. La proporci´on ni
Distribuci´
on de frecuencias
El conjunto de datos se resume en una tabla, llamada distribuci´on de frecuencias, con las categor´ıas y sus frecuencias. En el ejemplo:
Categor´ıa ni fi
A pie 15 0,125
Transporte p´ublico 30 0,25
Transporte privado 45 0,375
Combinaci´on 30 0,25
Representaci´
on gr´
afica de la distribuci´
on de frecuencias
Hay tres tipos de representaciones gr´aficas de la distribuci´on de frecuencias de una variable cualitativa:
Diagrama de barras.
Diagrama Pareto: es un diagrama de barras ordenado en funci´on de la
frecuencia, de mayor a menor.
Ejercicio
En una hoja de c´alculo EXCEL
1 Escribir la calificaci´on de 20 alumnos, en funci´on de
SOBRESALIENTE, NOTABLE, APROBADO, SUSPENSO.
2 Usando funciones de EXCEL, calcular la distribuci´on de frecuencias de
las calificaciones.
3 Usando tablas din´amicas, calcular la distribuci´on de frecuencias de las
calificaciones.