ESTADÍSTICA
DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA
•
Los orígenes de la estadística, aunque no se sabe con
exactitud cuándo se comenzó a utilizar, pueden estar
ligados al antiguo Egipto como a los censos chinos que se
realizaron hace unos 4.000 años, aproximadamente.
•
Sin duda, fueron los romanos, maestros de la organización
política, quienes mejor supieron ocupar la estadística.
Cada cinco años realizaban un censo de la población,
cuyos datos de nacimientos, defunciones y matrimonios
eran esenciales para estudiar los avances del imperio; sin
olvidar los recuentos de ganancias y las riquezas que
ESTADÍSTICA DESCRIPTIVA
•
Para poder comprender mejor este tipo de
estudio es importante que conozcas los
siguientes términos básicos:
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA
Todo estudio estadístico debe considerar
diferentes tipos de variables:
Variables
Variables cualitativas
ESTADÍSTICA DESCRIPTIVA
Variables
cualitativas:
Relacionadas
con
ESTADÍSTICA DESCRIPTIVA
Variables Cuantitativas:
Relacionadas
con características numéricas del
individuo por ejemplo: edad, precio
de un producto, ingresos anuales.
Las variables cuantitativas se dividen
en
discretas
(aquellas que pueden
tomar solo algunos valores en un
intervalo y no valores intermedio,
ejemplo: edad,
número de hermanos
que puede ser 1, 2, 3....,etc, pero,
por ejemplo, nunca podrá ser 3,45) o
Estadística Descriptiva
: Es la parte de la estadística que trata solamente de
describir y analizar un grupo dado sin sacar conclusiones o inferencias de un
grupo mayor, a partir de ella. La estadística descriptiva incluye las técnicas que
se relacionan con el resumen y la descripción de datos numéricos. Estos datos
pueden ser gráficos o pueden incluir análisis computacional.
Estadística Inferencial
: Cuando una muestra es representativa de una
población se pueden deducir importantes conclusiones acerca de esta, a
partir de su análisis. La inferencia estadística comprende aquellas técnicas por
medio de las cuales se toma decisiones sobre una población estadística
basadas solo en la muestra observada. Debido a que dichas decisiones se
toman en condiciones de incertidumbre, entonces estas serán confiables con
cierto grado de probabilidad. Considerando que las características medidas de
una muestra se denominan estadísticas de la muestra, las características
medidas de una población estadística, o universo se llaman parámetros de la
ESTADÍSTICA DESCRIPTIVA
Ordenando la Información
Al ordenar datos muy numerosos, es
usual agruparlos en
clases
o
categorías
.
Al determinar cuántos pertenecen a
cada clase, establecemos la
frecuencia.
ESTADÍSTICA DESCRIPTIVA
¿Para qué se construyen las tablas
de frecuencias ?
1. ORDENAR
2. AGRUPAR
ESTADÍSTICA DESCRIPTIVA
El formato general de una tabla estadística , llamada también
TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS es la siguiente:
Nombre de la
variable
Frecuencia
Categorías o
Recorrido de la
variable
Frecuencias
Observadas
ESTADÍSTICA DESCRIPTIVA
En la siguiente tabla se presenta el motivo de la
consulta médica, durante una semana.
Motivo Consulta
Número de pacientes
Bronquitis
19
Otitis
13
Heridas
7
Fracturas
18
ESTADÍSTICA DESCRIPTIVA
TIPOS DE FRECUENCIAS
a) Frecuencia o Frecuencia Absoluta:
Es el número de veces
que se presenta un valor o categoría de una variable. Se
representa por f
i.
b)
Frecuencia Relativa:
La frecuencia relativa se puede expresar
ESTADÍSTICA DESCRIPTIVA
Los siguientes datos corresponden a las notas obtenidas por
un curso de
24 alumnos
en un trabajo de matemáticas:
3,2 4,2
5,6
6,0 2,8
3,9
4,2 4,2 5,0 5,0
3,9 3,9
3,2
3,2 4,2 5,6 6,0 6,0 3,2
6,0 4,2
5,0 5,6 5,0
Ordenemos estos datos en una tabla:
Anota en tu cuaderno una tabla de frecuencias que
considere
•
Nombre de variable: Notas
•
Frecuencia Absoluta
•
Frecuencia relativa (ambas)
ESTADÍSTICA DESCRIPTIVA
Nota
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia Relativa
Porcentual (%)
ESTADÍSTICA DESCRIPTIVA
Nota
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia Relativa
Porcentual (%)
2,8
1
0,041
4,166
3,2
4
0,166
16,666
3,9
3
0,125
12,500
4,2
5
0,208
20,833
5,0
4
0,166
16,666
5,6
3
0,125
12,500
6,0
4
0,166
16,666
ESTADÍSTICA DESCRIPTIVA
Hasta el momento sólo hemos trabajado con una pequeña
cantidad de datos. ¿Qué crees que deberíamos hacer si tenemos
muchos datos?
Tabla de Frecuencias de datos agrupados
(
tambien llamadas tabla de frecuencias con clase)En ocasiones, el agrupar los datos en
ESTADÍSTICA DESCRIPTIVA
Definiciones:
•
Rango: Diferencia entre el máximo y el mínimo
valor de una variable.
•
Marca de clase: Representante de un intervalo, y
corresponde al promedio entre los extremos de
éste.
•
Tamaño de un intervalo: Es el cuociente entre el
ESTADÍSTICA DESCRIPTIVA
Para estas tablas debemos considerar cada intervalo con límites
cerrado y abierto, o sea [ - [
La tabla siguiente la vamos a elaborar con:
frecuencias absolutas
: estas frecuencias son las que se
obtienen directamente del conteo
frecuencias relativas
: corresponden a los porcentajes de cada
frecuencia absoluta.
frecuencia absoluta acumulada
: corresponde a la frecuencia
absoluta del intervalo más la suma de las frecuencias absolutas
de todos los valores anteriores.
Sueldo ($)
Marca de
Clase
frecuencia
Absoluta
Frecuencia
Relativa %
Frecuencia
Absoluta
Acumulada
Frecuencia
Relativa
Acumulada %
[200.000 – 300.000[
250.000
5
25
5
25
`[300.000 – 400.000[
350.000
4
20
9
45
[400.000 – 500.000[
450.000
4
20
13
65
[500.000 – 600.000[
550.000
3
15
16
80
Nivel de colesterol en la sangre de una muestra de hombres
estadounidenses que tienen entre 25 y 34 años de edad , que fueron
atendidos en centros médicos de New York y sufren de hipertensión
arterial , en el año 2001
Nivel de Colesterol (mg/
100 ml)
Cantidad de hombres
80-120
13
120-160
15
160-200
44
200-240
29
240-280
9
¿Cuál es la variable de
interés?
¿Qué se mide?
ESTADÍSTICA DESCRIPTIVA
Ejemplo:
Consideremos los siguientes datos, expresados en metros,
correspondientes a las estaturas de 80 estudiantes de Cuarto
año de Educación Media.
ESTADÍSTICA DESCRIPTIVA
Estatura Mayor: 1,93 metros
Estatura Menor: 1,66 metros
Rango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.
Formaremos 6 intervalos. Para calcular el tamaño de intervalo de
cada uno dividimos 27 y 6, obteniendo finalmente 4,5 5
Luego los intervalos de la tabla son:
Intervalo Marca de Clase Frecuencia Absoluta
1,65 – 1,69
1,70 – 1,74
1,75 – 1,79
1,80 – 1,84
1,85 – 1,89
ESTADÍSTICA DESCRIPTIVA
Representaciones Gráficas
La información contenida en las tablas de frecuencias resulta más accesible y fácil de interpretar si se representan por medio de gráficos estadísticos.
GRÁFICOS
Gráficos estadísticos
Diagrama de barras
Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de series
GRÁFICOS
Histograma
Está formado por rectángulos, cuyas bases corresponden con los intervalos de clase y
sus
Áreas son iguales o proporcionales a sus frecuencias.
GRÁFICOS
Polígono de frecuencias
GRÁFICOS
Diagrama de sectores o gráfico circular
Gráfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace
GRÁFICOS
Pictogramas
Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de frecuencias. Este tipo de gráfica atrae la atención por los dibujos, pero la desventaja es que se lee en forma aproximada.
Gráfico de líneas u ojiva
En este tipo de gráfico, al igual que el histograma y el polígono de frecuencias el objetivo es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas.
se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí.
ESTADÍSTICA DESCRIPTIVA
Ejercicios:
ESTADÍSTICA DESCRIPTIVA
Días
N° Artículos
Frecuencia
Relativa
Frecuencia
relativa
porcentual
ESTADÍSTICA DESCRIPTIVA
Edad
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia
Relativa %
20-24
6
MEDIDAS DE RESUMEN
Entre las medidas que permiten
resumir información proveniente de
una
población,
podemos
Medidas de Posición
Tienen por objeto, obtener un valor
que resuma en sí todas las
mediciones. La mayoría de ellas trata
de ubicar el centro de la distribución,
razón por la cual, se llaman
MEDIDAS
DE
TENDENCIA
MEDIDAS DE TENDENCIA CENTRAL
Media aritmética o promedio: Es una de
las medidas de tendencia central de
mayor uso. La media muestral se
simboliza por y la media poblacional
de denota por
.
PROMEDIO PARA DATOS NO TABULADOS
Sea X una variable cuantitativa y x
1, x
2,…, x
nuna muestra
de tamaño "n" de valores de la variable, se define la media
aritmética de X como:
n
x
x
x
x
X
1
2
3
...
n
n
x
X
n i i
1PROMEDIO PARA DATOS TABULADOS
Para calcular la
media aritmética
de un conjunto de datos, se suma cada uno de los
valores y se divide entre el total de casos.
Sea X una variable estadística que toma los valores , con frecuencias absolutas ,
respectivamente, la media viene dada por
:
Ejemplo N°1
Consideremos la edad en años de ocho personas
10 18 25 32 12 5
7
7
En este ejemplo el promedio , media o media aritmética de la edad de
estas personas está dada por:
8
7
7
5
12
32
25
18
10
x
Mediana (Me)
Sea X una variable por lo menos ordinal y sea x
1, x
2,…x
nuna muestra de
tamaño n de observaciones de la variable, se define como Mediana "Me" un
valor tal que supera a no más del 50% de las observaciones y es superado
por no más del 50% de las observaciones, cuando estas han sido
ordenadas según magnitud
.
MEDIANA PARA DATOS NO TABULADOS
Ejemplo: Consideremos la edad en años de ocho personas
10 18 25 32 12 5
7
7
Para calcular la mediana , previamente se deben ordenar las
observaciones. En este caso lo haremos en forma creciente:
5 7 7 10 12 18 25 32
Como la cantidad de datos es par, entonces la mediana
MEDIANA PARA DATOS TABULADOS
En casos de datos agrupado es un poco más complejo
y requiere de la utilización de la siguiente fórmula
límite inferior de la clase mediana
amplitud del intervalo
número total de datos
frecuencia absoluta acumulada de la clase anterior a la mediana
frecuencia absoluta de la clase mediana
i
i
i
f
F
N
c
L
M
2
1
Moda o Modo (Mo) para datos no tabulados
La
moda
se identifica al observar el valor que se presenta con más
frecuencia en la distribución.
Si consideramos el ejemplo del peso de una muestra de
personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas pesa 48 kilos y 78 kilos.
Esta distribución es bimodal.
Moda o Modo (Mo) para datos tabulados
Ahora bien, en el caso de datos agrupados en intervalos, es fácil determinar la clase modal (clase con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga
mayor frecuencia se obtiene a partir de la siguiente expresión:
límite inferior de la clase modal. amplitud de los intervalos.
diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior.
Cuantiles
La mediana divide a la distribución en dos partes iguales, los cuantiles son parámetros que dividen los datos de la distribución en partes iguales.
Los más usados son:
Cuartiles:
Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales. ( cuartil primero, cuartil segundo y cuartil tercero )
Quintiles:
Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales. ( quintil primero,... )
Deciles:
Nueve valores iguales que dividen la distribución en 10 partes iguales. ( decil primero,...)
Percentiles:
Noventa y nueve valores que dividen la serie en 100 partes iguales. ( percentil primero,... )