ESTADÍSTICA
1.- NOCIONES GENERALES
:
Conjunto de elementos cuyo conocimiento es objeto de estudio.
Ejemplo: Jóvenes de Laguna de Duero.
:
Parte de la población cuyo estudio sirve para inferir características de la población.
Ejemplo: Jóvenes que viven en la Av. Madrid.
:
Cada uno de los elementos de la población.
Ejemplo: Cada uno de vosotros.
VARIABLES ESTADÍSTICAS
Aspectos que se desean estudiar en los individuos de una población.
Ejemplos: Consumo de tabaco, tiempo dedicado a la lectura, cantidad de dinero del que disponen
mensualmente.
:
Se asocian a los caracteres estadísticos. Recorre todos los valores de un carácter.
:
Cualitativas: no toman valores numéricos.
Ejemplo: Consumo de tabaco (Si / No).
Cuantitativas discretas: Toman valores numéricos aislados.
Ejemplo: Número de personas que viven en un domicilio, calificaciones en Matemáticas.
Cuantitativas continuas: Toman todos los valores de un cierto intervalo
Ejemplo: Estatura de las personas, ingresos mensuales de una familia.
2.- DISTRIBUCIONES ESTADÍSTICAS
• VARIABLE DISCRETA – Diagramas de barras:
• VARIABLE CONTINUA – Histograma:
Cada barra tiene una altura proporcional a la frecuencia absoluta de cada valor de la variable.
Cada columna tiene una superficie proporcional a la frecuencia absoluta del
intervalo.
0 1 2 3 4 5 6 7 8
0 1 2 3 4 5 6 7 8 9 10
NÚMERO DE ACIERTOS DE 40 ALUMNOS/AS EN UN TEST
HISTOGRAMA pág. 207
3.- TABLAS DE FRECUENCIAS
• Frecuencia relativa (fri): cociente entre la frecuencia absoluta y el número total de datos.
• Frecuencia absoluta de un dato (fi): nº de veces que se repita cada dato.
• Porcentaje de cada dato: fri x 100.
Ejemplo: La tabla muestra el número de hijos de 50 familias
TABLAS DE FRECUENCIAS con DATOS AGRUPADOS Ejemplo Pág. 209: La tabla muestra el número de personas que viven en cada portal de una gran barriada.
Marca de clase:
punto medio de cada intervalo.
4.- PARÁMETROS ESTADÍSTICOS
• Parámetros de dispersión: indican cuando se alejan los datos del centro de la distribución. Indican el grado de
concentración de los datos.
• Parámetros de centralización: indican entorno a qué valor se distribuyen los datos. Son la media, la mediana y la moda.
• Los parámetros de dispersión van asociados a las medidas de centralización:
Media: , varianza: sx 2, desviación típica: s.
Mediana: Me, cuartiles: Q1 y Q3.
Cálculo de y s
x
• Media: suma de los datos dividido por el número de datos. i i i
f · x
x f
Ejemplo: Observad los datos de la tabla. 117
x 50
2i i
2
i
f x x var ianza :
f
• Varianza: med¡a de los cuadrados de las diferencias de los datos a la media.
2 2i i
2 i i 2
i i
f x x f ·x
var ianza : x
f f
2 337 2
2' 34
50
x 117 2' 34
50
2 337 2
2' 34 1' 2644
50
• Desviación típica: raíz cuadrada de la varianza. var ianza 1'2644
1'2644 1'124
• Coeficiente de variación: C.V.
x
1'124
, C.V.
2' 34
1'124
, C.V. 0'48
2' 34
Interpretación de y s
x
• La Media es el centro de gravedad de la distribución.
• La desviación típica nos indica lo alejados o dispersos que están los datos de la distribución.
• Las siguientes distribuciones tienen la misma media, pero son muy diferentes.
•Ejercicio Pág. 211: 1 y 2.
5.- PARÁMETROS DE POSICIÓN PARA DATOS AISLADOS
• Colocados ordenadamente de menor a mayor los datos. La mediana y los cuartiles dividen la distribución en cuatro partes, cada una de ellas con el 25 % de los datos.
• Primer cuartil Q1: es un número mayor que el 25%
de los datos y menor que el 75% de los datos.
• Mediana Me: es un número mayor que el 50% de los datos y menor que el 50% de los datos.
• Tercer cuartil Q3: es un número mayor que el 75%
de los datos y menor que el 25% de los datos.
25% datos Q1 25% datos Me 25% datos Q3 25% datos Mediana y cuartiles
• Los valores de la variable que dividen la distribución en 100 partes iguales se denominan percentiles o
centiles.
• El percentil pk: es un número mayor que el k % de los datos y menor que los demás datos.
• Me = p50 , Q1 = p25 , Q3 = p75
37% de datos p37 63% de los datos
Percentiles o centiles
•Ejercicios Pág. 212: 1.
• Para calcular la mediana, los cuartiles y los centiles en distribuciones dadas por tablas de frecuencias, es
aconsejable utilizar las frecuencias acumuladas.
• Frecuencia acumulada de un dato: frecuencia de ese dato mas las de los datos menores a él.
Frecuencias acumuladas
Fk = f1 + f2 + ... + fk
xi fi Fi %
0 2 2 4,00%
1 9 11 22,00%
2 18 29 58,00%
3 14 43 86,00%
4 5 48 96,00%
5 2 50 100,00%
50 100,00%
Ejemplo: hallar la mediana, los cuartiles y el percentil 80%
Xi fi Fi %
0 2 2 4,00%
1 9 11 22,00%
2 18 29 58,00%
3 14 43 86,00%
4 5 48 96,00%
5 2 50 100,00%
50 100,00%
• Me: 2, porque si se colocan
ordenadamente los datos hay un 2 que divide los datos en dos partes iguales.
• Q1:
• Q3:
Me:
• Q1: 2, porque también hay un 2 que divide la distribución en dos partes, una con el 25% de los datos y otra con el 75%.
• Q3: 3, hay un 3 que divide la distribución en dos partes,
una primera con el 75% de los datos y otra segunda con el 25%.
• P80:
• P80: 3, hay un 3 que divide la distribución en dos partes, una primera con el 80% de los datos y otra segunda con el 20%.
•Ejercicios Pág. 213: 2.
6.- MEDIDAS DE POSICIÓN CON DATOS AGRUPADOS
Es una línea poligonal que tiene por vértices los puntos correspondientes a los extremos de los intervalos y sus frecuencias acumuladas.
Polígono de frecuencias acumuladas
INTERVALOS fi 148,5 - 153,5 2 153,5 - 158,5 4 158,5 - 163,5 11 163,5 - 168,5 14 168,5 - 173,5 5 173,5 - 178,5 4
Extremos
Intervalos Fi
148,5 0
153,5 2
158,5 6
163,5 17
168,5 31
173,5 36
178,5 40
Los percentiles se hallan interpolando.
Cálculo de percentiles con los polígonos de frecuencias
Extremos
Intervalos Fi
148,5 0
153,5 2
158,5 6
163,5 17
168,5 31
173,5 36
178,5 40
Ejemplo: halla Me en la distribución anterior.
x 5
7 5 35' · ' ,x 5 7 5
35 , x = 1’06 , Me = 163’5 + 1’06 = 164’56
•Ejercicios Pág. 215: 2.
7.- DIAGRAMAS DE CAJAS
• La caja abarca el intervalo Q1 – Q3, recorrido intercuatílico.
• Los bigotes deben intentar abarcar a todos los individuos.
• Los bigotes no pueden ser mayores que 1’5 veces la caja.
• Los datos fuera de los bigotes se representan por asteriscos.
Cajas y bigotes
Son muy útiles para comparar distribuciones. Ver Pág. 216
•Ejercicios Pág. 216: 1 y 2.