ESTAD´ISTICA DESCRIPTIVA
1.
Conceptos Generales
Poblaci ´on estad´ıstica.- Conjunto de todos los elementos sobre el que recaen las observaciones. Las poblaciones pueden ser:
• infinitas, p.e. extracciones con reemplazamiento de una bolsa, • finitas, p.e. pacientes de un centro m ´edico.
Unidad estad´ıstica o individuo.- Cada uno de los elementos que componen la poblaci ´on. Este nombre se debe al origen demogr ´afico de la estad´ıstica descriptiva.
Muestra.- Subconjunto de elementos de la poblaci ´on. Para extraer conclusiones sobre la poblaci ´on, hay que elegir una muestra repre-sentativa de ella. El n ´umero de elementos de la muestra se llama
tama ˜no de la muestra. Se realiza un censo cuando se observan todos los elementos de la poblaci ´on.
Car ´acter.- Cualidad o propiedad en un individuo.
• Cada car ´acter de los individuos de la poblaci ´on puede repre-sentar variasmodalidades, de tal forma que cada individuo de la poblaci ´on presenta una y solamente una de las modalidades del car ´acter.
Ejemplo 1.1. Considerando una muestra de mujeres
ingresa-das en una maternidad, el car ´acter estado civil puede presen-tar las siguientes modalidades: solteras, casadas, viudas, no
• Se dice que un car ´acter es cualitativo si sus modalidades no son medibles. Y que escuantitativoen caso contrario.
Ejemplo 1.2. Considerando la poblaci ´on formada por los
pa-cientes de un centro m ´edico son caracteres cualitativos el
se-xo o el estado civil, y son caracteres cuantitativos el peso,
la edad, la altura o las pulsaciones por minuto.
Variable estad´ıstica.- Valores num ´ericos de las distintas modalida-des de un car ´acter estad´ıstico. Se clasifican en:
• discretas, que solo pueden tomar valores aislados. General-mente, las variables estad´ısticas discretas toman valores sobre el conjunto de los n ´umeros enteros. Ejemplo: n ´umero de hijos de mujeres ingresadas en una maternidad.
• continuas, que pueden tomar infinitos valores en un intervalo dado. Ejemplo: temperatura de un paciente.
Existen variables cuantitativas que son continuas por naturaleza, pe-ro que debido a la precisi ´on de los aparatos empleados para medir-las aparecen como discretas. Tal es el caso de una b ´ascula que ofrece 100 gramos de precisi ´on. Las medidas que se pueden ob-tener con ella en kg son: 10.1, 10.2, 10.3, . . . . En realidad, lo que representa cada valor es que el peso del objeto en cuesti ´on se en-cuentra en un intervalo de radio 0.05.
2.
Ordenaci ´on de datos. Distribuciones de un
car ´acter
Consideremos una poblaci ´on estad´ıstica de N individuos, y una va-riable estad´ıstica X que puede tomar los valores x1, x2, . . . , xk, pero cada
Ejemplo 2.1. El siguiente conjunto de datos representa el n ´umero de
ci-garrillos fumados al d´ıa para un cierto n ´umero (N = 60) de mujeres em-barazadas:
2 1 7 6 8 4 8 4 6 8 6 7 7 7 8 3 9 7 6 5 1 1 2 9 6 3 7 6 4 7 6 9 7 8 6 5 7 10 8 3 5 7 7 6 5 10 8 5 9 7 2 1 4 8 9 4 2 1 8 1
Recorrido.- Diferencia entre el mayor y menor valor que toma la variable.
Frecuencia absoluta (ni) de un valor xi de la variable X.- N ´umero
de veces que aparece repetido en el conjunto de las observaciones realizadas.
Frecuencia relativa (fi).- Viene dada por fi = nNi, donde N es el
n ´umero de observaciones.
Frecuencia absoluta acumulada (Ni).- Suma de las frecuencias
absolutas de los valores menores o iguales a xi.
Frecuencia relativa acumulada (Fi).- Viene dada por Fi = NNi =
Pi j=1 nj N = Pi j=1fj
Tabla de frecuencias de una variable discreta.- Se construye or-denando los distintos valores de la variable de menor a mayor y anotando las distintas frecuencias:
xi ni fi Ni Fi
Ejemplo 2.2. Construir la tabla de frecuencias correspondiente al
xi ni fi Ni Fi 1 6 0.1 6 0.1 2 4 0.067 10 0.167 3 3 0.05 13 0.217 4 5 0.083 18 0.3 5 5 0.083 23 0.383 6 9 0.15 32 0.533 7 12 0.2 44 0.733 8 9 0.15 53 0.883 9 5 0.083 58 0.967 10 2 0.033 60 1 2 1 7 6 8 4 8 4 6 8 6 7 7 7 8 3 9 7 6 5 1 1 2 9 6 3 7 6 4 7 6 9 7 8 6 5 7 10 8 3 5 7 7 6 5 10 8 5 9 7 2 1 4 8 9 4 2 1 8 1
2.1.
Propiedades de las frecuencias
1. n1+ n2+ . . . + nk = N 2. f1+ f2+ . . . + fk= 1 3. Nk = N 4. Fk= 1 5. 0 ≤ ni ≤N 6. 0 ≤ fi ≤1 7. Ni = Ni−1+ ni 8. ( %)xi = fi×100
2.2.
Tratamiento de variables agrupadas en intervalos
de clase
En caso de disponer de pocas observaciones se tienen pocos valores para la variable en estudio. Aunque se disponga de muchas observacio-nes, se pueden tener pocos valores distintos. Ahora bien, en caso de tener muchas observaciones y muchos valores distintos, agruparemos los valo-res en intervalos.
Hay que elegir la amplitud del intervalo de modo que no se pierda mucha informaci ´on. A la diferencia entre el extremo superior y el inferior se le llamaamplitud del intervalo. Se distinguen:
intervalos de amplitud constante.
intervalos de amplitud variable.
En general es conveniente agrupar los datos en intervalos de igual tama ˜no.
Los intervalos tambi ´en podemos elegirlos:
semiabiertos[a, b), [b, c), . . .
con l´ımites reales de clase.- No se solapan. Por ejemplo: 120 − 139, 140 − 159, ...
Conviene elegir en este caso intervalos que contengan a ´estos, que no modifiquen las frecuencias y que se solapen, por ejemplo
119,5 − 139,5, 139,5 − 159,5, . . .
A estos extremos se les llama l´ımites reales de clase. La marca de clasees el punto medio de cada intervalo y es el que representa la informaci ´on que contiene el intervalo. Para construir la tabla de frecuencias de una variable agrupada en intervalos trabajamos con la marca de clase.
3.
Representaciones Gr ´aficas
Las tablas estad´ısticas proporcionan un resumen de los datos dispo-nibles de una poblaci ´on. Esto permite realizar un an ´alisis r ´apido de los datos. Para poder realizar un r ´apido an ´alisis visual de las caracter´ısticas de la poblaci ´on se usan gr ´aficos y diagramas. Veamos algunos de los m ´as empleados.
Representaci ´on gr ´afica de caracteres cualitativos
• Diagrama de barras.- En el eje de abscisas se representan las modalidades del car ´acter cualitativo, y se levantan rect ´angulos cuyas bases miden todas lo mismo y cuyas alturas son las fre-cuencias absolutas.
Ejemplo 3.1. Cualitativo discreto: Mujeres ingresadas en una
maternidad seg ´un su estado civil.
Estado civil No mujeres
Solteras 3981 Casadas 68637
Viudas 150 No consta 646
• Diagrama de sectores.- Consiste en representar mediante sec-tores circulares las distintas modalidades de un car ´acter. Los sectores circulares han de tener un ´angulo central proporcional a la frecuencia absoluta correspondiente, por lo que el ´area del
Ejemplo 3.2. Distribuci ´on de profesionales sanitarios en el a ˜no pasado. Profesionales Frecuencias M ´edicos 51594 Odont ´ologos 3613 Farmac ´euticos 17498 Veterinarios 7462 ATS 25723
Representaci ´on gr ´afica de caracteres cuantitativos
• Diagrama de barras.- La definici ´on es an ´aloga al caso de ca-racteres cualitativos.
Ejemplo 3.3. Cuantitativo discreto: Distribuci ´on de lotes seg ´un
n ´umero de piezas defectuosas.
No piezas defectuosas Frecuencia por lote 1 6 2 14 3 16 4 7 5 5 6 2
frecuencia relativa fi. La uni ´on de los puntos medios de las
bases superiores de los rect ´angulos se denominapol´ıgono de frecuencias, y tambi ´en se ha representado en el ejemplo. • Histograma.- Se utiliza para variables agrupadas en intervalos
de clase, y consiste en representar, mediante un rect ´angulo, cada una de las modalidades, de manera que las alturas de los rect ´angulos sean iguales a las frecuencias de clase, supo-niendo que todas las clases tengan igual tama ˜no. Si no es as´ı, las alturas han de ser calculadas, de manera que las ´areas de los rect ´angulos han de ser proporcionales a las frecuencias de cada clase. La altura del i- ´esimo rect ´angulo viene dada por:
hi = ni ci , ´o hi = fi ci ,
donde ci es la longitud del i- ´esimo intervalo.
Ejemplo 3.4. Distribuci ´on de pesos para una determinada
mues-tra poblacional. Peso Frecuencia (kg) (miles) 30-40 29 40-50 127 50-60 16 60-70 24
Elpol´ıgono de frecuencias, tambi ´en representado en el ejem-plo anterior, es la l´ınea que une los puntos medios de las bases superiores de los rect ´angulos de un histograma de frecuencias.
• Diagrama de frecuencias acumuladas.- Se emplea para va-riables discretas. En el eje x se representan los valores x1, x2, ..., xk de la variable, y en el eje y sus frecuencias acumuladas,
que pueden ser absolutas o relativas.
• Pol´ıgono de frecuencias acumuladas.- Se emplea para varia-bles estad´ısticas agrupadas en intervalos. En el eje x se repre-sentan los intervalos, y en el eje y sus frecuencias acumuladas, que pueden ser absolutas o relativas.