• No se han encontrado resultados

EJERCICIOS RESUELTOS TEMA 1: Recogida y tratamiento de datos. Calificación Nº de estudiantes [5-6) 170 [6-7) 130 [7-8) 70 [8-9) 60 [9-10] 20

N/A
N/A
Protected

Academic year: 2021

Share "EJERCICIOS RESUELTOS TEMA 1: Recogida y tratamiento de datos. Calificación Nº de estudiantes [5-6) 170 [6-7) 130 [7-8) 70 [8-9) 60 [9-10] 20"

Copied!
6
0
0

Texto completo

(1)

1 EJERCICIOS RESUELTOS TEMA 1: Recogida y tratamiento de datos

Ejercicio 1

Después de extraer una muestra aleatoria de 450 estudiantes que aprobaron las últimas pruebas de Selectividad de Madrid, se obtuvo la siguiente distribución de frecuencias de sus calificaciones:

Calificación Nº de estudiantes

[5-6) 170

[6-7) 130

[7-8) 70

[8-9) 60

[9-10] 20

a) ¿Qué nivel de medición tiene esta variable?

b) ¿Cumple los criterios básicos de clasificación que debe cumplir toda variable? Justifique su respuesta

c) Calcule la distribución de frecuencias relativas, y la distribución de frecuencias acumuladas absolutas y relativas.

Solución

a) La variable “Calificación” es cuantitativa continua. Conocemos exactamente la distancia que separa un valor de otro, por lo que tiene un nivel de medición “de intervalo”.

b) Efectivamente cumple ambos criterios:

- Principio de exhaustividad: todos los alumnos aprobados están comprendidos en alguna de las calificaciones (es decir, en alguno de los valores de la variable), no dejando a nadie fuera.

- Principio de exclusividad muta de las categorías: no hay ningún alumno que pueda clasificarse, a la vez, en dos categorías de la variable. Por tanto, cumple con el criterio de exclusividad.

Aunque vemos en la tabla que los límites superiores de un intervalo coinciden con el límite inferior del intervalo siguiente, los corchetes cerrados nos indican que ese valor (el límite inferior) entra dentro de ese intervalo, mientras que los paréntesis (o los corchetes abiertos) indican que el valor que lo acompaña (en este caso, el límite superior) no entra en el intervalo. Así, por ejemplo:

[5-6) o [5-6[ nos indican que el valor “5” está dentro del intervalo, mientras que el “6” queda fuera. La interpretación es idéntica para los siguientes intervalos de la variable. Únicamente, el último intervalo [9-10] incluye, como es lógico, el límite superior “10” para incluir a los alumnos que hayan obtenido la máxima calificación.

c) La frecuencia relativa de cada categoría (de la i-ésima categoría) será el resultado de dividir la frecuencia absoluta (ni) de la categoría entre el total de casos (N). En este ejercicio, cada categoría corresponde a cada uno de los intervalos de la variable:

fri = 𝑛𝑛𝑖𝑖

𝑁𝑁

(2)

2 La frecuencia absoluta acumulada de una categoría (Nai) corresponde a la suma de su frecuencia absoluta (ni) más la frecuencia acumulada de la categoría anterior (Nai-1) o, lo que es lo mismo, más la suma de todas las frecuencias absolutas anteriores:

Nai = ni + Nai-1

La frecuencia relativa acumulada de cada categoría (Frai) será la suma de su frecuencia relativa (fri) más la frecuencia relativa acumulada de la categoría anterior (Frai-1) o, lo que es lo mismo, más la suma de todas las frecuencias relativas anteriores:

Frai = fri + Frai-1

Las frecuencias se presentan en la tabla siguiente. Dado que es muy útil e intuitivo para la interpretación de los datos, se ha añadido una columna para expresar las frecuencias relativas (fri) en porcentaje. Si las frecuencias relativas indican el peso de cada categoría de la variable respecto al total en tantos por uno, los porcentajes expresan ese peso en tantos por 100. Para ello, solo hay que multiplicar por 100 cada frecuencia relativa:

Calificación (xi) ni fri % Nai Frai

[5-6) 170 0,378 37,8% 170 0,378 [6-7) 130 0,289 28,9% 300 0,667 [7-8) 70 0,156 15,6% 370 0,822 [8-9) 60 0,133 13,3% 430 0,956

[9-10] 20 0,044 4,4% 450 1

TOTAL (N) 450 1 100%

Ejercicio 2

Las medidas que se representan a continuación corresponden a las alturas en centímetros de 40 niños:

157 159 155 166 162 159 156 145 152 148 157 151 160 156 154 158 154 159 162 163 148 155 158 159 149 164 163 157 169 153 155 151 163 154 168 162 157 162 161 156

a) Construya una distribución de frecuencias agrupadas en, al menos, cuatro categorías

b) Una vez construidas las categorías, ¿cuál es el porcentaje de niños que se encuentra en la categoría de mayor estatura?

(3)

3 Solución

a) La distribución de frecuencias permite resumir y ordenar una colección de datos para poder tener una visión del conjunto. Una distribución posible sería la que señalamos a continuación, con 5 categorías. Aunque la altura es genéricamente una variable continua, los valores del ejercicio aparecen en forma discreta (no hay ningún valor con decimales, es decir, entre un valor entero y otro). Por tanto, podría construirse la tabla tomando los centímetros como valores discretos:

Altura (xi) ni

145-149 4

150-154 7

155-159 16

160-164 10

165-169 3

Total (N) 40

También sería adecuado expresar las categorías en intervalos de igual amplitud considerando la variable como continua:

Altura (xi) ni [145-150) 4 [150-155) 7 [155-160) 16 [160-165) 10 [165-170] 3 Total (N) 40

b) Para ver el porcentaje solicitado es útil obtener las frecuencias relativas y expresarlas en porcentaje:

Altura (xi) ni fri %

145-149 4 0,1 10%

150-154 7 0,175 17,5%

155-159 16 0,4 40%

160-164 10 0,25 25%

165-169 3 0,075 7,5%

Total (N) 40 1 100

Con esta distribución de frecuencias podemos observar el porcentaje de individuos respecto al total en cada una de las categorías. El 7,5% de los niños entrarían en la categoría de mayor altura, es decir, entre 165 y 169 cm.

(4)

4 Ejercicio 3

Según datos del INE, la siguiente tabla muestra la población residente en Castilla-La Mancha distribuida por provincias a 1 de enero de 2016:

Provincia CLM Habitantes

Albacete 392.118

Ciudad Real 506.888

Cuenca 201.071

Guadalajara 252.882

Toledo 688.672

a) Calcule la distribución de frecuencias relativas

b) ¿Qué porcentaje de población supone Cuenca respecto al total de castellano-manchegos? ¿Y Toledo?

Solución

a) Para calcular la tabla de frecuencias relativas necesitamos primero saber el total (N), es decir, el total de población residente en Castilla-La Mancha. Para ello sumamos todas las frecuencias absolutas. La tabla resultante es la siguiente:

Provincia CLM

(xi) Frecuencia

absoluta (ni) Frecuencia relativa (fr)

Albacete 392.118 0,1921

Ciudad Real 506.888 0,2483

Cuenca 201.071 0,0984

Guadalajara 252.882 0,1239

Toledo 688.672 0,3373

TOTAL (N) 2.041.631 1

b) Para calcular el porcentaje multiplicamos la frecuencia relativa de la categoría por 100:

𝑛𝑛𝑖𝑖

𝑁𝑁 · 100

Cuenca: 0,0984 · 100 = 9,84% La población de Cuenca supone un 9,84% del total de Castilla-La Mancha

Toledo: 0,3373 · 100 = 33,73% El 33,73% de los castellano-manchegos pertenece a la provincia de Toledo.

(5)

5 Ejercicio 4

Según datos del INE, la distribución de adultos condenados en 2016 es la siguiente:

Edad Adultos

condenados De 18 a 20 23.945 De 21 a 25 39.862 De 26 a 30 39.491 De 31 a 35 39.552 De 36 a 40 37.472 De 41 a 50 55.459 De 51 a 60 24.948

De 61 a 70 8.178

Más de 70 2.619

TOTAL (N) 271.526

a) Calcular la distribución de frecuencias absolutas, relativas y acumuladas

b) ¿Cuál es el porcentaje de condenados entre 41 y 50 años? ¿Y de los que tienen entre 18 y 40 años?

Solución

a) Calculamos la tabla completa de distribución de frecuencias, incorporando también los porcentajes de las frecuencias relativas, pues su interpretación es más intuitiva:

Edad Frecuencia

absoluta (ni) Frecuencia relativa (fri)

Frecuencia absoluta acumulada

(Nai)

Frecuencia relativa acumulada (Frai)

De 18 a 20 23.945 0,0882 (8,82%) 23.945 0,0882 (8,82%) De 21 a 25 39.862 0,1468 (14,68%) 63.807 0,2350 (23,50%) De 26 a 30 39.491 0,1455 (14,55%) 103.298 0,3805 (38,05%) De 31 a 35 39.552 0,1457 (14,57%) 142.850 0,5262 (52,62%) De 36 a 40 37.472 0,1380 (13,80%) 180.322 0,6642 (66,42%) De 41 a 50 55.459 0,2042 (20,42%) 235.781 0,8684 (86,84%) De 51 a 60 24.948 0,0919 (9,19%) 260.729 0,9603 (96,03%) De 61 a 70 8.178 0,0301 (3,01%) 268.907 0,9904 (99,04%)

Más de 70 2.619 0,0096 (0,96%) 271.526 1 (100%)

TOTAL (N) 271.526 1 (100%)

b) Con los datos de la tabla vemos que los condenados entre 41 y 50 años suponen un 20,42%

de la población total de adultos condenados en 2016.

Para saber el porcentaje que suponen los que tienen entre 18 y 40 años podemos fijarnos en la distribución de frecuencias relativas acumuladas (Frai). El valor que buscamos se encuentra en la categoría “de 36 a 40”, pues incluye, además de los individuos en ese tramo de edades, la

(6)

6 suma de los porcentajes de todas las categorías de edades precedentes. Así, concluimos que el 66,42% de los adultos condenados tiene entre 18 y 40 años. Podemos interpretar este dato (ese es finalmente el sentido de construir distribuciones estadísticas): vemos que en la población adulta condenada los individuos jóvenes tienen un peso muy importante (más de un 66% tienen 40 años o menos).

Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional.

La autoría de este trabajo corresponde al equipo docente de la asignatura Estadística Social del Grado en Criminología de la UNED: Beatriz Mañas Ramírez, Alejandro Almazán Llorente y José María Arribas Macho.

http://www2.uned.es/socioestadistica/Crim/Ejercicios%20resueltos%20Tema%201- Recogida%20y%20tratamiento%20de%20datos.pdf

Referencias

Documento similar

31 Tabla 6 Coeficiente de correlación de Spearman Hipótesis Especifica 1 32 Tabla 7 Coeficiente de correlación de Spearman Hipótesis Especifica 2 33 Tabla 8 Coeficiente

Guía Didáctica de Teorías e Instituciones Contemporáneas de Educación (Madrid, UNED).. El programa de la asignatura se encuentra íntegramente desarrollado en las

Para Concluir, Europa también hizo grandes aportes a la humanidad no solo en materia de tipografía e impresión sino que también contó con artistas que con sus obras se han dado

La materia correspondiente al cuarto y al quinto Bloques, dedicados a las áreas de Didáctica de la Lengua y la Literatura y Didáctica de las Ciencias Sociales, corresponderán a

En este Master se ofrece a los alumnos instrumentos para analizar y comprender los problemas sociales de nuestros días, para conocer la pluralidad de sujetos y agentes receptores

El trabajo intelectual contenido en esta obra, se encuentra protegido por una licencia de Creative Commons México del tipo “Atribución-No Comercial-Licenciamiento Recíproco”,

5 Emisión de compuestos foto-oxidantes 6 Cambios en la biodiversidad 7 Agotamiento de energía no renovable 8 Agotamiento de recursos no renovables 9 Agotamiento de agua

Las pruebas de evaluación a distancia abarcan básicamente tres aspectos: una dedicada a las expresiones y los términos críticos manejados a lo largo de la asignatura; otro basado en