Indicar para cada uno de los siguientes tipos de gráficos con qué variables se utilizan : numéricas sin agrupar (1) ; numéricas agrupadas (2) ; nominales (3).
Puede haber más de una respuesta correcta por gráfico:
Histograma
Diagrama de frecuencia Diagrama de barras
Polígono de frecuencias acumuladas Diagrama de sectores
2 2 1, 3
2 1, 3
Indicar para cada una de las siguientes afirmaciones si es verdadera (V) ó falsa (F).
El percentil 75 de una distribución es el valor de x
que deja por encima de él, el 75% de los casos. F Cuando se usa la mediana como medida de tendencia central una medida de dispersión que se
puede utilizar es la amplitud total. V*
La media aritmética es el centro de gravedad de la
distribución. V
En una distribución con asimetría positiva o a la
derecha, la media suele ser mayor que la moda. V La mediana es la medida de tendencia central más
útil para cálculos posteriores. F
* La mejor medida de dispersión en este caso, sería la desviación cuartílica
Indicar para cada uno de los siguientes tipos de variables con qué gráficos se utilizan : histograma (1), diagrama de frecuencias (2), diagrama de barras (3), polígono de frecuencias acumuladas (4), diagrama de sectores (5). Puede haber más de una respuesta correcta por gráfico:
Nominal
Numérica sin agrupar Numérica agrupada
3, 5
1*, 2*, 3, 4* y 5 1, 2 y 4
* Si tenemos muchos datos podemos hacer intervalos de clase y utilizar este gráfico
Este gráfico NO está bien, pues tal y como viene sería un Diagrama de Barras, tratando la edad como una variable Cualitativa, es decir los intervalos son como cualidades,
El histograma (con frecuencias relativas) o diagrama de frecuencias (con frecuencias absolutas, serían los apropiados.
En la siguiente se puede observar el diagrama de frecuencias
DISTRIBUCION SEGÚN LA GLUCOSA
60
50
20 30
Frecuencia
40
10
0 40 60 80 100 120 140
Glucosa en mg/dl
Este gráfico NO está bien, pues tal y como viene sería un Diagrama de Barras dobles, tratando la edad como una variable Cualitativa,
es decir los intervalos son como
cualidades,
El histograma (con frecuencias relativas) o diagrama de frecuencias (con frecuencias absolutas, serían los apropiados, pero en el caso de cubrirse los rectángulos el gráfico más adecuado como es en este caso es el polígono de frecuencias. (ver a continuación)
DISTRIBUCION DE LAS MUJERES SEGÚN LA GLUCOSA
60
50
40
30
20
10
0 40 60 80 100 120 140
Glucosa en mg/dl
DISTRIBUCION DE LOS HOMBRES SEGÚN LA GLUCOSA
60
50
40
30
20
10
0 40 60 80 100 120 140
Glucosa en mg/dl
DISTRIBUCION DE LA GLUCOSA SEGÚN SEXO
60
mujeres hombres 50
40
30
20
10
0 40 60 80 100 120 140
Glucosa en mg/dl
CLASIFICAR LAS SIGUIENTES VARIABLES:
* Preferencias políticas (izquierda, derecha o centro). (CL)
* Velocidad en Km/h. (CTC)
* El peso en Kg. (CTC)
* Nivel educativo (primario secundario, superior). (SC)
* Años de estudios completados. (CTD)
* Tipo de enseñanza (privada o pública). (CL)
* Número de empleados de una empresa. (CTD)
* La temperatura de un enfermo en grados Celsius. (CTC)
* La clase social (baja, media o alta). (SC)
CL: Cualitativa; CTD: Cuantitativa discreta; CTC: Cuantitativa continua; SC: Semicuantitativa
CLASIFIQUE LAS VARIABLES QUE APARECEN EN EL SIGUIENTE CUESTIONARIO.
1. ¿Cuál es su edad? (CTC) 2. Estado civil: (CL)
(a) Soltero (b) Casado (c) Separado (d) Divorciado (e) Viudo
3. ¿Cuanto tiempo emplea para desplazarse a su trabajo? (CTC)
CLASIFIQUE LAS VARIABLES QUE APARECEN EN EL SIGUIENTE CUESTIONARIO.
4. Tamaño de su municipio de residencia: (SC)
(a) Municipio pequeño (menos de 2.000 hab.) (b) Municipio mediano (de 2.000 a 10.000 hab.) (c) Municipio grande (de 10.000 a 50.000 hab.) (d) Ciudad pequeña (de 50.000 a 100.000 hab.) (e) Ciudad grande (más de 100.000 hab.)
5. ¿Está afiliado a la seguridad social? (CL)
Con el fin de observar la relación entre la inteligencia y el nivel socioeconómico (medido por el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos de cociente intelectual inferior a 95 y otro formado por los demás; De cada sujeto se anotó el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla:
46 15
De 34 o más
54 20
De 28 a 34
30 25
De 22 a 28
26 30
De 16 a 22
25 35
De 10 a 16
19 75
10 o menos
Sujetos con CI ≥ 95 Sujetos con CI < 95
Nivel socioeconómico
Comentarios:
* Aquí tenemos una variables cuantitativa continua que es el nivel socioeconómico.
* Para hacer la estadística, el primer intervalo lo pondríamos de la misma amplitud que el siguiente(4 a 10) y el último igual que el anterior (34 a 40).
* Representación respecto del total y el nivel socioeconómico, el histograma, el diagrama de frecuencias, el polígono de frecuencias, los acumulados de todos también, podríamos hacer cualquiera de ellos.
* Si hacemos la representación con respecto a los totales de cada grupo, haríamos el sectorial, diagrama de barras, cualquiera para variables cualitativas.
* Las medidas más adecuadas de tendencia central en ambas muestras, sería la mediana, pues son desviadas a la Dcha los de menor a 95 y desviada a la Izda los de igual o mas de 95 de coeficiente intelectual. En este caso la medida de dispersión sería la desviación cuartílica.
* La estadística respecto al total, serían las medidas normales calculadas en los ejercicios de clase.
Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la concentración de estrona en saliva(X) para predecir la concentración del esteroide en plasma libre (Y). Se extrajeron los siguientes datos de 14 varones sanos:
68 63
64 51
48 55
49 43
38 39
27 51
25 30
Y
23 20
18 17
16 14
14 13
11 9
9 8,5 7,5
5,4 X
Estúdiese la posible relación lineal entre ambas variables.
X
30 20
10
Y 0
70
60
50
40
30
20
La relación lineal entre ambas variables es positiva, tal y como vemos en la inclinación de la nube de puntos. Más adelantes podrán determinar el grado y la ecuación.
La siguiente tabla muestra los resúmenes descriptivos que proporciona la opción Explorar del SPSS para los datos sobre la cantidad de lluvia registrada por n estaciones de medición en Madrid.
Comentarios:
* Excluimos A, pues el valor mínimo (9) no coinciden.
* Excluimos D, pues el valor mediano (20) no coinciden.
* Excluimos C, pues el valor del recorrido intercuartílico (19’75) no coinciden.
* Luego esos datos corresponden al gráfico de caja B.