Paso 3– Análisis de la Información.
Tutor: Astrid Segura
Luis Miguel Botero Vélez Christian Alexander Rebellon
Brayan Armando Sanchez
Universidad Abierta y a Distancia (UNAD) Ingeniería de Sistemas
Estadística Descriptiva Bogotá
Introducción
En este trabajo propuesto por la UNAD, específicamente por el curso Estadística Descriptiva, nos establece los temas más avanzados en cuento a la estadística se refiere y desarrollar mediante una serie de lineamientos las temáticas de Medidas Univariantes de tendencia central y Medidas Univariantes de Dispersión. La actividad parte de forma individual, para posteriormente pasar a ser colaborativa realizando un aporte grupal donde se reportan y analizan ciertos factores mediante una base de datos que da el curso para revisar y así consolidar el trabajo final.
Justificación
Este trabajo nos brinda la posibilidad de empezar hacer
cuestionamientos, analizar, proceder y categorizar ciertos temas de manera que podamos clasificarlos y podamos debatirlo de forma clara y precisa. En este contexto, las actividades propuestas servirán para aprender de diferentes maneras de representar y hacer estadísticas, además de que nos pueden servir para nuestra vida cotidiana.
Objetivos
El objetivo principal de esta actividad consiste relacionar nociones básicas, clasificar, tabular, presentar la información y describir la problemática planteada.
Objetivos específicos:
-Coordinarse específicamente entre los miembros del grupo para elaborar un buen informe.
-Realizar satisfactoriamente la elección de una variable discreta que sea representativa y elaborar una tabla de frecuencias para datos NO
agrupados, representarla gráficamente, calcular las medidas de
tendencia central: media, mediana, moda, los cuartiles, deciles 5 y 7 ; percentiles 30 , 50 e interpretar sus resultados.
-Poder elegir una variable Continua que sea representativa y siguiendo los lineamientos, diseñar una tabla de frecuencia para datos agrupados, representarla gráficamente por medio de un histograma de frecuencias, un polígono de frecuencias, calcular las medidas de tendencia central, determinar el tipo de asimetría, los cuartiles , deciles 5 y 7 ; percentiles 25, 50 ( Interpretar sus resultados).
-A partir de la base de datos suministrada, lograr elegir como mínimo, una variable discreta y calcular las medidas univariantes de dispersión más adecuadas, a aquellas que consideremos sean relevantes para el problema de estudio. Con la variable Discreta elegida debemos calcular: rango, varianza, desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio. Con la variable Continúa elegida debemos calcular: rango, varianza, desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio.
Desarrollo de la actividad
Medidas De Tendencia Central y Dispersión para la variable discreta
Variable Personas sin Empleo
0 5 10 15 20 25 30 35 Fre cu en cia
Personas sin empleo
Histográma de Frecuencia
Clase Frecuencia 2282952.576 1 2713048.873 1 3143145.17 8 3573241.466 5 4003337.763 14 4433434.06 20 4863530.356 27 5293626.653 29 5723722.949 31 6153819.246 21 6583915.543 18 7014011.839 11 7444108.136 4 y mayor... 5
Para esta variable las medidas de tendencia central se hallaron los siguientes resultados en los cuales, de 195 datos, que son los meses transcurridos entre enero de 2001 y marzo de 2017, se halló que:
0 5 10 15 20 25 30 35 Fre cu en cia
Personas sin empleo
Polígino de Frecuencias
-La media de la variable son en promedio 5.148.582 personas que
estuvieron sin empleo en este periodo de tiempo que fue establecido por la base de datos brindada.
-La mediana de la variable: *Explicación de datos: -Dato mínimo: 2.282.953 -Mediana: 5.193.946 -Dato máximo: 7.874.204
En conclusión, entre 2.282.953 y 5.193.946 de personas estuvieron sin empleo entre el 50% de los 195 meses de la muestra. El otro 50% se interpreta que hubo entre 5.193.946 y 7.874.204 de personas sin empleo.
-La moda para esta variable no aplica, puesto que ningún valor se repite, es por esto que tampoco aplica la tabla de frecuencias.
-Los cuartiles de la variable, es decir la división de la variable en 4 partes iguales, dándonos 3 cuartiles, que serían los puntos de división y en el cual también uno de los cuartiles es la mediana o la mitad de los datos de la variable siendo en este caso y en todos los casos
estadísticos el cuartil número 2, se establece rangos en este caso de personas que estuvieron desempleadas en un periodo de tiempo que se expondrá a continuación:
Las interpretaciones de datos comprenden valores entre 25%, 50%, 75% y 100%
*Explicación de datos: -Dato mínimo: 2.282.953
-Cuartil 1: 4.411.976
-Mediana y cuartil número 2: 5.193.946 -Cuartil 3: 5.890.311
-Dato máximo: 7.874.204
En el cuartil número 1 es decir, entre el dato mínimo de la variable y el primer punto de división, podemos indicar, tras la explicación de datos anterior, hubo entre 2.282.953 y 4.411.976 de personas sin empleo. Representando lo anterior el 25% de la interpretación mediante los 195 meses de la muestra. El otro 75% restante se interpreta que hubo entre 4.411.976 y 7.874.204 de personas sin empleo.
En el cuartil número 2, que a su vez es el decil número 5 que es
también el percentil número 50, y la mediana de la variable, representa que entre: 2.282.953 de personas (siendo este el dato mínimo de la variable) y 5.193.946 de personas, (siendo este las demás medidas de posición antes mencionadas), estuvieron sin empleo. En esta
interpretación de los datos sería el 50% de la variable. El otro 50% se interpreta que hubo entre 5.193.946 y 7.874.204 (siendo este último valor el máximo de la variable) de personas que estuvieron sin empleo.
En el cuartil número 3, representa que hubo entre 2.282.953 (siendo este el dato mínimo de la variable) y 5.890.311 (siendo este el cuartil número 3), de personas que estuvieron sin empleo. Lo anterior
representando el 75% en esta interpretación de datos de la variable. El otro 25% se interpreta que hubo entre 5.890.311 y 7.874.204 de
El decil número 7 que significa la división en 10 partes iguales nuestra muestra, significando que cada parte representa el 10% y en ese porcentaje hubo 5.749.360 de personas que estuvieron sin empleo.
El percentil que significa la división de nuestra muestra en 100 partes iguales, donde cada una representa el 1% y en ese porcentaje hubo 4.601.425 de personas que estuvieron sin empleo.
Dispersión
-El rango de la variable establece que es el intervalo entre el valor máximo y el valor mínimo; por ello, se halló que ese intervalo es de 5,591,252 de personas.
La varianza de la variable es de 1,245,273,304,148
La desviación típica de la variable que nos indica cuánto pueden alejarse los valores respecto al promedio (media) es de 1,115,918 de personas
El coeficiente de evaluación es de 0.22%
Lo anterior concluye que los datos de la variable y la muestra de ellos nos indica que los valores no tienen una dispersión considerable del promedio/media.
Medidas De Tendencia Central y Dispersión para la variable continua
Variable Tasa de Desempleo
Tabla de frecuencias
Número de clases ( Intervalos) Límite inferior Límite superior Marca de clase Frecuencia absoluta Frecuencia absoluta acumulada 1 7,27 8,45 7,9 10 10 2 8,45 9,63 9,0 30 40 3 9,63 10,80 10,2 32 72 4 10,80 11,98 11,4 44 116 5 11,98 13,16 12,6 34 150 6 13,16 14,34 13,7 16 166 7 14,34 15,52 14,9 16 182 8 15,52 16,69 16,1 9 191 9 16,69 17,87 17,3 4 195
0 5 10 15 20 25 30 35 Fre cu en cia Tasa de Desempleo
Histograma de Frecuencias
0 5 10 15 20 25 30 35 40 Fre cue n ci a Tasa de DesempleoPolígono de Frecuencias
Media de la variable
La media de la variable indica un promedio de 11,68 en la tasa de desempleo en el periodo comprendido entre enero de 2001 y marzo de 2017.
Moda de la variable
La moda de la variable indica que la tasa de desempleo que más se repitió fue de 11,4 % ya que después de hacer el cálculo y el uso de las diversas fórmulas fue el dato que más se repitió siendo este 44 veces interpretados en meses. La Mediana de la variable *Explicación de datos: -Dato mínimo: 7,27 -Mediana: 11,48 -Dato máximo: 17,87
En conclusión, hubo una tasa de desempleo entre el 7,27% y el 11,48% entre el 50% de los 195 meses comprendiendo entre enero de 2001 y marzo de 2017. El otro 50% indicó que hubo una tasa de desempleo entre el 11,48 % y el 17,87%.
Cuartiles, deciles y percentiles de la variable
En el cuartil número 1 es decir, entre el dato mínimo de la variable y el primer punto de división, podemos indicar, tras la explicación de datos anterior, hubo una tasa de desempleo entre 7,27% y 9,95%
Representando lo anterior el 25% de la interpretación mediante los 195 meses de la muestra. El otro 75% restante se interpreta que hubo una tabla de desempleo entre el 9,95% y el 17,87.
En el cuartil número 2, que a su vez es el decil número 5 que es
también el percentil número 50, y la mediana de la variable, representa que hubo una tasa de desempleo entre 7,27% y el 15,89%. En esta interpretación de los datos sería el 50% de la variable. El otro 50% se interpreta que hubo una tasa de desempleo entre el 15,89% y el 17,87%.
El tipo de asimetría de la variable es una asimetría negativa ya que el valor de la media tuvo una tendencia hacia la derecha a pesar de que el caso de estudio casi arroja una simetría.
En el cuartil número 3 es decir podemos indicar, tras la explicación de datos anterior, hubo una tasa de desempleo entre 7,27% y 13,03% Representando lo anterior el 75% de la interpretación mediante los 195 meses de la muestra. El otro 25% restante se interpreta que hubo una tabla de desempleo entre el 13,03% y el 17,87%.
El decil número 7 que significa la división en 10 partes iguales nuestra muestra, significando que cada parte representa el 10% y en ese porcentaje hubo una tasa de desempleo de 12,69%.
El percentil que significa la división de nuestra muestra en 100 partes iguales, donde cada una representa el 1% y en ese porcentaje hubo una tasa de desempleo del 10,31%.
Dispersión
El Rango de la variable establece que es el intervalo entre el valor máximo y el valor mínimo; por ello, se halló que ese intervalo es de un porcentaje del 10.60%
La varianza de la variable es 5.10%
La desviación típica de la variable que nos indica cuánto pueden alejarse los valores respecto al promedio (media) es de solo el 2.3%
El coeficiente de evaluación es de 0.2%
Lo anterior concluye que los datos y la muestra de ellos no tienden alejarse entre sí y por lo tanto la tasa de desempleo calculada no tiene una dispersión severa sobre el promedio/media.
Conclusiones
En síntesis, este trabajo primero que todo, sirvió para elaborar mejor un esquema organizado de trabajo en nuestro inicio. A su vez, mediante este curso y sus temáticas podemos empezar a estudiar los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio y así poder acercanos a la estadística como tal. Además, ahora sumarle las temáticas propuestas como lo son las Medidas Univariantes de tendencia central y las Medidas Univariantes de Dispersión. Seguido de esto, resulta enriquecedor para nuestro proyecto de trabajo y de vida, si se quiere, ya que la estadística es una disciplina aplicada en todos los campos de la actividad humana. Ya que como es bien sabido, se utiliza para describir, analizar e interpretar ciertas características de un conjunto de individuos llamado población y demás conceptos acuñados a la estadística como tal.
Bibliografía
Conceptos Básicos. (31 de Marzo de 2013). Obtenido de
población,muestra,dato y variable estadística descriptiva: https://www.youtube.com/watch?v=FKcb16juO9c
Lorenzo, J. M. (2007). Conceptos Generales. Madrid: Paraninfo. Obtenido de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100007&v= 2.1&u=unad&it=r&p=GVRL&sw=w&asid=0a7332df0d4700de0bd2 72caa41e1718
Pava, M. F. (1 de Julio de 2015). ESTADÍSTICA DESCRIPTIVA. Obtenido de
http://estadisticadescriptivaunad100105.blogspot.com.co/2015/07 /tablas-de-contingencia-doble-entrada.html
Pava, M. F. (12 de Septiembre de 2017). Adobe Connect UNAD. Obtenido de Webconference 2 Estadistica Descriptiva: https://goo.gl/xmHJnf