ANALISIS ESTADISTICO
Ing. Miguel Angel Núñez.
CIENCIAS BASICAS
Tabla de contenido
• Objetivos
• 1. Estadística descriptiva
• 2. Teoría de probabilidades.
• 3. Inferencia estadística
• Bibliografía
Objetivos Generales
• Proporcionar los conocimientos de herramientas para la toma de decisiones ante situaciones de incertidumbre.
Objetivos específicos
• Aumentar las destrezas y habilidades del estudiante en la interpretación de datos con la ayuda de herramientas de estadística descriptiva e inferencial.
• Capacitar al estudiante en el manejo de los instrumentos para disminuir el riesgo para la toma de decisiones.
UNIDAD 1.
ESTADISTICA DESCRIPTIVA
CONTENIDO
1. Conceptos básicos de estadística.
2. Distribución de frecuencias
3. Presentación de los datos en gráficos
4. Medidas de tendencia central: media, mediana y moda.
5. Medidas de variabilidad: rango, varianza, desvío estándar y coeficiente de variación.
6. Medidas de posición: Cantiles, cuartiles, deciles y percentiles.
7. Medidas de forma: asimetría y curtosis.
8. Diagrama de cajas.
Estadística
• La estadística hace referencia a la recopilación , presentación, análisis y utilización de datos para la toma de decisiones cuando existe incertidumbre (Dominick Salvatore y Derrick Reagle).
• La estadística hace referencia a la recopilación , organización
presentación, análisis e interpretación de datos con el fin de realizar decisiones mas efectivas (Mason Lind).
• Su utilización es en todos los campos de la ciencia, ingeniería,
negocios, contabilidad, economía, medicina, deporte, política, etc.
Estadística Descriptiva e Inferencial
• La estadística descriptiva se ocupa de resumir y describir un conjunto de datos (Dominick Salvatore y Derrick Reagle).
• La estadística descriptiva son procedimientos empleados para organizar y resumir conjuntos de datos numéricos (Mason Lind).
• La estadística inferencial es el proceso consistente en realizar
generalizaciones sobre un conjunto (población) mediante el análisis de una parte de dicho conjunto (muestra). Para esto la muestra debe ser
representativa de la población además de especificarse la probabilidad de error (Dominick Salvatore y Derrick Reagle).
• La estadística inferencial tiene como finalidad determinar algo acerca de una población. Siendo la población el conjunto de todos los posibles
individuos, objetos o mediciones de interés, en cambio la muestra es una parte de una población de interés (Mason Lind).
Estadística Descriptiva e Inferencial
• Población
• Conjunto de datos sobre los que se va a estudiar.
•
• Individuos
• Unidad por estudiar.
• Muestra
• Una muestra estadística es un subconjunto de datos perteneciente a una población de datos. Estadísticamente hablando, debe estar constituido por un cierto número de observaciones que representen adecuadamente el total de los datos.
Tipos de variables
• ¿Qué es una variable estadística?
• Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población y que estamos interesados en
estudiar. Estos valores, a su vez, se caracterizan por poder medirse.
• Por ejemplo, el color de pelo, las notas de un examen, el sexo o la estatura de una persona, son variables estadísticas.
• Tipos de variables estadística
• La variable estadística, de acuerdo con las características que la definen, puede ser cualitativa o cuantitativa.
Tipos de variables
Tipos de variables
• ¿Qué son las variables cualitativas?
• Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números
• Una variable cualitativa es un tipo de variable
estadística que describe las cualidades, circunstancias o
características de un objeto o persona, sin hacer uso de números.
• De esta manera, las variables cualitativas permiten expresar una característica, atributo, cualidad o categoría no númerica. Por
ejemplo, el sexo de una persona es una variable cualitativa, ya que es masculino o femenino.
Tipos de variables
• Características de las variables cualitativas
• Algunas características notables de la variable cualitativa son las siguientes:
• No se puede medir numéricamente.
• No otorga datos específicos y a veces tampoco un orden.
• Especifica una condición, cualidad o característica.
• Cuando los valores de dicha variable son solamente dos, se llama dicotómica.
• Cuando distingue tres valores o más, se la llama politómica.
Tipos de variables
• Ejemplos de variables cualitativas
• Algunos ejemplos que nos pueden ayudar a comprender la variable cualitativa son los siguientes:
• Estado civil: soltero, casado, viudo.
• La sed de una persona: mucha, poca, nada.
• Calificación no numérica de un examen: aprobado, sobresaliente, aceptado, reprobado.
• Color de ojos: marrones, azules, verdes.
• Profesión: arquitecto, médico, ingeniero, abogado.
Tipos de variables
• Variable cualitativa
• Las variables cualitativas son aquellas características o cualidades que no pueden ser calculadas con números, sino que son clasificadas con
palabras. Este tipo de variable, a su vez, se divide en:
• Cualitativa nominal: aquellas variables que no siguen ningún orden en específico. Por ejemplo, los colores, tales como el negro, naranja o
amarillo, el estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
• Cualitativa ordinal: aquellas que siguen un orden o jerarquía. Por ejemplo, el nivel socioeconómico alto, medio o bajo, La nota en un
examen: suspenso, aprobado, notable, sobresaliente, puesto conseguido en una prueba deportiva: primero, segundo, tercer.
• Cualitativa binaria: variables que permiten tan solo dos resultados. Por ejemplo, sí o no; hombre o mujer.
Tipos de variables
• Tipos de variables cualitativas
• Nominal. Variable que no es representada por números ni tiene algún tipo de orden, y por lo tanto es matemáticamente menos precisa.
• Por ejemplo, son variables nominales los colores: negro, azul, rojo, amarillo, naranja, etc.
• Ordinaria. La variable cualitativa ordinaria, también conocida como variable cuasi-cuantitativa, es representada por una modalidad que no requiere números pero sí consta de un orden o un puesto.
• Por ejemplo, el nivel socioeconómico: alto, medio, bajo.
• Binaria. La variable cualitativa binaria trabaja con valores específicos del tipo binario.
• Por ejemplo, el sexo de una persona será masculino o femenino.
Tipos de variables
• ¿Qué son las variables cuantitativas?
• Las variables cuantitativas son aquellas variables estadísticas que otorgan, como resultado, un valor numérico.
• Por ejemplo, variables tales como el peso (62 kg, 80 kg), la
altura (1.72 cm, 1.85 cm) o la cantidad de miembros en una familia (2, 3 o 4), son variables cuantitativas.
Tipos de variables
• Características de las variables cuantitativas
• Las principales características de las variables cuantitativas son las siguientes:
• Expresan sus valores con números.
• Son utilizadas generalmente en encuestas o entrevistas.
• Utilizan gráficos llamados diagramas integrales y diagramas
diferenciales para mostrar la frecuencia relativa de las variables.
• También pueden servirse de diagramas de barra para otorgar cifras.
Tipos de variables
• Ejemplos de variables cuantitativas:
• Peso exacto de un niño: 40 kg, 30 kg, etc.
• Cantidad de mascotas que posee una persona: 1, 2, 3, etc.
• Velocidad con la que se traslada un automóvil: 160 km/h, 100 km/h, etc.
• Valor económico de un producto: $25, $50, $100, etc.
• Grados de alcohol de una cerveza: 5%, 10%, 12%, etc.
• Cantidad de niños en el aula de una escuela: 20, 30, 40, etc.
• Calificación exacta de un examen universitario: 4, 7, 8, 10, etc.
Tipos de variables
• Variable cuantitativa
• Las variables cuantitativas son aquellas características o cualidades que sí pueden expresarse o medirse a través de números.
• Este tipo de variable, a su vez, se divide en:
• Cuantitativa discreta: aquella variable que utiliza valores enteros y no finitos. Por ejemplo, la cantidad de familiares que tiene una
persona, tal como 2, 3, 4 o más.
• Cuantitativa continua: aquella variable que utiliza valores finitos y objetivos, y suele caracterizarse por utilizar valores decimales. Por ejemplo, el peso de una persona, tal como 64.3 kg, 72.3 kg, etc.
Tipos de variables
• Discreta
• La variable discreta otorga cifras que se encuentran separadas en escalas, es decir que el resultado comprende un valor exacto.
• De esta manera, dichas variables solo pueden adquirir un valor en
números enteros. Por ejemplo, una persona puede tener 1, 2, 3 o más perros, pero no un perro y medio.
• Continua
• La variable continua, por otro lado, puede otorgar un valor de cualquier intervalo o medición, es decir que puede haber otros valores en medio de dos exactos. Generalmente estos son representados por valores
decimales, por lo cual la cifra será mucho más específica.
• Por ejemplo, la estatura de una persona puede ser de 1,75 centímetros.
Variables cualitativas
Tipos definición Ejemplos
nominal Variables cualitativa cuyas categorías no siguen ningún
orden. - Color (blanco, rojo,
azul, etc.)
ordinal Son las variables categóricas con orden o jerarquía - Nota examen
(suspenso, aprobado, notable, sobresaliente) – Nivel económico
(pobre, clase media, rico) – Medalla deportiva
(Oro, plata, bronce) Binaria o
dicotómica Es un caso particular de variable nominal con solo dos categorías. Si las dos categorías determinan dos estados cualesquiera (ejemplo: sexo) se denomina binaria
simétrica. Si el 1 determina la presencia de una
característica y el 0 su ausencia (ejemplo: depresión,
enfermedad,…) la variable se denomina binaria asimétrica.
– Sexo (mujer, hombre).
Simétrica
– Enfermo (si, no).
Asimétrica
Variables cuantitativas
Tipos definición Ejemplos
Discreta La variable solo puede tomar valores en número determinado de valores. En cada intervalo de valores la variable solo puede tomar un valor.
– Canastas en un partido (20;
21; 22; pero no 21,5)
– Hijos por familia (0, 1, 2, 3,…)
Cuantitativa La variable puede adquirir cualquier valor dentro de un intervalo de valores
determinado.
– Peso (53,53 kg; 89,4 kg,…)
Tipos de variables
• Diferencias entre cualitativas y cuantitativas:
• Las variables cualitativas se concentran en la naturaleza de tales realidades y su dinámica, mientras que las variables cuantitativas se concentran en determinar la fuerza que tienen las variables.
• Una variable cuantitativa proporciona un valor numérico, mientras que una variable cualitativa proporciona resultados con características o cualidades.
• La variable cuantitativa suele ser específica, mientras que la variable cualitativa suele ser amplia y relativa.
• Las variables cuantitativas se basan en determinar la correlación o
asociación que hay entre variables, mientras que las variables cualitativas se enfocan en profundizar la naturaleza de dichas realidades.
ACTIVIDADES.
Ejercicios de actividad asincrónica
• Trata de definir dos variables
estadísticas de cada tipo y que
sean posibles de estudiar.
Tablas de frecuencia
• Las tablas de frecuencia son herramientas de estadística donde se colocan los datos representando los distintos valores recogidos en la muestra y las frecuencias en que ocurren.
Tablas de frecuencia
Donde:
f1: es la frecuencia absoluta de la clase i e indica la cantidad de datos que hay en un intervalo de clase determinado
F1: frecuencia absoluta acumulada de clase i h1: frecuencia relativa de la clase i
H1: frecuencia relativa acumulada de la clase i Además: f1 ≥ 0; F1 ≥ 0 ‸ 0 ≤ h1 ≤ 1
• Tablas de frecuencias para variables cualitativas
• En el caso de variable cualitativa no se pueden calcular las
frecuencias acumuladas pues no es posible establecer un orden en las clases dentro de la modalidad. Colocamos en la tabla aquellos valores que son independientes del lugar en que se pongan las modalidades. ("*Tablas de frecuencias para datos cualitativos", 2017)
• Ejemplo:
• Calculemos la tabla de frecuencias para una variable cualitativa.
• Inactivos por tipos de inactividad declarada (miles de personas).
Tablas de frecuencia
Modalidad ni fi pi
Estudiante 522,6 0,1380 13,80%
Percibiendo una pensión de jubilación o unos ingresos de prejubilación
712,3 0,1882 18,82%
Labores del hogar 1.480,00 0,3910 39,10%
Incapacitado permanente 265,9 0,0702 7,02%
Percibiendo una pensión distinta de la jubilación o prejubilación
525,3 0,1388 13,88%
Otras situaciones 279,5 0,0738 7,38%
3785,6 1 100,00%
FUENTE: IEA. Explotación de la Encuesta de Población Activa del INE (Metodología 2005)
• Tablas de frecuencias para variables cuantitativas
• Si toman un número determinado de valores entre dos números. (año de nacimiento, número de libros leídos).
• Cuantitativa discreta: Si toman un número determinado de
valores entre dos números. (año de nacimiento, número de libros leídos). ("*Tablas de frecuencias para datos cualitativos", 2017)
• Ejemplo:
• En un centro de Educación secundaria se pregunta a 40 alumnos por el número de hermanos que tienen, el resultado es el siguiente:
1,1,1,2,3,4,4,2,0,0,0,1,2,1,0,1,0,2,3,1,0,0,0,1,1,2,3,3,2,1,1,1,0,0,0,3,0,1,1, 3Ahora contamos, ordenamos los datos y construimos la tabla
estadística.
Tablas de frecuencia
• Tablas de frecuencias para variables cuantitativas
• 1. En la primera columna de la tabla colocaremos los distintos caracteres de la modalidad objeto de estudio ordenados de menor a mayor (esto será
posible en los caracteres cuantitativos), en nuestro caso el número de hermanos.
• 2. En la columna siguiente ponemos la frecuencia absoluta de cada carácter (contamos el número de veces que aparece cada valor). La suma de las
frecuencias absolutas debe coincidir con el total de datos procesados.
• 3. La tercera columna estará formada por las frecuencias relativas, cada frecuencia relativa se obtiene dividiendo la frecuencia absoluta
correspondiente por el total de datos. La suma de todas las frecuencias relativas debe ser 1.
• 4. Creamos una nueva columna en la que multiplicaremos las frecuencias relativas por 100.
• 5. Finalmente crearemos dos columnas en las que reflejaremos las frecuencias absolutas y relativas acumuladas.
Tablas de frecuencia
En nuestro ejemplo la tabla queda como sigue:
24 ni fi pi Ni Fi
0 12 0,3 30% 12 0,3
1 14 0,35 35% 26 0,65
2 6 0,15 15% 32 0,8
3 6 0,15 15% 38 0,95
4 2 0,05 5% 40 1
40 1 100%
ACTIVIDADES.
Ejercicios de actividad asincrónica
• Ejercicio 3: El color de lo coches que circulan por una calle céntrica es el siguiente:
NEGRO NEGRO ROJO AZUL ROJO VERDE VERDE BLANCO BLANCO
BLANCO NEGRO NEGRO BLANCO NE GROROJO ROJO BLANCO BLANCO NEG ROBLANCO AZUL ROJO NEGRO AZUL NEGRO BLANCO BLANCO VERDE VERDE ROJO
• Construye, una tabla similar a la
anterior con estos datos. Y dibuja el diagrama de barras, el polígono de frecuencia y el diagrama de sectores.
ACTIVIDADES.
Ejercicios de actividad asincrónica
• Ejercicio: En la entrada de un partido internacional de Baloncesto se
pregunta a un grupo de espectadores desde que Provincia (P:
Pontevedra: A: A Coruña; O:
Ourense; L: Lugo) se desplazaron.
Hemos obtenido estos datos:
P, L, O, A, O, P, P, A, L, O, P, O, P, O, A, A, O, P, O, A, P, O, P, P, O, O, A, O, O, L,
• Construye, una tabla similar a la
anterior con estos datos. Y dibuja el diagrama de barras, el polígono de frecuencia y el diagrama de sectores.
Gráficos
• Gráfica circular (o de sectores):
• Este método gráfico es un instrumento auxiliar de análisis y presentación de la información.
• Éste, como un diagrama en forma de círculo, es particularmente útil para visualizar las diferencias de frecuencia entre algunas categorías de nivel
nominal.
Gráficos
• Gráfica de barras:
• Muestra datos de forma visual utilizando barras horizontales o verticales cuyas longitudes son
proporcionales a las cantidades que representan.
Gráficos
• Histograma.
• Este diagrama es útil cuando se
trata de representar distribuciones de frecuencia cuya variable es
continua, y viene dada en
intervalos o clases; dicha gráfica se define y construye como la gráfica de barras, con la diferencia de que las columnas no están separadas, sino unidas, lo que le da
continuidad.
Gráficos
• Polígono de frecuencias:
• Es una gráfica lineal y se construye
uniendo, por medio de segmentos, los puntos medios superiores (marcas de clase) de cada una de las columnas que forman el histograma.
• El polígono de frecuencias puede contener una amplia variedad de categorías o intervalos y tiende a
destacar la continuidad a lo largo de una escala; por tanto, es útil para
representar puntuaciones ordinales y de intervalos.
Tablas de distribución de frecuencias
• Una tabla estadística es un recurso que emplea la Estadística con el fin de presentar información resumida, organizada por filas y columnas. Su principal finalidad es representar distribuciones de frecuencias, medidas de resúmenes y series cronológicas.
• Tenemos dos tipos de tablas de frecuencias:
• Tablas de frecuencias con datos no agrupados.
• Tablas de frecuencias con datos agrupados.
Tablas de frecuencias con datos no agrupados
• Usamos este tipo de tablas cuando tenemos variables cualitativas o cuantitativas con pocos valores. Esta tabla está compuesta por las siguientes columnas:
• Valores de la variable: son los diferentes valores que toma la variable en el estudio.
• Frecuencia absoluta: es la cantidad de veces que aparece el valor en el estudio. La sumatoria de las frecuencias absolutas es igual al número de datos.
• Frecuencia acumulada: es el acumulado o suma de las frecuencias absolutas, indica cuantos datos se van contando hasta ese momento o cuántos datos se van reportando.
• Frecuencia relativa: es la fracción o proporción de elementos que pertenecen a una clase o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de datos del estudio.
• Frecuencia relativa acumulada: es la proporción de datos respecto al total que se han reportado hasta ese momento. Es la suma de las frecuencias relativas.
• Frecuencia porcentual: es el porcentaje de elementos que pertenecen a una clase o categoría. Se puede calcular rápidamente multiplicando la frecuencia relativa por 100%.
• Frecuencia porcentual acumulada: es el porcentaje de datos respecto al total que se han reportado hasta ese momento. Se puede calcular rápidamente multiplicando la frecuencia relativa acumulada por 100%.
Tablas de frecuencias con datos agrupados
• Usamos las tablas de frecuencias con datos agrupados cuando la variable toma un gran número de valores o es una variable continua. Para ello, se agrupan los diferentes valores en intervalos de igual amplitud, a los cuáles llamamos clases. Aparecen además algunos parámetros importantes:
• Límites de clase: cada clase es un intervalo que va desde el límite inferior, hasta el límite superior.
• Marca de clase: es el punto medio de cada intervalo, y representa a la clase para el cálculo de algunos parámetros.
• Amplitud de clase: es la diferencia entre el límite superior y el límite inferior.
• Los pasos para elaborar una tabla de frecuencias con datos agrupados, son los siguientes:
• Hallar el rango(R): R = Xmax– Xmin
• Hallar el número de intervalos (K). Si el problema no indica cuántos intervalos usar, se recomienda usar la regla de Sturgues: K = 1 + 3,322.log(n) ; siendo n el número de datos.
• Determinar la amplitud de clase (A): A = R/K
• Hallar el límite inferior y superior de cada clase, así como las marcas de clase.
• La Tabla de frecuencia de datos agrupados aquella distribución en la que los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.
Tablas de frecuencias con datos agrupados
Ejemplo de tabla de frecuencia de datos agrupados
Tablas de frecuencias con datos no agrupados
Ejemplo de tabla de frecuencia de datos agrupados
Tablas de frecuencias con datos agrupados
Ejemplo de tabla de frecuencia de datos agrupados
Medidas de tendencia central para datos no agrupados
• Media aritmética
• La media aritmética o promedio aritmético es el valor obtenido por la suma de todos sus valores dividida entre el número de
sumadores. Por ejemplo, las notas de 5 alumnos en una prueba:
Niño Nota
1 6.0
2 5.4
3 3.1
4 7.0
5 6.1
Medidas de tendencia central para datos no agrupados
• Media aritmética
• La media aritmética o promedio aritmético es el valor obtenido por la suma de todos sus valores dividida entre el número de
sumadores. Por ejemplo, las notas de 5 alumnos en una prueba:
μ = !"#!$# …….#!' '
μ = (.)#*.+#,."#-.)#(."
*
μ = 5.52
Medidas de tendencia central para datos no agrupados
• Media aritmética ponderada
• A veces puede ser útil otorgar pesos o valores a los datos
dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada.
Medidas de tendencia central para datos no agrupados
• Media muestral
• Esencialmente, la media muestral es el mismo parámetro que el anterior, aunque el adjetivo "muestral" se aplica a aquellas
situaciones en las que la media aritmética se calcula para un subconjunto de la población objeto de estudio.
• Es importante destacar que la media de la poblacion es una
cantidad fija mientras que el promedio de una muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias.
Medidas de tendencia central para datos no agrupados
• Media Geométrica
• La media geométrica se calcula como un producto. De modo que si uno de ellos fuera cero, el producto total sería cero. Por ello, debemos
siempre tener en cuenta que a la hora de calcular la media geométrica necesitamos números que sean únicamente positivos.
• Uno de sus principales usos es para calcular medias sobre porcentajes, pues su cálculo ofrece unos resultados más adaptados a la real.
Medidas de tendencia central para datos no agrupados
• Moda
• La moda es el dato más repetido de la encuesta. La moda de una
distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico.
• Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.
• Una muestra puede tener más de una moda. Hablaremos de una
distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen la
misma frecuencia diremos que no hay moda.
Medidas de tendencia central para datos no agrupados
• Inconvenientes en la Moda
• Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en
variables agrupadas en intervalos, su valor depende
excesivamente del número de intervalos y de su amplitud.
• Usa muy pocas observaciones, de tal modo que grandes
variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.
• No siempre se sitúa hacia el centro de la distribución.
• Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma frecuencia
(distribuciones bimodales o multimodales).
Medidas de tendencia central para datos no agrupados
• Mediana
• La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos están ordenados de menor a
mayor. Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2.
• La mediana es el valor de la variable que ocupa la posición central,
cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el
otro 50% tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al
promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Medidas de tendencia central para datos no agrupados
• Rango medio
• El rango suele ser utilizado para obtener la dispersión total. También se conoce como recorrido estadístico.
• R = Max - Min
• Rango medio
• Es el promedio de las observaciones menores y mayores de una serie de datos.
• El rango medio a menudo es usado como una medición de resumen tanto por analistas financieros como por reporteros meteorológicos, puesto que puede proporcionar una medición adecuada, rápida y simple para caracterizar toda una serie de datos, como por ejemplo todo una serie de lecturas registradas de temperatura por horas
durante todo un día.
Medidas de dispersión para datos no agrupados
• Varianza muestral y poblacional
•
• La Varianza es una medida de dispersión que se utiliza para
representar la variabilidad de un conjunto de datos respecto de la media aritmética de los mismo. ... No obstante, se trata de una
medida que también puede calcularse como la desviación típica al cuadrado.
• La desviación estándar de la población es un parámetro, que es un valor fijo calculado a partir de cada individuo de la población. Una desviación estándar de muestra es una estadística. Esto significa que se calcula solo a partir de algunos de los individuos de una población.
Medidas de dispersión para datos no agrupados
• La varianza poblacional tiene por formula:
• La varianza muestral tiene por formula:
Medidas de dispersión para datos no agrupados
• Desviación estándar
• La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación
estándar, mayor es la dispersión de la población. La desviación estándar es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución.
Medidas de dispersión para datos no agrupados
• Coeficiente de variación
• Este coeficiente es utilizado para comparar conjuntos de datos de poblaciones distintas, teniéndose en cuenta el valor de la media aritmética, lo que nos permite eliminar las eventuales distorsiones de las medias de dos o más poblaciones.
•
cv =
!"#$%&'%() "#*&)!&+,"!%& &+%*,"*%'&
∗ 100%
•
• El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos.
Medidas de tendencia central para datos agrupados
• Media
Medidas de tendencia central para datos agrupados
• Media de la siguiente distribución
Medidas de tendencia central para datos
agrupados
Medidas de tendencia central para datos
agrupados
Medidas de tendencia central para datos agrupados
• Media
Medidas de tendencia central para datos agrupados
• Mediana
•Li: límite inferior del intervalo en el cual se encuentra la mediana.
•n: número de datos del estudio. Es la sumatoria de las frecuencias absolutas.
•Fi-1: frecuencia acumulada del intervalo anterior al que se encuentra la mediana.
•Ai: amplitud del intervalo en el que se encuentra la mediana.
•fi: frecuencia absoluta del intervalo en el que se encuentra la mediana.
Medidas de tendencia central para datos agrupados
• Mediana
Medidas de tendencia central para datos agrupados
• Este valor, lo buscamos en la columna de frecuencias acumuladas. Si no
aparece, buscamos el valor que sigue. Como vemos, después del 11 sigue el 14, por lo tanto, la mediana se ubica en el intervalo 3.
•
Medidas de tendencia central para datos agrupados
• Aplicamos la formula de la mediana:
•
Ahora, aplicamos la fórmula de la mediana:
Medidas de tendencia central para datos agrupados
• Moda
• Encontrar el intervalo en el cual se encuentra la moda, que es el intervalo con mayor frecuencia absoluta.
•
Ahora, aplicamos la fórmula de la mediana:
•Li: límite inferior del intervalo en el cual se encuentra la moda.
•fi-1: frecuencia absoluta del intervalo anterior en el que se encuentra la moda.
•fi: frecuencia absoluta del intervalo en el que se encuentra la moda.
•fi+1: frecuencia absoluta del intervalo siguiente en el que se encuentra la moda.
•Ai: amplitud del intervalo en el que se encuentra la moda.
Medidas de tendencia central para datos agrupados
• Moda Primero, encontramos el intervalo en el cual se encuentra la moda, es decir, el intervalo con mayor frecuencia absoluta. El intervalo 3, tiene la
mayor frecuencia absoluta (6), por lo tanto, aquí se encontrará la moda.
•
Ahora, aplicamos la fórmula de la mediana:
Medidas de tendencia central para datos agrupados
• Ahora, aplicamos la fórmula para estimar la moda:
Ahora, aplicamos la fórmula de la mediana:
Medidas de tendencia central para datos agrupados
• Media
• La media es el valor que se obtiene al sumar todos los datos multiplicados por su frecuencia y dividir el resultado entre la cantidad de datos. Usamos la
siguiente fórmula:
Ahora, aplicamos la fórmula de la mediana:
Medidas de tendencia central para datos agrupados
• Para calcula la media, agregamos una columna adicional, en la
que multiplicaremos el valor de la variable (x) por la frecuencia absoluta (f).
Ahora, aplicamos la fórmula de la mediana:
Medidas de tendencia central para datos agrupados
• Mediana
• Ahora, buscamos la posición 17 en la columna de frecuencias acumuladas
Ahora, aplicamos la fórmula de la mediana:
El valor (x) que ocupa dicha posición es 4, por lo tanto, Me = 4.
Medidas de tendencia central para datos agrupados
• Calcular la mediana de la siguiente distribución:
Ahora, aplicamos la fórmula de la mediana:
Medidas de tendencia central para datos agrupados
• Como nos ha quedado un valor con decimales, significa que la mediana será la media aritmética del valor que ocupa la posición 17, con el valor que ocupa la posición 18.
• Buscamos los valores de posición 17 y 18 en la tabla de frecuencias acumuladas:
Medidas de tendencia central para datos agrupados
• Calcular la mediana de la siguiente distribución:
Medidas de tendencia central para datos agrupados
• Como nos ha quedado un valor con decimales, significa que la mediana será la media aritmética del valor que ocupa la posición 29, con el valor que ocupa la posición 30.
Buscamos los valores de posición 29 y 30 en la tabla de frecuencias acumuladas:
Ahora, aplicamos la fórmula de la mediana:
Medidas de tendencia central para datos agrupados
• La moda es el valor con mayor frecuencia absoluta.
El valor con mayor frecuencia absoluta, es el 4, por lo tanto: Mo = 4.
Medidas de tendencia central para datos agrupados
• La moda es el valor con mayor frecuencia absoluta.
El valor con mayor frecuencia absoluta, es el 4, por lo tanto: Mo = 4.
ACTIVIDADES.
Ejercicios de actividad asincrónica
• Ejercicio: completa la tabla y obtén la media, moda y mediana.
valor Frecuencia
absoluta Frecuencia
acumulada
13 6 6
14 2
15 6 14
16 4
17 7 25
total 25
Medidas de tendencia central para datos agrupados
• Completamos la tabla y obtenemos la columna x*f. Luego aplicamos la formula para obtener la media.
Medidas de tendencia central para datos agrupados
• Para calcular la mediana, encontramos la posición central:
Por lo tanto, el valor de la mediana es: Me = 15.
Medidas de tendencia central para datos agrupados
• Para calcular la moda, encontramos el valor con mayor frecuencia:
Por lo tanto, el valor de la moda es: Mo = 17.
Medidas de tendencia central para datos no agrupados
• Datos: 1,1,3,3,4,4,5,5,5,5
• Media:
• μ = "∗$#,∗$#+∗$#*∗+
") =3.6
• Moda: 5
• Mediana: Aplicando la formula asociada a la mediana para n par 10/ 2 = 5,
• => Li5 < 5.5 < Ls6
• => (4+4)/2 = 4.
• Entonces la mediana Me = 5.5.
Xi fi Fi
1 2
3 4
5 4 10
Medidas de tendencia central para datos no agrupados
• Datos: 1,3,4,4,5,5,7
• Media:
• μ = "∗"#,∗"#+∗$#*∗$#-∗"
- =4.12
• Moda: 4, 5.
• Mediana: Aplicando la formula
asociada a la mediana para n impar 7+1/ 2 = 4
• Entonces la mediana Me = 4.
Xi fi Fi
1 1
3 4
5 2
7 7
Medidas de tendencia central para datos no agrupados
• Datos:
1,1,3,3,1,4,5,5,2,4,2,3,2,4,2.
• Media:
• μ = "∗,#$∗+#,∗,#+∗,#*∗$
"* = 2.8
• Moda: 2.
• Mediana: Aplicando la formula asociada a la mediana para n impar 15+1/ 2 = 8
• Entonces la mediana Me = 3.
Xi fi Fi
1 3
2 4
3
4 3
5 15
Medidas de tendencia central para datos agrupados
• Datos: 5.42, 6.22, 8.42, 7.54, 6.44, 6.76, 5.9, 6.18, 7.16, 6.8, 7.32, 8.12, 6.84, 7.12, 8.21, 8.13, 7.25, 7.34, 5.56, 8.32, 7.45, 7.43, 6.87, 7.10;
Xi fi Marca de
clase
Xi*fi
(5 - 5.5) 1 5.25 5.25
(5.5 - 6) 2 5.75 11.5
(6 - 6.5) 3 6.25 18.75
(6.5 - 7) 4 6.75 27
(7 - 7.5) 8 7.25 58
(7.5 - 8) 1 7.75 7.75
(8 - 8.5) 5 8.25 41.25
Total 24 169.50
Medidas de tendencia central para datos agrupados
Xi fi Marca de
clase
Xi*fi
(5 - 5.5) 1 5.25 5.25
(5.5 - 6) 2 5.75 11.5
(6 - 6.5) 3 6.25 18.75
(6.5 - 7) 4 6.75 27
(7 - 7.5) 8 7.25 58
(7.5 - 8) 1 7.75 7.75
(8 - 8.5) 5 8.25 41.25
Total 24 169.50
Medidas de tendencia central para datos agrupados
Al ser impar el numero de datos, para saber en que posición debe caer la mediana, tenemos 25+1/2 =13
La mediana Me = 3
Medidas de tendencia central para datos agrupados
• Mediana
• Primero hallamos las frecuencias absolutas acumuladas Fi
• Aplicando la formula asociada a la mediana para n par 38/ 2 = 19,
• => Li19 < 19.5 < Ls20
• => (5+6)/2 = 5.5.
• Entonces la mediana Me = 5.5.
Xi fi Fi
1 2 2
2 2 4
3 4 8
4 5 13
5 6 19 = 19
6 9 28
7 4 32
8 4 36
9 2 38
Medidas de tendencia central para datos agrupados
• Moda
• Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
• Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla (debajo):
• La moda en este caso es 6.
Calificaci
ones 1 2 3 4 5 6 7 8 9
Número
alumnos de 2 2 4 5 8 9 3 4 2
Medidas de tendencia central para datos agrupados
• Para variables cualitativas
• La mediana se calcula de la msima manera. Para datos pares. 40/2 = 20
• Li 20 < 20.5 < Ls21
Medidas de tendencia central para datos agrupados
• Para variables cualitativas
• La mediana sera aprobado ya que el dato 20.5 esta dentro de la frecuencia acumulada 23.
Medidas de tendencia central para datos agrupados
• Para variables cuantitativas
• La moda es el valor que mas se repite Mo = 1, 5
Medidas de tendencia central para datos agrupados
• Para variables cualitativas
• La moda es el valor que mas se repite Mo = Aprobado
Medidas de tendencia central para datos agrupados
• Para variables cuantitativas
• La moda es el valor que mas se repite
• Mo = (7 - 7.5)
Medidas de tendencia central para datos no agrupados
• Mediana
• Datos: 2,3,4,4,5,5,5,6,6.
• Valor impar = 9+1/2 = 5
• Me = 5
• Datos: 7,8,9,10,11,12
• Valor par = 6/2 = 3; Li9< 3.5 < Ls10
• Me = 9+10/2 = 9.5
Medidas de tendencia central para datos agrupados
datos fi Fi
(60 – 63) 5 5
(63 – 66) 18 23
(66 – 69) 42 65
(69 – 72) 27 92
(72 – 75) 8 100
100 Mediana
position = 100/2 = 50
Medidas de tendencia central para datos agrupados
datos fi Fi
(60 – 63) 5 5
(63 – 66) 18 23
(66 – 69) 42 65
(69 – 72) 27 92
(72 – 75) 8 100
100
Mediana = 100/2 = 50 entonces esta entre (66 – 69)
Medidas de tendencia central para datos agrupados
Li = es el límite inferior de la clase donde se encuentra la mediana N/2 = es la semisuma de las frecuencias absolutas
fi = es la frecuencia absoluta de la clase mediana
Fi = es la frecuencia acumulada anterior a la clase mediana ai = es la amplitud de la clase
Medidas de tendencia central para datos
agrupados
Medidas de tendencia central para datos agrupados
Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).
fi Frecuencia absoluta del intervalo modal.
fi-1 Frecuencia absoluta del intervalo anterior al modal.
fi+1 Frecuencia absoluta del intervalo posterior al modal.
ti Amplitud de los intervalos.
Moda
Medidas de posición y forma de datos no agrupados
Cuartiles: son valores que se obtienen a partir de los datos
ordenados y que dividen el conjunto en cuatro partes porcentuales iguales , por tanto , hay tres valores que representa el 25%, 50%, y 75% de los datos Q1, Q2, Q3 respectivamente.
Las medidas de posición son valores que permiten dividir el conjunto de datos en pates porcentuales iguales y se usan para clasificar una observación dentro de una población o muestra.
Medidas de posición y forma de datos no agrupados
Q1: Valor que deja por debajo el 25% de los datos.
Q2: Valor que deja por debajo el 50% de los datos.
Q3: Valor que deja por debajo el 75% de los datos.
25% 25%
25% 25%
Q1 Q2 Q3
Medidas de posición y forma de datos no
agrupados
Medidas de posición y forma de datos no agrupados
Deciles: D1, D2, D3, D4, D5, D6 , D7, D8, D9 son valores que dividen el conjunto de datos en 10 partes iguales cada uno representa el 10%.
Percentiles: D1, D2, D3…….., D99 son valores que dividen el conjunto de datos en 100 partes iguales cada uno representa el 1%.
Medidas de posición y forma de datos no agrupados
Para un numero de N observaciones una vez ordenados los datos , se puede identificar la posición de los cuartiles, deciles y percentiles:
N par kn/A, N impar k(n+1)/A.
si el resultado es exacto se promedia con el dato siguiente, si no, se aproxima al entero mas cercano.
Cuartiles: k es el numero del cuartil 1,2,3. A número de divisiones A = 4.
Deciles: k es el numero del decil 1,2,3….9. A número de divisiones A = 10 Percentiles: k es el numero del percentil 1,2,3….99. A número de
divisiones A = 100.
Medidas de posición y forma de datos no agrupados
Ejemplo de cuartiles. Datos: 2,5,3,6,7,4,9.
Ordenar: 2,3,4,5,6,7,9; aplican la formula con N impar k(n+1)/A.
Q1 = 1(7+1)/4 = 2 Q2 = 2(7+1)/4 = 4 Q3 = 3(7+1)/4 = 6
2,3,4,5,6,7,9.
Q1 Q2 Q3
Medidas de posición y forma de datos no agrupados
Ejemplo de cuartiles. Datos: 2,5,3,4,6,7,1,9.
Ordenar: 1,2,3,4,5,6,7,9; aplican la formula con N par kn/A.
Q1 = 1(8+1)/4 = 2.25 Q2 = 2(8+1)/4 = 4.5 Q3 = 3(8+1)/4 = 6.75
1,2,3,4,5,6,7,9.
Q1 Q2 Q3
Medidas de posición y forma de datos no agrupados
Ejemplo: En una serie de 32 términos se desea localizar el 4° sextil, 8° decil y el 95° percentil.
Aplican la formula con N par kn/A.
S4 = 4*32/6 = 21 D8 = 8*32/10 = 25.6 P95 = 95*32/100 = 30.4
Esto significa que el 4° textil se encuentra localizado en el termino numero 21, es decir, el que ocupa la 21° posición; el 8° decil se encuentra localizado entre el termino numero 25° y 26°; y el 95° percentil entre la posición 30° y 31°
Medidas de posición y forma de datos agrupados
Cuartiles para datos agrupados.
Aplican la formula.
Li es el limite inferior de la clase donde se encuentra la mediana N es la suma de las frecuencias absolutas
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
a1 es la amplitud de clase.
Medidas de posición y forma de datos agrupados
Calcular los cuartiles para datos agrupados. k*N/4 = 1*65/4 = 16.25
datos fi Fi
(50 – 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Medidas de posición y forma de datos agrupados
Calcular los cuartiles para datos agrupados. k*N/4 = 2*65/4 = 32.5
datos fi Fi
(50 – 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Medidas de posición y forma de datos agrupados
Calcular los cuartiles para datos agrupados. k*N/4 = 3*65/4 = 48.75
datos fi Fi
(50 – 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Medidas de posición y forma de datos agrupados
Calcular los deciles para datos
agrupados. k*N/4 = 1*65/10 = 6.5
datos fi Fi
(50 – 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Medidas de posición y forma de datos agrupados
Calcular los deciles para datos agrupados. k*N/4 = 2*65/10 = 13
datos fi Fi
(50 – 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65