• No se han encontrado resultados

CIENCIAS BASICAS ANALISIS ESTADISTICO. Ing. Miguel Angel Núñez.

N/A
N/A
Protected

Academic year: 2022

Share "CIENCIAS BASICAS ANALISIS ESTADISTICO. Ing. Miguel Angel Núñez."

Copied!
130
0
0

Texto completo

(1)

ANALISIS ESTADISTICO

Ing. Miguel Angel Núñez.

CIENCIAS BASICAS

(2)

Tabla de contenido

• Objetivos

• 1. Estadística descriptiva

• 2. Teoría de probabilidades.

• 3. Inferencia estadística

• Bibliografía

(3)

Objetivos Generales

• Proporcionar los conocimientos de herramientas para la toma de decisiones ante situaciones de incertidumbre.

(4)

Objetivos específicos

• Aumentar las destrezas y habilidades del estudiante en la interpretación de datos con la ayuda de herramientas de estadística descriptiva e inferencial.

• Capacitar al estudiante en el manejo de los instrumentos para disminuir el riesgo para la toma de decisiones.

(5)

UNIDAD 1.

ESTADISTICA DESCRIPTIVA

CONTENIDO

1. Conceptos básicos de estadística.

2. Distribución de frecuencias

3. Presentación de los datos en gráficos

4. Medidas de tendencia central: media, mediana y moda.

5. Medidas de variabilidad: rango, varianza, desvío estándar y coeficiente de variación.

6. Medidas de posición: Cantiles, cuartiles, deciles y percentiles.

7. Medidas de forma: asimetría y curtosis.

8. Diagrama de cajas.

(6)

Estadística

• La estadística hace referencia a la recopilación , presentación, análisis y utilización de datos para la toma de decisiones cuando existe incertidumbre (Dominick Salvatore y Derrick Reagle).

• La estadística hace referencia a la recopilación , organización

presentación, análisis e interpretación de datos con el fin de realizar decisiones mas efectivas (Mason Lind).

• Su utilización es en todos los campos de la ciencia, ingeniería,

negocios, contabilidad, economía, medicina, deporte, política, etc.

(7)

Estadística Descriptiva e Inferencial

La estadística descriptiva se ocupa de resumir y describir un conjunto de datos (Dominick Salvatore y Derrick Reagle).

La estadística descriptiva son procedimientos empleados para organizar y resumir conjuntos de datos numéricos (Mason Lind).

La estadística inferencial es el proceso consistente en realizar

generalizaciones sobre un conjunto (población) mediante el análisis de una parte de dicho conjunto (muestra). Para esto la muestra debe ser

representativa de la población además de especificarse la probabilidad de error (Dominick Salvatore y Derrick Reagle).

La estadística inferencial tiene como finalidad determinar algo acerca de una población. Siendo la población el conjunto de todos los posibles

individuos, objetos o mediciones de interés, en cambio la muestra es una parte de una población de interés (Mason Lind).

(8)

Estadística Descriptiva e Inferencial

Población

Conjunto de datos sobre los que se va a estudiar.

Individuos

Unidad por estudiar.

Muestra

Una muestra estadística es un subconjunto de datos perteneciente a una población de datos. Estadísticamente hablando, debe estar constituido por un cierto número de observaciones que representen adecuadamente el total de los datos.

(9)

Tipos de variables

• ¿Qué es una variable estadística?

Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población y que estamos interesados en

estudiar. Estos valores, a su vez, se caracterizan por poder medirse.

Por ejemplo, el color de pelo, las notas de un examen, el sexo o la estatura de una persona, son variables estadísticas.

• Tipos de variables estadística

La variable estadística, de acuerdo con las características que la definen, puede ser cualitativa o cuantitativa.

(10)

Tipos de variables

(11)

Tipos de variables

¿Qué son las variables cualitativas?

• Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números

• Una variable cualitativa es un tipo de variable

estadística que describe las cualidades, circunstancias o

características de un objeto o persona, sin hacer uso de números.

De esta manera, las variables cualitativas permiten expresar una característica, atributo, cualidad o categoría no númerica. Por

ejemplo, el sexo de una persona es una variable cualitativa, ya que es masculino o femenino.

(12)

Tipos de variables

Características de las variables cualitativas

• Algunas características notables de la variable cualitativa son las siguientes:

No se puede medir numéricamente.

No otorga datos específicos y a veces tampoco un orden.

Especifica una condición, cualidad o característica.

• Cuando los valores de dicha variable son solamente dos, se llama dicotómica.

Cuando distingue tres valores o más, se la llama politómica.

(13)

Tipos de variables

Ejemplos de variables cualitativas

• Algunos ejemplos que nos pueden ayudar a comprender la variable cualitativa son los siguientes:

Estado civil: soltero, casado, viudo.

La sed de una persona: mucha, poca, nada.

Calificación no numérica de un examen: aprobado, sobresaliente, aceptado, reprobado.

Color de ojos: marrones, azules, verdes.

Profesión: arquitecto, médico, ingeniero, abogado.

(14)

Tipos de variables

Variable cualitativa

Las variables cualitativas son aquellas características o cualidades que no pueden ser calculadas con números, sino que son clasificadas con

palabras. Este tipo de variable, a su vez, se divide en:

Cualitativa nominal: aquellas variables que no siguen ningún orden en específico. Por ejemplo, los colores, tales como el negro, naranja o

amarillo, el estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Cualitativa ordinal: aquellas que siguen un orden o jerarquía. Por ejemplo, el nivel socioeconómico alto, medio o bajo, La nota en un

examen: suspenso, aprobado, notable, sobresaliente, puesto conseguido en una prueba deportiva: primero, segundo, tercer.

Cualitativa binaria: variables que permiten tan solo dos resultados. Por ejemplo, sí o no; hombre o mujer.

(15)

Tipos de variables

Tipos de variables cualitativas

Nominal. Variable que no es representada por números ni tiene algún tipo de orden, y por lo tanto es matemáticamente menos precisa.

Por ejemplo, son variables nominales los colores: negro, azul, rojo, amarillo, naranja, etc.

Ordinaria. La variable cualitativa ordinaria, también conocida como variable cuasi-cuantitativa, es representada por una modalidad que no requiere números pero sí consta de un orden o un puesto.

Por ejemplo, el nivel socioeconómico: alto, medio, bajo.

Binaria. La variable cualitativa binaria trabaja con valores específicos del tipo binario.

Por ejemplo, el sexo de una persona será masculino o femenino.

(16)

Tipos de variables

¿Qué son las variables cuantitativas?

Las variables cuantitativas son aquellas variables estadísticas que otorgan, como resultado, un valor numérico.

Por ejemplo, variables tales como el peso (62 kg, 80 kg), la

altura (1.72 cm, 1.85 cm) o la cantidad de miembros en una familia (2, 3 o 4), son variables cuantitativas.

(17)

Tipos de variables

Características de las variables cuantitativas

• Las principales características de las variables cuantitativas son las siguientes:

Expresan sus valores con números.

Son utilizadas generalmente en encuestas o entrevistas.

Utilizan gráficos llamados diagramas integrales y diagramas

diferenciales para mostrar la frecuencia relativa de las variables.

También pueden servirse de diagramas de barra para otorgar cifras.

(18)

Tipos de variables

Ejemplos de variables cuantitativas:

• Peso exacto de un niño: 40 kg, 30 kg, etc.

• Cantidad de mascotas que posee una persona: 1, 2, 3, etc.

• Velocidad con la que se traslada un automóvil: 160 km/h, 100 km/h, etc.

• Valor económico de un producto: $25, $50, $100, etc.

• Grados de alcohol de una cerveza: 5%, 10%, 12%, etc.

• Cantidad de niños en el aula de una escuela: 20, 30, 40, etc.

• Calificación exacta de un examen universitario: 4, 7, 8, 10, etc.

(19)

Tipos de variables

Variable cuantitativa

• Las variables cuantitativas son aquellas características o cualidades que sí pueden expresarse o medirse a través de números.

• Este tipo de variable, a su vez, se divide en:

Cuantitativa discreta: aquella variable que utiliza valores enteros y no finitos. Por ejemplo, la cantidad de familiares que tiene una

persona, tal como 2, 3, 4 o más.

Cuantitativa continua: aquella variable que utiliza valores finitos y objetivos, y suele caracterizarse por utilizar valores decimales. Por ejemplo, el peso de una persona, tal como 64.3 kg, 72.3 kg, etc.

(20)

Tipos de variables

Discreta

La variable discreta otorga cifras que se encuentran separadas en escalas, es decir que el resultado comprende un valor exacto.

De esta manera, dichas variables solo pueden adquirir un valor en

números enteros. Por ejemplo, una persona puede tener 1, 2, 3 o más perros, pero no un perro y medio.

Continua

La variable continua, por otro lado, puede otorgar un valor de cualquier intervalo o medición, es decir que puede haber otros valores en medio de dos exactos. Generalmente estos son representados por valores

decimales, por lo cual la cifra será mucho más específica.

Por ejemplo, la estatura de una persona puede ser de 1,75 centímetros.

(21)

Variables cualitativas

Tipos definición Ejemplos

nominal Variables cualitativa cuyas categorías no siguen ningún

orden. - Color (blanco, rojo,

azul, etc.)

ordinal Son las variables categóricas con orden o jerarquía - Nota examen

(suspenso, aprobado, notable, sobresaliente) – Nivel económico

(pobre, clase media, rico) – Medalla deportiva

(Oro, plata, bronce) Binaria o

dicotómica Es un caso particular de variable nominal con solo dos categorías. Si las dos categorías determinan dos estados cualesquiera (ejemplo: sexo) se denomina binaria

simétrica. Si el 1 determina la presencia de una

característica y el 0 su ausencia (ejemplo: depresión,

enfermedad,…) la variable se denomina binaria asimétrica.

– Sexo (mujer, hombre).

Simétrica

– Enfermo (si, no).

Asimétrica

(22)

Variables cuantitativas

Tipos definición Ejemplos

Discreta La variable solo puede tomar valores en número determinado de valores. En cada intervalo de valores la variable solo puede tomar un valor.

– Canastas en un partido (20;

21; 22; pero no 21,5)

– Hijos por familia (0, 1, 2, 3,…)

Cuantitativa La variable puede adquirir cualquier valor dentro de un intervalo de valores

determinado.

– Peso (53,53 kg; 89,4 kg,…)

(23)

Tipos de variables

Diferencias entre cualitativas y cuantitativas:

Las variables cualitativas se concentran en la naturaleza de tales realidades y su dinámica, mientras que las variables cuantitativas se concentran en determinar la fuerza que tienen las variables.

Una variable cuantitativa proporciona un valor numérico, mientras que una variable cualitativa proporciona resultados con características o cualidades.

La variable cuantitativa suele ser específica, mientras que la variable cualitativa suele ser amplia y relativa.

Las variables cuantitativas se basan en determinar la correlación o

asociación que hay entre variables, mientras que las variables cualitativas se enfocan en profundizar la naturaleza de dichas realidades.

(24)

ACTIVIDADES.

Ejercicios de actividad asincrónica

• Trata de definir dos variables

estadísticas de cada tipo y que

sean posibles de estudiar.

(25)

Tablas de frecuencia

• Las tablas de frecuencia son herramientas de estadística donde se colocan los datos representando los distintos valores recogidos en la muestra y las frecuencias en que ocurren.

(26)

Tablas de frecuencia

(27)

Donde:

f1: es la frecuencia absoluta de la clase i e indica la cantidad de datos que hay en un intervalo de clase determinado

F1: frecuencia absoluta acumulada de clase i h1: frecuencia relativa de la clase i

H1: frecuencia relativa acumulada de la clase i Además: f1 ≥ 0; F1 ≥ 0 ‸ 0 ≤ h1 ≤ 1

(28)

Tablas de frecuencias para variables cualitativas

• En el caso de variable cualitativa no se pueden calcular las

frecuencias acumuladas pues no es posible establecer un orden en las clases dentro de la modalidad. Colocamos en la tabla aquellos valores que son independientes del lugar en que se pongan las modalidades. ("*Tablas de frecuencias para datos cualitativos", 2017)

• Ejemplo:

• Calculemos la tabla de frecuencias para una variable cualitativa.

• Inactivos por tipos de inactividad declarada (miles de personas).

Tablas de frecuencia

(29)

Modalidad ni fi pi

Estudiante 522,6 0,1380 13,80%

Percibiendo una pensión de jubilación o unos ingresos de prejubilación

712,3 0,1882 18,82%

Labores del hogar 1.480,00 0,3910 39,10%

Incapacitado permanente 265,9 0,0702 7,02%

Percibiendo una pensión distinta de la jubilación o prejubilación

525,3 0,1388 13,88%

Otras situaciones 279,5 0,0738 7,38%

3785,6 1 100,00%

FUENTE: IEA. Explotación de la Encuesta de Población Activa del INE (Metodología 2005)

(30)

Tablas de frecuencias para variables cuantitativas

Si toman un número determinado de valores entre dos números. (año de nacimiento, número de libros leídos).

Cuantitativa discreta: Si toman un número determinado de

valores entre dos números. (año de nacimiento, número de libros leídos). ("*Tablas de frecuencias para datos cualitativos", 2017)

Ejemplo:

En un centro de Educación secundaria se pregunta a 40 alumnos por el número de hermanos que tienen, el resultado es el siguiente:

1,1,1,2,3,4,4,2,0,0,0,1,2,1,0,1,0,2,3,1,0,0,0,1,1,2,3,3,2,1,1,1,0,0,0,3,0,1,1, 3Ahora contamos, ordenamos los datos y construimos la tabla

estadística.

Tablas de frecuencia

(31)

Tablas de frecuencias para variables cuantitativas

1. En la primera columna de la tabla colocaremos los distintos caracteres de la modalidad objeto de estudio ordenados de menor a mayor (esto será

posible en los caracteres cuantitativos), en nuestro caso el número de hermanos.

2. En la columna siguiente ponemos la frecuencia absoluta de cada carácter (contamos el número de veces que aparece cada valor). La suma de las

frecuencias absolutas debe coincidir con el total de datos procesados.

3. La tercera columna estará formada por las frecuencias relativas, cada frecuencia relativa se obtiene dividiendo la frecuencia absoluta

correspondiente por el total de datos. La suma de todas las frecuencias relativas debe ser 1.

4. Creamos una nueva columna en la que multiplicaremos las frecuencias relativas por 100.

5. Finalmente crearemos dos columnas en las que reflejaremos las frecuencias absolutas y relativas acumuladas.

Tablas de frecuencia

(32)

En nuestro ejemplo la tabla queda como sigue:

24 ni fi pi Ni Fi

0 12 0,3 30% 12 0,3

1 14 0,35 35% 26 0,65

2 6 0,15 15% 32 0,8

3 6 0,15 15% 38 0,95

4 2 0,05 5% 40 1

40 1 100%

(33)

ACTIVIDADES.

Ejercicios de actividad asincrónica

Ejercicio 3: El color de lo coches que circulan por una calle céntrica es el siguiente:

NEGRO NEGRO ROJO AZUL ROJO VERDE VERDE BLANCO BLANCO

BLANCO NEGRO NEGRO BLANCO NE GROROJO ROJO BLANCO BLANCO NEG ROBLANCO AZUL ROJO NEGRO AZUL NEGRO BLANCO BLANCO VERDE VERDE ROJO

Construye, una tabla similar a la

anterior con estos datos. Y dibuja el diagrama de barras, el polígono de frecuencia y el diagrama de sectores.

(34)

ACTIVIDADES.

Ejercicios de actividad asincrónica

Ejercicio: En la entrada de un partido internacional de Baloncesto se

pregunta a un grupo de espectadores desde que Provincia (P:

Pontevedra: A: A Coruña; O:

Ourense; L: Lugo) se desplazaron.

Hemos obtenido estos datos:

P, L, O, A, O, P, P, A, L, O, P, O, P, O, A, A, O, P, O, A, P, O, P, P, O, O, A, O, O, L,

Construye, una tabla similar a la

anterior con estos datos. Y dibuja el diagrama de barras, el polígono de frecuencia y el diagrama de sectores.

(35)

Gráficos

Gráfica circular (o de sectores):

• Este método gráfico es un instrumento auxiliar de análisis y presentación de la información.

• Éste, como un diagrama en forma de círculo, es particularmente útil para visualizar las diferencias de frecuencia entre algunas categorías de nivel

nominal.

(36)

Gráficos

Gráfica de barras:

• Muestra datos de forma visual utilizando barras horizontales o verticales cuyas longitudes son

proporcionales a las cantidades que representan.

(37)

Gráficos

Histograma.

• Este diagrama es útil cuando se

trata de representar distribuciones de frecuencia cuya variable es

continua, y viene dada en

intervalos o clases; dicha gráfica se define y construye como la gráfica de barras, con la diferencia de que las columnas no están separadas, sino unidas, lo que le da

continuidad.

(38)

Gráficos

Polígono de frecuencias:

Es una gráfica lineal y se construye

uniendo, por medio de segmentos, los puntos medios superiores (marcas de clase) de cada una de las columnas que forman el histograma.

El polígono de frecuencias puede contener una amplia variedad de categorías o intervalos y tiende a

destacar la continuidad a lo largo de una escala; por tanto, es útil para

representar puntuaciones ordinales y de intervalos.

(39)

Tablas de distribución de frecuencias

• Una tabla estadística es un recurso que emplea la Estadística con el fin de presentar información resumida, organizada por filas y columnas. Su principal finalidad es representar distribuciones de frecuencias, medidas de resúmenes y series cronológicas.

• Tenemos dos tipos de tablas de frecuencias:

• Tablas de frecuencias con datos no agrupados.

• Tablas de frecuencias con datos agrupados.

(40)

Tablas de frecuencias con datos no agrupados

Usamos este tipo de tablas cuando tenemos variables cualitativas o cuantitativas con pocos valores. Esta tabla está compuesta por las siguientes columnas:

Valores de la variable: son los diferentes valores que toma la variable en el estudio.

Frecuencia absoluta: es la cantidad de veces que aparece el valor en el estudio. La sumatoria de las frecuencias absolutas es igual al número de datos.

Frecuencia acumulada: es el acumulado o suma de las frecuencias absolutas, indica cuantos datos se van contando hasta ese momento o cuántos datos se van reportando.

Frecuencia relativa: es la fracción o proporción de elementos que pertenecen a una clase o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de datos del estudio.

Frecuencia relativa acumulada: es la proporción de datos respecto al total que se han reportado hasta ese momento. Es la suma de las frecuencias relativas.

Frecuencia porcentual: es el porcentaje de elementos que pertenecen a una clase o categoría. Se puede calcular rápidamente multiplicando la frecuencia relativa por 100%.

Frecuencia porcentual acumulada: es el porcentaje de datos respecto al total que se han reportado hasta ese momento. Se puede calcular rápidamente multiplicando la frecuencia relativa acumulada por 100%.

(41)

Tablas de frecuencias con datos agrupados

Usamos las tablas de frecuencias con datos agrupados cuando la variable toma un gran número de valores o es una variable continua. Para ello, se agrupan los diferentes valores en intervalos de igual amplitud, a los cuáles llamamos clases. Aparecen además algunos parámetros importantes:

Límites de clase: cada clase es un intervalo que va desde el límite inferior, hasta el límite superior.

Marca de clase: es el punto medio de cada intervalo, y representa a la clase para el cálculo de algunos parámetros.

Amplitud de clase: es la diferencia entre el límite superior y el límite inferior.

Los pasos para elaborar una tabla de frecuencias con datos agrupados, son los siguientes:

Hallar el rango(R): R = Xmax– Xmin

Hallar el número de intervalos (K). Si el problema no indica cuántos intervalos usar, se recomienda usar la regla de Sturgues: K = 1 + 3,322.log(n) ; siendo n el número de datos.

Determinar la amplitud de clase (A): A = R/K

Hallar el límite inferior y superior de cada clase, así como las marcas de clase.

La Tabla de frecuencia de datos agrupados aquella distribución en la que los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

(42)

Tablas de frecuencias con datos agrupados

Ejemplo de tabla de frecuencia de datos agrupados

(43)

Tablas de frecuencias con datos no agrupados

Ejemplo de tabla de frecuencia de datos agrupados

(44)

Tablas de frecuencias con datos agrupados

Ejemplo de tabla de frecuencia de datos agrupados

(45)

Medidas de tendencia central para datos no agrupados

Media aritmética

• La media aritmética o promedio aritmético es el valor obtenido por la suma de todos sus valores dividida entre el número de

sumadores. Por ejemplo, las notas de 5 alumnos en una prueba:

Niño Nota

1 6.0

2 5.4

3 3.1

4 7.0

5 6.1

(46)

Medidas de tendencia central para datos no agrupados

Media aritmética

• La media aritmética o promedio aritmético es el valor obtenido por la suma de todos sus valores dividida entre el número de

sumadores. Por ejemplo, las notas de 5 alumnos en una prueba:

μ = !"#!$# …….#!' '

μ = (.)#*.+#,."#-.)#(."

*

μ = 5.52

(47)

Medidas de tendencia central para datos no agrupados

Media aritmética ponderada

• A veces puede ser útil otorgar pesos o valores a los datos

dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada.

(48)

Medidas de tendencia central para datos no agrupados

Media muestral

• Esencialmente, la media muestral es el mismo parámetro que el anterior, aunque el adjetivo "muestral" se aplica a aquellas

situaciones en las que la media aritmética se calcula para un subconjunto de la población objeto de estudio.

• Es importante destacar que la media de la poblacion es una

cantidad fija mientras que el promedio de una muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias.

(49)

Medidas de tendencia central para datos no agrupados

Media Geométrica

La media geométrica se calcula como un producto. De modo que si uno de ellos fuera cero, el producto total sería cero. Por ello, debemos

siempre tener en cuenta que a la hora de calcular la media geométrica necesitamos números que sean únicamente positivos.

Uno de sus principales usos es para calcular medias sobre porcentajes, pues su cálculo ofrece unos resultados más adaptados a la real.

(50)

Medidas de tendencia central para datos no agrupados

Moda

La moda es el dato más repetido de la encuesta. La moda de una

distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico.

Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.

Una muestra puede tener más de una moda. Hablaremos de una

distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.

Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen la

misma frecuencia diremos que no hay moda.

(51)

Medidas de tendencia central para datos no agrupados

Inconvenientes en la Moda

• Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en

variables agrupadas en intervalos, su valor depende

excesivamente del número de intervalos y de su amplitud.

• Usa muy pocas observaciones, de tal modo que grandes

variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.

• No siempre se sitúa hacia el centro de la distribución.

• Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma frecuencia

(distribuciones bimodales o multimodales).

(52)

Medidas de tendencia central para datos no agrupados

Mediana

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos están ordenados de menor a

mayor. Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2.

La mediana es el valor de la variable que ocupa la posición central,

cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el

otro 50% tiene valores iguales o superiores a la mediana.

Si el número de observaciones es par, la mediana corresponde al

promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

(53)

Medidas de tendencia central para datos no agrupados

Rango medio

El rango suele ser utilizado para obtener la dispersión total. También se conoce como recorrido estadístico.

R = Max - Min

Rango medio

Es el promedio de las observaciones menores y mayores de una serie de datos.

El rango medio a menudo es usado como una medición de resumen tanto por analistas financieros como por reporteros meteorológicos, puesto que puede proporcionar una medición adecuada, rápida y simple para caracterizar toda una serie de datos, como por ejemplo todo una serie de lecturas registradas de temperatura por horas

durante todo un día.

(54)

Medidas de dispersión para datos no agrupados

Varianza muestral y poblacional

• La Varianza es una medida de dispersión que se utiliza para

representar la variabilidad de un conjunto de datos respecto de la media aritmética de los mismo. ... No obstante, se trata de una

medida que también puede calcularse como la desviación típica al cuadrado.

• La desviación estándar de la población es un parámetro, que es un valor fijo calculado a partir de cada individuo de la población. Una desviación estándar de muestra es una estadística. Esto significa que se calcula solo a partir de algunos de los individuos de una población.

(55)

Medidas de dispersión para datos no agrupados

• La varianza poblacional tiene por formula:

• La varianza muestral tiene por formula:

(56)

Medidas de dispersión para datos no agrupados

Desviación estándar

La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación

estándar, mayor es la dispersión de la población. La desviación estándar es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución.

(57)

Medidas de dispersión para datos no agrupados

Coeficiente de variación

• Este coeficiente es utilizado para comparar conjuntos de datos de poblaciones distintas, teniéndose en cuenta el valor de la media aritmética, lo que nos permite eliminar las eventuales distorsiones de las medias de dos o más poblaciones.

cv =

!"#$%&'%() "#*&)!&+

,"!%& &+%*,"*%'&

∗ 100%

• El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos.

(58)

Medidas de tendencia central para datos agrupados

Media

(59)

Medidas de tendencia central para datos agrupados

Media de la siguiente distribución

(60)

Medidas de tendencia central para datos

agrupados

(61)

Medidas de tendencia central para datos

agrupados

(62)

Medidas de tendencia central para datos agrupados

Media

(63)

Medidas de tendencia central para datos agrupados

Mediana

•Li: límite inferior del intervalo en el cual se encuentra la mediana.

n: número de datos del estudio. Es la sumatoria de las frecuencias absolutas.

Fi-1: frecuencia acumulada del intervalo anterior al que se encuentra la mediana.

Ai: amplitud del intervalo en el que se encuentra la mediana.

fi: frecuencia absoluta del intervalo en el que se encuentra la mediana.

(64)

Medidas de tendencia central para datos agrupados

Mediana

(65)

Medidas de tendencia central para datos agrupados

Este valor, lo buscamos en la columna de frecuencias acumuladas. Si no

aparece, buscamos el valor que sigue. Como vemos, después del 11 sigue el 14, por lo tanto, la mediana se ubica en el intervalo 3.

(66)

Medidas de tendencia central para datos agrupados

Aplicamos la formula de la mediana:

Ahora, aplicamos la fórmula de la mediana:

(67)

Medidas de tendencia central para datos agrupados

Moda

Encontrar el intervalo en el cual se encuentra la moda, que es el intervalo con mayor frecuencia absoluta.

Ahora, aplicamos la fórmula de la mediana:

•Li: límite inferior del intervalo en el cual se encuentra la moda.

fi-1: frecuencia absoluta del intervalo anterior en el que se encuentra la moda.

fi: frecuencia absoluta del intervalo en el que se encuentra la moda.

fi+1: frecuencia absoluta del intervalo siguiente en el que se encuentra la moda.

Ai: amplitud del intervalo en el que se encuentra la moda.

(68)

Medidas de tendencia central para datos agrupados

Moda Primero, encontramos el intervalo en el cual se encuentra la moda, es decir, el intervalo con mayor frecuencia absoluta. El intervalo 3, tiene la

mayor frecuencia absoluta (6), por lo tanto, aquí se encontrará la moda.

Ahora, aplicamos la fórmula de la mediana:

(69)

Medidas de tendencia central para datos agrupados

• Ahora, aplicamos la fórmula para estimar la moda:

Ahora, aplicamos la fórmula de la mediana:

(70)

Medidas de tendencia central para datos agrupados

Media

La media es el valor que se obtiene al sumar todos los datos multiplicados por su frecuencia y dividir el resultado entre la cantidad de datos. Usamos la

siguiente fórmula:

Ahora, aplicamos la fórmula de la mediana:

(71)

Medidas de tendencia central para datos agrupados

Para calcula la media, agregamos una columna adicional, en la

que multiplicaremos el valor de la variable (x) por la frecuencia absoluta (f).

Ahora, aplicamos la fórmula de la mediana:

(72)

Medidas de tendencia central para datos agrupados

Mediana

Ahora, buscamos la posición 17 en la columna de frecuencias acumuladas

Ahora, aplicamos la fórmula de la mediana:

El valor (x) que ocupa dicha posición es 4, por lo tanto, Me = 4.

(73)

Medidas de tendencia central para datos agrupados

• Calcular la mediana de la siguiente distribución:

Ahora, aplicamos la fórmula de la mediana:

(74)

Medidas de tendencia central para datos agrupados

Como nos ha quedado un valor con decimales, significa que la mediana será la media aritmética del valor que ocupa la posición 17, con el valor que ocupa la posición 18.

Buscamos los valores de posición 17 y 18 en la tabla de frecuencias acumuladas:

(75)

Medidas de tendencia central para datos agrupados

• Calcular la mediana de la siguiente distribución:

(76)

Medidas de tendencia central para datos agrupados

Como nos ha quedado un valor con decimales, significa que la mediana será la media aritmética del valor que ocupa la posición 29, con el valor que ocupa la posición 30.

Buscamos los valores de posición 29 y 30 en la tabla de frecuencias acumuladas:

Ahora, aplicamos la fórmula de la mediana:

(77)

Medidas de tendencia central para datos agrupados

• La moda es el valor con mayor frecuencia absoluta.

El valor con mayor frecuencia absoluta, es el 4, por lo tanto: Mo = 4.

(78)

Medidas de tendencia central para datos agrupados

• La moda es el valor con mayor frecuencia absoluta.

El valor con mayor frecuencia absoluta, es el 4, por lo tanto: Mo = 4.

(79)

ACTIVIDADES.

Ejercicios de actividad asincrónica

Ejercicio: completa la tabla y obtén la media, moda y mediana.

valor Frecuencia

absoluta Frecuencia

acumulada

13 6 6

14 2

15 6 14

16 4

17 7 25

total 25

(80)

Medidas de tendencia central para datos agrupados

• Completamos la tabla y obtenemos la columna x*f. Luego aplicamos la formula para obtener la media.

(81)

Medidas de tendencia central para datos agrupados

Para calcular la mediana, encontramos la posición central:

Por lo tanto, el valor de la mediana es: Me = 15.

(82)

Medidas de tendencia central para datos agrupados

Para calcular la moda, encontramos el valor con mayor frecuencia:

Por lo tanto, el valor de la moda es: Mo = 17.

(83)

Medidas de tendencia central para datos no agrupados

• Datos: 1,1,3,3,4,4,5,5,5,5

• Media:

• μ = "∗$#,∗$#+∗$#*∗+

") =3.6

• Moda: 5

• Mediana: Aplicando la formula asociada a la mediana para n par 10/ 2 = 5,

=> Li5 < 5.5 < Ls6

• => (4+4)/2 = 4.

• Entonces la mediana Me = 5.5.

Xi fi Fi

1 2

3 4

5 4 10

(84)

Medidas de tendencia central para datos no agrupados

• Datos: 1,3,4,4,5,5,7

• Media:

• μ = "∗"#,∗"#+∗$#*∗$#-∗"

- =4.12

• Moda: 4, 5.

• Mediana: Aplicando la formula

asociada a la mediana para n impar 7+1/ 2 = 4

• Entonces la mediana Me = 4.

Xi fi Fi

1 1

3 4

5 2

7 7

(85)

Medidas de tendencia central para datos no agrupados

• Datos:

1,1,3,3,1,4,5,5,2,4,2,3,2,4,2.

• Media:

• μ = "∗,#$∗+#,∗,#+∗,#*∗$

"* = 2.8

• Moda: 2.

• Mediana: Aplicando la formula asociada a la mediana para n impar 15+1/ 2 = 8

• Entonces la mediana Me = 3.

Xi fi Fi

1 3

2 4

3

4 3

5 15

(86)

Medidas de tendencia central para datos agrupados

• Datos: 5.42, 6.22, 8.42, 7.54, 6.44, 6.76, 5.9, 6.18, 7.16, 6.8, 7.32, 8.12, 6.84, 7.12, 8.21, 8.13, 7.25, 7.34, 5.56, 8.32, 7.45, 7.43, 6.87, 7.10;

Xi fi Marca de

clase

Xi*fi

(5 - 5.5) 1 5.25 5.25

(5.5 - 6) 2 5.75 11.5

(6 - 6.5) 3 6.25 18.75

(6.5 - 7) 4 6.75 27

(7 - 7.5) 8 7.25 58

(7.5 - 8) 1 7.75 7.75

(8 - 8.5) 5 8.25 41.25

Total 24 169.50

(87)

Medidas de tendencia central para datos agrupados

Xi fi Marca de

clase

Xi*fi

(5 - 5.5) 1 5.25 5.25

(5.5 - 6) 2 5.75 11.5

(6 - 6.5) 3 6.25 18.75

(6.5 - 7) 4 6.75 27

(7 - 7.5) 8 7.25 58

(7.5 - 8) 1 7.75 7.75

(8 - 8.5) 5 8.25 41.25

Total 24 169.50

(88)

Medidas de tendencia central para datos agrupados

Al ser impar el numero de datos, para saber en que posición debe caer la mediana, tenemos 25+1/2 =13

La mediana Me = 3

(89)

Medidas de tendencia central para datos agrupados

Mediana

• Primero hallamos las frecuencias absolutas acumuladas Fi

• Aplicando la formula asociada a la mediana para n par 38/ 2 = 19,

=> Li19 < 19.5 < Ls20

• => (5+6)/2 = 5.5.

• Entonces la mediana Me = 5.5.

Xi fi Fi

1 2 2

2 2 4

3 4 8

4 5 13

5 6 19 = 19

6 9 28

7 4 32

8 4 36

9 2 38

(90)

Medidas de tendencia central para datos agrupados

Moda

Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.

Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla (debajo):

La moda en este caso es 6.

Calificaci

ones 1 2 3 4 5 6 7 8 9

Número

alumnos de 2 2 4 5 8 9 3 4 2

(91)

Medidas de tendencia central para datos agrupados

Para variables cualitativas

La mediana se calcula de la msima manera. Para datos pares. 40/2 = 20

Li 20 < 20.5 < Ls21

(92)

Medidas de tendencia central para datos agrupados

Para variables cualitativas

• La mediana sera aprobado ya que el dato 20.5 esta dentro de la frecuencia acumulada 23.

(93)

Medidas de tendencia central para datos agrupados

Para variables cuantitativas

• La moda es el valor que mas se repite Mo = 1, 5

(94)

Medidas de tendencia central para datos agrupados

Para variables cualitativas

• La moda es el valor que mas se repite Mo = Aprobado

(95)

Medidas de tendencia central para datos agrupados

Para variables cuantitativas

• La moda es el valor que mas se repite

• Mo = (7 - 7.5)

(96)

Medidas de tendencia central para datos no agrupados

Mediana

• Datos: 2,3,4,4,5,5,5,6,6.

• Valor impar = 9+1/2 = 5

• Me = 5

• Datos: 7,8,9,10,11,12

• Valor par = 6/2 = 3; Li9< 3.5 < Ls10

• Me = 9+10/2 = 9.5

(97)

Medidas de tendencia central para datos agrupados

datos fi Fi

(60 – 63) 5 5

(63 – 66) 18 23

(66 – 69) 42 65

(69 – 72) 27 92

(72 – 75) 8 100

100 Mediana

position = 100/2 = 50

(98)

Medidas de tendencia central para datos agrupados

datos fi Fi

(60 – 63) 5 5

(63 – 66) 18 23

(66 – 69) 42 65

(69 – 72) 27 92

(72 – 75) 8 100

100

Mediana = 100/2 = 50 entonces esta entre (66 – 69)

(99)

Medidas de tendencia central para datos agrupados

Li = es el límite inferior de la clase donde se encuentra la mediana N/2 = es la semisuma de las frecuencias absolutas

fi = es la frecuencia absoluta de la clase mediana

Fi = es la frecuencia acumulada anterior a la clase mediana ai = es la amplitud de la clase

(100)

Medidas de tendencia central para datos

agrupados

(101)

Medidas de tendencia central para datos agrupados

Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).

fi Frecuencia absoluta del intervalo modal.

fi-1 Frecuencia absoluta del intervalo anterior al modal.

fi+1 Frecuencia absoluta del intervalo posterior al modal.

ti Amplitud de los intervalos.

Moda

(102)

Medidas de posición y forma de datos no agrupados

Cuartiles: son valores que se obtienen a partir de los datos

ordenados y que dividen el conjunto en cuatro partes porcentuales iguales , por tanto , hay tres valores que representa el 25%, 50%, y 75% de los datos Q1, Q2, Q3 respectivamente.

Las medidas de posición son valores que permiten dividir el conjunto de datos en pates porcentuales iguales y se usan para clasificar una observación dentro de una población o muestra.

(103)

Medidas de posición y forma de datos no agrupados

Q1: Valor que deja por debajo el 25% de los datos.

Q2: Valor que deja por debajo el 50% de los datos.

Q3: Valor que deja por debajo el 75% de los datos.

25% 25%

25% 25%

Q1 Q2 Q3

(104)

Medidas de posición y forma de datos no

agrupados

(105)

Medidas de posición y forma de datos no agrupados

Deciles: D1, D2, D3, D4, D5, D6 , D7, D8, D9 son valores que dividen el conjunto de datos en 10 partes iguales cada uno representa el 10%.

Percentiles: D1, D2, D3…….., D99 son valores que dividen el conjunto de datos en 100 partes iguales cada uno representa el 1%.

(106)

Medidas de posición y forma de datos no agrupados

Para un numero de N observaciones una vez ordenados los datos , se puede identificar la posición de los cuartiles, deciles y percentiles:

N par kn/A, N impar k(n+1)/A.

si el resultado es exacto se promedia con el dato siguiente, si no, se aproxima al entero mas cercano.

Cuartiles: k es el numero del cuartil 1,2,3. A número de divisiones A = 4.

Deciles: k es el numero del decil 1,2,3….9. A número de divisiones A = 10 Percentiles: k es el numero del percentil 1,2,3….99. A número de

divisiones A = 100.

(107)

Medidas de posición y forma de datos no agrupados

Ejemplo de cuartiles. Datos: 2,5,3,6,7,4,9.

Ordenar: 2,3,4,5,6,7,9; aplican la formula con N impar k(n+1)/A.

Q1 = 1(7+1)/4 = 2 Q2 = 2(7+1)/4 = 4 Q3 = 3(7+1)/4 = 6

2,3,4,5,6,7,9.

Q1 Q2 Q3

(108)

Medidas de posición y forma de datos no agrupados

Ejemplo de cuartiles. Datos: 2,5,3,4,6,7,1,9.

Ordenar: 1,2,3,4,5,6,7,9; aplican la formula con N par kn/A.

Q1 = 1(8+1)/4 = 2.25 Q2 = 2(8+1)/4 = 4.5 Q3 = 3(8+1)/4 = 6.75

1,2,3,4,5,6,7,9.

Q1 Q2 Q3

(109)

Medidas de posición y forma de datos no agrupados

Ejemplo: En una serie de 32 términos se desea localizar el 4° sextil, 8° decil y el 95° percentil.

Aplican la formula con N par kn/A.

S4 = 4*32/6 = 21 D8 = 8*32/10 = 25.6 P95 = 95*32/100 = 30.4

Esto significa que el 4° textil se encuentra localizado en el termino numero 21, es decir, el que ocupa la 21° posición; el 8° decil se encuentra localizado entre el termino numero 25° y 26°; y el 95° percentil entre la posición 30° y 31°

(110)

Medidas de posición y forma de datos agrupados

Cuartiles para datos agrupados.

Aplican la formula.

Li es el limite inferior de la clase donde se encuentra la mediana N es la suma de las frecuencias absolutas

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

a1 es la amplitud de clase.

(111)

Medidas de posición y forma de datos agrupados

Calcular los cuartiles para datos agrupados. k*N/4 = 1*65/4 = 16.25

datos fi Fi

(50 – 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

(112)

Medidas de posición y forma de datos agrupados

Calcular los cuartiles para datos agrupados. k*N/4 = 2*65/4 = 32.5

datos fi Fi

(50 – 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

(113)

Medidas de posición y forma de datos agrupados

Calcular los cuartiles para datos agrupados. k*N/4 = 3*65/4 = 48.75

datos fi Fi

(50 – 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

(114)

Medidas de posición y forma de datos agrupados

Calcular los deciles para datos

agrupados. k*N/4 = 1*65/10 = 6.5

datos fi Fi

(50 – 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

(115)

Medidas de posición y forma de datos agrupados

Calcular los deciles para datos agrupados. k*N/4 = 2*65/10 = 13

datos fi Fi

(50 – 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Referencias

Documento similar

Luis Miguel Utrera Navarrete ha presentado la relación de Bienes y Actividades siguientes para la legislatura de 2015-2019, según constan inscritos en el

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

You may wish to take a note of your Organisation ID, which, in addition to the organisation name, can be used to search for an organisation you will need to affiliate with when you

Where possible, the EU IG and more specifically the data fields and associated business rules present in Chapter 2 –Data elements for the electronic submission of information

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal