• No se han encontrado resultados

estadistica descriptiva II

N/A
N/A
Protected

Academic year: 2020

Share "estadistica descriptiva II"

Copied!
89
0
0

Texto completo

(1)

ESTADÍS

TICA

(2)

ESTADÍSTICA DESCRIPTIVA

• Los orígenes de la estadística, aunque no se sabe con exactitud cuándo se comenzó a utilizar, pueden estar ligados al antiguo Egipto como a los censos chinos que se realizaron hace unos 4.000 años, aproximadamente. • Sin duda, fueron los romanos, maestros de la

organización política, quienes mejor supieron ocupar la estadística. Cada cinco años realizaban un censo de la población, cuyos datos de nacimientos, defunciones y matrimonios eran esenciales para estudiar los avances del imperio; sin olvidar los recuentos de ganancias y las riquezas que dejaban las tierras.

(3)

ESTADÍSTICA DESCRIPTIVA

• Términos básicos:

Población: Es un conjunto de personas, eventos o cosas, de las cuales se desea hacer un estudio, y tienen una característica en común.

(4)

ESTADÍSTICA DESCRIPTIVA

Muestra:

Es un subconjunto cualquiera de la población; es importante escoger la muestra en forma aleatoria (al azar), pues así se logra que sea representativa y se puedan obtener conclusiones más a fines acerca de las características de la población.

(5)

ESTADÍSTICA DESCRIPTIVA

Todo estudio estadístico debe considerar

diferentes tipos de variables:

Variables

(6)

ESTADÍSTICA DESCRIPTIVA

Variables cualitativas:

Relacionadas con características no numéricas de un individuo y que califican al mismo (por ejemplo; atributos de una persona: nacionalidad, color de la piel, sexo, etc.)

Variables Cuantitativas: Relacionadas

con características numéricas del individuo por ejemplo: edad, precio de un producto, ingresos anuales. Las variables cuantitativas se dividen en

discretas (aquellas que pueden tomar

solo algunos valores en un intervalo y no valores intermedio, ejemplo: edad, número de hermanos que puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45) o continuas (aquellas que pueden tomar cualquier valor en un intervalo real, ejemplo: alturas, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.).

(7)

Estadística Descriptiva: Es la parte de la

estadística que trata solamente de describir y

analizar un grupo dado sin sacar conclusiones o

inferencias de un grupo mayor, a partir de ella. La estadística descriptiva incluye las técnicas que se relacionan con el resumen y la descripción de datos numéricos. Estos datos pueden ser gráficos o pueden incluir análisis computacional.

(8)

Estadística Inferencial: Cuando una muestra es

representativa de una población se pueden deducir importantes conclusiones acerca de esta, a partir de su análisis. La inferencia estadística comprende aquellas técnicas por medio de las cuales se toma decisiones sobre una población estadística basadas solo en la muestra observada. Debido a que dichas decisiones se toman en condiciones de incertidumbre, entonces estas serán confiables con cierto grado de probabilidad. Considerando que las características medidas de una muestra se denominan estadísticas de la muestra, las características medidas de una población estadística, o universo se llaman parámetros de la población.

(9)

ESTADÍSTICA DESCRIPTIVA

Ordenando la Información

Al ordenar datos muy numerosos, es usual agruparlos en clases o

categorías. Al determinar cuántos

pertenecen a cada clase, establecemos la frecuencia. Construimos así una tabla de datos llamada tabla de frecuencias.

(10)

ESTADÍSTICA DESCRIPTIVA

¿Para qué se construyen las tablas

de frecuencias ?

1. ORDENAR 2. AGRUPAR

(11)

ESTADÍSTICA DESCRIPTIVA

En la siguiente tabla se presenta el motivo de la consulta médica, durante una semana.

Motivo Consulta Número de pacientes Bronquitis 19

Otitis 13

Heridas 7

Fracturas 18

(12)

ESTADÍSTICA DESCRIPTIVA

Hasta el momento sólo hemos trabajado con una pequeña cantidad de datos. ¿Qué crees que deberíamos hacer si tenemos muchos datos?

Tabla de Frecuencias de datos agrupados

En ocasiones, el agrupar los datos en

intervalos, nos puede ayudar para realizar un

(13)

ESTADÍSTICA DESCRIPTIVA

Definiciones:

Rango: Diferencia entre el máximo y el mínimo valor de una variable.

Marca de clase: Representante de un intervalo, y corresponde al promedio entre los extremos de éste.

Tamaño de un intervalo: Es el cociente entre el valor del rango y la cantidad de intervalos que se desea obtener. Se recomienda tomar como longitud de los intervalos un valor entero que sea mayor o igual al cociente obtenido.

(14)

ESTADÍSTICA DESCRIPTIVA

frecuencias absolutas: estas frecuencias son las que se

obtienen directamente del conteo

frecuencias relativas: corresponden a los porcentajes de cada

frecuencia absoluta.

frecuencia absoluta acumulada: corresponde a la frecuencia

absoluta del intervalo más la suma de las frecuencias absolutas de todos los valores anteriores.

frecuencia relativa acumulada: corresponde al porcentaje de la

frecuencia relativa del intervalo más la suma de las frecuencias relativas de todos los valores anteriores.

(15)

• EJEMPLO 1:

En un estudio en particular estaban

interesados en evaluar el número de frutos por planta de zapallo. Se consideró solo las plantas de una parcela; para cada planta se contó la

cantidad de frutos que tenían. Los datos se presentan en forma aleatoria a continuación :

1 5 7 4 1 2 5 4 6 2 7 5 7 6 3 2 5 4 3 6 6 3 4 4

(16)

Tabla de distribución

N=30   3 7 4 6 5 5 8 4 4 3 3 2 3 1 fi Xi frecuencia variable Hay 3 zapallos con 2 frutos Hay 4 zapallos con 6 frutos

(17)

  100     1 N=30   100 10 1 1/10 30 3 7 90 13.33 9/10 2/15 27 4 6 76.67 16.67 23/30 1/6 23 5 5 60 26.67 3/5 4/15 18 8 4 33.3 13.33 1/3 2/15 10 4 3 20 10 1/5 1/10 6 3 2 10 10 1/10 3 1/10 3 1 Fr% fr% Fr fr F fi xi FRECUENCIA RELATIVA

Tabla de distribución

FRECUENCIA ACUMULADA FRECUENCIA ACUMULADA RELATIVA FRECUENCIA REALTIVA PORCENTUAL FRECUENCIA ACUMULADA RELATIVA PORCENTUAL

(18)
(19)

Distribución de Frecuencias (datos

agrupados)

Elemplo 2:

Siguiendo con el estudio del zapallo japonés ahora

estamos interesados en evaluar el peso de los zapallos para eso registramos su peso en kilogramos. Se tomó una muestra de 30 zapallos

Variable: peso tipo cuantitativa continua

(20)

1.18 1.20 1.17 1.30 1.30 1.30 1.60 1.60 1.60 1.60 1.60 1.60 1.40 1.50 1.50 1.50 1.50 1.50 1.70 1.70 1.70 1.70 1.80 1.80 1.60 1.90 1.80 1.80 1.95 1.90 R= xM - xm= R= XM - xm = 1.95 - 1.17 = 0.78 DATOS:

1º PASO: CALCULAR EL RANGO DE LOS DATOS. QUE ES LA DIFERENCIA ENTRE EL MAXIMO VALOR Y EL MINIMO

(21)

Fórmula para calcular la cantidad de intervalos Nº de intervalos = 5 log N Nº de intervalos = 1 + 3.3 * log N 5 * log 30 = 7.38  7 1 + 3.3 * log 30 = 5.67  6

(22)

0.78/6 = 0.13  0.15

La amplitud del intervalo es 0.15

3º PASO: CALCULAR LA AMPLITUD DEL INTERVALO

(23)

1.92 1.85 – 1.99 1.77 1.70 – 1.84 1.62 1.55 – 1.69 1.47 1.40 – 1.54 1.32 1.25 – 1.39 1.17 1.10 – 1.24 xi

Clase MARCA DE CLASE

(24)

Clase xi fi f r Fi Fr fr% Fr% 1 1.10 – 1.24 1.17 2 1.25 – 1.39 1.32 3 1.40 – 1.54 1.47 4 1.55 – 1.69 1.62 5 1.70 – 1.84 1.77 6 1.85 – 2.00 1.92

(25)

1.18 1.20 1.17 1.30 1.30 1.30 1.40

1.50 1.50 1.50 1.50 1.50 1.60 1.60

1.60 1.60 1.60 1.60 1.60 1.70 1.70

1.70 1.70 1.80 1.80 1.80 1.80 1.90

(26)

Clase xi f i f r Fi Fr fr% Fr% 1 1.10 – 1.24 1.17 3 0.10 3 0.10 10 10 2 1.25 – 1.39 1.32 3 0.10 6 0.20 10 20 3 1.40 – 1.54 1.47 6 0.20 12 0.40 20 40 4 1.55 – 1.69 1.62 7 0.23 19 0.63 23 63 5 1.70 – 1.84 1.77 8 0.27 27 0.90 27 90 6 1.85 – 1.99 1.92 3 0.10 30 1.00 10 100

(27)

GRAFICOS

Para Distribuciones De Frecuencias

Agrupadas

(28)

Cantidad de zapallos según peso 0 2 4 6 8 10 12 1.02 1.17 1.32 1.47 1.62 1.77 1.92 2.07 peso ca n ti d ad d e za p al lo s HISTOGRAMA

(29)

Cantidad de zapallos según peso 0 2 4 6 8 10 12 1.02 1.17 1.32 1.47 1.62 1.77 1.92 2.07 peso ca n ti d ad d e za p al lo s POLIGONO DE FRECUENCIAS

(30)

OJIVA

Fuente: Datos brindados por la cátedra

Ojiva o poligono de frecuencias acumuladas

0 3 6 9 12 15 18 21 24 27 30 33 1.1 1.25 1.4 1.55 1.7 1.85 2 cantidad de zapallos p e s o 3 7 12 23 27 30

(31)

ESTADÍSTICA DESCRIPTIVA

Ejemplo:

Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de 80 estudiantes del tercer año de Educación Media.

1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77

(32)

ESTADÍSTICA DESCRIPTIVA

Estatura Mayor: 1,93 metros Estatura Menor: 1,66 metros

Rango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.

Formaremos 6 intervalos. Para calcular el tamaño de intervalo de cada uno dividimos 27 y 6, obteniendo finalmente 4,5 5

Luego los intervalos de la tabla son:

Intervalo Marca de Clase Frecuencia Absoluta 1,65 – 1,69 1,70 – 1,74 1,75 – 1,79 1,80 – 1,84 1,85 – 1,89 1,90 – 1,94

(33)

Otras representaciones

• Variable de estudio: peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla:

Peso de 25 estudiantes (en kg) 40 43 48 51 49 56 44 42 55 52 52 62 44 50 59 63 50 56 55 45 57 66 63 51 58

(34)

Listado en orden ascendente

• El proceso consiste en ordenarlos de menor a mayor

Peso de 25 estudiantes (en kg)

42 40 48 51 49

56 44 43 55 52

52 62 44 50 59

63 50 56 55 45

57 66 63 51 58

Peso de 25 estudiantes (en kg)

40 42 43 44 44

45 48 49 50 50

51 51 52 52 55

55 56 56 57 58

(35)

• Datos sin ordenar: • Datos ordenados: 4 5 6 4 5 6 0,2,3,4,4,5,8,9 0,0,1,1,2,2,5,5,6,6,7,8,9 2,3,3,6

Peso de 25 estudiantes (en kg)

42 40 48 51 49 56 44 43 55 52 52 62 44 50 59 63 50 56 55 45 57 66 63 51 58 2,0,8,9,4,3,4,5 1,6,5,2,2,0,9,0,6,5,7,1,8 2,3,6,3

(36)

Caso de variables cualitatitivas

• El procedimiento es:

– Se identifican todos los valores diferentes y se acomodan en columna.

– Se agrega una segunda columna en donde se van registrando, mediante una línea vertical, la veces que aparece el valor dado.

(37)

Ejemplo

• Considera que la variable de estudio es el color de playera de 25 estudiantes.

Los colores se encuentran en la siguiente tabla:

rosa azul blanco azul rosa gris blanco café negro blanco rosa azul café blanco blanco gris azul blanco rosa gris gris blanco café negro verde

(38)

rosa azul blanco azul rosa gris blanco café negro blanco rosa azul café blanco blanco gris azul blanco rosa gris gris blanco café negro verde

Color Conteo Frecuencia

Azul Blanco Café Gris Negro Rosa Verde I I I I I I I I I I I I I I I I I I I I I I I I 4 7 3 4 2 4 1  : 25

(39)

Ejemplo

• Tabla de frecuencias de los pesos en kg de 25 alumnos.

Peso de 25 estudiantes (en kg)

40 42 43 44 44 45 48 49 50 50 51 51 52 52 55 55 56 56 57 58 59 62 63 63 66 xi f 40 42 43 44 45 48 49 50 51 xi f 52 55 56 57 58 59 62 63 66 Total 1 1 1 2 1 1 1 2 2 2 2 2 1 1 1 1 2 1 25

(40)

Ejemplo

xi f fr fa 40 1 42 1 43 1 44 2 45 1 48 1 49 1 50 2 51 2 xi f fr fa 52 2 55 2 56 2 57 1 58 1 59 1 62 1 63 2 66 1 Total 25 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.08 0.08 0.08 0.08 0.08 0.08 0.08 1/25 2/25 1 2 3 5 6 7 8 10 12 14 16 18 19 20 21 22 24 25 1 Siempre es el número total Siempre es 1

(41)

Ejemplo

Intervalo de clase Punto medio “xi”

38 – 42 40 43 – 47 45 48 – 52 50 53 – 57 55 58 – 62 60 63 – 67 65

Límite inferior Límite superior Lím inf + Lim sup 2

+5

+5

(42)

Límite verdadero del intervalo

• Frontera de clase o límite verdadero del intervalo:Intervalo de clase Punto medio “xi”

37.5 – 42.5 40 42.5 – 47.5 45 47.5 – 52.5 50 52.5 – 57.5 55 57.5 – 62.5 60 62.5 – 67.5 65 5/2 = 2.5 40 – 2.5 40 + 2.5

+5

+5

(43)

Ejemplo

• Para el ejemplo de los datos de los pesos de 25 alumnos, el valor de K:

• Y la amplitud de los intervalos sería:

K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.

Por lo tanto se requieren aproximadamente 6 intervalos.

Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64.

Aproximadamente 5 unidades es la amplitud de los intervalos.

(44)

Tabla de distribución de

frecuencias para datos agrupados

• Se elabora con los intervalos de clase, sus puntos medios y las frecuencias correspondientes para cada uno de los intervalos.

xi f 40 1 42 1 43 1 44 2 45 1 48 1 49 1 50 2 51 2 52 2 55 2 56 2 57 1 58 1 59 1 62 1 63 2 66 1 Total 25 D at o s si n a gr u p ar Intervalo de

clase Punto medio “xi” f

38 – 42 40 43 – 47 45 48 – 52 50 53 – 57 55 58 – 62 60 63 - 67 65 Total Datos agrupados 2 4 8 5 3 3 25

(45)

• Se agregan las columnas de frecuencia relativa “fr” y frecuencia acumulada “fa”:

Intervalo

de clase medio “xi”Punto f fr Fa

38 – 42 40 2 43 – 47 45 4 48 – 52 50 8 53 – 57 55 5 58 – 62 60 3 63 - 68 65 3 Total 25 0.08 0.16 0.32 0.20 0.12 0.12 1 2 6 14 19 22 25 2/25 4/25 8/25

(46)

Tablas de frecuencias absoluta,

relativa y acumulada

Intervalo

de clase Punto medio “xi” f fr f% fa fra f%a

38 – 42 40 2 0.08 2 43 – 47 45 4 0.16 6 48 – 52 50 8 0.32 14 53 – 57 55 5 0.20 19 58 – 62 60 3 0.12 22 63 - 68 65 3 0.12 25 Total 25 1 8 16 32 20 12 12 100 0.08 0.24 0.56 0.76 0.88 1 8 24 56 76 88 100 0.08 x 100 2/25 0.08 x 100

(47)

Gráfica de Datos

• Existen dos tipos de gráficas mas usuales: – Polígono de Frecuencias

– Histograma • Otros gráficos:

– Gráfica de barras – Pictograma

(48)

Polígono de Frecuencias

• Es la representación mediante un gráfico de línea. En él se muestra la distribución de

frecuencias y está formado por segmentos de línea que unen los puntos correspondientes a la frecuencia de cada una de las clases.

• El eje “x” representa el dato “xi” y el eje “y” las frecuencias.

(49)

Ejemplo

Intervalo de

clase Punto medio “xi” f

38 – 42 40 2 43 – 47 45 4 48 – 52 50 8 53 – 57 55 5 58 – 62 60 3 63 - 68 65 3 Total 25 35 40 45 50 55 60 65 70 0 2 4 6 8 10 Polígono de Frecuencias xi f

(50)

• El eje “y” puede ser sustituido por las frecuencias relativas o

porcentuales. 35 40 45 50 55 60 65 70 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 fr xi

(51)

% f

xi

Polígono de Frecuencia Porcentual

35 40 45 50 55 60 65 0 5 10 15 20 25 30 35

(52)

Histograma

• Es la representación gráfica de

los datos mediante una sucesión de rectángulos.

• Está formado por rectángulos cuya anchura representa a cada uno de

los intervalos y la altura corresponde a la frecuencia.

• En el eje “x” estarán los límites

verdaderos, los puntos medios y en el eje “y” las frecuencias.

(53)

35 40 45 50 55 60 65 0 1 2 3 4 5 6 7 8 9 Histograma xi f Intervalo de clase Punto medio “xi” f 38 – 42 40 2 43 – 47 45 4 48 – 52 50 8 53 – 57 55 5 58 – 62 60 3 63 - 68 65 3 Total 25

Ejemplo

(54)

• También podemos usar la frecuencia relativa y la frecuencia porcentual.

35 40 45 50 55 60 65 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

Histograma con frecuencias relativas

fr

(55)

35 40 45 50 55 60 65 0 5 10 15 20 25 30 35

Histograma con frecuencias porcentuales

% f

(56)

Pirámide Poblacional

• Una variante en el histograma es colocar en el eje “x” de tal manera

que las columnas quedarán en forma horizontal, es muy común en datos poblacionales.

(57)

Ojiva

• Es la representación gráfica de las frecuencias acumuladas mediante un gráfico de línea. Se muestra la distribución de frecuencias

acumuladas de los datos.

• En el eje “x” estarán los puntos medios y en el eje “y” las

(58)

Ejemplo

Interva lo de clase Punto medio “xi” f fr fa 38 – 42 40 2 0.08 2 43 – 47 45 4 0.16 6 48 – 52 50 8 0.32 14 53 – 57 55 5 0.20 19 58 – 62 60 3 0.12 22 63- 68 65 3 0.12 25 Total 25 1

(59)

35 40 45 50 55 60 65 0 5 10 15 20 25 30 0 2 6 14 19 22 25 Ojiva xi fa

(60)

• Usando la frecuencia acumulada y la frecuencia porcentual. Interval o de clase Punto

medio “xi” f fr f% fa fra f%a 38 – 42 40 2 0.0 8 8 2 0.08 8 43 – 47 45 4 0.1 6 16 6 0.24 24 48 – 52 50 8 0.3 2 32 14 0.56 56 53 – 57 55 5 0.2 0 20 19 0.76 76 58 – 62 60 3 0.1 2 12 22 0.88 88 63- 68 65 3 0.1 2 12 25 1 100 Total 25 1 100

(61)

35 40 45 50 55 60 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.08 0.24 0.56 0.76 0.88

Ojiva con frecuencia relativa acumulada

xi fra

(62)

35 40 45 50 55 60 65 0 10 20 30 40 50 60 70 80 90 100 0 8 24 56 76 88

Ojiva con frecuencia porcentual acumulada

xi f%a

(63)

Gráfico Circular

• También es llamado gráfico de pastel.

• Sólo se representan datos de

frecuencias relativas o frecuencias porcentuales.

• Se debe dividir el área del círculo de manera proporcional a las

(64)

• Agregaremos una columna a nuestra tabla de frecuencias “Frecuencia

relativa al círculo”, multiplicando (fr) (360°), para mostrar la parte

proporcional de círculo medida en grados que corresponde a cada

(65)

Ejemplo 1

Interval o de clase Punto medio “xi” f fr (fr ) (360°) 38 – 42 40 2 0.08 43 – 47 45 4 0.16 48 – 52 50 8 0.32 53 – 57 55 5 0.20 58 – 62 60 3 0.12 63- 68 65 3 0.12 Total 25 1 28.8° 0.08 x 360° 0.16 x 360° 57.6° 115.2 °72° 43.2° 43.2° 360°

(66)

40; 8.00% 45; 16.00% 50; 32.00% 55; 20.00% 60; 12.00% 65; 12.00% Gráfico Circular

(67)

Ejemplo 2

Color Frecuen cia Conteo Azul 4 Blanco 7 Café 3 Gris 4 Negro 2 Rosa 4 Verde 1 I I I I I I I I I II I I I I I I I I I I I I I 16.00% 28.00% 12.00% 16.00% 8.00%16.00% 4.00% Color de Playera

Azul Blanco Café Gris Negro Rosa Verde

(68)

Otros Gráficos

• La gráfica de barras se traza similar al Histograma, sólo que las barras se dibujan separadas unas de otras.

• La escala en el eje “x” es para

mostrar categorías o intervalos de números NO consecutivos.

(69)

Carrera Alumnos Medicina 8 Mecánica 11 Civil 8 Agronomía 3 Físico - Matemáticas 3 Leyes 6 Contaduría 11 8 11 8 3 3 6 11 Elección de Carrera

(70)

Pictograma

• Similar al de barras, sólo que se

sustituyen por figuras, generalmente relacionadas con la variable

(71)

ESTADÍSTICA DESCRIPTIVA

Representaciones Gráficas

Para hacer más clara y evidente la información que nos dan las tablas se utilizan los gráficos. Existen múltiples tipos de gráficos, pero aquí trataremos

solamente de los usados más frecuentemente, que son: gráfico de barras, gráfico de sectores o

circular (pastel), histograma, polígono de frecuencias, la ojiva y el pictograma.

(72)

ESTADÍSTICA DESCRIPTIVA

Ejercicios:

(73)

ESTADÍSTICA DESCRIPTIVA

Días Artículos Frecuenc ia Relativa Frecuenc ia relativa porcentu al Lunes 3 0,129 12,9 Martes 5,2 0,224 22,4 Miércole s 4,8 0,206 20,6 Jueves 6 0,258 25,8 Viernes 4,2 0,181 18,1 Total 23,2 0,998 99,8

(74)

ESTADÍSTICA DESCRIPTIVA

Edad Frecuen cia Absoluta Frecuen cia Relativa Frecuen cia Relativa % 20-24 6 24-28 5 28-32 3 32-36 2 Total 16

(75)

MEDIDAS DE RESUMEN

Entre las medidas que permiten

resumir información proveniente de

una población, podemos considerar las

medidas de posición, medidas de

dispersión y medidas de forma.

(76)

Medidas de Posición

Tienen por objeto, obtener un valor que resuma en sí todas las mediciones. La mayoría de ellas trata de ubicar el centro de la distribución, razón por la cual, se llaman MEDIDAS DE TENDENCIA CENTRAL; estas son: Media, Mediana, Moda, Media Geométrica, Media Armónica.

(77)

MEDIDAS DE TENDENCIA CENTRAL

Media aritmética o promedio: Es una de las

medidas de tendencia central de mayor uso. La media muestral se simboliza por y la media poblacional de denota por .

X

MEDIA PARA DATOS NO TABULADOS

Sea X una variable cuantitativa y x1, x2,…, xn una muestra de tamaño "n" de valores de la variable, se define la media aritmética de X como: n x ... x x x X 1  2  3   n n x X n 1 i i

 

(78)

PROMEDIO PARA DATOS TABULADOS

Sea X una variable estadística que toma los valores xi, con

frecuencias absolutas fi, respectivamente. La media está dada

por:

           n 1 i i n 1 i i i n 2 1 n n 2 2 1 1 f f x f ... f f f x ... f x f x x

Ejemplo: Consideremos la edad en años de ocho personas

10 18 25 28 12 5 7 7

En este ejemplo el promedio , media o media aritmética de la edad de estas personas está dada por:

14 8 7 7 5 12 28 25 18 10 x         

Es decir la media para las edades de estas personas es de 14 años.

(79)

Mediana (med)

Sea X una variable por lo menos ordinal y sea x1, x2,…xn una muestra de tamaño n de observaciones de la variable, se define como mediana “med" un valor tal que supera a no más del 50% de las observaciones y es superado por no más del 50% de las observaciones, cuando estas han sido ordenadas según

magnitud.

MEDIANA PARA DATOS NO TABULADOS

Ejemplo: Consideremos la edad en años de ocho personas 10 18 25 32 12 5 7 7

Para calcular la mediana , previamente se deben ordenar las observaciones. En este caso lo haremos en forma creciente:

5 7 7 10 12 18 25 32

Como la cantidad de datos es par, entonces la mediana

corresponde al promedio de los datos centrales, por lo tanto la mediana es 11.

(80)

MEDIANA PARA DATOS TABULADOS

En casos de datos agrupados es un poco más complejo y requiere de la utilización de la siguiente fórmula

Li: límite inferior de la clase mediana

c: amplitud del intervalo de la clase mediana N: número total de datos

fi: suma de frecuencias hasta la clase anterior a la mediana fmed: frecuencia de la clase mediana

c f f 2 N L med med i i     

(81)

Moda (mo) para datos no tabulados

La moda se identifica al observar el valor que se presenta con más frecuencia en la distribución.

Si consideramos el ejemplo del peso de una muestra de

personas: 65 76 48 48 68 78 90 87 67 72 78 mo = 48 kilos ; mo = 78 kilos. Esta distribución es

bimodal.

Moda (mo) para datos tabulados

Ahora bien, en el caso de datos agrupados en intervalos, es fácil determinar la clase modal (clase con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga mayor frecuencia se obtiene a partir de la siguiente expresión:

c L mo 2 1 1 i       

(82)

Cuantiles

La mediana divide a la distribución en dos partes iguales, los

cuantiles son parámetros que dividen los datos de la distribución en partes iguales.

Los más usados son:

Cuartiles:

Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales.

Q1: primer cuartil; Q2: segundo cuartil; Q3: tercer cuartil.

Deciles:

Nueve valores que dividen la distribución en 10 partes iguales. D1: primer decil; D2: segundo decil; …; D9: noveno decil.

Percentiles:

Noventa y nueve valores que dividen la serie en 100 partes iguales. P1: primer percentil; …; P99: percentil noventa y nueve.

(83)

Media Geométrica:

• Se define como la raíz n-ésima del producto de todos los valores numéricos, es decir,

n i n 1 i n n 2 1 G x .x ....x (x ) X     La media armónica:

• Se define como el número de observaciones de la muestra dividido por la suma del inverso de cada una de las observaciones, es decir,

  n 1 i i A ) x / 1 ( n X

(84)

MEDIDAS DE DISPERSIÓN: miden la

dispersión de los datos respecto de una medida de tendencia central.

• Las medidas descriptivas más comunes de

dispersión son: el rango, la varianza, la desviación estándar, la desviación media y el rango intercuartílico.

• El rango de la muestra es la medida de variabilidad más sencilla entre todas las mencionadas; y se define como la diferencia entre la observación más grande y la más pequeña :

(85)

n ) x x ( s n 1 i 2 i 2

 

• La varianza para una serie de datos x1; x2; x3; …; xn se define como: n ) x x ( s n 1 i 2 i

  

• La desviación típica es la raíz cuadrad de la varianza:

• rango intercuartílico: RQ = Q3 – Q1, donde Q3 es el tercer cuartil y Q1 es el primer cuartil.

(86)

Asimetría

• Si los valores de la serie de datos presenta la misma forma a izquierda y derecha de un

valor central (media aritmética) se dice que es simétrica de lo contrario será asimétrica.

• Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene definido:

3 1 3 1

)

(

)(

/

1

(

s

x

x

n

g

n i i

(87)

Los resultados pueden ser los siguientes:

• g1 = 0 (distribución simétrica; existe la misma

concentración de valores a la derecha y a la izquierda de la media)

• g1 > 0 (distribución asimétrica positiva; existe

mayor concentración de valores a la derecha de la media que a su izquierda)

• g1 < 0 (distribución asimétrica negativa; existe

mayor concentración de valores a la izquierda de la media que a su derecha)

(88)

Curtosis

• El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores

alrededor de la zona central de la distribución. • El Coeficiente de Curtosis viene definido

por la siguiente fórmula:

3 ) ( )( / 1 ( 4 1 4 2   

s x x n g n i i

(89)

Se definen 3 tipos de distribuciones según su grado de curtosis:

• g2 = 0: Distribución mesocúrtica; presenta un

grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

• g2 > 0: Distribución leptocúrtica; presenta un

elevado grado de concentración alrededor de los valores centrales de la variable.

• g2 < 0: Distribución platicúrtica; presenta un

reducido grado de concentración alrededor de los valores centrales de la variable.

Referencias

Documento similar

Desarrollar habilidades lógicas y matemáticas que permitan distinguir la estrategia adecuada para obtener antiderivadas mediante el análisis de diferentes técnicas..

If certification of devices under the MDR has not been finalised before expiry of the Directive’s certificate, and where the device does not present an unacceptable risk to health

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

Respuesta de los parámetros S en función de la frecuencia después de optimizar Como se observa en la gráfica, obtenemos un comportamiento no tan ideal, más realista, ya que la

Polígon industrial Torrent d'en Puig. Polígonindustrial de Can

13 El candidato que encabezaba la terna remitida por el gobernador de Orihuela –en marzo de 1593– para la provisión del primer titular de la Abogacía fiscal alicantina,

La combinación, de acuerdo con el SEG, de ambos estudios, validez y fiabilidad (esto es, el estudio de los criterios de realidad en la declaración), verificada la

Siete de cada diez de estos inversores más jóvenes esperan que las inversiones sustentables superen en desempeño a las inversiones tradicionales, mientras que solo un tercio de