1.1-DEFINICIONES Y CONCEPTOS BÁSICOS
Estadística: Es la ciencia que trata de la teoría y aplicación de métodos apropiados para coleccionar, representar, resumir
datos, y analizarlos y hacer inferencias a partir de ellos.
Tipos:
-E. Descriptiva ó Deductiva: recopilación de información y buscar conclusiones con fines comparativos.
Áreas de Aplicación de la Estadística
El uso de la Estadística es muy amplio.
Resulta difícil nombrar un área en la cual no se emplee.
Los métodos estadísticos han encontrado
aplicación en:
Gobierno Negocios
Ciencias Sociales Ingeniería
Ciencias Física y Naturales Control de Calidad
Procesos de Manufactura
Muchos otros campos de la actividad intelectual.
T
em
a 1
.
In
tro
du
cc
ió
Áreas de Aplicación de la Estadística
Esto se debe a la creciente facilidad con la cual se pueden manejar grandes
cantidades de datos numéricos, debido al uso de …
T
em
a 1
.
In
tro
du
cc
ió
Conceptos de Población y Muestra
Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.
T
em
a 1
.
In
tro
du
cc
ió
Conceptos de Población y Muestra
Se clasifica en dos categorías:
Finita: es aquella que incluye una cantidad
limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la
población.
T
em
a 1
.
In
tro
du
cc
ió
Conceptos de Población y Muestra
Infinita: es aquella que incluye un gran
conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos,
hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar. Tem
a 1
.
In
tro
du
cc
ió
Conceptos de Población y Muestra
Muestra:
es un conjunto de mediciones u
observaciones tomadas a partir de una población.
es un subconjunto de la población.
T
em
a 1
.
In
tro
du
cc
ió
Conceptos de Población y Muestra
Muestra aleatoria: se considera aleatoria
siempre y cuando cada observación, medición o individuo de la población tenga la misma
probabilidad de ser seleccionado.
T
em
a 1
.
In
tro
du
cc
ió
Tipos de datos y escalas de medida
Variables:
son las características o lo que se estudia de
cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...
Datos:
son los valores que toma la variable en cada
caso.
T
em
a 1
.
In
tro
du
cc
ió
Tipos de datos
Cualitativos: son datos que solo toman valores
asociados a las cualidades o atributos,
clasificándolos en una de varias categorías, es decir, no son valores numéricos. Ej:
Sexo: f/m.
Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón, … Religión: católica, evangélica, …
Estado civil: soltero, casado, divorciado,…
T
em
a 1
.
In
tro
du
cc
ió
Tipos de datos
Cuantitativos: provienen de variables que
pueden medirse, cuantificarse o expresarse numéricamente. Ejemplos:
Peso Edad
Estatura Presión Humedad
Intensidad de un sismo Cantidad de hermanos
T
em
a 1
.
In
tro
du
cc
ió
Escalas de medida
Tipos de variables cuantitativas:
Discretas: es aquella que solo puede tomar un
número finito o infinito numerable de valores. Ejemplo: cantidad de hermanos.
Continuas: es la variable que puede tomar
cualquier valor en una escala continua.
Ejemplo: cantidad de líquido contenido en un recipiente.
T
em
a 1
.
In
tro
du
cc
ió
Escalas de medida
Escala Nominal.
Escala Ordinal.
Escala de Intervalos.
Escala de Razón o Proporción.
Escala Absoluta.
Variables Cualitativas
Variables Cuantitativas T
em
a 1
.
In
tro
du
cc
ió
Escalas de medida
Escala nominal: los datos se pueden agrupar en categorías que no
mantienen una relación de orden entre si, por lo tanto no están definidas las operaciones lógicas (>, <, , ) sino solo las de igualdad o diferencia.
Ejemplos: color de ojos, sexo, profesión, estado civil, religión.
T
em
a 1
.
In
tro
du
cc
ió
Escalas de medida
Escala ordinal: existe un cierto orden o jerarquía entre las categorías (>, <, , ).
Ejemplos: grados militares, organigrama de
una empresa, escalafón de los profesores
universitarios, grados de disnea, estadiaje de
un tumor. Tem
a 1
.
In
tro
du
cc
ió
Escalas de medida
Escala de Intervalos: valores numéricos de las variables y además de las relaciones de orden (>, <, , ), se pueden establecer distancias, es decir, tienen sentido las operaciones de suma y resta. Tiene dos propiedades:
Existe una unidad de medida que se mantiene
constante para todos los valores que toma la variable.
Existe un valor patrón u origen relativo que no
significa la ausencia de valor en la variable.
T
em
a 1
.
In
tro
du
cc
ió
Escalas de medida
Ejemplo: temperatura, nivel de ruido, movimientos sísmicos.
T
em
a 1
.
In
tro
du
cc
ió
Escalas de medida
Escala de razón o proporción: es la más completa y general de todas las escalas. Se caracteriza porque los valores de la variable son números entre los cuales,
además de las relaciones de orden (>, <,
, ) y distancia (+,-), se pueden
establecer múltiplos y proporciones.
Ejemplos: peso, altura, volumen…
T
em
a 1
.
In
tro
du
cc
ió
Escalas de medida
Escala Absoluta: se caracteriza porque los valores que toma la variable son el resultado de contar y por lo tanto, está constituida por los enteros positivos y el cero.
Ejemplos: número de hermanos, cantidad de
autos vendidos, cantidad de accidentes en una intersección, cantidad de hijos,…
T
em
a 1
.
In
tro
du
cc
ió
Datos Univariantes y Multivariantes
Univariantes o unidimensionales: sólo
recogen información sobre una característica (Ej: edad de los alumnos de una clase).
Bivariantes o bidimensionales: recogen
información sobre dos características de la
población. (Ej: edad y estatura de los alumnos de una clase).
T
em
a 1
.
In
tro
du
cc
ió
Datos Univariantes y Multivariantes
Multivariantes o pluridimensionales: recogen información sobre tres ó más características. (Ej: edad, estatura y peso de los alumnos de una clase).
T
em
a 1
.
In
tro
du
cc
ió
Abusos que se pueden cometer con la Estadística
Conclusiones erróneas debido a que los
datos son numéricamente insuficientes.
Representaciones gráficas engañosas
(escalas).
Datos muestrales no representativos:
Muestra que no incluye a elementos de toda la
población.
Ciertas categorías de personas no responden
correctamente.
Respuestas voluntarias (sesgadas).
T
em
a 1
.
In
tro
du
cc
ió
Organización de los datos
Una vez que se ha
realizado la
recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Organización de los datos
Formas de organizar los datos:
Un arreglo: es la forma más sencilla de
organizar los datos en bruto, consiste en
colocar las observaciones en orden según su magnitud: ascendente o descendente.
Poco práctica cuando se tiene una gran
cantidad de datos.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Organización de los datos
Una distribución de frecuencias: es un
arreglo de los datos que permite expresar la frecuencia de ocurrencias de las
observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.
Clase Pto.
Medio fi Fi fri FRi
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla, que denominaremos distribución de frecuencias, en la que cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc.
Por tanto, llamaremos distribución de frecuencias a un agrupamiento de datos en clases acompañada de sus frecuencias: frecuencias absolutas, frecuencias relativa o frecuencia acumuladas.
Tabla de distribución de frecuencias
Organización de los datos
La Distribución de Frecuencias:
Se recomienda su uso cuando se tienen
grandes cantidades de datos (n).
Su construcción requiere, en primer
lugar, la selección de los límites de los intervalos de clase.
Para definir la cantidad de intervalos de
clase (k), se puede usar:
La regla de Sturges: k = 1 + 3.3log(n) k = n
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Organización de los datos
La cantidad de clases no puede ser tan
pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.
La amplitud de todas las clases deberá ser
la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.
Los límites de las clases deben tener una
cifras significativas más que los datos en bruto.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Organización de los datos
Determinar:
Punto medio = (Li+Ls)/2.
Frecuencia absoluta de la clase (fi).
Frecuencia acumulada de la clase (Fi). Frecuencia relativa de la clase (fri):
fri = fi/n
Frecuencia relativa acumulada de la clase
(FRi).
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
A continuación se presentan
las calificaciones de 60
estudiantes que
presentaron la PINA en el
año 2009:
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
a
23 60 79 32 57 74 52 70 82 36 80 77 81 95 41 65 92 85 55 76 52 10 64 75 78 25 80 98 81 67 41 71 83 54 64 72 88 62 74 43 60 78 89 76 84 48 84 90 15 79 34 67 17 82 69 74 63 80 85 61
a) Construya una distribución de frecuencias. b) Qué puede concluir de estos datos.
Representación gráfica de los datos
Los gráficos permiten visualizar en forma
global y rápida el comportamiento de los datos.
Para datos cuantitativos agrupados en clases,
comúnmente se utilizan tres gráficos:
Histogramas.
Polígono de frecuencias.
Ojiva o Polígono de frecuencias acumuladas.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Representación gráfica de los datos
Representación gráfica de los datos
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
a
Ojiva
Representación gráfica de los datos
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Representación gráfica de los datos
Para datos cualitativos se usan: Curvas
Barras Sectores
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Barras
Representación gráfica de los datos
Representación gráfica de los datos
Representación gráfica de los datos
Sectores, torta o circularT
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ejemplos de construcción de
gráficos
Tem
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de tendencia central o posición
Corresponden a valores que generalmente se
ubican en la parte central de un conjunto de datos.
Forma como los datos pueden condensarse en
un solo valor central alrededor del cual todos los datos muestrales se distribuyen.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de tendencia central o posición
Las medidas de tendencia central más
importantes son:
Media: Aritmética y Aritmética ponderada. Mediana.
Moda.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Media Aritmética
Es la suma de todas las observaciones dividida entre
el número total de observaciones.
Expresada de forma más intuitiva, podemos decir
que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación. (wikipedia)
Por ejemplo, si en una habitación hay tres personas,
la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y
dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la
información de una distribución (dinero en el
bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. (wikipedia)
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Cálculo de la media
aritmética
Para datos no agrupados:
n x X n i i
1 Para datos agrupados:
n f m X k i i i
1Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
k: cantidad de clases
Mediana
Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.
Divide al conjunto de datos en dos partes iguales.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Cálculo de la mediana
Para datos no agrupados:
Si n es impar: posición donde se ubica la
mediana es igual a (n+1)/2.
Si n es par: (n+1)/2 no es entero, por lo tanto
la mediana será igual al promedio de las dos posiciones centrales.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Cálculo de la mediana
Datos agrupados: clase mediana es la
que contiene a la observación que ocupa la posición n/2.
Cm x f x F n Lm Md m m ) ( ) ( 2 1 1
Donde: Lm: límite inferior de la clase mediana.
F(xm-1): frecuencia acumulada de la clase
anterior a la clase mediana.
f(xm): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
Moda
Observación o clase que tiene la mayor
frecuencia en un conjunto de observaciones.
Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
Es la única medida de tendencia central que
se puede determinar para datos de tipo cualitativo.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Cálculo de la moda
Para datos no agrupados: es simplemente
la observación que más se repite.
Para datos agrupados:
Cm
Lim
Mo
2 1 1
Donde: Lim: límite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la
anterior.
2: diferencia entre fi de la clase modal y la
posterior.
Relación entre la media, la mediana y la moda
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
a
Propiedades, ventajas y desventajas de la media
Propiedades: La suma de las diferencias entre las media
muestral y el valor de cada observación es cero.
La media de una constante es la constante.
Si todas las observaciones xi se multiplican por
una constante a, la X también se debe
multiplicar por ese mismo valor constante.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Propiedades, ventajas y desventajas de la media
Si se somete a una variable estadística X a un cambio de origen y escala, Y = a + bX, la
media aritmética de dicha variable X varía en la misma proporción.
La media de la suma de dos variables es igual a la suma de sus medias.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Propiedades, ventajas y desventajas de la media
Ventajas:
Emplea en su cálculo toda la información disponible.
Se expresa en las mismas unidades que la
variable en estudio.
Es el centro de gravedad de toda la
distribución, representando a todos los valores observados.
Es una valor único.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Propiedades, ventajas y desventajas de la media
Se trata de un concepto familiar para la mayoría de las personas.
Es útil para llevar a cabo procedimientos
estadísticos como la comparación de medias de varios conjuntos de datos.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Propiedades, ventajas y desventajas de la media
Desventajas: Se ve adversamente afectada por valores
extremos, perdiendo representatividad.
Si el conjunto de datos es muy grande puede
ser tedioso su cálculo manual.
No se puede calcular para datos cualitativos. No se puede calcular para datos que tengan
clases de extremo abierto, tanto superior como inferior.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y desventajas de la mediana
Ventajas:
Fácil de calcular si el número de observaciones no es muy grande. No se ve influenciada por valores
extremos, ya que solo influyen los valores centrales.
Fácil de entender.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y desventajas de la mediana
Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto.
Es la medida de tendencia central más
representativa en el caso de variables que solo admiten la escala ordinal.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y desventajas de la mediana
Desventajas:
No utiliza en su “cálculo” toda la información disponible.
No pondera cada valor por el número de
veces que se ha repetido.
Hay que ordenar los datos antes de
determinarla.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y desventajas de la
moda
Ventajas:
No requiere cálculos.
Puede usarse para datos tanto cuantitativos como cualitativos.
Fácil de interpretar.
No se ve influenciada por valores extremos. Se puede calcular en clases de extremo
abierto.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y desventajas de la
moda
Desventajas:
Para conjuntos pequeños de datos su
valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos.
No utiliza toda la información disponible. No siempre existe, si los datos no se
repiten.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y desventajas de la
moda
En ocasiones, el azar hace que una sola
observación se no representativa se el valor más frecuente del conjunto de datos.
Difícil de interpretar si los datos tiene 3 o más modas.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de dispersión, variación o variabilidad.
Son valores numéricos que indican o
describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de dispersión, variación o variabilidad.
Son importantes debido a que dos muestras
de observaciones con el mismo valor central pueden tener una variabilidad muy distinta. Tem
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de dispersión, variación o variabilidad.
Rango.
Varianza.
Desviación Típica.
Coeficiente de variación.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de dispersión: Rango
Rango (amplitud o recorrido):
Está determinado por los dos valores extremos de los datos muestrales, es simplemente la diferencia entre la
mayor y menor observación.
Es una medida de dispersión absoluta,
ya que depende solamente de los datos y permite conocer la máxima dispersión.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de dispersión: Rango
Casi no se emplea debido a que depende
únicamente de dos valores.
No proporciona una medida de variabilidad
de las observaciones con respecto al centro de la distribución.
Notación: R
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de dispersión:
Varianza
Es un valor numérico que mide el grado de
dispersión relativa porque depende de la
posición de los datos x1,x2,…,xn con respecto a la media.
Es el promedio al cuadrado de las
desviaciones de cada observación con respecto a la media.
Notación: s2, 2, var(X)
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de dispersión:
Varianza
Si la varianza de un conjunto de
observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un
varianza menor.
2 1 2 2 1 2 2 x n x s n x x s n i i n i i
T em a 2 . E sta dís tic a D es cr ip tiv aPara datos agrupados en una distribución de frecuencias:
Medidas de dispersión:
Varianza
Medidas de dispersión: Desviación Típica
Es la raíz cuadrada de la varianza. Notación: s, .
2
s
s
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de dispersión: Coeficiente de
Variación
Es una medida de dispersión relativa que
permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.
No tiene dimensiones. Notación: CV
% 100
x s CV
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y Desventajas del
Rango
Ventajas:
Útil cuando se quiere conocer la extensión de las variaciones extremas (valor máximo de la dispersión).
Fácil de calcular.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y Desventajas del
Rango
Desventajas:
No es una MD con respecto al centro de la
distribución.
Solo emplea dos valores en su cálculo.
No se puede calcular en distribuciones de límite de clase abierto.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Propiedades, Ventajas y Desventajas de la
Varianza
Propiedades:
1. Siempre es mayor o igual a cero y menor
que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a Y=a+bX,
la varianza de Y será Var(Y) = b2Var(X)
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Propiedades, Ventajas y Desventajas de la
Varianza
Ventajas:
Es útil cuando se compara la variabilidad de
dos o más conjuntos de datos.
Utiliza toda la información disponible.
Desventajas:
No proporciona ayuda inmediata cuando se
estudia la dispersión de un solo conjunto de datos.
Difícil de interpretar por tener sus unidades
elevadas al cuadrado.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y Desventajas de la Desviación Típica
Ventajas:
Esta expresada en las mismas unidades que
la variable en estudio.
Utiliza todas las observaciones en su cálculo. Fácil de interpretar.
Desventajas: No tiene.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y Desventajas del Coeficiente de
Variación
Ventajas:
Es la única MD que permite comparar el nivel
de dispersión de dos muestras de variables diferentes.
Emplea toda la información disponible en su
cálculo.
Fácil de calcular.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Ventajas y Desventajas del Coeficiente de
Variación
Desventaja:
No es una MD con respecto al centro de la
distribución de los datos. Tem
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de Forma
Son medidas numéricas que permiten
determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los gráficos muestran.
Medidas de forma
-Asimetría
-Kurtosis o apuntamiento
Coeficiente de Pearson Coeficiente de Fisher
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de Forma: Asimetría
Permiten estudiar la forma de la curva,
dependiendo de cómo se agrupan los datos.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de Forma:
Asimetría
Coeficiente de Asimetría de Pearson:
Fácil de calcular e interpretar. Cálculo:
s
Md
X
ASP
3
o Interpretación:
ASP
= 0, X=Md Simétrica
> 0, X>Md Asimétrica Positiva
< 0, X<Md Asimétrica Negativa
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de Forma:
Asimetría
Coeficiente de Asimetría de Fisher:
No es de fácil cálculo, pero si su
interpretación. Tem
a 2 . E sta dís tic a D es cr ip tiv a
3 1 3 3 1 3 ns f x M ASF ns X x ASF k i i i n i i
Datos NO agrupados
Medidas de Forma: Asimetría
o Interpretación:
ASF
= 0, Simétrica
> 0, Asimétrica Positiva
< 0, Asimétrica Negativa
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de Forma: Kurtosis
Miden si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribución).
Se definen tres tipos de distribución según su grado de Kurtosis:
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de Forma: Kurtosis
Mesocúrtica: grado de concentración
medio alrededor de los valores centrales de la variable.
Leptocúrtica: grado de concentración elevado.
Platicúrtica: grado de concentración reducido.
T
em
a 2
. E
sta
dís
tic
a
D
es
cr
ip
tiv
Medidas de Forma: Kurtosis
3 3 4 1 4 4 1 4
ns f X M CK ns X x CK k i i i n i iDatos No Agrupados
Referencias:
Wikipedia(
http://es.wikipedia.org/wiki/Wikipedia:Portad a
)
Walpole y Myers. Probabilidad y Estadística. Mc Graw-Hill.
Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo. Para efectos prácticos, asumiremos las siguientes definiciones de frecuencias:
a) frecuencias absolutas : es el número de veces que aparece dicho valor de la variable y se representa por fi.
b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fri
c) frecuencias absoluta acumulada: es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓)
d) frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el cociente entre la frecuencia absoluta acumulada dividido por el tamaño de la muestra (N) y la denotaremos por fra.