“ESTADISTICA”
EN GENERAL, UNA
Objetivos que se esperan por parte de los alumnos son:
Objetivos que se esperan por parte de los alumnos son:
1.
1. Saber el significado de Saber el significado de EstadísticaEstadística.. 2.
2. Clasificar y Explicar la ESTADÍSTICA:Clasificar y Explicar la ESTADÍSTICA: a) Descriptiva
a) Descriptiva
b) e Inferencial.b) e Inferencial.
3. Reconocer los distintos tipos de variables que se pueden
3. Reconocer los distintos tipos de variables que se pueden
encontrar y agrupar.
encontrar y agrupar.
4. Diferenciar entre variables :
4. Diferenciar entre variables :
a) Variable Cualitativas
a) Variable Cualitativas
b) Variable Cuantitativa
5.
5. Clasificar los Distintos niveles de medición de las VariablesClasificar los Distintos niveles de medición de las Variables 6.
6. Diferenciar entre los niveles de medición de las VariablesDiferenciar entre los niveles de medición de las Variables 7.
7. Compilar y Representar en tablas de FrecuenciasCompilar y Representar en tablas de los datos. los datos. 8.
8. Graficar Los Datos ObtenidosGraficar Los Datos Obtenidos 9.
9. Interpretar Los datos RecopiladosInterpretar Los datos Recopilados 10.
• Todos los Meses se espera saber “ la variacion del IPC” para tomar deciciones Financieras o de cualquier otra especie, por ejemplo la adquisición de una Casa.adquisición de una Casa
• En la TV, Radios, diarios, revistas, etc.. Nos “Bombardean”
con datos y cifras “estadística”, por ejemplopor ejemplo
El precio al cierre de acciones a una Empresa
Valor de la UF al día de Hoy $...
Tasa de desocupación en Chile en trimestre de Octubre – Diciembre 2006, etc.
Definamos el concepto de
Definamos el concepto de
ESTADISTICA
ESTADISTICA
Existen diversas definiciones de Estadísticas
Entre las cuales tenemos las siguientes
La Estadística es el conjuntos de Técnicas y
procedimientos que permiten recoger datos, presentarlos,
ordenarlos y analizarlos, de manera que a partir de ellos se
puedan inferir conclusiones.
Otro concepto de: E
E
STADISTICA
STADISTICA
La Estadística es el proceso de inferir conclusiones una ves de:. • Recolectar
•Organizar •Resumir
•Presentar
•Analizar los datos y hacer una buena Toma de decisiones.
Otro concepto de ESTADISTICA
La Estadística se puede considerar como una ciencia
que, utilizando herramientas de la Matemática y en
especial en el cálculo de las Probabilidades, que
estudia aquellas leyes del comportamiento de esos
fenómenos que , no estando sometidos a leyes
Físicas, dependan del Azar
La palabra “ESTADISTICA” tiene dos significados distintos.
¿Qué significados podemos dar a la estadística?
Como una colección de datos estadísticos presentados en una forma ordenada y sistemática.
Un ejemplo de este significado:
Esta colección se dice también ESTADISTICA
Ejemplo:
El anuario estadístico del INE.
N ° 1
ESTADISTICA es la ciencia de recolectar, organizar, resumir, presentar, analizar e interpretar datos
(estadísticas con el propósito de ayudar a toma de decisiones mas efectiva)
SIGNIFICADO
SIGNIFICADO
Como una Ciencia.
Como una Ciencia.
Los métodos estadísticos se usan ampliamente por personas en el áreas
Los métodos estadísticos se usan ampliamente por personas en el áreas
de:
de:
• La comercializaciónLa comercialización, ,
• Finanzas,Finanzas,
• Relaciones laboralesRelaciones laborales,, • Economía negociosEconomía negocios,,
• MedicinaMedicina, ,
• Control de calidad de una Empresa,Control de calidad de una Empresa,
• Consumidores,Consumidores,
• Administración de hospitales, Administración de hospitales, • Educación,Educación,
Principales profesiones que usan la
ESTADISTICA
La estadística se puede puede utilizar, por ejemplo en
varios de estos campos.
• Sociología
• En la sicología
• En la Economía
• En la salud
CLASIFICACION DE LA
CLASIFICACION DE LA
ESTADISTICA
ESTADISTICA
La estadista se puede dividir en:
• Estadística
Descriptiva
Descriptiva
Desarrolla métodos para organizar, resumir y presentar datos de manera Informativa.
Por ejemplo podemos analizar las siguientes información.
En un sondeo de opinión se encontró que el 49 % de las personas sabían el
nombre del 1º Libro en la Biblia. La estadística “49” describe el número de cada 100 personas que saben las respuesta.
Según el Consumer Reports (Empresa Consultor), los dueños de lavadoras Whirlpool reportaron nueve problemas por cada 100 máquinas en el año 1995. La estadística”9” describe el número de problemas por cada 100 máquinas.
Estadística Descriptiva
La
estadística descriptiva
implica la abstracción
de varias propiedades de conjuntos de
observaciones, mediante el empleo de métodos
gráficos, tabulares ó numéricos. Entre estas
Estadística Descriptiva
• El campo de la estadística descriptiva no tiene
que ver con las implicaciones o conclusiones que
se puedan deducir de conjuntos de datos.
• La estadística descriptiva sirve como método para
organizar datos y poner de manifiesto sus
Estadística Inductiva o Inferencial
• La inferencia estadística se basa en las conclusiones a la que se llega por la ciencia experimental basándose en
información incompleta.
• Por ejemplo, Mendel al estudiar la manera como diferían entre sí las plantas de guisantes en altura, color de las
CONCEPTO ESTADISTICOS
• En la estadística Descriptiva se utilizan
muchos conceptos que debemos saber esos
significados.
Las cadenas de TV monitorean la popularidad de sus
programas contratando a organizaciones para muestrear las preferencias de los televidentes.
El departamento de contabilidad de una empresa una muestra de factura (Población) para verificar exactitud de todas las facturas de la compañía.
Los catadores de vino prueban unas cuantas gotas (Muestra) para tomar la decisión de liberar todo el vino para la muestra.
POBLACION
Y
MUESTRA
Es cada uno de los elementos de una muestra o de
Población, que pasaran a ser las “unidades
estadisticas“.
O también “Unidades Experimentales” o “Unidades
de Análisis”.
O finalmente es la persona u objeto que contiene la
informacion que se desea etudiar
.La definición d
e una Población y s
us Características
dependerán ( Varia
bles) de sus unida
des elementales
que deben ser obs
ervadas y depend
iendo de la
naturaleza del prob
lema planteado
Al realizar un estudio estadístico debamos especificar las
Al realizar un estudio estadístico debamos especificar las
CARAACTERISTICAS o PROPIEDADES
CARAACTERISTICAS o PROPIEDADES de los individuos ( O de los individuos ( O Unidades de análisis que vamos a tener en cuenta a observar).
Unidades de análisis que vamos a tener en cuenta a observar).
• VARIABLEVARIABLE: Característica (o propiedad) observada respecto a la
cual los individuo de una muestra ( o Población) se diferencia en algo verificable y medible.
• Ejemplos de VariableEjemplos de Variable: Longitud, Alturas; pesos, géneros, Rut.; edad;
color de ojos; nacionalidad; Ingreso mensual;…….
LAS VARIABLES Y SUS TIPOS
LAS VARIABLES Y SUS TIPOS
Los datos son los valores que toman las
unidades en las variables estudiadas.
RESUMEN DE TIPOS DE
VARIABLES
Variables (Datos)
Cualitativas
(Atributos, Categorías) ( Ej.: Tipo de auto que posees)
Cuantitativas
(numéricas)
Discretas (Número de hijos)
Continuas
Según la “
Naturaleza
de la variable
”: Se tiene la
Variable Cualitativa
(o de Atributo o categórica); lacaracterística o variables que se estudia no se puede registrar numéricamente.
Ejemplo: a) Sexo
b) afiliación religiosa.
c) Tipo de automóvil que se posee. d) Lugar de nacimiento.
e) Color de ojos
Las
Variable Cuantitativa que
son posible su medición
Las variables Cuantitativas se dividen en dos grupos.
• Variable
Discreta
• Variable
Continua
Variable Cuantitativa
Continua son aquellas que
Continua
pueden adquirir
valores Intermedio
valores Intermedio
entre dos valores discretos. Por ejemplo:
a)Estaturas de los estudiantes de un Parvulario. b) Dimensiones de los clavos en una Ferretería c) Liquido de las bebidas actualmente.
d) .Los kilos de trigo en saco recién cosechado. e) El tiempo trascurrido de una acción a otra.
VARIABLES Y SUS TIPOS
Sólo pueden adquirir valores
enteros
Ejemplo: a) El valor de los billetes que circulan en un paísb) Números de alumnos en una sala de clases. c) Numero de niños de una familia.
d) Edad de personas adultas.
e) Numero de la casa Habitación..
Nota: Cada valor x i de la variable discreta es un numero Natural
VARIABLES Y SUS TIPOS
Escala de medidas
.
Niveles de medición de las variables de
acuerdo a su naturaleza pueden encontrarse
entre estas escalas
NOMINAL
ORDINAL
INTERVALAR
Niveles de medición de las variables
NOMINAL Valores que se agrupan en categorías disjuntas y
exhaustivas
•Genero (sexo) •Color de pelo •Religión
ORDINAL Hay un orden entre las categorías
Clase social Preferencias Educación
DE
INTERVALO
•Hay orden •Hay distancia
•Hay un cero convencional
•Temperatura
•Coeficiente Intelectual
DE RAZON
•Hay orden •Hay distancia
•Edad
•Producción
.
Niveles de medición de las variables
Nivel Nominal
•Los valores de las Variables (datos)
sólo se pueden clasificar exhaustivamente en categorías mutuam
ente excluyentes y no se pueden ordenar.
•Exhaustivo
: Cada persona u objeto o artículo debe
clasificarse en al menos una categoría.
•Mutuamente Excluyente
; Un individuo (objeto o artículo) al ser incluido en una categoría debe exc
.
Nivel Ordinal
•Los valores de las Variables (datos) se pueden ordenar pero no es posible determinar la diferencia aritmética (o distancias) entre ellos.
Ejemplo: Resultados del sabor de tres bebidas A, B, C X = Sabor.
La bebida C clasifico 1 ( o 1º) La bebida B clasifico 2 ( o 2º) La bebida A clasifico 3 ( o 3º)
.
Nivel Intervalar
Similar al nivel ordinal con la propiedad adiciona
l de
que se pueden determinar cantidades significativ
as
(distancias iguales) de las diferencias entre los va
lores.
No existe un punto cero natural sino
Convenciona
l.
•Temperatura en escala de Grados Celsius
.
•Talla de camisas ( zapatos, ternos etc.
).
Nivel Razón
Es aquella con un punto cero inicialmente inherente. Las diferencias y razones (cuocientes) son significativas. • Ejemplo:
a) Producción
b) Ingresos Mensuales Dinero.
c) Altura de los jugadores del equipo de fútbol de Osorno
.
Parámetros Estadísticos
Parámetro
:es un solo valor obtenido para describir en forma resumida las características pertinentes a una (variable) acerca de una población .En General se denota por θ:
Estadígrafos
: (Estadístico, estadística): es un función definida sobre los valores de la muestra Se usa a menudo para“estimar” un parametro.
X
Aritmetica
Media
La
X
Aritmetica
Media
.
FUENTES PRIMARIA DE DATOS DE
DATOS ESTADÍSTICOS
• No todos los temas disponen de datos publicados. En esos casos , la información deberá recolectarse y analizarse. Esto se llama “Fuente Primaria”.Fuente Primaria
• Una forma de recolectar datos es mediante las encuestas. • Hay dos posibilidades:
.
FUENTES SECUNDARIA DE DATOS
ESTADÍSTICOS
• Los problemas que se estudian o se investigan se adquieren de datos empíricos ( de la realidad)
publicados u obtenidos.
• Se pueden encontrar datos (estadísticas) relacionadas en artículos publicados, tesis, revistas y periódicos.
Estos se llaman “Fuentes secundarias
MUESTREOS
Fuentes
Fuentes
Secundarias
• Es característica de toda investigación su vocación de
universalidad, es decir, que tiene a presentar una información que refleje determinadas totalidades que pertenecen a un grupo
definido con precisión.
• La primera etapa de una investigación reside en la definición previa de las entidades u observaciones sobre las que se van a estudiar a determinadas características.
• El conjunto de todas las entidades que se pertenecen a este grupo se denomina Población o Universo.
• En particular, las investigaciones sociológicas , por ejemplo
necesitan una gran cantidad de colaboradores y las competencias para hacer una buena investigación y por otro lado un gran
numero de otro colaboradores con menos competencias para hacer otro tipo de trabajo, es decir, mas rustico, por decirlo así.
Por suerte la estadística ha desarrollado lo que se denomina Teoría de las muestras objeto es obtener, por camino
Inferencial ,conclusiones válidas para la población, partiendo de la observación de una pequeña parte de ella, la que
Calculo del tamaño de una muestra
• Esta formula permite determinar el tamaño de la muestra en donde participan parámetros estadísticos que son previos determinar
• Donde error muestral. La varianza . La d error estándar
donde se calcula por
2 1
Z
• Se desea estimar el peso promedio de los sacos
que son llenados por un nuevo instrumento en una
industria. Se conoce que el peso de un saco que se
llena con este instrumento es una variable
aleatoria con distribución normal. Si se supone
que la desviación típica del peso es de 0,5 kg.
Determine el tamaño de muestra aleatoria
necesaria para determinar una probabilidad igual a
0,95 de que el estimado y el parámetro se
Entonces para que se hacen los muestreos?
“
“
Es la sección de una parte de un agregado o
Es la sección de una parte de un agregado o
totalidad conocida como
totalidad conocida como
Población,
Población,
de los
de los
cuales se basan las decisiones con respecto a
cuales se basan las decisiones con respecto a
una población
una población
”.
”.
• Una
población de unidades
es un grupo de
entidades que tienen alguna característica
cuantificable en común.
• Las unidades pueden ser personas, árboles,
bacterias, compuestos químicos, etc..
• Una
muestra de unidades
es un número finito de
unidades procedentes de una
población de
unidades
.
Las siguientes son las ventajas y /o necesidades
para el muestreo en la toma de decisiones
Estadísticas
.
COSTOS
COSTOS
: El costo es uno de los principales
argumentos a favor del muestreo,
básicamente por que una muestra puede
EXACTITUD
:
En el muestreo a
diferencia, que en un censo, existe
un mayor control sobre los errores
en la recopilación por que una
MENOS TIEMPO
: Otra de las ventajas de
Otra de las ventajas de
la muestra sobre el censo, es que provee
la muestra sobre el censo, es que provee
resultados e información mas rápida .
resultados e información mas rápida .
Esto es importante para una toma de
Esto es importante para una toma de
decisiones sujeta al tiempo limitado
CALIDAD DE INFORMACIÓN
:
La información es más detallada puede ser
mejor obtenida de una muestra que la que
puede dar un censo, porque la muestra toma
menos tiempo, es más costosa y nos permite
tener más cuidado de las etapas del
PRUEBAS DEDUCTIVAS: Cuando
Métodos de muestreos
Desde la comida que se ingiere hasta lo que se ve
por la televisión , de las elecciones políticas hasta
el consejo disciplinario de un liceo una
La muestra es generalmente seleccionada
La muestra es generalmente seleccionada
para ser el objeto de estudio ya que las
para ser el objeto de estudio ya que las
poblaciones son muy largas para
poblaciones son muy largas para
estudiarla en su totalidad
estudiarla en su totalidad
.
La muestra debería ser representativa de una
La muestra debería ser representativa de una
población.
población.
Esto se lograría aplicando los siguientes
Esto se lograría aplicando los siguientes
Métodos de Muestreos
Métodos de Muestreos
.
Tipos de muestreos
Existen diversas formas de efectuar Muestreos tales como:
1. Muestreo Aleatorio Simple ( M.A.S)
2. Doble M.A.S
3. Estratificado
4. Conglomerado
Producción
1. Sistemático
Probabilística para la Elección de Personas
Muestreo Aleatorio Simple.
Consiste básicamente en que cada integrante de la población debe ser enumerado y aplicando posteriormente una tabla aleatoria se elige al azar los elementos de la población.
Los números a elegir, dependerá del tamaño de la muestra, es decir, sin de dos dígitos, se consideraran la columna de las unidades, es decir, de derecha a izquierda, y si son de mas dígitos, ase elegirán las columnas de la centenas o de las milésimas y así sucesivamente.
Tipos De Muestreos
Tabla aleatoria
0,408 0,020 0,493 0,721
0,935 0,955 0,836 0,287
0,920 0,094 0,902 0,982
0,677 0,657 0,623 0,083
0,854 0,327 0,624 0,934
0,536 0,919 0,867 0,678
0,352 0,561 0,852 0,433
0,401 0,933 0,664 0,170
0,700 0,031 0,889 0,675
0,484 0,879 0,311 0,835
0,790 0,104 0,870 0,474
0,149 0,684 0,606 0,011
0,408 0,296 0,056 0,473
0,196 0,761 0,836 0,030
0,432 0,405 0,464 0,751
0,373 0,543 0,596 0,572
0,196 0,343 0,276 0,629
0,778 0,395 0,064 0,655
Tabla aleatoria
CONGL
OMERA
DO
CONGLOMERADO: Es un grupo Natural o artificial de unidades Muestrales.
Este procedimiento, consiste en la elección de conglomerados, en vez de unidades Muestrales y además individuales de una Población.
TIPOS DE MUESTREOS
2.
Doble Mas
este método consiste en
extraer de una muestra ya extraída al
azar , otra sub.-muestra mediante una
tabla aleatoria
CONGL
OMERA
DO
Se puede entender por
conglomerado
una
Población
de
casas por ejemplo, y consideramos de ella una de las
¿COMO
ELEGI
R UN C
ONGLO
MERAD
O?
Una manzana = N
Muestra = n
EJEMPLO DE COMO LOGRAR MUESTREO
POR CONGLOMERADO
Casas de una Población
ESTRA
TIFICA
DO
Este tipo de muestreo debe aplicarse a estratos en que se
puede dividir una Población.
Antes de aplicarse este tipo de muestreo la Población debe
PARCELARCE o subdividirse de acuerdo a ciertos
cortes.
ESTRA
TIFICA
DO
Parcelación de la Población mediante estratos
Alto
Medio Alto Medio Bajo
Bajo Si fuese una
Los pasos que se deben de cumplir para lograr un buen
muestreo estratificado SON LOS SIGUIENTES:
1° Determinar los porcentajes que representan cada estrato
de la población
:
Se debe tener en cuenta la totalidad de los datos de cada estrato siendo , la sumatoria de ellos, la totalidad de la población (N). 2° Cada estrato será dividido por la cantidad de elementos que
forma Poblacion en general y este cuociente , lo multiplicamos por 100.
ESTRATIFICADO
Para efectuar el Calculo de los
porcentajes
que
representa cada estrato de la población, debe aplicarse la
siguiente formula:
100
Calculo de los porcentajes de cada estrato
.
Por ejemplo
Por ejemplo : Se tiene una Población de 20.000 habitantes y dividida en los siguientes estratos con sus cantidad de in dividuos.
Si la Población esta dividida en 4 Estratos: a) 501
b) 700 c) 15000 d) 3.799 20.000 505 . 2 100 * 000 . 20 501
%1
20.000 *100 3,5
700
%2
3.799
%4 = * 100 = 18,99 20.000
15.000
01 , 5 100 200 505 , 2 1 n
Población = 20000
Muestra = 200
5,01 7 150 37,932
150
100 200 75 3 n 932 , 37 100 200 996 , 18 4 n
Ahora calculamos la cantidad de individuos de cada
estrato para formar la muestra
=200 1 , 6 100 200 05 , 3 2 n 501 700 15.000 3799
Por ejemplo
Este tipo de muestreo tiende aplicarse cuando se
requiere de un
control de calidad
de un determinado
producto a fabricar, por ejemplo “bebidas”
SISTEMA
TICO
En fin este m
étodo puede a
plicarse en la vida diaria de
En este caso pensemos que se fabrican tubos
de
pantallas
para computadores y de ellos
queremos saber cómo esta la producción en
serie
de ellos.
SISTEMA
TICO
El procedimiento es el siguiente: si tenemos una
producción de 100.000 tubos de pantallas y se desea una muestra de 200 tubos debemos hacer el siguiente calculo
SISTEMA
TICO
k Constante,
Esta constante indica, que cuando se estén produciendo la cantidad de tubos deseados por la fabrica, es decir, los 100.000 tubos, cuando se llegue al valor de la
constante, se sacará uno de ellos y se probará si responde a las exigencias deseadas.
El total de tubos a probar será el tamaño de la muestra.
SISTEMATICO
Veamos cuál sería en este caso la K (constante)
SISTEMATICO
constate la
de Valor 500
200
100000
k
Es decir, cuando este en pleno funcionamiento la fabrica y la producción de tubos que se esta generando, al
Sistemático trabajando con P
oblación
Si ahora se traba
jara con una población, que pued
e ser
personas , animales, insectos , bacterias, es decir
seres vivos y de
ellos por ser muy numerosos, po
r lo tanto se debe obtener una
muestra que sea Probabilística el proceso a segu
ir, es totalmente
distinto, para ello los integrantes
de esta población deben
enumerados los elementos de la población y me
diante un
cálculo matemático se obtendrá al azar la muest
ra deseada,
usando el siguiente mecanismo p
Procedimiento par
a el calculo matem
ático
Debemos considerar los siguient
es elementos:
•K = Intervalo •N = Población
•n = Muestra
“METODO SISTEMATICO
”
Para determinar el valor de “
K
” que corresponde al
Intervalo debemos aplicar la siguiente fór
mula:
n
M
Muestra
Población
k
De este cu
ociente se elige el valor entero mas apro
ximado
Determinación del Intervalo o Valor
Determinación del Intervalo o Valor
de “
Profesor: Braulio Rodríguez
Sistemático para elegir las pe
rsonas
Una vez determinado el Va
lor de K se
procede del siguiente mod
o:
•Se elige un número que
esté en este
Intervalo, y éste será el 1º e
lemento de
la serie.
•A partir de este elemento
se van
obteniendo los demás elem
entos
sumándole el valor de k al 1
º y así
sucesivamente
;Profesor: Braulio Rodríguez
Supongamos el siguiente ejemplo:
N = 700 Poblacion
n = 25 Muestra
1.
Se elige un numero del 1 al 28 ; por ejemplo
el número 12.
2. Los números elegidos serán entonces.
3.
3.
12
12
siendo el 1º Número y a este se le va sumandoel valor de K = 28
4.
4.
12 + 28 ; 12 +2 28 ; …....+ 12 + n k
12 + 28 ; 12 +2 28 ; …....+ 12 + n k
5.
5. Es decir 12; 40; 68; …….hasta el nuemro 684.Es decir 12; 40; 68; …….hasta el nuemro 684.
28
25
700
k
“FUENTES DE DATOS ESTADÍSTICOS”
• Cuando los datos no están registrados, es decir, no
existen publicaciones de ellos, como las encuestas Cas, Casen, el INE, etc.
• En esos casos , la información deberá recolectarse y analizarse.
Una forma de recolectar los datos es mediante las
Encuestas
.Una Encuesta
Hay dos posibilidades de realizar las encuestas: a) Encuestas Muestrales ( En Muestras)
b) Encuestas Censales (En poblaciones)
Es un instrumento elaborado mediante procesos rigorosos para lograr de ellos las variables que están o estén
FUENTES DE DATOS
ESTADISTICOS
Cuando la información se encuentra en un registro de
datos empíricos (sacados de la realidad) o publicados en
documentos, tales como las encuesta Cas, Casen, o la
información del INE. Como así también a través de la
información entregada por medios de comunicación
tanto escrita, como radiales y visuales.
¿COMO ORDENAR LOS D
ATOS
UNA VEZ OBTENIDOS?
Una vez
obtenido
s los dato
s, ellos
deben re
gistrarse
y orden
arse en u
nas
tablas de
Distribu
ción de F
recuenci
¿COMO ORDENAR LOS D
ATOS
UNA VEZ OBTENIDOS?
Estas tablas de distribución de frecuencias están
formadas por filas y columnas en donde se registran
las variables a estudiar, ya sean variables de tipo:
a) Cuantitativas
Cuantitativas
b) Cualitativas
Cualitativas
.
.
v1 v2 ..v i.. …. V
p
1 2 3
. x
i j
. n
Tabla de datos Tipo Excel)
TABLA Y MATRZ DE DATOS
La i-ésima fila contiene los valores que resultan de la medición de las p variables sobre el i-ésimo individuo (caso) observado
•Al inicio de cualquier tabla de datos puede
contener “Datos correctos” y “ Datos incorrectos” o
Erróneos.
Esta tabla se llama “Tabla de datos en Bruto
(“Raw Data Table”)
TABLA Y MATRIZ DE DATOS
¿
QUE SON DATOS INCORRECTOS?
Errores de Medición (Mal tomados los valores)
Errores de Medición (Mal tomados los valores)
De digitación (La forma de escribir los Datos)
De digitación (La forma de escribir los Datos)
Valores ausentes o no Considerados (“missing values”)
Valores ausentes o no Considerados (“missing values”)
Valores Perdidos o valores extraviados en la investigación
Valores Perdidos o valores extraviados en la investigación
Ellos se pueden producir de varias formas en los que se
Lo
registrado esta bien, pero la medición esta
“incorrecta
“incorrecta
”
”
Notoriamente el valor registrado no pertenece a la población
o se contradice con el valor de otra variable.
“La Edad tomada ”
no
corresponde a la de “
Fecha de
Nacimiento declarada
”
¿Cómo se sabe el valor correcto, si la medición no se puede
hacer de nuevo?
¿ Se elimina el Dato?
Los Datos rec
olectados pued
en ser
También podemos establecer una causal de estos
datos erróneos por la siguientes causas:
•
Datos Atípicos
No es error
No hay consistencia del dato recolectado
Es raro, o casi nunca se da.
¿Se mantiene aunque influye mucho en los
DISTRIBUCION DE FRECUENCIAS
UNIDEMENCIONALES
Pregunta a responder
Recolección de datos (Originales)
Organización de los Datos
Distribución de frecuencias Representación de datos (gráficos)
Obtención de conclusiones Obtención de conclusiones
VARIABLE UNIDIMENCIONAL
UNIDIMENCIONAL: Si una serie de datos se refiere solamente a una variable. Por ejemplo:
Notas Peso Edad
Clasificación y Tabulación de los datos
Sea X la variable de interés con valores (datos originales – observaciones) x1 ;x 2 ; x3 ;x 4 ;………;x n
Sea x i ( i = 1, 2, 3, ….., n) una observación cualquiera. Para construir la TABLA DE DISTRIBUCIÓN DE
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
Descripción de los datos
ORGANIZACIÓN Y PRESENTACION DE LOS DATOS
OBJETIVOS:
1. Organizar los datos en una tabla de distribución de frecuencias 2. Presentar una distribución de frecuencias en un histograma , un
polígono de frecuencias y un polígono de frecuencia acumulada. 3. Representar gráficamente, con gráficos de barras , líneas y
circulares los datos analizados.
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia AcumuladaFrecuencia Relativa Frecuencia Relativa Acumulada En esta columna
puede ir variable discreta o continua
Se presenta por “xi”
Aquí se registra las veces que aparece unas de
las variables Re representa por
“ni”
En esta columna se van acumulando las
frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor porcentual, se representa
por
“hi” y se calcula por:
En esta columna de calcula un valor porcentual, se representa
por
“Hi” y se calcula por:
“
x
i”
“
n
i”
“
N
i”
“
h
i”
“
H
i”
N n h i
i
N n H i
i
Tabla de distribución de Frec
uencias
¿Que
indic
a Cad
a colu
mna?
Volver a la Tabla
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia AcumuladaFrecuencia Relativa Frecuencia Relativa Acumulada En esta columna puede ir
variable discreta o continua Se presenta por
“xi”
Aquí se registra las
veces que aparece unas de las variables Re representa
por “ni”
En esta columna se van acumulando las
frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor porcentual, se representa
por
“hi” y se calcula por:
En esta columna de calcula un valor porcentual, se representa
por
“Hi” y se calcula por:
Esta columna representa la variable a considerar: •Discreta N n h i
i
N n H i
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia Acumulada
Frecuencia Relativa Frecuencia Relativa Acumulada En esta columna puede ir variable discreta o continua Se presenta por “xi”
Aquí se registra las veces que aparece unas de las
variables Re representa por
“ni”
En esta columna se van acumulando
las frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor porcentual, se representa
por
“hi” y se calcula por:
En esta columna de calcula un valor porcentual, se representa
por
“Hi” y se calcula por:
Esta columna representación de las veces que se repitió la variable Y contesta La siguiente Pregunta
N n h i
i
N n H i
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia Acumulada
Frecuencia Relativa Frecuencia Relativa Acumulada En esta columna puede ir variable discreta o continua Se presenta por “xi”
Aquí se registra las veces que aparece unas de las
variables Re representa por
“ni”
En esta columna se van acumulando
las frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor porcentual, se representa
por
“hi” y se calcula por:
En esta columna de calcula un valor porcentual, se representa
por
“Hi” y se calcula por:
¿Cuantas veces resulto la variable de ese Nivel?
N
n
h
ii
N
n
H
iSI LOS DATOS FUESEN
x
in
i0 4
1 9
2 12
3 10
4 8
5 4
6 2
SU GRAFICA
0 2 4 6 8 10 12
0 1 2 3 4 5 6 7
NUMERO DE HIJOS
F
R
E
C
U
E
N
C
IA
A
B
S
O
L
U
T
OTRA FORMA DE REPRESENTARLA
0 2 4 6 8 10 12
0 1 2 3 4 5 6 7
NUMERO DE HIJOS
F
R
E
C
U
E
N
C
IA
A
B
S
O
L
U
T
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta
Frecuencia Acumulada Frecuencia Relativa Frecuencia Relativa Acumulada En esta columna
puede ir variable discreta o continua
Se presenta por “xi”
Aquí se registra las
veces que aparece unas
de las variables Re representa
por “ni”
En esta columna se van acumulando las frecuencias Absolutas
Se representa por “Ni”
En esta columna de calcula un valor porcentual, se representa
por
“hi” y se calcula por:
En esta columna de calcula un valor porcentual, se representa
por
“Hi” y se calcula por:
Esta Columna presenta la acumulación de las Frecuencias absolutas N n h i
i
N n H i
Tabla de distribución de Frec
uencias
Variable Frecuenci a Absoluta Frecuencia AcumuladaFrecuencia Relativa Frecuencia Relativa Acumulada En esta columna puede ir variable discreta o continua Se presenta por “xi”
Aquí se registra las veces que aparece unas de las variables Re represent a por “ni”
En esta columna se van acumulando las
frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor
porcentual, se representa por “hi” y se calcula por:
En esta columna de calcula un valor
porcentual, se representa por “Hi” y se calcula
por:
Y contesta a la Pregunta?
N n h i
i
N
n
H
iTabla de distribución de Frec
uencias
Variable Frecuencia Absoluta
Frecuencia Acumulada Frecuencia Relativa Frecuencia Relativa Acumulada En esta columna
puede ir variable discreta o continua
Se presenta por “xi”
Aquí se registra las
veces que aparece unas
de las variables Re representa
por “ni”
En esta columna se van acumulando las frecuencias
Absolutas Se representa por
“Ni”
En esta columna de calcula un valor porcentual, se
representa por “hi” y se calcula por:
En esta columna de calcula un valor
porcentual, se representa por “Hi” y se calcula por:
¿Cuantos valores de esta variable aparecieron o menos de Ella?
N n h i
i
N n H i
Si los datos para la frecuencia Acumulada
x i f i N i
0 4 4
1 9 13
2 12 25
3 10 35
4 8 43
5 4 47
6 2 49
SU GRAFICA
4 13 25 35 4347 49 50
0 10 20 30 40 50
0 1 2 3 4 5 6 7
NUMERO DE HIJOS
Otra forma de representarla
4 13 25 35 4347 49 50
0 10 20 30 40 50
0 1 2 3 4 5 6 7
NUMERO DE HIJOS
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia AcumuladaFrecuencia Relativa Frecuencia Relativa Acumulada En esta columna
puede ir variable discreta o continua
Se presenta por “xi”
Aquí se registra las veces que aparece unas de
las variables Re representa por
“ni”
En esta columna se van acumulando las
frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor porcentual, se
representa por “hi” y se calcula por:
En esta columna de calcula un valor
porcentual, se representa por “Hi” y se calcula por:
”
Y representa el porcentaje de cada vez que apareció esta variable,Acumul
N n h i
i
N n H i
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia AcumuladaFrecuencia Relativa Frecuencia Relativa Acumulada En esta columna
puede ir variable discreta o continua
Se presenta por “xi”
Aquí se registra las veces que aparece unas de
las variables Re representa por
“ni”
En esta columna se van acumulando las
frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor porcentual, se
representa por “hi” y se calcula por:
En esta columna de calcula un valor
porcentual, se representa por “Hi” y se calcula por:
¿Y a qué pregunta contesta?
N n h i
i
N n H i
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia AcumuladaFrecuencia Relativa Frecuencia Relativa Acumulada En esta columna
puede ir variable discreta o continua
Se presenta por “xi”
Aquí se registra las veces que aparece unas de
las variables Re representa por
“ni”
En esta columna se van acumulando las
frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor porcentual, se
representa por “hi” y se calcula por:
En esta columna de calcula un valor porcentual, se representa
por
“Hi” y se calcula por:
El porcentaje de las Veces que apareció dicha variables
N n h i
i
N n H i
Si los datos fuesen para la
frecuencia relativa
x i n i N i h i
0 4 4 0,08
1 9 13 0,18
2 12 25 0,24
3 10 35 0,20
4 8 43 0,16
5 4 47 0,08
6 2 49 0,04
Su grafica sería
0,08 0,18 0,24 0,2 0,16 0,08 0,04 0,02 0 0,1 0,2 0,30 1 2 3 4 5 6 7
NUMERO DE HIJOS
Forma grafica de reprensarla
0,08 0,18 0,24 0,2 0,16 0,08 0,04 0,02 0 0,1 0,2 0,30 1 2 3 4 5 6 7
NUMERO DE HIJOS
Si los datos fuesen
x i n i N i
0 4 4
1 9 13
2 12 25
3 10 35
4 8 43
5 4 47
6 2 49
Su grafica sería
4 13 25 35 4347 49 50
0 10 20 30 40 50
0 1 2 3 4 5 6 7
NUMERO DE HIJOS
Forma de representar la frecuencia acumulada
0,08 0,26 0,5 0,7 0,860,94 0,98 1
0 0,2 0,4 0,6 0,8 1
0 1 2 3 4 5 6 7
NUMERO DE HIJOS
Si los datos fuesen los siguientes para frecuencia
relativa
x i n i N i h i
0 4 4 0,08
1 9 13 0,18
2 12 25 0,24
3 10 35 0,20
4 8 43 0,16
5 4 47 0,08
6 2 49 0,04
Forma gráfica de la Frecuencia relativa
0,08 0,18 0,24 0,2 0,16 0,08 0,04 0,02 0 0,1 0,2 0,30 1 2 3 4 5 6 7
NUMERO DE HIJOS
Su gráfica sería
0,08 0,18 0,24 0,2 0,16 0,08 0,04 0,02 0 0,1 0,2 0,30 1 2 3 4 5 6 7
NUMERO DE HIJOS
Tabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia AcumuladaFrecuencia Relativa Frecuencia Relativa Acumulada En esta columna
puede ir variable discreta o continua
Se presenta por “xi”
Aquí se registra las veces que aparece unas de
las variables Re representa por
“ni”
En esta columna se van acumulando las
frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor
porcentual, se representa por “hi” y se calcula por:
En esta columna de calcula un valor porcentual, se representa
por
“Hi” y se calcula por:
Esta columna nos indicara el % de la Frecuencia relativa
acumulada
N
n
h
ii
N
n
H
iTabla de distribución de Frec
uencias
Variable Frecuencia Absoluta Frecuencia AcumuladaFrecuencia Relativa Frecuencia Relativa Acumulada En esta columna
puede ir variable discreta o continua
Se presenta por “xi”
Aquí se registra las veces que aparece unas de
las variables Re representa por
“ni”
En esta columna se van acumulando las
frecuencias Absolutas Se representa por
“Ni”
En esta columna de calcula un valor
porcentual, se representa por “hi” y se calcula por:
En esta columna de calcula un valor porcentual, se representa
por
“Hi” y se calcula por:
¿Qué %
representa esta variable O menos que ella?
N n h i
i N
n H i
Si los datos fuesen
x i n i N i h i H i 0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
6 2 49 0,04 0,98
Su gráfica sería
0,08 0,26 0,5 0,7 0,860,94 0,98 1
0 0,2 0,4 0,6 0,8 1
0 1 2 3 4 5 6 7
NUMERO DE HIJOS
Otra forma de representarla
0,08 0,26 0,5 0,7 0,860,94 0,98 1
0 0,2 0,4 0,6 0,8 1
0 1 2 3 4 5 6 7
NUMERO DE HIJOS
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
x i ni Ni hi Hi 1 2 2 7,1 7,1 2 4 6 14,3 21,4 3 5 11 17,9 39,3 4 6 17 21,4 60,7 5 6 23 21,4 82,1 6 2 25 7,1 89,3 7 3 28 10,7 100,0
28
La siguiente Tabla muestra las notas Obtenidas por 28 alumnos de una Escuela de :_________________
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
De cuadro anterior nos podemos hacer una serie de preguntas, por ejemplo:
1. ¿Cuantos alumnos rindieron la Prueba?
2. ¿Cuantos alumnos obtuvieron nota mínima de aprobación?
3. ¿Qué % de alumnos reprobaron?
4. ¿ Qué % de alumnos obtuvo igual o Inferior a 5?
5. ¿Cuantos alumnos obtuvieron nota Igual o inferior a 6?
6. ¿Cuántos alumnos Obtuvieron nota igual o inferior a 2?
7. ¿Que % representa esa cantidad?
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
De cuadro anterior nos podemos hacer una serie de preguntas, por ejemplo:
1. ¿Cuantos alumnos rindieron la Prueba?
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
De cuadro anterior nos podemos hacer una serie de preguntas, por ejemplo:
2.- ¿Cuantos alumnos obtuvieron nota mínima de aprobación ?
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
De cuadro anterior nos podemos hacer una serie de preguntas, por ejemplo:
3.- ¿Qué % de alumnos reprobaron?
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
De cuadro anterior nos podemos hacer una serie de preguntas, por ejemplo:
4.- ¿ Qué % de alumnos obtuvo no igual o Inferior a 5?
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
De cuadro anterior nos podemos hacer una serie de preguntas, por ejemplo:
5.- ¿Cuantos alumnos obtuvieron nota Igual o inferior a 6?
¿COMO ORDENAR LOS D
ATOS UNA
VEZ OBTENIDOS?
7. -
¿Que % representan los 25 alumnos?
21,4 %
Tablas de Frecuencias con Datos Agrupados
HASTA AQUÍ POR AHORA
Tablas de Frecuencias para d
atos
Agrupados en Intervalos de c
lases
Los datos de tipo Cuantitativo sean ellos Discretos o Continuos pueden ser en algunos casos muy numerosos .esto trae consigo problemas, y por lo tanto deberíamos Confeccionar tablas de frecuencias donde los datos sean Agrupados en Intervalos de Clases o Categorías
La creación de estos Intervalos dependerá de varios pasos que deben de cumplirse rigurosamente, para no tener complicaciones futuras:
Los pasos que se deben dar para la construcción de estas tablas de
Tablas de Frecuencias para datos Agrupados
en Intervalos de clases
Paso
s a se
guir
para
orga
nizar
en ta
blas
de
Frec
uenc
ia co
n da
tos a
grup
ados
en
inter
valos
Tablas de Frecuencias para datos Agrupados
en Intervalos de clases
Para determinar los intervalos de una distribución de
frecuencias es necesarios seguir 6 pasos.
1º Determinar el rango
2º Determinar el número de intervalos 3º Determinar el tamaño del Intervalo.
4º Fijar el Límite Inferior y Superior de cada Intervalo.
5º Determinar la marca de Clase.
RANGO
El Rango o recorrido de
un conjunto de
datos es la diferencia en
tre el Mayor y el
Menor valor de la Varia
ble
R = VA
LOR M
AYOR
– VALO
NUMERO DE INTERVALOS
NUMERO DE INTERVALOS
Número de Intervalos; Los datos
Número de Intervalos
Tablas de Frecuencias para datos Agrupados
en Intervalos de clases
1. Para elegir el Numero de Intervalos se debe tener en
cuenta los siguientes elementos
2. El cálculo del número de intervalos dependerá en cierto modo de la cantidad de datos observados, y generalmente ellos deben ser un número cercano a los 10, ya que al elegir muchos
(mas de 25) es poco lo que se gana con esa agrupación , y si ( son menos de 5) se pierde parte de la información ,
Se debe tener presente las siguientes
Indicaciones
Otra forma de determinar el número de intervalos es mediante algunos cálculos matemáticos previos, dependiendo del número de datos que se consideren:
a) Se elige un número “
n
”, tal que permite visualizar la estructura de los datos y dependiendo de la cantidad el valor de “n
” y que variará como se dijo entre 5 y 20 intervalos (n
= numero de intervalos)b) “m” =
1 + 3,22 · log “n” en otro caso
Grande muy
es no n" " si
Tamaño de los intervalos
Para determinar el tamaño de los intervalos en las tablas de distribución de frecuencias, se divide el Rango por el número de intervalos
previamente determinados Amplitud del intervalos
Amplitud del intervalos ( c ) : para determinarlo debe aplicarse la siguientes expresión
c =
Los valores a considerar deben ser valores enteros o el mas cercano al valor entero.
Se define como la diferencia entre el Limite Superior e Inferior del intervalo de la clase.
m
corrido
GENERACION DE LOS LIMITES DE
GENERACION DE LOS LIMITES DE
LOS INTERVALOS
LOS INTERVALOS
Un Intervalo puede ser Cerrado escrito de la siguiente forma: [30 35]
[35 40] Limite Inferior del Intervalo = 30 Límite Superior del Intervalo = 35
Tablas de Frecuencias para datos Agrupados
Tablas de Frecuencias para datos Agrupados
en Intervalos de clases
en Intervalos de clases
Un Intervalo puede ser [Cerrado / Abierto[ escrito de la siguiente forma:
[30 35[ [36 41[
En este tipo de Intervalo el valor 35 será contabilizado en el 1º Intervalo y no en el 2º; como así mismo el valor 41 será contabilizado en el segundo
Tablas de Frecuencias para datos Agrupados
en Intervalos de clases
Se determinan los Límites de los intervalos
Un Intervalo puede ser [Cerrado / Abierto[ escrito de la siguiente forma:
[30 35[ [36 41[
Forma de determinar una tab
la de
datos con Intervalos de Clase
Tabla de Intervalos
Cerrados
Intervalo Marca de Clase Frecuencia Absoluta Frecuencia Acumulada Frecuencia relativa Frecuencia Rel.. acum.
60 64 68 72 76 80 64 68 72 76 80 84 62 66 70 74 78 82 30 34 11 13 3 7 30 64 75 88 91 98 30,61 34,69 11,22 13,27 3,061 7,143 30,61 65,31 76,53 89,8 92,86 100 98 i H i
Tabla de Intervalos
Cerrados / Abiertos
Intervalo
Cerrado /Abierto
Marca de Clase Frecuencia Absoluta Frecuencia Acumulada Frecuencia relativa Frecuencia Rel.. acum.
60 65 70 75 80 64 69 74 79 84 62 67 72 77 82 37 37 10 7 7 37 74 84 91 98 37,76 37,76 10,2 7,143 7,143 37,76 75,51 85,71 92,86 100 98 i
Representación grafica de lo
s datos
Existe varias formas de representar gráficamente la información recopilada, tabulada y analizada.
Gráficos
De Barras.
Tortas
De líneas
Bigote de Gatos
Histogramas
Representación grafica de lo
s datos
Existe varias formas de representar gráficamente la información recopilada, tabulada y analizada.
Grafico de Barras
0 10 20 30 40 50 60 70 80 90
1er trim. 2do trim. 3er trim. 4to trim.
Este Oeste Norte
1er trim. 2do trim. 3er trim. 4to trim.
Este 20,4 27,4 90 20,4
Oeste 30,6 38,6 34,6 31,6
Representación grafica de lo
s datos
Existe varias formas de representar gráficamente la información recopilada, tabulada y analizada.
Grafico de Torta
Notas Nº de Alumnos
1 2
2 4
3 5
4 10
5 6
6 3
7 2
Representación grafica de lo
s datos
Existe varias formas de representar gráficamente la información recopilada, tabulada y analizada.
Grafico de Torta
Notas
1 2
3
4 5
6
7 1