TRATAMIENTOS DE
DATOS Y AZAR
Prof. Miguel Alvarado Conalep Tonala
Material para la clase
•Cuaderno• Cuadro Chico • Cuadro Grande
•Hoja Milimétricas -> Graficas •Calculadora
•Carpeta para portafolio
Horario Y Paginas Web
•Programas Web•Khan Academy •ThatQuiz
Evaluación
•Cuaderno 20% •Tareas 20% •Ejercicios 20% •Examen 20% •Conducta/Asistencia 20%Propósito del Modulo
•El propósito del módulo es que el alumno sea capaz de:
•Estimar parámetros e interpretar márgenes probables de error y
tolerancia, a partir de datos poblacionales y muéstrales, para resolver problemas en diferentes contextos.
Portafolio de evidencias
• Debe contener los siguientes documentos:
• Portada con datos de identificación del alumno: Nombre del colegio,
nombre del alumno, grupo, módulo, carrera y nombre del maestro
• Misión • Visión
• Valores institucionales
• Hoja de lineamientos generales y criterios de evaluación • Reglamento del colegio
• Propósito del módulo
• Separadores de Actividades Formativas y Actividades de evaluación • Actividades realizadas durante el semestre
MODULO 1
Interpretación de la informaciónLa naturaleza de la estadística
•La estadística es una rama de la ciencia, encargada del diseño y
aplicación de métodos para recolectar , organizar, analizar y hacer deducciones a partir de ellos.
•La estadística proporciona una metodología para evaluar y juzgar
las discrepancias entre la realidad y la teoría. Además de su papel instrumental, el estudio de la estadística es importante para
entender las posibilidades y limitaciones de la investigación experimental, para diferenciar las conclusiones que pueden
obtenerse de los datos de aquellas que carecen de base empírica y en definitiva para desarrollar un pensamiento critico y anti
dogmático ante la realidad.
•En la actualidad con al ayuda de la informática y la tecnología el
División de la estadística
•La estadística se divide en 2 grandes ramas, dependiendo del
método empleado para manejar la información y hacer que tenga sentido:
•Estadística descriptiva •Estadística inferencial
Estadística descriptiva
•Permite describir resumir y analizar la información obtenida de la
muestra.
•Para tal fin se recolecta la información, se tabula, se grafica y
muchos casos en vez de trabajar con todas las observaciones, es preferible tener unas medidas que resuman los datos.
•Básicamente hay 3 tipos de medidas de resumen: • Medidas de tendencia central
• Medidas de dispersión o variabilidad de datos • Medidas de ubicación o posición
Medidas de tendencia central
•Los estadísticos tienden a ubicarse hacia el centro de la
distribución.
•Entre ellos se encuentran:
• la media aritmética (promedio matemático, es afectado por valores
extremos, se usa para variables cuantitativas)
• la mediana (divide en dos partes iguales la distribución, no es afectada
por valores extremos, se usa para variables cuantitativas)
• la moda (el dato de mayor frecuencia en la distribución, se usa
Medidas de dispersión o
variabilidad
• Muchas veces no es suficiente con conocer las MTC, también es fundamental
conocer los estadísticos que reflejan el grado de dispersión o variabilidad que tienen los datos en la distribución, por lo general, se hace respecto a la media aritmética.
• Aquí podemos encontrar:
• al rango o desviación máxima (diferencia entre el valor máximo y mínimo de los datos, es
afectado por valores extremos)
• el rango intercuartil o amplitud intercuartil (esta medida se concentra en el 50 % de los
datos, no es afectado por valores extremos)
• la varianza (representa el promedio de variación en unidades cuadráticas de los datos
respecto a la media aritmética, esta medida no se interpreta y se ve afectada por valores extremos)
• la desviación típica o estándar (se interpreta como la desviación promedio en unidades
lineales de los datos respecto a la media, es susceptible a valores extremos)
• y el coeficiente de dispersión (representa una medida de dispersión relativa a la media,
no tiene unidad de medida, permite comparar la variabilidad entre grupos, se puede hablar de homogeneidad y heterogeneidad en los datos).
Medidas de posición o Ubicación
•Los percentiles se distribuyen en diversas
partes de la distribución de datos.
•Por ejemplo:
•Los cuartiles (dividen los datos en 4 partes
iguales, 25 % cada uno)
•Los deciles (dividen los datos en 10 partes
iguales, 10 % cada uno)
•Los percentiles (dividen los datos en 100
Dos consejos
•Más allá de intentar memorizar las ecuaciones que encontrará en
las medidas de resumen, es importante que preste atención a sus propiedades, las ventajas y desventajas concernientes a estos estadísticos. Es decir, cuando es apropiado el uno u otro.
•Es fundamental entender por ejemplo, cómo se relaciona la media
aritmética y la desviación típica, la relación entre el promedio, la media y la moda.
Tarea investigación
•Etapas de la investigación • 3 etapas •Población •Muestra •Tamaño de la muestraEtapas de la investigación
•La Estadística nos permite realizar inferencias y sacar conclusiones a partir de
los datos. Extrayendo la información que contienen, podremos comprender mejor las situaciones que ellos representan.
•Los métodos estadísticos abarcan todas las etapas de la investigación, desde el
diseño de la investigación hasta el análisis final de los datos.
•Podemos distinguir tres grandes etapas:
• 1. Diseño: Planeamiento y desarrollo de las investigaciones • 2. Descripción: Resumen y exploración de los datos
• 3. Inferencia: Predicciones y toma de decisiones sobre las características de una
POBLACIÓN ESTADÍSTICA
•Una población estadística es un conjunto de sujetos o elementos
que presentan características comunes. Sobre esta población se realiza el estudio estadístico con el fin de sacar conclusiones.
•El tamaño poblacional es el número de individuos que constituyen la
población. Según el número de sujetos, el tamaño puede ser finito o infinito. Los conjuntos infinitos son algo artificial o conceptual, ya que toda población de entidades físicas es finita. Por ejemplo:
•Población finita: el conjunto de habitantes de una ciudad, los bolígrafos
producidos en una fábrica en un día, etc.
•Población infinita: el conjunto de los números positivos.
•Cuando la población es muy grande, normalmente es imposible estudiar
a todos los individuos.
•Supongamos que queremos saber cual es el nivel de colesterol de la
población de Estados Unidos. Por cuestiones económicas y de tiempo
obvias, no está al alcance realizar un análisis de sangre a toda la población de EEUU. Para solucionar este impedimento, se utiliza una muestra
MUESTRA ESTADÍSTICA
•Una muestra estadística (o una muestra) es un subconjunto de
•El mejor resultado para un proceso estadístico sería estudiar a toda la población. Pero esto generalmente resulta imposible, ya sea porque supone un coste económico alto o porque requiere demasiado tiempo.
•Frente a la dificultad de hacer un censo (estudio de toda la población), se examina una muestra estadística que
representará a la totalidad de los sujetos. Con los resultado obtenidos mediante la muestra, se intentará inferir las
propiedades de todos los elementos, mediante la estadística inferencial.
•La muestra elegida debe ser representativa de la población. Las muestras tienen un nivel de confianza de la bondad con la que representan a todos los sujetos, generalmente del 95% o
Ejercicio
•Supongamos que se realiza un control de calidad en una fábrica que
produce dvds en el transcurso de un día. Esta empresa produce un millón de dvds diarios por lo que sería imposible para los
controladores examinarlos todos. Por ello, se elige una muestra de cien elementos para realizar dicho control.
•Pero surge la siguiente pregunta: ¿Cómo elegimos la muestra? •Existen diferentes tipos de muestreo.
MUESTREO
•El muestreo es el método utilizado para elegir una muestra a partir
de la población.
•En la mayoría de los casos, no es posible estudiar a toda
la población, y se elige una muestra para representar a todos los individuos. Esta muestra debe ser representativa de todas las características de todos los elementos.
Tipos de muestreo
•Las muestras pueden ser elegidas mediante diversas técnicas o procedimientos.
Estas técnicas se clasifican según el según como sean elegidos los individuos. Se dividen en dos grandes grupos:
•Muestreo probabilístico (o muestreo aleatorio): proceso de selección de
individuos de manera que cada sujeto tiene probabilidad positiva e independiente de ser seleccionado.
• Muestreo aleatorio simple: 1) todos los individuos tienen la misma probabilidad de ser
elegidos, 2) las observaciones se realizan con reemplazamiento, de forma que la población es igual en todas las extracciones.
• Muestreo aleatorio estratificado: los individuos se dividen en grupos o estratos. La
muestra se elige escogiendo en cada estrato un número representativo de individuos.
• Muestreo aleatorio sistemático: se utiliza en muestras ordenadas. Consiste en
seleccionar al azar un elemento y a partir de él, incrementando un intervalo fijo, seleccionar toda la muestra.
• Muestreo aleatorio por conglomerados: la población está dividida en conglomerados
naturales (provincias, ciudades,etc.). Se seleccionan algunos conglomerados y se toman en representación de toda la población.
•Muestreo no probabilístico (o muestreo no aleatorio): la selección de los
individuos se basa en el criterio del investigador. No se conoce la probabilidad de que cada individuo sea elegido en la muestra.
• Muestreo por cuotas: se basa en seleccionar la muestra después de dividir
la población en grupos o estratos. Los sujetos dentro de cada grupo se eligen por métodos no probabilísticos.
• Muestreo por conveniencia: consiste en seleccionar a los individuos que convienen
al investigador para la muestra. Esta conveniencia se produce porque al investigador le resulta más fácil examinar a estos sujetos, ya sea por proximidad geográfica, por ser sus amigos, etc.
• Muestreo de bola de nieve (o muestreo por referidos): se realiza
sobre poblaciones en las que no se conoce a sus individuos o es muy difícil acceder a ellos. Se llama muestreo de bola de nieve porque cada sujeto estudiado propone a otros, produciendo un efecto acumulativo parecido a una bola de nieve.
• Muestreo casual o accidental: los individuos son elegidos de manera casual, sin
ningún juicio previo. Las personas que realizan el estudio eligen un lugar o un medio, y desde ahi realizan el estudio a los individuos de la población que accidentalmente se encuentren a su disposición.
• Muestreo discrecional (o muestreo por juicio): los sujetos se seleccionan a base del
VARIABLES ESTADÍSTICAS
• Una variable estadística es el conjunto de valores que puede tomar cierta
característica de la población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición. Estas variables pueden ser: la edad, el peso, las notas de un examen, los ingresos mensuales, las horas de sueño de un paciente en una
semana, el precio medio del alquiler en las viviendas de un barrio de una ciudad, etc.
• Las variables estadísticas se pueden clasificar por diferentes criterios. Según su
medición existen dos tipos de variables:
• Cualitativa (o categórica): son las variables que pueden tomar como valores
cualidades o categorías.Ejemplos:
• Sexo (hombre, mujer)
• Salud (buena, regular, mala)
• Cuantitativas (o numérica): variables que toman valores numéricos.Ejemplos:
• Número de casas (1, 2,…). Discreta. • Edad (12,5; 24,3; 35;…). Continua.
EXPERIMENTO
• Un experimento, en estadística, es cualquier proceso que proporciona datos,
numéricos o no numéricos. Un conjunto cuyos elementos representan todos los posibles resultados de un experimento se llama espacio muestral y se representa como S.
• El espacio muestral de un experimento siempre existe y no es necesariamente único
pues, dependiendo de nuestra valoración de los resultados, podemos construir diferentes espacios muestrales.
• Los elementos del espacio muestral se llaman puntos muestrales y son los distintos
resultados del experimento.Si consideramos el conjunto de las partes de (P(S)) sus elementos son los sucesos. Un suceso, por tanto, es un subconjunto del espacio muestral.
• Existen dos tipos de sucesos:
• Sucesos simples, que son aquellos que comprenden un sólo punto muestral.
• Sucesos compuestos, que son los que engloban más de un punto del espacio muestral.
• Todo suceso compuesto se puede considerar como unión de puntos del espacio
FRECUENCIA
• La frecuencia es una medida que sirve para comparar la
aparición de un elemento Xi en un conjunto de elementos (X1, X2,…, XN). Mediante tablas de distribuciones de
frecuencia se puede presentar organizadamente el recuento de datos.
• Las frecuencias de cada elemento se pueden expresar
tanto absolutas (número total de apariciones) como relativas (proporción de apariciones).
• Si los datos provienen de una variable cuantitativa o
existen muchas categorías, los datos se suelen agrupar
en clases. Cada clase, que tiene un intervalo o amplitud
constante, está representado por su marca de clase, que es el punto medio de la misma
FRECUENCIA ABSOLUTA
•La frecuencia absoluta (ni) de un valor Xi es el número de veces que
el valor está en el conjunto (X1, X2,…, XN).
•La suma de las frecuencias absolutas de todos los elementos
diferentes del conjunto debe ser el número total de sujetos N. Si el conjunto tiene k números (o categorías) diferentes, entonces:
Ejercicio
• Un profesor tiene la lista de las notas en matemáticas
de 30 alumnos de su clase. Las notas son las siguientes:
• Se realiza el recuento de la variable que se estudia (notas)
para ver el número de veces que aparece cada nota.
• Una vez realizado el recuento, se representan
las frecuencias absolutas de cada una de las notas (ni). Las frecuencias son: n1(3)=2, n2(4)=4, n3(5)=6, n4(6)=7, n5(7)=5, n6(8)=3, n7(9)=2 y n8(10)=1.
FRECUENCIA ABSOLUTA
ACUMULADA
•La frecuencia absoluta acumulada(Ni) de un valor Xidel conjunto
(X1, X2,…, XN) es la suma de las frecuencias absolutas de los valores menores o iguales a Xi, es decir:
Ejemplo
•Un profesor tiene la lista de las notas en matemáticas de 30
alumnos de su clase. Las notas son las siguientes:
•Primero se realiza el recuento de la variable que se estudia (notas)
para ver el número de veces que aparece cada nota y obtener las frecuencias absolutas.
•Las frecuencias absolutas son las siguientes: n1(3)=2, n2(4)=4,
n3(5)=6, n4(6)=7, n5(7)=5, n6(8)=3, n7(9)=2 y n8(10)=1.
•Finalmente se pueden calcular las frecuencias absolutas
acumuladas como la suma de las frecuencias absolutas de los
• N1(3)=n1(3)=2 • N2(4)=n1(3)+n2(4)=2+4=6 • N3(5)=n1(3)+n2(4)+n3(5)=2+4+6=12 • N4(6)=n1(3)+n2(4)+n3(5)+n4(6)=2+4+6+7=19 • N5(7)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)=2+4+6+7+5=24 • N6(8)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)=2+4+6+7+5+3 =27 • N7(9)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)=2+4+6+ 7+5+3+2=29 • N8(10)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)+n8(10) • =2+4+6+7+5+3+2+1=30
FRECUENCIA RELATIVA
•La frecuencia relativa (fi) de un valor Xies la proporción de valores
iguales a Xien el conjunto de datos (X1, X2,…, XN). Es decir, la
frecuencia relativa es la frecuencia absoluta dividida por el número total de elementos N:
•Las frecuencias relativas son valores entre 0 y 1, (0 ≤ fi≤ 1). La
suma de las frecuencias relativas de todos los sujetos es siempre 1. Supongamos que en el conjunto tenemos k números (o categorías) diferentes, entonces:
•Si se multiplica la frecuencia relativa por cien se obtiene
Ejercicio
•Un profesor tiene la lista de las notas en matemáticas de 30
alumnos de su clase. Las notas son las siguientes
•Para obtener la frecuencia relativa, se necesita calcular antes
la frecuencia absoluta. Se realiza el recuento de la variable y se observa el número de veces que aparece cada nota.
•Las frecuencias absolutas de cada una de las notas son: n1(3)=2,
n2(4)=4, n3(5)=6, n4(6)=7, n5(7)=5, n6(8)=3, n7(9)=2 y n8(10)=1.
•Una vez se obtienen, se puede calcular la frecuencia relativa de
cada elemento como la división de la frecuencia absoluta entre el total de elementos N=30.
• f1(3) = n1(3)/N = 2/30 = 0,07 • f2(4) = n2(4)/N = 4/30 = 0,13 • f3(5) = n3(5)/N = 6/30 = 0,20 • f4(6) = n4(6)/N = 7/30 = 0,23 • f5(7) = n5(7)/N = 5/30 = 0,17 • f6(8) = n6(8)/N = 3/30 = 0,10 • f7(9) = n7(9)/N = 2/30 = 0,07 • f8(10) = n8(10)/N = 1/30 = 0,03
• Se pueden calcular las frecuencias relativas en porcentaje (%)
FRECUENCIA RELATIVA
ACUMULADA
•Definimos la frecuencia relativa acumulada (Fi) de un valor
Xicomo la proporción de valores iguales o menores a Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividida por el número total de sujetos N:
•La frecuencia relativa acumulada de cada valor siempre es mayor
que la frecuencia relativa. De hecho, la frecuencia relativa acumulada de un elemento es la suma de las frecuencias relativas de los elementos menores o iguales a él, es decir:
Ejercicio
• Un profesor tiene la lista de las notas en matemáticas de 30
alumnos de su clase. Las notas son las siguientes:
• Para calcular la frecuencia relativa acumulada, se necesita obtener
antes la frecuencia relativa. Para ello es necesario antes calcular
la frecuencia absoluta, realizando el recuento de la variable contando el número de veces que aparece cada nota.
• Las frecuencias absolutas de cada una de las calificaciones son: n1(3)=2,
•Una vez se obtienen, se calcula la frecuencia relativa de cada
elemento como la división de la frecuencia absoluta entre el total de elementos N=30. •f1(3) = n1(3)/N = 2/30 = 0,07 •f2(4) = n2(4)/N = 4/30 = 0,13 •f3(5) = n3(5)/N = 6/30 = 0,20 •f4(6) = n4(6)/N = 7/30 = 0,23 •f5(7) = n5(7)/N = 5/30 = 0,17 •f6(8) = n6(8)/N = 3/30 = 0,10 •f7(9) = n7(9)/N = 2/30 = 0,07 •f8(10) = n8(10)/N = 1/30 = 0,03
• La frecuencia relativa acumulada es la suma de las frecuencias relativas de los
elementos iguales o menores a Xi. Son las siguientes:
• F1(3)=f1(3)=0,07 • F2(4)=f1(3)+f2(4)=0,07+0,13=0,20 • F3(5)=f1(3)+f2(4)+f3(5)=0,07+0,13+0,20=0,40 • F4(6)=f1(3)+f2(4)+f3(5)+f4(6)=0,07+0,13+0,20+0,23=0,63 • F5(7)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)=0,07+0,13+0,20+0,23+0,17=0,80 • F6(8)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8) • =0,07+0,13+0,20+0,23+0,17+0,10=0,90 • F7(9)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9) • =0,07+0,13+0,20+0,23+0,17+0,10+0,07=0,97 • F8(10)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9)+f8(10) • =0,07+0,13+0,20+0,23+0,17+0,10+0,07+0,03=1,00
•Se pueden calcular las frecuencias relativas acumuladas en
Ejercicio 1
Elaborar la tabla de frecuencias absolutas, relativas y acumuladas
12
8
7
10
10
8
3
2
7
1
2
4
3
6
9
4
1
6
9
12
9
5
9
11
2
15
15
4
11
3
Actividad 2
•
El número de veces que han ido al cine en
el último mes los alumnos de una clase es:
•
{2,3,0,1,5,3,2,1,0,0,2,1,2,
3,5,0,5,4,1,1,1,2,0,1,2}
•
Forma la tabla de frecuencias absolutas y
relativas, las acumuladas y los
Ejercicio 3
•
Se realiza un trabajo en la asignatura de
lengua en una clase formada por 40
alumnos. 2 alumnos realizan el trabajo en
un folio, 5 en 2 folios, 6 en 3 folios, y el
resto en 4 folios.
•
Forma las tabla de frecuencias Absoluta,
Ejercicio 4
• En una maternidad se han tomado los pesos (en kg) de 50 recién
nacidos:
• Construye una tabla con los datos agrupados en 6 intervalos de
amplitud 0,4 kg.
• Realizar las frecuencias Relativas, Absolutas y Acumuladas
2.8 3.2 3.8 2.5 2.7 3.7 1.9 2.6 3.5 2.3
3.0 2.6 1.8 3.3 2.9 2.1 3.4 2.8 3.1 3.9
2.9 3.5 3.0 3.1 2.2 3.4 2.5 1.9 3.0 2.9
2.4 3.4 2.0 2.6 3.1 2.3 3.9 2.9 3.0 2.7
2.9 2.8 2.7 3.1 3.0 3.1 2.8 2.6 2.9 3.3
Ejercicio 5
•
De los 100 trabajadores de una empresa
han llegado a trabajar 10 minutos pronto
23, 5 minutos pronto 15, en su hora 22, 5
minutos tarde 17, y el resto 10 minutos
tarde.
•
Forma la tabla de frecuencias absolutas ,
CONSTRUCCIÓN E
INTERPRETACION DE
GRAFICOS
DEFINICION
•
Los gráficos de control por variables
se utilizan para las características de
calidad que son cuantificables.
Ventajas del Uso de Gráficos de
Control por Variables
Ofrecen un uso muy amplio. Proporcionan información útil respecto al funcionamiento del proceso: Se obtiene directamente información específica
acerca de la media del proceso y su variabilidad.
Cuando hay puntos que caen fuera de control se
puede extraer mucha información sobre la causa
especial que provocó esta señal fuera de control.
Con todos los valores individuales dentro de las
especificaciones, se puede analizar el proceso,
lo que facilita su mejora.
Ayudan en el estudio de la capacidad de un proceso.
CONSTRUCCIÓN
Seleccionar la característica medible que va a ser la base de estudio.1.- Decidir el tamaño de muestra. Se requiere un tamaño de muestra constante. Habitualmente será sobre 5 elementos.
2.- Establecer la frecuencia de muestreo.
3.- Elegir el número de muestras.
4.- Registrar los datos. Si éstos se realizan manualmente, existen plantillas que adoptan pequeñas variantes
Grafica de Barra
Xi
ni
M
6
C
7
H
4
G
5
D
8
N=30
0 1 2 3 4 5 6 7 8 9Matematicas Ciencias Historia Geografia Deportes
Frecuencia Absoluta
Grafica Circular
Xi
ni
fi%
M
6
20%
C
7
23.3%
H
4
13.3%
G
5
16.7%
D
8
26.7%
100%
360°
Fi
X°
X° =
360°
100%
fi
X°
72°
83.9°
47.9°
60.1°
96.°
Xi
ni
fi%
M
6
20%
C
7
23.3%
H
4
13.3%
G
5
16.7%
D
8
26.7%
360°
Matema ticas, 20% Ciencias, 23.30% Historia, 13.30% Geografi a, 16.70% Deporte s, 26.70%Grafica de Frecuencias
Xi
ni
fi
M
6
.20
C
7
.23
H
4
.13
G
5
.17
D
8
.27
0.2 0.23 0.13 0.17 0.27 0 0.05 0.1 0.15 0.2 0.25 0.3Matematicas Ciencias Historia Geografia Deportes
FI
Actividad
Realizar de los ejercicios
1,2,3,4y 5 las siguientes graficas
•Barras (ni)
•Circular (fi%)
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ni
Ejercicio 1
8% 8% 8% 8% 3% 5% 5% 8% 11% 6% 6% 6% 6% 6% 6% FI % 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0.000 0.020 0.040 0.060 0.080 0.100 0.120 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 fi
Ejercicio 2
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 ni20% 28% 24% 12% 4% 12% fi % 20.0% 28.0% 24.0% 12.0% 4.0% 12.0%
0.2 0.28 0.24 0.12 0.04 0.12 0 0.05 0.1 0.15 0.2 0.25 0.3 1 2 3 4 5 6 fi
Ejercicio 3
0 5 10 15 20 25 30 1 2 3 4 ni5% 12% 15% 68% fi %
1
2
3
4
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 fi
Ejercicio 4
0 5 10 15 20 25 1.6 -2.0 2.0 -2.4 2.4 - 2.8 2.8 - 3.2 3.2 - 3.6 3.6 - 4.0 ni6% 10% 20% 40% 18% 6%
fi %
1 2 3 4 5 60 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 1 2 3 4 5 6 fi
Ejercicio 5
0 5 10 15 20 25 -10 -5 0 5 10 ni23% 15% 22% 17% 23%
fi %
1 2 3 4 50 0.05 0.1 0.15 0.2 0.25 1 2 3 4 5 fi
DISTRIBUCIÓN DE
FRECUENCIAS CON
DATOS AGRUPADOS
Tablas de frecuencias con datos
agrupados
• Cuando los valores de la variable son muchos, conviene agrupar los
datos en intervalos o clases para así realizar un mejor análisis e interpretación de ellos.
• Para construir una tabla de frecuencias con datos
agrupados, conociendo los intervalos, se debe determinar la
frecuencia absoluta (ni) correspondiente a cada intervalo, contando la cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan las frecuencias relativas y acumuladas, si es
pertinente.
• Si no se conocen los intervalos, se pueden determinar de la siguiente
manera: (recuerda que los intervalos de clase se emplean si
las variables toman un número grande de valores o la variable es continua).
• Se busca el valor máximo de la variable y el valor mínimo. Con estos
•
Otra forma de calcular la cantidad de intervalos es aplicando
los siguientes métodos:
•
Método Sturges: k = 1 + 3.332 log n donde:
k= número de clases
n= tamaño muestral
•
Debemos tener en cuenta 2 cosas. Primero que el número
de intervalos me tiene que dar impar, segundo que el
resultado se redondea generalmente a la baja. Si al
redondear a la baja nos da como resultado un número par
debemos redondear al alza. Este es el método que tiene
mayor precisión.
•
Método Empírico: este método depende del criterio del
evaluador de los datos, por lo tanto es arbitrario. Dice lo
siguiente.
Ejemplo
•En un centro comercial, se consultó la edad a todas las personas
que entraban entre las 12:00 h y 12:30 h. Los resultados obtenidos fueron los siguientes:
Construye una tabla de frecuencias
cuyos datos estén agrupados en
ocho intervalos.
•
1°Para poder construir la tabla de frecuencias lo primero que
debemos hacer es calcular el rango.
•
El rango da la idea de proximidad de los datos a la media. Se
calcula restando el dato menor al dato mayor.
•
El dato mayor y el menor lo hemos destacado con color rojo:
•
Dato mayor - dato menor = 73 - 1 = 72
•Por lo tanto; Rango = 72
•
2° En el problema nos dicen que debemos agruparlo en
8 intervalos o clases, con este dato podemos calcular la
amplitud o tamaño de cada intervalo, dividiendo el valor del
rango por la cantidad de intervalos que se desean obtener (en
este caso son 8).
•
Amplitud: La amplitud de un intervalo es la diferencia entre
el límite superior y el límite inferior. La amplitud(A) de los
intervalos puede calcularse mediante la expresión:
•
Por lo tanto la amplitud de cada intervalo
será de 9
•
- El valor de la amplitud se redondea al
número inmediato superior de acuerdo a la
cantidad de decimales que tienen los datos o
según la precisión con que se desea trabajar.
•
- Puede haber intervalos con distinta
amplitud.
•
- Puede haber intervalos con amplitud
indefinida (intervalos abiertos)
•
3° Ahora podemos comenzar a construir la
Con esta información construiremos
la tabla en esta ocasión con el último
método explicado.
Intervalo Edades ni Ni fi FI 1 1 -10 7 7 .17 .17 2 11 – 20 6 13 .14 .31 3 21 - 30 8 21 .19 .5 4 31 – 40 6 27 .14 .64 5 41 – 50 5 32 .12 .76 6 51 – 60 4 36 .1 .86 7 61 – 70 4 40 .1 .95 8 71 - 80 2 42 .05 1 Amplitud 9 42 1Ejercicio 6
•
En un universidad se ha realizado una encuesta
a 200 alumnos de la licenciatura de
documentación. El 32% afirma que esta muy
contento con la universidad , el 40% esta
contento, el 23% no esta contento, y el resto
muy descontento.
•
Forma la tabla de frecuencias absolutas,
relativas y acumuladas y explica si crees que la
universidad lo esta haciendo bien.
Ejercicio 7
•Completa la siguiente tabla de frecuencias relativa y absoluta.
Xi Ni Fi
0 -10
10 -20
7
.35
20 – 30
0
30 – 40
2
.1
40 -50
8
20
Ejercicio 8
•
En Villanueva de arriba el 40% de las
familias tienen un solo hijo, el 35%
tienen 2 hijos, el 11% ninguno y el
resto mas de 2. sabiendo que en el
pueblo viven mas de 1100 familias,
forma la tabla de frecuencias
Ejercicio 9
•Loa goles que se han marcado en la ultima jornada de la liga han
sido en los siguientes minutos de juego:
•
Realiza la tabla de frecuencia absoluta,
relativa y acumulada agrupando en clases
de ¼ de hora.
20
11
89
3
20
4
2
35
50
29
59
30
90
33
78
54
21
19
60
34
56
63
45
31
26
32
5
78
88
85
Ejercicio 10
•Los aviones que han aterrizado en un aeropuerto lo hicieron en lo
siguientes minutos de cada hora: