INDICE
UNIDAD ACADÉMICA I ESTADÍSTICA – GENERALIDADES 1. Definición de Estadística 07 2. Clases de Estadística 08 3. Conceptos Básicos 08 4. Variable y tipos 10 5. Regla de Redondeo 14 6. Notación Científica 15 7. Cifras Significativas 15 8. Sumatoria 16 UNIDAD ACADÉMICA IIORGANIZACIÓN DE DATOS Y GRÁFICOS
1. Tabla de Frecuencia 19
2. Clases de Frecuencias 20
3. Tabla de Frecuencia para Variables Cualitativas 21 4. Tabla de Frecuencia para Variables Cuantitativas 21 5. Construcción de Intervalos o Reducción de Datos 23
6. Gráficos 28
7. Clases de Gráficos 28
8. Análisis Exploratorio de Datos 31
UNIDAD ACADÉMICA III
MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL (I)
1. La Medida o Promedio Aritmético 37
2. Mediana 39
3. La Moda 43
4. Relación Entre en Promedio Aritmético, Mediana y Moda 47 UNIDAD ACADÉMICA IV
MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL (II)
1. Media Geométrica 53
2. Media Armónica 55
3. Relaciones Entre los Promedios 56
4. Cuarteles 57
5. Deciles 58
6. Percentiles 58
UNIDAD ACADÉMICA V
DISPERSIÓN, ASIMETRÍA Y APUNTAMIENTO
1. Medidas de Dispersión o Variabilidad 065
2. Rango 066
3. Desviación Media 066
4. Varianza 068
5. Desviación Estándar 070
6. Características de la Varianza y Desviación Estándar 071
7. Coeficiente de Variación 072 8. Variable Estandarizada 073 9. Medida de Asimetría 073 Medida de Apuntamiento 076 UNIDAD ACADÉMICA VI CORRELACIÓN Y REGRESIÓN 1. Correlación 079 2. Coeficiente de Correlación 080 3. Regresión 082
4. Serie de Tendencia Rectilínea 082
5. Serie de Tendencia Parabólica 084
6. Aplicación de la Ecuación Exponencial 087
UNIDAD ACADÉMICA VII
PROBABILIDAD (I)
1. Introducción a la Teoría de la Probabilidad 091
2. Concepto de Probabilidad 091 3. Experimento 092 4. Espacio Muestral 092 5. Evento o Suceso 093 6. Análisis Combinatorio 098 7. Factorial de un Número 101 8. Permutación 101 9. Variación 104 10. Combinación 105 11. Diagramas de Árbol 106
UNIDAD ACADÉMICA VIII
PROBABILIDAD (II)
1. Definición Clásica de Probabilidades 111
2. Probabilidad de Frecuencia Relativa 115
3. Probabilidad Subjetiva 118
4. Probabilidad Frente a “Apuestas” 118
5. Probabilidades de Espacios Muestrales Finitos 119
6. Probabilidad Condicional 121
7. Sucesos Independientes 124
ESTADÍSTICA – GENERALIDADES
Este primer fascículo esta diseñado para ayudar al lector a hacerse una idea de la estadística, para que sepa los principales conceptos, variables y sus tipos, regla de redondeo, notación científica y cifras significativas.
Hoy las estadísticas están presentes en casi todas las profesiones, se han convertido en una herramienta de suma utilidad.
Al finalizar el estudio del presente fascículo el estudiante: - Define la estadística y conoce sus clases.
- Conceptúa lo que es población, muestra, parámetro, estadígrafo y dato. - Define lo que es una variable, conoce y determina sus tipos.
- Aplica la regla de redondeo y las cifras significativas; así como, la notación científica. - Resuelve problemas de sumatoria.
1. Definición de Estadística
La Estadística es la ciencia de la:
- Sistematización, recogida, ordenación y presentación de datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con el objeto de
(Descriptiva)
- deducir las leyes que rigen esos fenómenos, (Probabilidad)
- y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones
(Inferencia)
Definiciones etimológicas:
deriva del latín STATUS que significa “situación” mientras que algunos autores afirman que procede del alemán STAAT cuyo significado es “Estado” por su función de registrar: población, nacimiento, defunción, etc. Y finalmente, otros autores dicen que proviene de una voz italiana STATISTA que significa “estadista” y que acuño Gottfried Achenwall (1719 – 1772), un profesor en Marlborough y Gottingen.
2. Clases de Estadística
Estadística Descriptiva y Deductiva
Es la Estadística que únicamente se ocupa de describir y analizar un conjunto determinado sin extraer ningún tipo de conclusión o inferencia sobre un conjunto mayor.
El análisis se limita a si mismo a los datos coleccionados. Las gráficas, las tablas y diagramas que muestran los datos y facilitan su interpretación son ejemplos de este tipo de Estadística.
Estadística Inferencial o Inductiva
Es la Estadística que estudia las condiciones bajo las cuales tales inferencias son válidas, para cuyo estudio se requiere un alto nivel de conocimiento de estadística descriptiva, probabilidades y matemáticas.
Comprende la teoría de estimación, prueba de hipótesis y análisis de varianza. Aquí, la influencia estadística incluye generalizaciones y afirmaciones sobre probabilidades de su validez.
3. Conceptos Básicos
PoblaciónEs el conjunto mayor o colección completa de todos los elementos que posee al menos una característica común observable, cuyo estudio nos interesa o acerca de los cuales se desea información.
La población puede ser según su tamaño de dos tipos:
- Población Finita: cuando se tiene un número determinado de elementos. Ejemplo. El conjunto de todos los alumnos de la UPLA
- Población Infinita: Cuando el número de elementos es indeterminado o tan grande que pudiesen considerarse infinitos.
Ejemplo. El conjunto de Insectos El conjunto de estudiantes
Tamaño de la población: es el número total de elementos que tiene la población estudiada y se denota con la letra “N” (ene mayúscula).
Muestra
Es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar las propiedades con el fin de estudiar las propiedades de la población de la cual es obtenida.
Ejemplo. Un grupo de alumnos del total de estudiantes de la UPLA.
Tamaño de la muestra: Es el número de elementos de la muestra y se denota con la letra “n” (ene minúscula).
Parámetro
Es un número que describe alguna característica de la población o medida de resumen de una población. Se considera como un valor verdadero de la característica estudiada y para determinar su valor es necesario utilizar la información poblacional completa y por lo tanto la decisión se toma con certidumbre total.
Los parámetros se representan con letras griegas. Ejemplo: La media aritmética con “µ”
La desviación estándar con “σ”
Estadígrafo o Estadístico
Es el número que describe alguna característica de la muestra o medida de resumen de una muestra y la toma de decisión contiene un grado de incertidumbre.
La estadística se representa con letras latinas. Ejemplo: La media aritmética con “
x
”Dato
Es el valor, respuesta o registro que adquiere una característica o variable asociada a un elemento de la población o muestra, como resultado de la observación, entrevista o recopilación en general. Puede ser un símbolo, una palabra o un número.
Los datos pueden ser: A. Según su naturaleza
a. Datos cuantitativos: Consiste en números que representan conteos o mediciones.
Ejemplo. El número de soldados del Perú La talla de los estudiantes de la UPLA
b. Datos Cualitativos: Se pueden dividir en diferentes categorías que se distinguen por alguna característica no numérica.
Ejemplo. Los grados del ejército Los colores del arco iris B. Según su procedencia.
a. Datos Primarios: Son aquellos que se obtienen directamente de la misma realidad, sin sufrir ningún proceso de elaboración previa.
Ejemplo: Lo que se recoge directamente de un muestreo o de un censo. b. Datos Secundarios: Son registros escritos que proceden tambien de un
contacto con la práctica, pero que ya han sido recogidos y muchas veces procesados por los investigadores.
Ejemplo: Lo que se obtiene de textos, revistas, etc.
4. Variable
Es una característica estudiada de las unidades estadísticas (elementos de la población)
Tipos de Variable
Según la Naturaleza de la Variable
a) Variables Cualitativas
Cuando expresan una cualidad, característica o atributo, sus datos se expresan mediante palabras, no es numérica.
Ejemplo: Estado civil, lugar de nacimiento, profesiones, causas de accidentes, colores, etc.
b) Variables Cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de carácter numérico. El dato o valor puede resultar de la operación de contar o medir. Ejemplo: Número de hijos, ingresos, talla, peso, producción, edad, utilidades,
etc.
Las variables cuantitativas pueden ser Discretas y Continuas b.1. Variable Discreta
Cuando el valor de una variable resulta de la operación de contar, su valor está representado solo por números naturales (entero positivo).
Ejemplo: Número de hijos, habitaciones por vivienda, población por país. Etc.
b.2. Variable Continua
Cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medición o comprobación con una unidad o patrón de medida. Se expresa por cualquier número real.
Ejemplo: Área de terreno, ingresos monetarios, peso, estatura, tiempo, etc.
Según la relación entre variables
a) Variables Dependientes
Son aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales hay que buscar su motivo, causa o razón de ser.
Ejemplo: El consumo. Esta variable depende de los ingresos personales. La producción. Esta variable depende del tiempo (año, meses, etc.)
b) Variables Independientes
Son las variables explicativas o predictivas, cuya asociación, relación o influencia en la variable dependiente se pretende descubrir en la investigación. También, son causas o antecedentes.
Ejemplo: Los ingresos personales, relacionado con el consumo. El tiempo, relacionado con la producción.
c) Variables intervinientes o interferentes
Son aquellas que coparticipan con la variable independiente condicionando el comportamiento de la variable dependiente.
Ejemplo: El caso del Presupuesto familiar que es una variable dependiente, con relación a los ingresos que es una variable independiente y con otras variables que serían la conducta de consumo, edad de la familia, etc. Éstos últimos son variables intervinientes.
Según la escala de medición
a) Variables Nominales
Son aquellas variables que establecen la distinción de los elementos en diversas categorías, sin explicar algún orden entre ellas.
Ejemplo: Sexo, estado civil, profesiones, lugar de nacimiento, deportes de práctica.
b) Variables Ordinales
Son aquellas variables que implican orden entre sus categorías, están referidas a un orden de jerarquía, donde la categoría expresa una posición de orden. Ejemplo: Grado de instrucción, clases sociales, rango de agresividad, orden
de mérito, etc.
c) Variable de Intervalo
Son aquellos que suponen a la vez orden y grados de distancia iguales entre diversas categorías, pero no tienen origen natural, sino convencional, tiene un cero relativo.
Ejemplo: Coeficiente de inteligencia, temperatura, puntuación obtenida en una escala, etc.
d) Variables de Razón
Estas variables comprenden a la vez todos los casos anteriores, distinción, orden, distancia y origen único natural; el valor se expresa con un número real, tiene un cero absoluto.
Según Amplitud de las Unidades de Observación
a) Variables Individuales
Son referidas a características de individuos o personas, una empresa, centro educativo, etc. Son variables para estudio de casos, donde se pueden subdividir en variables públicas y privadas.
a.1. Variables Públicas
Son aquellas en que los valores individuales son conocidos por otras personas y se saben que son conocidos.
Ejemplo: Edad, sexo, ocupación, estado civil, etc.
a.2. Variables Privadas
Son aquellos valores individuales que pueden ser conocidos por otros, una vez averiguados.
Ejemplo: Coeficiente de inteligencia, opiniones frente a la política, conducta de consumo, etc.
b) Variables Colectivas
Son aquellas que se refieren a características de las unidades cuando estas son colectivas, conjuntos o grupos (ciudades, empresas, escuelas, etc.)
Ejemplo: Tasa de mortalidad, urbanización, tasa de crecimiento demográfico, escolaridad, etc.
Las variables dependientes en un momento o caso pueden ser variables independientes y viceversa.
1.1
Determinar la clase de variable que nos dan los datos de las siguientes fenómenos o hechos:
a) Temperatura. b) Razas. c) Nacionalidad.
d) Precio del dólar en un mes.
e) Número de habitaciones por familia.
5. Regla de Redondeo
Cuando el número que se quiere redondear le sigue una cifra mayor que 5, este tomará el valor inmediato superior.
Ejemplo:
57,8 58 (redondear al entero)
1,036 1,04 (redondear a 2 decimales)
36,8079 36,808 (redondear a 3 decimales)
Cuando al número que se quiere redondear le sigue una cifra menor que 5, se quedará en el mismo valor.
Ejemplo:
74,3 74 (redondear al entero)
1,254 1,25 (redondear a 2 decimales)
53,6182 53,618 (redondear a 3 decimales)
Cuando al número que se quiere redondear le sigue una cifra igual que 5, se tomará dos criterios:
a) Si la cifra es par, queda sin alterar. Ejemplo:
24,5 24 (redondear al entero)
2,385 2,38 (redondear a 2 decimales)
137,6125 137,612 (redondear a 3 decimales) b) Si la cifra es impar, pasa al inmediato superior.
Ejemplo: 85,5 86 (redondear al entero) En la práctica por lo general, cuando a la cifra que se desea redondear le sigue 5
1,315 1,32 (redondear a 2 decimales) 57,5435 57,544 (redondear a 3 decimales)
6. Notación Sistémica o Científica
La notación científica se utiliza cuando una información es seguida o antecedida de ceros. Ejemplos: ) ( 10 80 80000000 10 67 , 5 000000567 , 0 10 8 , 3 00038 , 0 10 3 , 9 930000000 10 8 80000000 6 7 4 8 7 científica notación es no
7. Cifras Significativas
Son los dígitos que no precisan una medición, se consideran como cifras significativas los ceros a la derecha; no así los ceros a la izquierda.
Ejemplo: 1,630 4 cifras significativas 0,008 1 cifras significativas 2,003 4 cifras significativas 1,0000 5 cifras significativas 1.2 1. Redondear al entero a) 4,97 b) 38,49 c) 127,511 d) 36,59 e) 288,71 2. Redondear a un decimal a) 36,55 b) 123,45 c) 0,06 3. Redondear a 3 decimales a) 0,0034 b) 137,0056 c) 0,01351 La notación científica solo tiene un entero
4. Realizar la notación científica de:
a) 7 000 000 b) 9 430 000
c) 0,002 937 d) 0,000 005
5. Cuántas cifras significativas tienen los siguientes números:
a) 23,000 2 b) 0,23
c) 90,000 00 d) 0,000 895 4
8. Sumatoria
Es un operador que representa una suma de términos cuyos elementos se encuentran formados de acuerdo a una ley dada.
NOTACIÓN: El operador sumatoria vienen representado por la letra griega sigma (∑ ) Ejemplo: a) Desarrollar:
7 4 a aax
La expresión dada tiene la siguiente lectura: “Sumatoria de “a” por “x” elevado a la “a”, variando “a” desde 4 hasta 7”.
7 4 7 6 5 4 5 6 7 4 a a x x x x ax b) Desarrollar:
4 0 11
k k kx
La expresión dada tiene la siguiente lectura: “Sumatoria de -1 elevado a la k por x elevado a la (k+1), variando k desde 0 hasta 4”.
5 4 3 2 5 4 4 3 3 2 2 1 4 4 1 3 3 1 2 2 1 1 1 1 0 0 4 0 1 1 1 1 1 1 1 1 1 1 1 x x x x x x x x x x x x x x x x k k k
c) Desarrollar:
3 0 k k n a k nLa expresión dada tiene la siguiente lectura: “Sumatoria del coeficiente binómico “n” sobre “k” por “a” elevado a la “n-k”, variando k desde 0 hasta 3”.
3 2 1 0 3 0 0 1 2 3
n n n n k k n n a n a n a n a a k n 1.3 1. Desarrollar
9 3 b b by 2. Desarrollar
6 1 1 1 2 P P P y 3. Desarrollar
4 0 M x M c x MEn este fascículo estudiamos la definición de Estadística como ciencia y sus clases, como la Estadística Descriptiva y la Estadística Inferencial. También se analizó los conceptos básicos de población, muestra, parámetro, estadígrafo y dato; asimismo, de variable y sus tipos.
Luego se planteó la Regla de Redondeo, la Notación científica y cifras significativas.
AVILA A., Roberto. Estadística Elemental. Editorial R.A. Lima, 1998.
CAPUÑAY C. Abelino. Sumatoria y Binomio de Newton. Editorial Ingeniería. Lima 1984. JONSON, Robert. Estadística Elemental, Editorial Trillas. 2ª edición. México. 1991. MOOD, Alexander M. Introducción a la Teoría Estadística. Editorial Aguilar. Madrid 1972. MOYA, Rufino. Estadística Descriptiva. Editorial San Marcos. Lima 1991.
VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias Graficas S.A. 2ª Edición. Lima 1993.
En el siguiente fascículo estudiaremos la organización de datos a través de la Tabla de Frecuencias, la interpretación de los cuadros y los gráficos.
Se desarrollará los pasos para elaborar una tabla de Frecuencia.
Nombre____________________________________________________ Apellidos______________________________Fecha _______________ Ciudad_______________________________Semestre______________
1. Determinar la clase de variable que nos dan los datos de los siguientes fenómenos o hechos:
a) Colores b) Nivel de desempleo
c) Accidentes de Tránsito d) Orientación en el tiempo
2. De los siguientes enunciados. ¿Cuál probablemente exija el empleo de la Estadística Descriptiva y cuál de la Estadística Inferencial?
a) En un campeonato de fútbol se desea conocer el promedio de goles de los equipos que participan.
b) Un comité para la prevención de la contaminación del aire, analiza la disminución del tráfico automotriz y el grado de polución.
c) Un psicólogo estudia el efecto de la asesoría personal sobre el rendimiento de un estudiante.
d) Un Economista registra el crecimiento de la población en un área determinada. 3. Redondear los siguientes números a las cifras significativas siguientes:
a) 23,5 a 2 cifras significativas b) 0,0008532 a 1 cifra significativa
c) 0,05 a un decimal y una cifra significativa d) 90000455 a 7 cifras significativas 4. Desarrollar: a)
7 2 a ay abcx b)
5 3 2 3 N N N x c)
6 1 M MY k Y M5. ¿Por qué la Estadística es probabilística e Inferencial? 6. De 4 Ejemplos de variable discreta
ORGANIZACIÓN DE DATOS Y GRÁFICAS
Los datos recogidos sobre una variable conducen, muchas veces, a una gran cantidad de números que presentados directamente dificultan su interpretación. Este problema se evita si la información se presenta en las llamadas TABLAS DE FRECUENCIA. Estas tablas permiten analizar la distribución de los elementos de la población de acuerdo al carácter en estudio y ayudan en la búsqueda del modelo teórico que mejor ajustará a los datos. A partir de la tabla de frecuencia se puede hacer representaciones gráficas.
- Organiza datos originales en una distribución de frecuencia. - Representa la distribución de frecuencia en graficas.
- Interpreta las frecuencias relativas y absolutas. - Desarrolla una representación de “tallo y hoja”.
1. Tabla de Frecuencia
Representación organizada de los datos que muestra el número de observaciones del conjunto de datos que caen dentro de cada conjunto de clases mutuamente excluyentes La tabla de frecuencia consta de:
a) Clase y Marca de Clase
Clase
Esta constituido por números o descritos por algún atributo cualitativo o cuantitativo de muestras de objetos. La información conforme a características cualitativas son: raza, religión y sexo. Así mismo, puede estar formado por intervalo de clase.
Marca de Clase ( Xi )
Es la semisuma del limite inferior ( Li ) y limite superior ( Ls ) de cada intervalo de clase.
2
Ls
Li
Xi
Los atributos cualitativos y cuantitativos deben ser exhaustivos y mutuamente excluyentes.
b) Frecuencia
Es el número de observaciones provenientes del conjunto de datos que caen dentro de cada una de las clases. Si podemos determinar la frecuencia con que ocurren los valores en cada clases de un conjunto de datos, estaremos en condiciones de construir una distribución de frecuencia.
2. Clases de Frecuencias
a) Frecuencia Absoluta Simple (
fi
)Es el número de observaciones que presentan una modalidad perteneciente a la clase.
b) Frecuencia Absoluta Acumulada ( Fi )
Representación tabular de los datos que muestra cuantas observaciones se hallan encima o debajo de ciertos valores. Estas son ascendente y descendente.
- Frecuencia Absoluta Acumulada Ascendente (
F
(1)) Sirven para decir si son iguales o menores.- Frecuencia Absoluta Acumulada Desscendente (
F
(2)) Sirven para decir si son iguales o mayoresc) Frecuencia Relativa Simple ( hi )
Son datos que muestran la fracción del conjunto total de datos que caen dentro de cada conjunto de clases mutuamente excluyente.
d) Frecuencia Relativa Acumulada ( Hi )
Es el tanto por uno de los elementos de la población que están en alguna clase y que presentan una modalidad inferior o superior a la clase. Estas son ascendente y descendente.
- Frecuencia Relativa Acumulada Ascendente (
H
(1))Nos indica la fracción de los datos que son iguales o menores. - Frecuencia Relativa Acumulada Descendente (
H
(2))e) Frecuencia Porcentual ( Pi )
Es el producto de las frecuencias relativas por 100.
3. Tabla de Frecuencia para Variables Cualitativas
Clase
fi
hi Pi (%) m C C C C 3 2 1 m f f f f 3 2 1 m h h h h 3 2 1 m P P P P 3 2 1 Totaln
1.00 100 Ejemplo:Consideremos la muestra formada por 50 personas y en esta, la variable sexo. Si se observa que hay 30 varones y 20 mujeres, podemos trasladar esta información a la siguiente tabla de frecuencias.
Clase
fi
hi Pi (%) Varón Mujer 30 20 0.6 0.4 60 40 Total 50 1.0 1004. Tabla de Frecuencia para Variables Cuantitativas
Clase
fi
hiF
(1)F
(2)H
(1)H
(2) 1C
f
1h
1 F(11) f1 F(12) n H(11) h1 H1(2) 1.0 2C
f
2h
2 F(21) f1 f2 F(22) n f1 1 2 2 ) 1 (h
h
H
H(22) 1.0h1 3 C f3 h3 F(31) F(11) f3F
(32)
F
(22)
f
2 H(31) H(21)h3 H(32) H(22)h2
m C fm hm F n m ) 1 ( m m f F(2) H(m1) 1.0 m m h H(2) Totaln
1.0Ejemplo: Caso cuantitativo discreto
Para estudiar la producción de artículos de una fábrica se tomaron 100 lotes de 250 artículos cada uno. El número de artículos defectuosos en cada lote fue como sigue:
1 4 3 5 5 2 5 4 2 3 5 3 5 1 3 5 3 3 7 5 2 4 5 8 3 4 2 3 8 5 7 7 4 3 3 4 5 5 5 4 2 3 3 2 4 1 5 4 4 2 2 5 5 2 4 3 4 4 6 5 5 2 6 4 6 2 4 6 5 2 4 7 6 2 3 6 4 4 1 3 3 2 1 5 8 6 4 4 5 6 4 5 3 3 4 4 7 6 6 4
Xi
fi
hi Pi (%) 1 5 0,05 5 2 14 0,14 14 3 18 0,18 18 4 25 0,25 25 5 20 0,20 20 6 10 0,10 10 7 5 0,05 5 8 3 0,03 3 Total 100 1.00 100Ejemplo: Caso cuantitativo continúo
Se desea estudiar la cantidad de kilómetro que recorre un automóvil modelo A por cada galón de gasolina que consume; para tal fin se anotaron las distancias recorridas por 36 automóviles de tal modelo usando un galón de gasolina. Los resultados, en kilómetros fueron así: 34,51 31,54 35,40 38,24 34,60 38,20 35,61 36,70 35,47 31,60 36,57 34,50 37,85 33,15 30,16 36,96 35,93 33,80 36,80 33,29 36,88 34,00 40,00 31,57 37,10 32,91 36,23 34,90 33,00 33,20 36,20 30,00 34,55 33,98 38,10 36,00 Distancia Recorrida Xi
fi
hi Pi (%) [ 30,00 - 31,25 [ 30,6250 2 0,0556 5,6 [ 31,25 - 32,50 [ 31,8750 3 0,0833 8,3 [ 32,50 - 33,75 [ 33,1250 5 0,1389 13,9 [ 33,75 - 35,00 [ 34,3750 8 0,2222 22,2 [ 35,00 - 36,25 [ 35,6250 7 0,1944 19,4 [ 36,25 - 37,50 [ 36,8750 6 0,1667 16,7 [ 37,50 - 38,75 [ 38,1250 4 0,1111 11,1 [ 38,75 - 40,00 ] 39,3750 1 0,0278 2,8 TOTAL 36 1,0000 100fi
= Cantidad de Autos2
Ls
Li
Xi
Marca de ClasePor convención, cada intervalo es tomado cerrado por la izquierda y abierto por la derecha, a excepción del último, que es cerrado en ambos extremos.
5. Construcción de Intervalos o Reducción de Datos
Regla:
1. Ordenamiento de datos (según magnitud) en forma creciente o decreciente. 2. Determinar
- Valor máximo (X max ) - Valor mínimo (X min)
3. Calcular el Rango(R)
1
min
max
X
X
R
para variable discretamin
max X
X
R
para variable continua4. Determinar el numero de clases o intervalos (m) - Método de STURGES (n50)
)
log(
322
,
3
1
n
m
- Método de PORTUGAL)
100
50
(
n
)
log(
991
,
3
8914
,
1
n
m
)
100
(
n
)
log(
815
,
5
766
,
2
n
m
- Método de la RAIZ 45
,
2
n
m
n m
m
debe ser entero (
), si sale decimal se redondea.5. Calcular la amplitud Interválica (
a
)m
R
a
6. Corrección (D)R
a
m
D
(
*
)
Si el resultado de D es: Se ContinuaSe rehace (En la amplitud interválica se redondea por exceso) 7. Intervalo de Clase
a X
Ii min
Ejemplo:
Se tiene las tallas de 41 alumnos de la facultad de Derecho de la UPLA siguientes; dados en metros: 1,73 1,80 1,70 1,74 1,87 1,59 1,70 1,87 1,72 1,70 1,75 1,71 1,87 1,70 1,78 1,75 1,70 1,87 1,71 1,71 1,75 1,60 1,55 1,65 1,60 1,86 1,65 1,55 1,60 1,85 1,73 1,61 1,55 1,67 1,82 1,57 1,64 1,55 1,68 1,80 1,75
A continuación vamos a aplicar la regla para construir los intervalos y elaborar la tabla de frecuencia. Regla: 0 0 0
1º. Ordenamiento de Datos
Se obvia por ser una muestra pequeña 2º. Determinar mt 1.87 max X mt 1.55 min X 3º Calcular el Rango (R) min max X X R (variable continua).
32
,
0
55
,
1
87
,
1
R
4º Determinar el numero de clases; (
m
) por sern
<50 aplicamos el método de STURGES ) ( 6 4 , 6 ) 613 , 1 ( 322 , 3 1 41 log 322 , 3 1 log 322 , 3 1 entero ser que Tiene m m m m n m También, se puede aplicar el método de la RAIZ, por ser muestra pequeña
) ( 6 4 , 6 41 entero m m n m ) ( 6 3 , 6 41 5 , 2 5 , 2 4 4 entero m m n m
5º Calcular la Amplitud Interválica (
a
)053 , 0 ) ( 053 , 0 0533 , 0 6 32 , 0 a redondeo regla a m R a 6º Corrección (D)
) ( 002 , 0 32 , 0 318 , 0 032 , 0 ) 053 , 0 6 ( ) ( negativo ser por rehace Se D D D R a m D Entonces se corrige
a
0
,
054
)
(
004
,
0
32
,
0
324
,
0
32
,
0
)
054
,
0
6
(
continua
se
positivo
es
D
D
D
El valor 0,004 se distribuye en la variable máximo y mínimo (se suma y se resta para ampliar el rango)
Teniendo los datos siguientes se elabora la tabla de frecuencia:
6 054 , 0 872 , 1 max 548 , 1 min m mt a mt X mt X 7º Intervalo de Clase
602
,
1
054
,
0
548
,
1
min
1 1
I
I
a
X
I
i Talla(Intervalo) Tabulaciónfi
hiF
(1)F
(2)H
(1)H
(2) Xi [ 1.548 - 1.602 [ ||||| |||| 9 0.22 9 41 0.22 1.00 1.575 [ 1.602 - 1.656 [ |||| 4 0.10 13 32 0.32 0.78 1.629 [ 1.656 - 1.710 [ ||||| || 7 0.17 20 28 0.49 0.68 1.683 [ 1.710 - 1.764 [ ||||| | 11 0.27 31 21 0.76 0.51 1.737 [ 1.764 - 1.818 [ ||| 3 0.07 34 10 0.83 0.24 1.791 -0,002 1,548 1,55 +0,002 1,87 1,872 1,548 R=0,324 1,872[ 1.818 - 1.872 ] ||||| || 7 0.17 41 7 1.00 0.17 1.845
TOTAL 41 1.00
Tabulación: es ubicar los datos de la muestra en la clase interválica correspondiente.
2.1
1. Los hábitos de trabajo de la mano de obra( llevan trabajo a casa) en Huancayo se muestran a continuación: c b a b a c b c a a a b a a a d d a b b b a c b d b b c b b a b b c c a c a c a c a d b a d a d d a
Donde a= Nunca, b= Menos de una vez al mes, c= Una vez al mes, d= todos los días. Construya un cuadro que presente la información recolectada.
LLEVAN EL TRABAJO A CASA Nº de trabajadores (
fi
) hipi
Nunca
Menos de una vez al mes Una vez al mes
Todos los días TOTAL
2. En una muestra de 40 pequeñas empresas se recoge información a cerca del número de trabajadores en cada una de ellas. Los datos fueron los siguientes:
16 15 14 14 14 13 13 14 14 15 12 15 16 12 12 13 14 17 15 13 14 13 13 14 14 15 17 16 18 13 13 14 14 15 16 15 14 16 15 14
Complete la siguiente tabla de frecuencias.
Número de Trabajadores Empresas(
fi
) hipi
12 13 14 15 16
17 18 Totales
3. En el departamento de producción de una fábrica los sueldos mensuales de los empleados son los siguientes
440 560 335 587 613 400 424 466 565 393 453 650 407 376 470 560 321 500 528 526 570 430 618 537 409 600 550 432 591 428 224 340 558 460 560 607 382 667 512 492 450 530 501 417 660 470 364 634 580 450 574 500 462 380 518 480 625 507 645 382
Complete la siguiente tabla de frecuencias
Sueldo Mensual Xi Conteo Empleados
F
(1) hiH
(1) piTOTAL
6. Graficas
Es otra forma de presentar los datos referentes a un fenómeno.
Una grafica es el idioma universal que bien presentado e ilustrado evita la fraseología. En estadística se emplea una diversidad de tipos de graficas, cuya forma dependerá de la naturaleza de los datos y de los objetivos de la presentación. Antes de elegir el tipo de grafico conviene imaginarse de antemano, el grafico a construir que en general debe tener rasgos simples y de fácil comprensión.
7. Clases de Graficas
Grafica de Coordenadas Ortogonales o Cartesianos
b) Histograma
c) Polígono de Frecuencia
d) Polígono de Frecuencia Acumulada u OJIVA
e) Diagrama de Barra - Simple - Compuesta - Agrupadas Simple 0 20 40 60 80 100 0 10 20 30 40 50 0 10 20 30 40 50 Marca de clas 0 20 40 60 80 100 0 2 4 6 Punto de equ
Compuesta
Agrupadas
Grafica No Ortogonales
a) De Superficie Circular o Torta
0 20 40 60 80 100 Ca n tid ad 0 20 40 60 80 100 120 1995 2000 Ca nt idad Exportación Demanda Interna Producción Demanda de Alg 0 5 10 15 20 25 30 35 40 45 2000 2001 Ca nt
idad Varon Mujer
b) Pictórica
Con los problemas de la actividad 2.1 elaborar graficas
8. Analisis Exploratorio de Datos
El Diagrama de Tallo y HojaUn método para iniciar el análisis exploratorio de los datos, que proporcione información rápida, visual y es relativamente nueva, es el Diagrama de Tallo y Hoja. Esta representación se basa en la ordenación de los datos a manera de grafico, pero sin llegar a ello, utilizando las decenas y las unidades.
Ejemplo:
Los siguientes datos son las calificaciones obtenidas en una prueba de Historia:
78 93 61 100 70 83 88 74 97 72 66 73 76 81 83 64 91 70 77 86 Costa 10% Sierra 30% Selva 60% 10 20 40 0 10 20 30 40 50
La representación del tallo y hoja se elabora de manera que las decenas se pondrán en una columna, en forma vertical y las unidades a la derecha:
6 1 6 4
7 8 0 4 2 3 6 0 7
8 3 8 1 3 6
9 3 7 1
10 0
Para entender un poco mas, hemos de decir que le primer renglón que dice 6|1 6 4 quiere decir que entre la lista de datos se encuentran los valores 61, 66, 64.
La representación de Tallo y Hoja, donde cada renglón es una posición de tallo y cada digito de la derecha es una hoja.
Reforzamiento del Aprendizaje
1. Dado la siguiente tabla de frecuencia que significa:
a) f3 d) 4 ) 2 ( F b)
h
4 e) 6 ) 1 ( H c) 5 ) 1 ( F f) H(52)TABLA DE FRECUENCIA DE SALARIOS POR TRABAJADOR
i Salario(Intervalo) fi hi
F
(1)F
(2)H
(1)H
(2) 1 [ 82 - 89 [ 4 0.05 4 80 0.05 1.00 2 [ 89 - 96 [ 6 0.08 10 76 0.13 0.95 3 [ 96 - 103 [ 9 0.11 19 70 0.24 0.87 4 [ 103 - 110 [ 13 0.16 32 61 0.40 0.76 5 [ 110 - 117 [ 15 0.19 47 48 0.59 0.60 6 [ 117 - 124 [ 13 0.16 60 33 0.75 0.41 7 [ 124 - 131 [ 12 0.15 72 20 0.90 0.258 [ 131 - 138 [ 5 0.06 77 8 0.96 0.10
9 [ 138 - 145 ] 3 0.04 80 3 1.00 0.04
TOTAL 80 1.00
Respuesta:
a) f3= Hay 9 trabajadores que tienen un salario entre 96 y 103 nuevos soles.
3
f = Hay 9 trabajadores que tienen un salario de 96 a 102.99 nuevos soles. b)
h
4= El 16% de los trabajadores ganan de 103ª 109.99 nuevos soles.c) 5
) 1 (
F = 47 trabajadores ganan menos de 117 nuevos soles.
d) 4
) 2 (
F = 61 trabajadores ganan más o igual a 103 nuevos soles.
e) 6
) 1 (
H = 75% de los trabajadores ganan menos de 124 nuevos soles.
f) 5
) 2 (
H = 60% de los trabajadores ganan más o igual que 110 nuevos soles.
2. Una distribución de frecuencia consta de 5 intervalos de igual amplitud y de ella se conoce los siguientes datos: n=110; limite inferior de la 1ª clase 12.5; f4-f5=10; f4-f1=0;
f2=f4; f1=f5 y L4f4=975, donde L4 es el limite superior de la cuarta clase.
Elaborar la tabla de frecuencia
i Intervalo fi hi Pi % 1 [ 12.5 - 17.5 [ 20 0.1818 18.18 2 [ 17.5 - 22.5 [ 30 0.2727 27.27 3 [ 22.5 - 27.5 [ 10 0.0909 9.091 4 [ 27.5 - 32.5 [ 30 0.2727 27.27 5 [ 32.5 - 37.5 ] 20 0.1818 18.18 TOTAL 110 1.0000 100.00 100 100 10 10 0 10 10 1 4 4 1 4 2 5 1 5 4 2 1 3 3 1 4 1 3 4 1 4 5 1 5 4 f f f f f f y f f Si f f f f f Si f f f f f f Si f f f f y f f Si
Entonces:
50
100
)
(
2
100
2
2
1 4 1 4 1 4
f
f
f
f
f
f
30
30
10
50
2 2 4 4 1 4 1 4
f
f
f
Si
f
f
f
y
f
f
Si
Luego f1 f5 205
.
32
30
975
975
4 4 4f
L
L
Si
Entonces5
4
20
0
.
20
5
.
12
5
.
32
4
a
R
Luego los intervalos de clases son: 12.5 + 5 = 17.5
17.5 + 5 = 22.5 22.5 + 5 = 27.5 27.5 + 5 = 32.5 32.5 + 5 = 37.5
AVILA A., Roberto. Estadística Elemental. Editorial R.A. Lima, 1998.
CALZADA B., José. Estadística General. Editorial Jurídica S.A., Lima, 1966. JONSON, Robert. Estadística Elemental, Editorial Trillas. 2ª edición. México. 1991. MOOD, Alexander M. Introducción a la Teoría Estadística. Editorial Aguilar. Madrid 1972. MOYA, Rufino. Estadística Descriptiva. Editorial San Marcos. Lima 1991.
VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias Graficas S.A. 2ª Edición. Lima 1993.
En el siguiente fascículo se calculará los estadígrafos de posición o de tendencia central y se explicara las características y empleo de estas medidas.
Nº 2
Nombre____________________________________________________ Apellidos______________________________Fecha _______________ Ciudad_______________________________Semestre______________
1. Se realiza una encuesta a los alumnos de la UPLA acerca de la preferencia de marcas de gaseosas, los resultados fueron los siguientes:
PE IK KR PE PE IK IK PE CC CC IK PE IK IK PE PE KR CC IK KR O KR CC KR IK PE PE IK O CC PE O PE PE CC CC KR CC PE IK IK IK CC PE KR IK IK PE PE CC Donde
IK= Inca Kola PE= Pepsi O= otras
CC= Coca Cola KR= Kola Real a) Construya una tabla de frecuencia
b) ¿Qué porcentaje de estudiantes de la UPLA prefiere Kola Real? c) ¿Cuántos estudiantes prefieren otras gaseosas?
d) Realizar un tipo de grafico
2. los siguientes datos muestran velocidades en km/h de 48 carros que pasaron por un punto de control de velocidad.
60 30 31 60 45 34 54 38 35 27 45 40 45 83 30 40 46 105 29 102 60 82 72 63 36 70 31 81 65 80 25 70 108 24 85 45 120 65 39 83 72 60 70 100 55 50 64 61
a) Elabore una tabla de frecuencia.
b) Que significa:
f
4; h5; F(31); F(25); H(41); H(51)3. Los puntajes de una aprueba de aptitud se tabularon en una distribución de frecuencias de 6 intervalos de amplitud constante. Si las marcas de clases del segundo y cuarto intervalo son 40 y 80, las frecuencias relativas están relacionadas de la siguiente manera: del primero es igual al sexto intervalo, la tercera y quinta frecuencia son iguales, la cuarta frecuencia es igual a 0.25, del segundo intervalo es igual al cuarto menos el primero, el tercer intervalos es igual al primero mas 0.10 y la frecuencia absoluta acumulada del sexto intervalo es igual a 60.
MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL (I)
En el fascículo anterior aprendimos a construir tablas y gráficos donde se usaba datos brutos. Las representaciones resultantes de las distribuciones de frecuencia nos permitieron discernir las tendencias y patrones de datos.
Los valores mas caracterizados corresponden a la parte central de la distribución, pero entre ellas iniciamos en este fascículo la Media o promedio aritmético, la mediana y la moda.
- Calcula e interpreta la media aritmética, la mediana y la moda. - Explica las características y propiedades de las medidas. - Relación de media, la mediana y la moda.
Las medidas de centralización son valores que tienden a situarse en el centro del conjunto de datos ordenados según magnitud.
1. La Media o Promedio Aritmético
La media es el valor representativo de la serie; pudiera decirse que es el punto de equilibrio o centro de gravedad de la serie.
Se representa por
x
para una muestra y
para la poblaciónLa Media simple n x x x x n x x n n i i
1 1 2 3 Ejemplo: x: 18, 24, 45, 12, 89, 1233
.
33
6
12
89
12
45
24
18
x
La Media Ponderada n f x x n i i i
1 Ejemplo:x: es la talla de 65 obreros de una empresa, se quiere saber cual es la estatura promedia. i Xi(metros) fi xifi 1 1.55 3 4.65 2 1.60 8 12.8 3 1.65 22 36.3 4 1.70 17 28.9 5 1.75 10 17.5 6 1.80 5 9.00 65 109.15 . 68 . 1 679 . 1 65 15 . 109 1 mt x n f x x n i i i
El promedio de la estatura de los obreros de la empresa, es de 1.68 metros.
Propiedades de la Media Aritmética
a) La media de una constante es la misma constante.
c
c
b) La media del producto de una constante por una variable es igual al producto de la constante por la media de la variable.
x
c
cx
c) La media de una variable mas o menos una constante, es igual a la media de la variable mas o menos la constante.
c
x
c
x
d) La media de la suma o diferencia de dos o mas variables e igual a la suma o diferencia de las medias de cada una de las variables.
y
x
y
x
3.1
1. Las edades de los componentes de una familia de 7 miembros, es como sigue: 52, 42, 26, 24, 13, 8 y 1 años, se pide determinar el promedio de edad de esta familia.
2. Hallar el salario promedio correspondiente a los trabajadores de cierta fabrica, extrayendo datos de la tabla de frecuencia:
i Salario(S/.) fi xi xifi 1 [ 70 - 80 [ 20 2 [ 80 - 90 [ 30 3 [ 90 - 100 [ 60 4 [ 100 - 110 [ 90 5 [ 110 120 [ 100 6 [ 120 130 [ 85 7 [ 130 140 [ 70 TOTAL
2. Mediana
La mediana es el punto medio de un conjunto de datos; o es aquel valor de la variable que divide al conjunto de valores en dos partes iguales.
Características de la Mediana
a) Localiza mejor el centro de distribución para lo cual es necesario ordenar. b) Su cálculo es fácil y poco sensible a los valores extremos.
c) Puede ser calculado inclusive cuando los intervalos son abiertos.
d) Pueden ser calculados cuando las variables son cualitativos, susceptibles de ordenar de acuerdo a alguna propiedad, categoría, etc.
e) No puede ser manejada algebraicamente para cálculo posteriores. f) Se halla inclusive cuando las amplitudes son diferentes.
La Mediana simple o No Agrupados
a) Datos Impar
1
xn
Ejemplo:
Se tiene los gastos de 7 personas siguientes:
x: s/. 120, s/. 140, s/. 100, s/. 150, s/. 145, s/. 135, s/. 160 Calcular la mediana.
Solución PASOS:
1º. En la mediana se ordenan los datos:
x: s/. 100, s/. 120, s/. 135, s/. 140, s/. 145, s/. 150, s/. 160 2º. En datos impar se toma el valor centradle acuerdo a la formula.
140 . / 4 2 1 7 2 1 S n x x x Me
Interpretación: el 50% gastan menos de s/140 y el otro 50% restante gasta mas de s/140 b) Datos Par 2 2 2 2 1 n n x x Me Ejemplo:
Se tiene los pesos de 8 personas siguientes: x: 70, 65, 83, 62, 94, 75, 79, 86 kg
Calcular la mediana. Solución
PASOS:
1º. Se ordenan los datos
x: 62, 65, 70, 75, 79, 83, 86, 94 kg 2º. Se aplica la formula
Kg
Me
x
x
Me
x
x
x
x
Me
n n77
2
154
79
75
2
1
2
1
2
1
2
1
5 4 2 2 8 2 8 2 2 2
Interpretación: el 50% de personas pesan menos de 77kg y el restante 50% pesan mas de 77kg.
La Mediana Agrupada o Ponderado
k k f F n a Li Me ) 1 ( 1 2
Li = limite inferior de la clase mediana
a
= intervalo de clasen
= número de elementos (tamaño de la muestra)) 1 ( 1 k
F
= frecuencia absoluta acumulada ascendente anterior a la clase mediana.k
f = frecuencia absoluta de la clase mediana.
Pasos Para Hallar la Mediana
1º. Determinar la clase mediana, a través del cociente de
2
n
cuyo resultado se la ubica en la frecuencia acumulada absoluta ascendente
F
(1), que le contenga mas próximo.2º. determinar la amplitud del Intervalo “
a
”, restando el Limite superior menos el Limite inferior de la clase mediana.Li Ls a
O si se tuviera la marca de clase, restar una de ella con respecto al siguiente inmediato.
i i
X
X
a
1
3º. Determinar en la clase mediana el Límite inferior del intervalo o clase.
Li
Ls
Si solo tuviera la marca de clase xi entonces el límite inferior seria:
2
a
Xi
Li
i
x = valor de la marca de clase de la clase mediana.
4º. Determinar la Frecuencia Acumulada Absoluta ascendente anterior a la clase mediana
F
k(11)5º. Determinar la frecuencia absoluta simple de la clase mediana fk 6º. Remplazar los valores en la formula de la mediana.
Ejemplo:
Se tiene la tabulación de los pesos en kg., de 110 obreros de una fabrica se pide determinar la mediana. Peso i x fi
F
(1) 50 5 5 55 15 20 60 28 48
F
k(11) 65 22 70Clase mediana
70 19 89 75 11 100 80 10 110 110 k k f F n a Li Me ) 1 ( 1 2 PASOS 1º.55
2
110
2
n
55 esta contenido
F
(1)
70
este determina la clase mediana. 2º. axi1xi x11x1x2x1 5 50 55 a 3º.2
a
x
Li
i
5
.
2
65
2
5
65
Li
Kg
Li
62
.
5
4º. (1)48
1
kF
5º. fk 22 6º.
22
48
55
5
5
.
62
Me
Kg
Me
64
.
09
64
.
1
Interpretación: el 50% de los obreros pesan menos de 64.1 kg y el otro 50% de los obreros pesan mas de 64.1 kg
3.2
1. Hallar la mediana de los salarios mensuales de 6 trabajadores: s/1000, s/1300, s/1100, s/1150, s/1200, s/970
2. hallar la mediana de las alturas de 100 alumnos de la UPLA Altura (m) Intervalo fi
F
(1) [ 1.57 - 1.61 [ 4 [ 1.61 - 1.65 [ 28 [ 1.65 - 1.69 [ 43 [ 1.69 - 1.73 [ 18 [ 1.73 - 1.77 ] 7 TOTAL 1003. La Moda
La moda es el valor de la variable que mayor veces se repite o con mayor frecuencia sucede.
Un grupo de datos puede tener una moda, dos modas, etc. En tales casos la distribución se llama, respectivamente, unimodal, bimodal, etc. También, la moda puede no existir, en caso de haber valores que se repitan.
3.1. La Moda Serie Simple
Ejemplo:
El número que más veces se repite es 5. Por consiguiente, 5 es la moda (unimodal).
Ejemplo:
Hallar la moda de los números 2, 3, 4, 5, 6, 7, 8
Ningún número se repite más que los otros. Por consiguiente, no hay moda. Ejemplo:
Las calificaciones de un estudiante en 8 asignaturas fueron: 6, 5, 7, 6, 8, 5, 9, 10 Hallar la moda de las calificaciones.
Las calificaciones que más veces se repiten son 5 y 6. Por consiguiente, 5 y 6 son las calificaciones moda (bimodal)
3.2. La Moda serie Ponderada o agrupada:
2 1 1
Li
a
Mo
Li = Limite inferior de la clase modal
a
= Amplitud del intervalo de clase1
= Variación 12
= Variación 2Pasos Para Hallar la Moda
1º. Determinar la clase modal, a través de la frecuencia absoluta simple mayor.
2º. Determinar la amplitud del intervalo “
a
” restando el limite superior menos el limite inferior de la clase modal.Li Ls a
O si se tuviera la marca de clase, restar una de ella con respecto al siguiente inmediato.
i i
X
X
a
1
Li
Ls
Si solo tuviera la marca de clase xi entonces el límite inferior seria:
2
a
Xi
Li
i
x = valor de la marca de clase de la clase modal.
a
= amplitud del intervalo4º. Determinar la variación 1,
1, restando el valor de la frecuencia absoluta simple de la clase modal menos la frecuencia de la clase anterior inmediata.1 1
fMo fMo
5º. Determinar la variación 2,
2, restando el valor de la frecuencia absoluta simple de la clase modal menos la frecuencia de la clase posterior inmediata.1 2
fMo fMo
6º. Remplazar los valores en la formula. Ejemplo:
Las temperaturas tomadas en la ciudad de Huancayo, cada semana, durante un año, hallar la temperatura Moda.
Temperaturas (ºC) fi 5 12 10 8 15 16
Clase modal
20 7 25 5 30 4 2 1 1
Li
a
Mo
PASOS1º. La clase modal queda determinada por la frecuencia absoluta simple que mas veces se repite, en este caso es 16.
2º. axi1xi x31x3x4x3 5 15 20 a 3º.
2
a
x
Li
i
5
.
2
15
2
5
15
Li
C
Li
12
.
5
º
4º. 1 fMo fMo18
16
1
8
1
5º. 2 fMo fMo17
16
2
9
2
6º. Reemplazando en la fórmulaC
Mo
Mo
º
85
.
14
9
8
8
5
5
.
12
Interpretación: la temperatura que mayor veces se repite en el año es 14.85ºC
Cuando en una frecuencia absoluta simple ( fi) existen 2 o mas frecuencias mayores iguales, se toma cualquiera para determinar la clase modal.
3.3
1. Al finalizar sus estudios de Derecho, 60 estudiantes tenían 22 años, 50 tenían 23 años, 17 tenían 24años, y 8 tenían 25 años. Hallar la moda de las edades.
Intervalo fi [ 220 - 240 [ 48 [ 240 - 260 [ 60 [ 260 - 280 [ 60 [ 280 - 300 ] 30 TOTAL 198
4. Relacion Entre el Promedio Aritmético, Mediana y Moda
a) Para curvas de frecuencias unimodales que sean ligeramente asimétricas, se tiene la siguiente relación empírica:
)
(
3
x
Me
Mo
x
b) Cuando la curva de frecuencia es unimodal y simétrica:
Mo
Me
x
c) La Media aritmética esta influenciada por los valores extremos, en cambio la Mediana y la Moda no lo están.
d) Una curva de distribución solo tiene una
x
y una Me , pero puede tener mas de unaMo .
Reforzamiento de Aprendizaje
1. La inversión anual ( en niveles de soles) de un grupo de pequeñas empresas de la ciudad fueron: 10 38 30 16 25 30 30 18 23 25 38 13 21 14 27 14 13 18 30 25 18 37 12 10 15 20 28 26 10 17 26 28 17 14 19 22 11 15 20 39 23 38 Calcular: a) Media b) Mediana c) Moda
Solución
Tenemos que desarrollar una tabla de frecuencia 1º. R X max Xmin 29 10 39 R 2º.
m
1
3
.
322
log
n
42
log
322
.
3
1
m
6 4 . 6 m 3º.6
29
m
R
a
83 . 4 a 4º.D
(
m
a
)
R
29
)
83
.
4
6
(
D
02 . 0 29 98 . 28 DPor ser negativo se rehace Entonces a 4.84
29
)
84
.
4
6
(
D
02
.
0
02
.
0
04
.
0
29
04
.
29
D
Resumen: 6 84 . 4 02 . 39 max 98 . 9 min m a X X Tabla de Frecuencia -0,002 9.98 10 +0,002 39 39.02Intervalo Tabulación fi
F
(1) Xi Xifi [ 9.98 - 14.82 [ ||||| 10 10 12.40 124.00 [ 14.82 - 19.66 [ ||||| |||| 9 19 17.24 155.16 [ 19.66 - 24.5 [ ||||| | 6 25 22.08 132.48 [ 24.5 - 29.34 [ ||||| ||| 8 33 26.92 215.36 [ 29.34 - 34.18 [ |||| 4 37 31.76 127.04 [ 34.18 - 39.02 ] ||||| 5 42 36.60 183.00 TOTAL 42 937.04 Luego, calculamos: a) La Media n f x x n i i i
1 En la tabla determinamos
xifisoles
de
miles
x
x
31
.
22
42
04
.
937
Interpretación: la inversión anual de las pequeñas empresas de la ciudad fue de 22.31 (miles de soles) = s/22,310.00 b) La Mediana k k f F n a Li Me ) 1 ( 1 2
21
2
42
2
n
Determina la clase mediana en
F
(1) de la tabla que es 256 19 66 . 19 84 . 4 ) 1 ( 1 fk F Li a k
soles
nuevos
de
miles
Me
Me
27
.
21
6
19
21
84
.
4
66
.
19
Interpretación: el 50% de las pequeñas empresas invierten menos de s/21,270.00 y el otro 50% invierten más de s/21,270.00 c) La Moda 2 1 1
Li
a
Mo
Determinamos la clase modas en fi mayor = 10
1 9 10 10 0 10 98 . 9 84 . 4 2 1 Li a
soles
de
miles
Mo
Mo
38
.
14
1
10
10
84
.
4
98
.
9
Interpretación: la inversión mas frecuente es de 14.38 (miles de soles) = s/14,380.00
AVILA A., Roberto. Estadística Elemental. Editorial R.A. Lima, 1998.
CALZADA B., José. Estadística General. Editorial Jurídica S.A., Lima, 1966. JONSON, Robert. Estadística Elemental, Editorial Trillas. 2ª edición. México. 1991. MOOD, Alexander M. Introducción a la Teoría Estadística. Editorial Aguilar. Madrid 1972. MOYA, Rufino. Estadística Descriptiva. Editorial San Marcos. Lima 1991.
VELIZ C., Carlos. Estadística: Aplicaciones. Editorial Servicios Copias Graficas S.A. 2ª Edición. Lima 1993.
En el siguiente fascículo continuamos con medidas de posición, como otros promedios, cuartiles, deciles y percentiles.
Nº 3
Nombre____________________________________________________________ Apellidos_________________________________________Fecha ______________ Ciudad _______________________________________Semestre______________
1. En el departamento de producción de una fábrica tienen los siguientes sueldos hasta fines del mes de julio.
Sueldo Mensual (S/.) Empleados
485 - 585 15 585 - 685 25 685 - 785 30 785 - 885 20 885 - 985 5 985 - 1085 5 TOTAL Calcular e interpretar: a) La Media b) La Mediana c) La Moda d)
2. Los siguientes datos dan las cantidades gastadas (en nuevos soles) en alimentación de una muestra de familia.
22.7 7.6 29.5 15.19 31.9 19.9 26.6 16.2 27.9 23.2 24.6 30.9 5.0 32.1 4.0 47.4 24.0 17.0 15.1 18.8 29.9 34.2 43.4 57.0 12.3 33.7 27.1 36.3 25.0 17.7 27.9 20.5 32.5 27.8 42.9 18.1 32.0 29.7 19.2 10.0 30.3
Calcular e interpretar: a) La Media b) La Mediana c) La Moda
3. De un total de 100 números, 15 eran 4; 45 eran 5; 25 eran 6; 15 eran 7 Calcular:
a) La Media b) La Moda c) La Mediana
MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL (II)
Continuando con las medidas de tendencia central, en el presente fascículo se desarrolla otros tipos de promedios como la geométrica y la armónica, luego complementaran con otras medidas como cuartiles, deciles y percentiles cuyos valores dividen a la distribución en grupos de igual numero de términos.
- Identifica y aplica los medios geométricos y armónica. - Reconoce y calcula los conceptos de cuartil, decil y percentil.
1. Media Geométrica
El promedio geométrico se usa cuando hay que promediar razones o proporciones. Asimismo, se aplica cuando en la serie interviene el factor tiempo, como sucede en el cómputo de intereses; en el cálculo de números índices y en series que presentan una progresión geométrica.
La media geométrica de una serie de n números es la raíz enésima del producto de dichos números. n n x x x x g X 1 2 3 Ejemplo:
Hallar la media geométrica de los números 3, 9 y 27
9
729
27
9
3
3 3
g
X
g
X
g
X
Para simplificar los cálculos es necesario aplicar logaritmos (recuérdense que con logaritmos, la multiplicación se transforma en suma y la raíz en división).