co como SPSS e incluso las funciones estadísticas de Excel.
Se recomienda que la sesión presencial se aproveche con un
taller práctico en el computador preparado por su profesor.
MEDIDAS DE TENDENCIA CENTRAL
En la unidad anterior vimos formas de presentar la información y a partir de ellas podemos con- cluir que:
Los métodos gráficos son muy útiles para obte- ner una descripción rápida y general de los da- tos coleccionados y para presentarlos. Esto apo- ya, en muchos aspectos, el dicho de una figura vale mas que mil palabras.
Por ejemplo, supóngase que deseamos discutir nuestros datos con un grupo de personas y que solamente podemos discutir los datos verbal- mente. Estaríamos obligados a utilizar otras me- didas descriptivas, al no poder presentar el his- tograma visualmente, que transmitirían a los interlocutores una imagen visual del histograma.
Una segunda limitación, no tan obvia del histo- grama y de otras técnicas gráficas, es que son difíciles de usar para hacer inferencias estadísti- cas. Utilizamos probablemente el histograma muestral para hacer inferencias acerca de la for- ma y posición del histograma poblacional, que describe la población y que desconocemos. Nuestra información se basa en la suposición correcta de que existirá cierto grado de similitud entre ambos histogramas, pero nos enfrentamos entonces al problema de medir el grado de simi- litud. Sabemos cuando dos figuras son idénti- cas, pero esta situación no se presenta proba- blemente en la práctica.
* Si los histogramas de la población y la muestra difieren, ¿Cómo podemos medir el gra-
do de diferencia o, concretamente, el grado de simi- litud?
Se pueden superar las limitaciones del método grá- fico para describir datos, utilizando medidas descrip- tivas numéricas. Las medidas de esta clase para una población se llaman parámetros. Las medidas des- criptivas numéricas obtenidas a partir de una mues- tra, se denominan estadísticos.
Con los histogramas y polígonos se puso en eviden- cia un significativo comportamiento de los datos en cuanto a la frecuencia con que se presentan los va- lores: algunos de estos valores son más frecuentes que otros. Además, se observó una clara tendencia de agrupación en el vecindario de los valores más frecuentes, haciendo que las curvas representativas adquirieran formas de campana. Por lo general, la mayor densidad de frecuencia está en la parte cen- tral de las gráficas, de aquí deriva el nombre de me- didas de tendencia central. En estadística es cos- tumbre usar letras griegas para designar los parámetros y las últimas letras minúsculas del alfa- beto para los estadísticos.
4
Tendencia CentralMedida de tendencia central (o de posición) es toda aquella que indica el valor esperado de un punto de datos típico o situado en el medio. Cantidades numéricas que dan una idea sobre la ubicación de la distribución de frecuencias.
* Si consideramos la variable, años de vida al morir de los colombianos varones, ¿existe algún valor de la variable que represente la mayoría de los valores del conjunto de datos? ¿Qué significado tiene la esperanza de vida al nacer de un co- lombiano varón?
Media. Medida de tendencia central que representa el prome- dio aritmético de un conjunto de observaciones. La media para la población (parámetro) la simbolizamos como s y para la muestra (estadístico) la simbolizamos como
Para calcular la media de datos no agrupados simplemente su- mamos todos los datos y el resultado lo dividimos por el nú- mero total de estos, así:
Ejemplo. La media de los números 8, 3, 5, 12 y 10 es:
Para datos agrupados, el numerador de la expresión cambia. La sumatoria no es de cada dato, sino de los productos de las marcas de clase por las frecuencias absolutas.
Mediana. Punto situado a la mitad de conjunto de datos, medida de localización que divide al conjunto de datos en dos partes iguales. Se simboliza frecuentemente como Me.
Para calcular la mediana de datos no agrupados necesitamos ordenarlos y tomar de estos, el más central. Si tenemos un grupo de 11 datos ordenados, la mediana será el 6°. Si tenemos 16 datos ordenados, la mediana será el promedio entre los datos 8° y 9°. Esa regla se aplica en general para cantidades impares y pares
Ejemplo. La mediana de los números 8, 3, 5, 12 y 10 es 8. Vea- mos.
3, 5, 8, 10,12 es claro que 8 es el más central.
Para datos agrupados la mediana está dada por
Donde:
L1 Limite inferior de la clase mediana. N Número de datos.
( f)1 Suma se frecuencias de las clases inferiores a la clase mediana.
fMe Frecuencia de la clase mediana
c ancho del intervalo de la clase mediana.
La clase mediana es aquella en la cual se completa el 50% de los datos. Esto es facil mirarlo en las frecuencias relativo - acumula- das.
Geométricamente la mediana es el valor de X (abscisa) que corres- ponde a la recta vertical que divide un histograma en dos partes de igual área.
Moda. El valor que más a menudo se repite en un conjunto de datos. Está representado por el punto más alto de la curva de distribución de un conjunto de datos. Se simboliza frecuentemen- te como Mo. La moda puede no existir, e incluso no ser única en caso de existir. Una distribución con moda única se llama unimo- dal.
En el caso de los datos agrupados donde se haya construido una curva de frecuencias para ajustar los datos, la moda será el valor (o los valores) de X correspondiente al pico máximo (o máximos) de la curva. A partir de una distribución de frecuen- cias puede deducirse con la ecuación
4
Tendencia CentralDonde:
L1 Limite inferior de la clase modal fi Frecuencia absoluta de la clase modal
fi-1 Frecuencia absoluta de la clase anterior a la clase modal
fi+1 Frecuencia absoluta de la clase posterior a la clase modal
C Ancho del intervalo de la clase modal
Retomando el ejemplo del capítulo anterior referente a las es- taturas de los deportistas, miremos en que consisten las medi- das de tendencia central.
Para la media tenemos:
La mediana será:
De las medidas de tendencia central, la media es la única que se presta a tratamientos algebraicos, con los que se demues- tran varias propiedades de la media. También es posible obte- ner medias ponderadas de varias medias. Ejemplo. Durante diciembre un pequeño empresario vendió lechones a negocios en tres sectores de la ciudad, en el sector A vendió 35 a un precio promedio de $320.000, en el sector B vendió 19 por un precio de $286.500 y en el sector C vendió 9 por un precio promedio de $336.000. Calcular el precio promedio por le- chón del total de las ventas del microempresario.
Evaluemos la siguiente situación, si tenemos los siguientes da- tos 3, 5, 7, 7, 8 que corresponden a la edad en que entran a la escuela los niños de una pequeña aldea, la media es (3+5+7+7+8)/5=6;
* ¿Es el 6 un valor que puede representar a los demás? ¿Tiene coherencia decir que los niños de esta aldea inician el estudio en la escuela alrededor de los seis años?
Si cambiamos el valor extremo 8 por 23, los datos serán 3, 5, 7, 7, 23, cuya media es (3+5+7+7+23)/5=9.
* ¿Podremos ahora decir que el 9 puede representar a los demás valores? ¿Tiene coherencia decir que las personas de esta aldea inician el estudio en la escuela alrededor de los nueve años?
* ¿Qué podemos concluir acerca de la media? * ¿Cuál es la mediana de las dos series?
* ¿Qué podemos decir entonces ahora acerca de la mediana?
De las tres medidas de tendencia central que hemos estudiado, la media aritmética es muy sensible a los valores extremos, en tanto que la mediana y la moda no lo son. En el ejemplo anterior que la mediana por ser insensible a los valores extremos no varió al cambiar 8 por 18 y fue 7 en ambas series. La moda en ambas series también es 7 por ser el valor más frecuente.
4
Tendencia CentralDebido a la gran sensibilidad de la media a los valores extre- mos, a veces resulta que su valor produce efectos engañosos. Así, por ejemplo, si se está estudiando el ingreso diario de un grupo de personas y se tienen los valores 320, 400, 400, 400, 450, 500, 550, 2000, 2900, a esta serie le corresponde:
Media 880
Mediana 450
Moda 400
Se observa que solo dos personas tienen ingresos altos y las siete restantes tienen salarios de 550 o menos, o sea que en este caso la media resultó atípica. La media de 450 y la moda de 400 resultan más representativas para esa distribución. El conocimiento de las tres medidas de tendencia central da una buena apreciación de la distribución de los valores. Pero si se debe hacer una apreciación con una sola medida, es mejor usar la mediana que corresponde al valor del medio.
La siguiente gráfica nos muestra la ubicación de las medidas en una curva de distribución de frecuencias.
Figura 4.1. La curva de distribución de frecuencias y las medidas de tendencia central.
En la gráfica verificamos que:
La media aritmética es un punto de equilibrio, similar al centro de gravedad,
La gráfica nos muestra una distribución que no es simétrica lo cual hace que las tres medidas no se ubiquen en el mismo lugar. En una distribución simétrica las tres medidas de tendencia cen- tral son idénticas, y si la distribución se torna asimétrica no se produce cambio en la moda; la mediana y la media se corren en dirección de la asimetría. La asimetría es positiva hacia la derecha y negativa hacia la izquierda. En la simetría positiva la mediana aumenta por el mayor número de frecuencias hacia la derecha y la media aumenta mas, ya que hay un aumento en la frecuencia y el valor de las observaciones. En las asimetrías negativas ocurre lo contrario: la mediana disminuye y la media disminuye mas que la mediana.
Al elegir la medida mas adecuada debemos recordar que:
* La medida de tendencia central que se debe utilizarse depende de la información que se tenga y el objetivo que se persiga.
* Si la distribución es aproximadamente simétrica, pueden utilizarse indistintamente las tres medidas, que resultan aproximadamente iguales.
* Si los datos no están ordenados, puede resultar más fácil el cálculo de la media aritmética que el de la mediana; la moda se encuentra por simple búsqueda del valor más frecuente.
* Si los datos son irregulares y hay lagunas en los valores de la clase mediana, esta medida de tendencia central no resulta muy buena ya que su ubicación puede resultar falsa.
* Si desea calcular totales, la única medida utilizable es la media aritmética. Así, si basados en una experiencia deseamos conocer en una empresa el posible gasto de energía eléctrica para el periodo futuro, la única medida utilizable es la media. * Si deseamos ubicar las condiciones de una persona en una clase, la mediana resulta
la medida más indicada ya que por comparación pone en evidencia si la persona esta por sobre la mitad o por debajo de ella.
Media Geométrica. Es útil en el cálculo de tasas de crecimiento y se define como la raíz n-ésima del producto de N términos positivos.
4
Tendencia CentralEn este ejemplo se han usado los valores de la variable que va creciendo, para obtener el valor nominal de crecimiento promedio. Sin embargo, también se pueden usar los valo- res porcentuales de las tasas de crecimiento, expresando por ejemplo porcentajes de crecimiento continuo de 5%, 17%, 12% y 20% como 1,05; 1,17; 1,12 y 1,20 como fac- tores dentro de la raíz. Véanse el ejercicio resuelto No. 1 del presente capítulo.
Recuerde que la extracción de una raíz se puede expresar como una potencia del exponente fraccionario. Esta opera- ción es muy fácil de hacer con la calculadora usando la tecla Xy o la tecla X1/y.
La Media Armónica. Esta medida de una serie de números es el recíproco o inverso de la media aritmética de los recípro- cos de los números de una serie. Se usa para encontrar mode- los o comportamientos tipo, para ser utilizados en la elabora- ción y evaluación de proyectos.
Ejemplo. La media armónica de los números 2, 4 y 8 es
Para la media armónica de datos agrupados se tiene la siguiente ecuación.
La media geométrica de una colección de números positivos es menor o igual que su media aritmética, pero mayor o igual que su media armónica.
La Media Cuadrática. Es un tipo de promedio que se utiliza frecuentemente en las aplicaciones físicas.
Ejemplo. La media cuadrática del conjunto 1, 3, 4, 5 y 7 es
MEDIDAS DE POSICION RELATIVA.
Percentiles, Cuartiles, Deciles.
A veces se desea conocer la posición que tiene una observación respecto de un conjunto de datos. Por ejemplo si se presentó un examen de admisión y se obtuvo una calificación de 640, intere- saría conocer el porcentaje de participantes que obtuvieron una calificación menor que 640. Tal medida de posición relativa den- tro de un conjunto de datos se llama centil o percentil.
Si un conjunto de datos esta ordenado por magnitud, el valor central que divide al conjunto en dos partes iguales es la mediana. Extendiendo esa idea, la medida que divide el conjunto en cuatro partes iguales, es el cuartil. Los cuartiles se denotan como Q1, Q2 y Q3. El Q2 coincide con la mediana Me.
Análogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles, y se denotan D1, D2, ..., D9, mientras que los valores que los dividen en 100 partes iguales son los que ya llamamos percentiles.
El decil 5 y el percentil 50, coinciden con la mediana. Los cuartiles 1 y 3 coinciden con los percentiles 25 y 75 respectivamente.
Ejemplo. Para la distribución de frecuencia correspondiente al grupo de deportistas tenemos que el primer cuartil tendrá el siguiente número de observaciones
4
Tendencia CentralEl primer cuartil cae en el intervalo de clase 138.5 – 143.5; hay 14 deportistas en las tres clases anteriores, es decir, para com- pletar los 27 de Q1 debemos hacer una interpolación lineal para los 13 que faltan así:
En la clase que contiene el cuartil hay 24 observaciones en un ancho de 5 centímetros.
1 observación corresponde a 5/24 centímetros; 13 corresponden a 13(5/24)=2.7 centímetros
Tomamos entonces el límite inferior de la clase, hasta donde sabemos que hay 14 observaciones y le agregamos la medida correspondiente a los 13 restantes.
138.5 + 2.7 = 141.2 centímetros.
El primer cuartil es de 141.2 centímetros y quiere decir que el 25% de los deportistas tiene una estatura de 141.2 centíme- tros o inferior.
El segundo cuartil que equivale a la mediana, lo podemos ob- tener así:
Se ubica en el intervalo 143.5 – 148.5 de manera que
Hasta 148.5 se encuentra el 62.0 % Hasta 143.5 se encuentra el 35.2 % Restando 5 centímetros corresponden a un 26.8 %
Podemos hallar cuantos centímetros corresponden al 50 % - 35.2 % = 14.8 % y sumárselos a los 143.5 centímetros del límite inferior.
Podemos también hallar cuantos centímetros corresponden a 62.0 % - 50 % = 12 % y restárselos a los 148.5 centímetros del límite superior. En este caso parece ser la opción más fácil. Si lo hacemos en un paquete estadístico, estos cálculos pierden significado, sin embargo el practicarlos y descifrarlos nos ayudan a enten-
Si 26.8 % corresponden a 5 centímetros; 1 % corresponde a 5/ 26.8; 12% corresponde a 12(5/26.8)=2.24
Restamos entonces a 148.5 - 2.24 = 146.26 que es el mismo valor que habíamos obtenido anteriormente con una fórmula para la mediana. Existen ecuaciones para calcular todos los deciles, cuartiles y percentiles, sin embargo como estos los aplica el programa contable en forma oculta, resulta valioso el proce- dimiento anterior para captar el significado de la medida.
Obtuvimos que Q2 = D5 = P50 = Me = 146.6
* Compare el procedimiento que se usó para calcular Q1 con el que se usó para Q2.
* Vuelva a hacer el calculo pero usando para Q1 el pro ceso usado anteriormente para Q2 y viceversa.
* ¿Que concluimos a cerca del procedimiento?
* Calcule ahora Q3.
EJERCICIOS PROPUESTOS
1. La población de un país creció en los últimos 5 años de 4.200.000 a 4.775.000; halle (a) la tasa de crecimiento total en los cinco años. (b) La tasa de crecimiento anual.
2. Los salarios aumentaron en los últimos 4 años en 8%, 9.6%, 7,75% y 11.3%, halle: (a) la tasa de crecimiento total en los cuatro años; (b) la media anual de crecimiento; (c) la media geométrica anual de crecimiento.
3. En una industria se ha controlado el tiempo que tardan tres obreros en ensamblar un mo- tor. Uno demora 6 horas, otro 8 horas y un tercero demora5 horas. Halle el rendimiento de un obrero tipo que sirva de base para análisis financieros.
4. Una empresa de transportes tiene tres automotores diferentes que emplean en el recorrido entre dos pueblos 16, 15 y 12 horas respectivamente. Halle el tiempo que emplearía un automotor tipo que sirva de base para un estudio de costos.
4
Tendencia Central5. En un concurso de méritos se tienen unas calificaciones de 8 personas en los diferentes aspectos a evaluar, cada aspecto tiene una ponderación y sus valores se indican entre paréntesis. Hallar (a) la media ponderada del grupo, (b) la media de cada concursante y (c) explique si en este caso tendrían alguna utilidad la media armónica, la media geométrica o la media cuadrática.
6. La población de un país aumentó en 4 años de 16.320.430 habitantes a 17.840.210; halle: (a) el porcentaje de aumento en los cuatro años; (b) el promedio geométrico anual.
7. El aumento en el consumo de energía de los usuarios de una empresa del servicio publico de energía eléctrica, fue en los últimos 5 años de: 28%; 12%; 19%; 24%; 22%; halle: (a) el porcentaje del incremento del último año con base en las ventas del servicio en el primer año; (b) el promedio geométrico de incremento anual.
8. La pérdida en el valor adquisitivo de la moneda de un país fue en los últimos 4 años de: 12%, 17%, 14% y 15%; halle: (a) el porcentaje de pérdida del valor del último año con relación al primer año; (b) el promedio geométrico de pérdida anual.
9. En cierta industria se controló la producción de un artículo y se encontró que la produc- ción de tres obreros de una sección fue de 93, 84 y 102 piezas respectivamente; halle la producción de un obrero tipo para esta sección.
10. Halle el valor promedio para el kilogramo de mercancía adquirida en tres lotes así: 340 kilogramos a $2830 cada uno, 260 kilogramos a $3010 cada uno y 535 a $2750 cada kilogramo.
11. Al hacer un estudio del transporte público de una ciudad se midió el tiempo empleado por los buses en el recorrido de cierta ruta y se encontró los siguientes tiempos para los 5 buses asigna- dos al recorrido: 7.3 horas, 6.8 horas, 7.4 horas, 6.4 horas y 7.6 horas; halle el tiempo que se debe asignar a un bus tipo para estudios económicos.
12. Un contratista recibe dos ofertas para pintar un edificio; una cuadrilla de obreros ofrece pintar el edificio en 28 días, otra cuadrilla se compromete a pintarlo en 35 días. El contratista decide entregar el trabajo a las dos cuadrillas para que trabajen simultáneamente. Halle el tiempo que
13. En el municipio de Cota (Cundinamarca) para 1990 había un potencial electoral de 13.875. Unos politólogos deseaban saber cual de las edades representó mayor afluencia en las elecciones presidenciales de ese momento. Se tomó una muestra de 100 personas, teniendo en cuenta su edad dentro del proceso electoral. Esto con el fin de determinar cual fue la edad de los votantes que decidie- ron los resultados de la elección.
Los politólogos obtuvieron los siguientes datos: de 9.680 personas que votaron, se registraron las siguientes edades de 100 personas:
18 18 23 20 19 70 19 47 32 43 43 45 19 20 24 19 21 21 26 20 65 19 71 21 33 18 29 40 19 52 24 23 44 20 34 24 47 29 39 40 21 55 30 21 18 45 41 61 35 35 23 27 33 21 18 19 34 61 37 18 63 38 35 46 41 34 23 36 19 20 26 40 28 40 34 29 39 28 50 48 20 23 20 37 24 32 30 19 30 27 29 53 27 44 32 21 43 23 21 37
* Identifique la población de estudio y la muestra de estudio. * ¿Cuál es la variable que se quiere medir? ¿De que tipo es?
* Elabore una tabla de frecuencias para organizar la información y con base en ella haga un