2.2.5 Medidas de tendencia central
2.2.5.1 Media (una aproximación a la idea de estándar)
Es por excelencia la medida de tendencia central. Su valor es el punto de equilibrio entre los pesos y contrapesos de datos que están por debajo y por encima. La media es el punto en que la balanza no se inclina para ningún lado, el punto justo. Que la media sea por excelencia la medida
45
de tendencia central, no siempre la hace el mejor indicador, pues está sujeta a la variabilidad de los datos. En estadística, la idea de media viene del concepto de centro de masa, empleado en la Física, definida como el promedio de la posición de todas las partes del sistema, ponderadas de acuerdo a sus masas. Supóngase que un estudiante será evaluado y se le dan dos opciones: i) un examen de validación en el cual se le toma una única nota o ii) cuatro exámenes con iguales pesos35 realizados durante todo el semestre. En cualquier caso, el estudiante aprueba con 3.0 en una escala de calificación de 0 a 5. Si el estudiante elige i) la validación, superará el estándar exigido y aprobará la asignatura si en esa nota única obtiene un valor mayor o igual a 3.0. Si elige la opción ii) realizar 4 exámenes, considérese las siguientes notas del estudiante: N1 = 1.7, N2 = 4.5, N3 = 2.3, N4 = 3.5. ¿Cómo saber si supera el estándar exigido? No es fácil saber con esas notas tan variadas si el estudiante aprueba o no la asignatura; podría el lector afirmar que sí porque 4.5 y 3.5 compensan a 1.7 y 2.3. ¿Está seguro de eso? Plantéese lo siguiente: se quiere determinar el promedio global de las notas definitivas de todos los estudiantes de la universidad, que aproximadamente son unos 3000, con el fin de averiguar si en general los estudiantes superan el estándar. ¿Lo estaría si la información recabada consta ahora de 3000 datos? ¿Con qué argumentos afirmar que ese numeroso conjunto de datos se compensan entre sí para finalmente superar el umbral? Imagine una tabla recta, homogénea y simétrica, de 5 unidades de longitud. Su punto de equilibrio está justo en la mitad, en la posición 2.5. Ahí la tabla queda completamente horizontal, no se inclina ni a hacia la izquierda ni a la derecha. Para el caso nos compete un estándar es 3.0. Luego, se ubica la cuña en la posición 3.0. Téngase en cuenta que el número que
35 En el contexto, entiéndase peso como la ponderación o la valoración que se le da a cada nota.
Ejemplo, como son 4 notas, cada una tiene un peso del 25%. Bien podríamos decir que cada nota tiene un peso de 1kgf.
46
representa a cada una de las notas corresponde a una posición en la tabla en donde debe ubicarse cada peso. Lógicamente, si ponemos la cuña en la posición 3, la tabla se desequilibra y se inclina hacia la izquierda. ¿Qué sucede si ponemos los pesos (notas) en sus respectivas posiciones? Si al poner todos los pesos en las posiciones de la tabla y esta se inclina hacia la izquierda, el estudiante pierde; si se inclina hacia a la derecha el estudiante supera el estándar (punto de equilibrio) y aprueba. Si la tabla queda completamente horizontal, el estudiante obtuvo lo justo; la tabla no se inclina ni hacia la izquierda (pierde) ni a hacia la derecha (gana), pero como 3.0 es el estándar, aprueba la asignatura. En matemáticas suele decirse que las cosas más interesantes suceden en la frontera.
En el caso de las 4 notas, si se ubican los pesos en las posiciones correspondientes, la tabla queda completamente horizontal(*); esto equivale a decir que las 4 notas pueden reemplazarse por una sola, ubicada en el punto de equilibrio; esto es, 3.0.
Si se intenta el mismo procedimiento para determinar el punto de equilibrio en el caso de los 3000 datos, sería muy tedioso. Se evita esta
(*)No es objeto de este trabajo demostrar la manera en cómo se llega a esa conclusión, ni la
47
tarea, sumando los datos(*) y dividiéndose por la cantidad de los mismos. La media (o promedio) se denota por una letra testada.
𝑋̅ = 1.7 + 2.3 + 3.5 + 4.5
4 =
12
4 = 3.0
Si el resultado hubiese dado 3.7, indicaría que este es el punto de equilibrio, luego, que el estudiante podría superar hasta un estándar exigido de 3.7; como el estándar es 3.0, con 3.7 estaría sin duda alguna por encima del mínimo exigido. De esta manera, para el segundo caso, se suman los valores de los 3000 datos y el resultado se divide entre 3000.
No siempre la media es el mejor indicador para resumir un conjunto de datos. Si se quiere hallar el promedio de ingresos mensuales de 100 personas, y la mayoría oscila entre 6 y 7 puntos, pero hay uno cuyo puntaje es de un millón (1’000.000), al hallar el promedio, el punto de equilibrio estaría alterado por este valor extremo. No sería razonable afirmar que la mayoría de ingresos giran en torno al dato calculado, por lo cual se dice que la media es sensible a los datos extremos. Por ello, al analizar un conjunto de datos no ha de mirarse una sola arista; debe tenerse en cuenta otros indicadores, como la mediana y la moda, para encontrar apoyo en la toma de una decisión. Por no tener estas consideraciones, han surgido frases como la atribuida a Bernard Shaw36, en la cual se refiere a la estadística como la ciencia que explica que si como dos pollos y mi vecino ninguno, entonces, en promedio, hemos comido un pollo cada uno. Sería como afirmar que, en promedio, nadie
(*) Que han de tener pesos iguales, si no se emplea un procedimiento llamado media ponderada.
No es el caso.
36 AMSTER, Pablo & PINASCO, Juan. Teoría de juegos. Una introducción matemática a la toma
48
sufre de hambre; o la mejor manera de bajar los impuestos en Colombia consiste en bajárselos al sector más rico.
Otra medida de tendencia central, que podría resolver el problema de la existencia de datos atípicos, es la mediana.