En diversas ocasiones los datos que se emplean para determinar una medida estadística no tienen el mismo peso relativo entre sí. Un ejemplo típico sobre este hecho corresponde a las calificaciones que se generan para una asignatura particular en el colegio. En estos casos, hay diferentes tipos de evaluación y todas ellas con valores porcentuales diferentes. Al momento de generar el promedio, no basta con sumar las calificaciones y dividirlas por el número de ellas, sino que se debe ponderar cada calificación con el porcentaje correspondiente.
4
2
Proyecto Reforma de la Educación matemática en Costa Rica, 2015
Actividad 11
En una zapatería se promedian ventas diarias de 8 zapatos de hombre y 12 de mujer. La ganancia
media en los zapatos de hombre es de ₡2000 mientras que en los zapatos de mujer la ganancia media
es de ₡2500.
¿Cuál es el monto correspondiente a las utilidades o ganancias promedio por cada par de zapatos?
Análisis de la actividad 11
Debido a que en promedio se vende un número diferente de zapatos para hombres y para mujeres y que las utilidades medias también son distintas, para determinar la utilidad promedio se deben ponderar las utilidades generadas en zapatos para hombres y mujeres por el número medio de unidades de cada tipo de zapato, de la siguiente manera:
𝑈𝑡𝑖𝑙𝑖𝑑𝑎𝑑 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜=8∙₡2000+12∙₡2500
8+12 =₡2300 Entonces la utilidad promedio por par de zapatos es de ₡2300
Promedio ponderado:
Si se tienen n datos 𝑋!,𝑋!,…,𝑋!, los cuales en un problema particular tienen pesos relativos (o ponderaciones)
diferentes: 𝑊!,𝑊!,…,𝑊! respectivamente. Por ende el promedio debe calcularse tomando en cuenta estas
ponderaciones: 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜=𝑋!∙𝑊!+𝑋!∙𝑊!" …+𝑋!∙𝑊! 𝑊!+ 𝑊!+ …+ 𝑊! = 𝑋!∙𝑊! ! !!! 𝑊! ! !!!
Un ejemplo consiste en el cálculo de un promedio cuando los datos están agrupados en una distribución de frecuencias. En un análisis didáctico anterior se tenía el siguiente cuadro:
Proyecto Reforma de la Educación Matemática en Costa Rica, 2015
4
3
Compañía Hardware: Resultado de la evaluación de una prueba de conocimientos estadísticos básicos a los agentes vendedores de la compañía
Puntajes Puntaje mediode clase (X) Número de Empleados (f) De 60 a menos de 70 65 2 De 70 a menos de 80 75 6 De 80 a menos de 90 85 8 De 90 a menos de 100 95 11 De 100 a menos de 110 105 9 De 110 a menos de 120 115 7 Total 43
La calificación promedio por empleado se determinó de la siguiente forma:
Promedio=2∙65+6∙75+8∙85+11∙95+9∙105+7∙115
43 =
4055
43 =94,3
La fórmula empleada fue la siguiente: P𝑟𝑜𝑚𝑒𝑑𝑖𝑜= !!∙!, la cual es equivalente a la que se ha aplicado en la actividad 11.
Actividad 12
En un estudio para determinar el grado de contaminación sobre la parte alta de la cuenca del el río Tibás en las montañas de San Rafael de Heredia, se analizaron diferentes características contenidas en muestras de agua tomadas en seis sitios seleccionados aleatoriamente y en 10 meses del año 2003. El estudio fue realizado por una funcionaria de la Escuela de Química de la Universidad Nacional. Entre otras cosas, el estudio pretendió determinar la variabilidad en las mediciones generadas de algunas de las variables. Algunas de las variables más importantes consideradas en el estudio son: la cantidad de coliformes fecales y el índice de la calidad del agua, en los mismos términos en que fueron definidas en la actividad 6. Los valores correspondientes a 30 de las muestras se presentan a continuación:
4
4
Proyecto Reforma de la Educación matemática en Costa Rica, 2015
Número de muestra Coliformes Fecales Índice de calidad Número de muestra Coliformes Fecales Índice de calidad 1 5,94 4 16 8,77 4 2 6,66 4 17 9,82 4 3 8,77 3 18 5,87 4 4 8,77 3 19 7,47 4 5 5,87 4 20 5,87 3 6 7,52 4 21 5,87 3 7 11,4 4 22 7,95 3 8 7,47 4 23 7,47 4 9 13,78 5 24 11,4 3 10 9,82 4 25 10,33 4 11 12,07 5 26 14,11 5 12 11,4 6 27 12,57 4 13 8,77 7 28 5,87 5 14 7,47 7 29 9,82 5 15 8,77 7 30 9,82 6
Realice el análisis estadístico necesario para comparar la variabilidad relativa entre la cantidad de coliformes fecales y el índice de calidad de agua.
Análisis de la actividad 12
En los casos en que se desean realizar comparaciones entre dos o más variables, sea en cuanto a su posición o su variabilidad, los valores absolutos no son comparables, ya que la magnitud de los datos o las mismas unidades de medida son diferentes. En este caso se debe recurrir al coeficiente de variación. Los resultados se incluyen en el siguiente cuadro:
Medidas Coliformes fecales Índice de calidad Promedio 8,916 4,4 Desviación estándar 2,417 1,192 Coeficiente de variación 27,107 27,089
La variabilidad relativa es aproximadamente la misma para ambas variables. De acuerdo con los resultados de la muestra, se dice que la variabilidad relativa es similar para el comportamiento de los coliformes fecales y el índice de calidad del agua. Esto quiere decir que la variabilidad de la cantidad de coliformes fecales es congruete con la variabilidad en el índice de calidad de agua.
Proyecto Reforma de la Educación Matemática en Costa Rica, 2015
4
5
Medidas relativas.
Como se ha venido indicando en los análisis didácticos de este documento, cuando se hacen comparaciones entre variables o entre datos debe analizarse el contexto en el que se está trabajando. En casos como el actual, donde la comparación incluye variables cuyos datos no solamente difieren en cuanto a magnitud sino en las unidades de medida, es necesario realizar una comparación relativa. En este tipo de comparaciones se elimina el efecto de la magnitud de los datos y de las unidades de medida. El empleo de porcentajes constituye un ejemplo simple de comparación relativa cuando se trabaja con datos cualitativos. Sin embargo, cuando se desean comparar variables cualitativas, existen medidas relativas para efectuar comparaciones en cuanto a posición o en cuanto a variabilidad. Estas se resumen seguidamente:
Posición relativa:
Cuando se efectúan comparaciones en cuanto a la posición que tienen dos o más valores ubicados en contextos diferentes, se debe eliminar el efecto del contexto; una forma de hacerlo consiste en estandarizar los datos mediante la fórmula:
𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟=𝑃𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛−𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
Variabilidad relativa:
Si se desea comparar la variabilidad que presentan dos o más grupos de datos tomados de contextos distintos, para los cuales hay diferencias por magnitud, unidad de medida o ambas, se requiere eliminar estos efectos. Una medida estadística apropiada para realizar estas comparaciones es el coeficiente de variación:
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛=𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 ∙100
Normalmente se multiplica por 100, para darle un enfoque porcentual a la medida, aunque debe quedar claro que esta medida no representa un porcentaje como tal.
Actividad 13
Suponga que tres empresas producen componentes electrónicos. Son de diferente tamaño y su producción mensual histórica tiene el siguiente comportamiento:
4
6
Proyecto Reforma de la Educación matemática en Costa Rica, 2015
Empresa A Empresa B Empresa C Promedio mensual 140 500 83 200 254 300 Desviación estándar 45 325 33 456 65 350
En el mes de marzo del 2015, las producciones generadas en las tres empresas fueron las siguientes.
Empresa A Empresa B Empresa C Promedio mensual 130 250 77 420 232 450
a) ¿Cuál de las empresas tiene menor variabilidad relativa?
b) En términos relativos, en cuál de estas empresas la producción durante el mes de marzo del 2015
fue mayor?
Análisis de la actividad 13
Para responder la primera pregunta, se debe realizar un análisis similar al efectuado en la actividad 11. Dado que las producciones en las empresas son muy diferentes, no se puede comparar la variabilidad simplemente analizando las desviaciones estándar, se debe hacer una comparación relativa, que elimine las diferencias de magnitud en las producciones de las tres empresas. Por ello se recurre a los coeficientes de variación. Por ello se tiene:
Empresa A Empresa B Empresa C Promedio mensual 140 500 83 200 254 300 Desviación estándar 45 325 33 456 65 350 Coeficiente de variación 32,3 40,2 25,7
En este sentido, la producción de componentes es relativamente más variable en la Empresa B y relativamente menos variable en la Empresa C.
Para comparar la producción en el mes de marzo del 2015 y debido a que los datos no son comparables entre sí, se requiere comparar la producción en este mes con el referente histórico de cada empresa por medio de la estandarización de los datos:
Proyecto Reforma de la Educación Matemática en Costa Rica, 2015
4
7
Producción estándar Empresa A 130 250−140 500 45 325 =−0,23 Empresa B 77 420−83 200 33 456 =−0,17 Empresa C 232 450−254 300 65 350 =−0,33Los valores negativos significan que la producción en marzo estuvo por debajo de la producción histórica promedio. En términos relativos la empresa con mayor producción fue B, aunque su producción absoluta fue la más baja en términos relativos fue la que se apartó menos del promedio.
Análisis didáctico
Las medidas son una de las herramientas estadísticas más empleadas en los análisis de datos, por esta razón el sistema educativo tiene el compromiso de ofrecer una adecuada alfabetización sobre un uso adecuado de ellas. Analice la siguiente situación que se puede plantear a estudiantes de undécimo año:
Problema:
Pilar y Beatriz discuten acerca del rendimiento de sus automóviles con respecto al gasto de combustible. Cada una de ellas indica que su vehículo es más económico, así que deciden medir el rendimiento de sus vehículos en los días laborales (5 días por semana). Al iniciar cada día, llenan completamente el tanque de combustible y miden el kilometraje recorrido. Al día siguiente vuelven a realizar el proceso, determinando para cada día los litros consumidos. Después de dos semanas, tienen información correspondiente a 10 días, la cual se resume en el siguiente cuadro. El experimento se realiza suponiendo que variables como topografía de los trayectos, densidad del tránsito, estilo de manejo y otras, tienen comportamientos similares para los recorridos de ambos vehículos.
4
8
Proyecto Reforma de la Educación matemática en Costa Rica, 2015
Vehículo de Pilar Vehículo de Beatriz Km recorridos Litros consumidos Km recorridos Litros consumidos
28,62 2,37 43,15 4,37 28,68 2,17 34,84 2,54 30,05 2,40 35,99 3,76 30,50 2,62 37,77 3,12 30,73 2,05 38,85 2,96 28,42 2,14 40,92 2,88 27,85 2,13 38,77 4,07 27,26 2,33 38,01 2,71 32,96 2,44 39,36 3,04 29,10 2,02 40,84 3,36
Utilice la información suministrada para determinar cuál de las damas tiene razón sobre el rendimiento de su vehículo.
Este es un problema similar al que se presentó en la actividad 9: los estudiantes tienen que realizar un análisis integral de la información, deben observar tanto la posición como la variabilidad de los datos. Primeramente, deben determinar en cada caso el rendimiento en kilómetros por litro para cada uno de los días observados.
Además de que conlleva muchos cálculos, el problema necesita razonamiento para utilizar y combinar las mejores medidas estadísticas que permitan obtener la respuesta, de manera que pueda estar debidamente argumentada. Al mismo tiempo, para la solución del problema los estudiantes requieren combinar diferentes formas de representación, tanto tabulares como gráficas.
Por otro lado, el problema enlaza con una situación que, aunque hipotética, tiene un contexto claro y la respuesta que se vaya a brindar responde a ese contexto. El uso de la tecnología se convierte en una herramienta indispensable para responder el problema; la calculadora y la computadora ayudan a simplificar cálculos y a la construcción de gráficas.
Para la solución de este problema, se espera que los estudiantes primero determinen el rendimiento en kilómetros por litro para cada uno de los días observados, tal como se muestra en el siguiente cuadro:
Proyecto Reforma de la Educación Matemática en Costa Rica, 2015
4
9
Rendimiento en consumo de combustible de los vehículos de Pilar y Beatriz, en una muestraaleatoria de 10 días (Km por litro)
Vehículo de Pilar Vehículo de Beatriz
km litros km/litros km litros km/litros 28,62 2,37 12,09 43,15 4,37 9,87 28,68 2,17 13,20 34,84 2,54 13,73 30,05 2,40 12,52 35,99 3,76 9,58 30,50 2,62 11,65 37,77 3,12 12,10 30,73 2,05 15,00 38,85 2,96 13,14 28,42 2,14 13,30 40,92 2,88 14,20 27,85 2,13 13,09 38,77 4,07 9,53 27,26 2,33 11,72 38,01 2,71 14,04 32,96 2,44 13,52 39,36 3,04 12,96 29,10 2,02 14,40 40,84 3,36 12,17
Con la información del rendimiento se puede determinar las principales medidas estadísticas.
Medidas estadísticas correspondientes al rendimiento en consumo de combustible de los vehículos de Pilar y Beatriz, en una muestra aleatoria de 10 días (Km por litro)
Vehículo de Pilar Vehículo de Beatriz Promedio 13,05 12,13 Mediana 13,15 12,56 percentil 25 12,20 10,42 percentil 75 13,47 13,59 Desviación Estándar 1,10 1,84 Mínimo 11,65 9,53 Máximo 15,00 14,20
La información anterior es suficiente para determinar que según los datos, el vehículo de Pilar presentó un mayor rendimiento. Así lo muestran el promedio, la mediana y las otras medidas de posición desde el punto de vista de la variabilidad. También este vehículo fue más consistente en el rendimiento, tal como lo refleja la desviación estándar. Para favorecer una mayor visualización se puede construir un diagrama de cajas:
5
0
Proyecto Reforma de la Educación matemática en Costa Rica, 2015
Esta representación comprueba lo indicado previamente.
El docente debe estar atento a que la combinación de técnicas estadísticas que puedan emplear los estudiantes sea acorde con los requerimientos del problema. Pero debe tener presente que la solución del mismo puede ser encontrada de muchas formas, es decir, no existe un mecanismo único que permita llegar a la respuesta, sino que muchos procedimientos pueden llegar a ella. Lo importante es que los argumentos en uno u otro caso estén debidamente fundamentados desde el punto de vista estadístico.
Proyecto Reforma de la Educación Matemática en Costa Rica, 2015
5
1
Predicciones estadísticas
Algunos de los resultados de análisis estadísticos sencillos pueden ser utilizados para predecir valores desconocidos por medio de la interpolación o extrapolación. Existen técnicas estadísticas especializadas para realizar esta labor. El análisis de dichas técnicas supera los propósitos de este curso. Sin embargo, es posible aprovechar las estrategias analizadas en esta unidad didáctica, aunque los resultados no sean tan precisos como los que se podrían generar mediante técnicas inferenciales.
Actividad 14.
En la municipalidad de un determinado cantón de Costa Rica, están muy preocupados por el alto porcentaje de desempleados que existen. Por ello, se pretende buscar alternativas de empleo en la comunidad, para lo cual se desea conocer el número aproximado de desempleados y algunas de sus características. Primeramente se deben identificar cuáles personas se catalogan como desempleados, pues no todas las personas adultas que no tienen empleo pueden ser catalogadas como tales. Niños y adolescentes, pensionados o adultos mayores, personas que dedican su tiempo a estudiar, rentistas, amas de casa, entre otros no forman parte de este grupo. De acuerdo con la CEPAL, el porcentaje de desempleo debe determinarse sobre la población económicamente activa, la cual se define así:
POBLACIÓN ECONÓMICAMENTE ACTIVA (PEA): En general se considera población económicamente activa al conjunto de personas, de uno u otro sexo, que están dispuestas a aportar su trabajo para la producción de bienes y servicios económicos. Generalmente cada país determina la edad de inicio de la investigación de actividad económica que puede variar en el tiempo y en distintas fuentes (censos y encuestas especializadas). El CELADE para lograr una mejor armonización de las cifras considera población económicamente activa aquella que, según lo establecido por cada país en cada momento o fuente sea considerada PEA y además tenga 15 o más años de edad.
http://www.cepal.org/celade/noticias/paginas/8/45838/Def_IND.pdf
Para lograr este y otros propósitos, los miembros del Consejo Municipal aplicaron una encuesta a una muestra aleatoria de 800 ciudadanos de todas las edades de un determinado cantón. Entre otras características se determinó el desempleo en la población económicamente activa del mismo.
Se comprobó que de las 800 personas incluidas en la encuesta 370 eran personas económicamente activas, de las cuales 46 estaban desocupadas. Suponga que la encuesta tenía un error máximo del 3,4%, con una probabilidad del 95%.
De acuerdo con las proyecciones de población del Instituto Nacional de Estadísticas y Censos, al momento de aplicar la encuesta el cantón contaba con 86 546 personas.
5
2
Proyecto Reforma de la Educación matemática en Costa Rica, 2015
a) Estime el número de desempleados que se encontraban en el cantón al momento de aplicar la
encuesta.
b) Utilice el margen de error para estimar nuevamente este número de desempleados.
c) ¿Qué supuestos se debe tomar en cuenta para que la estimación hecha por usted no tenga errores
muy grandes?