UNIDAD Nº5 ESTADÍSTICA DESCRIPTIVA 1 - INTRODUCCION: “Una nueva forma de medir el desempleo- El mercado laboral cambió, y las

(1)

UNIDAD Nº5

ESTADÍSTICA DESCRIPTIVA

1 - INTRODUCCION:

“Una nueva forma de medir el desempleo- El mercado laboral cambió, y las estadísticas actuales no lo reflejan con nitidez. Cómo será la nueva Encuesta Permanente de Hogares. El INDEC está reformulando la Encuesta Permanente de Hogares (EPH) que mide el empleo y los ingresos argentinos. Esta modificación obedece a que se admite, no sólo en la Argentina sino en todo el mundo, que cambiaron las relaciones laborales y ahora tienen mayor pesos los trabajos temporales e intermitentes, la subcontratación, la terciarización y las formas encubiertas de empleo asalariado. A esto se agregan las conocidas dificultades para captar bien los ingresos de los hogares y de las personas, sobre todo del trabajo independiente y los beneficios y rentas de la propiedad, por problemas de subdeclaración y desconocimiento de los entrevistados de sus propios ingresos. Por eso, en los últimos días se reunieron en Buenos Aires, por segunda vez en el año, expertos internacionales con los especialistas del INDEC para debatir cómo debe encararse la reformulación de la Encuesta y las nuevas preguntas que deben incorporarse a la medición... Montero explicó que en la actual encuesta la variable “ingresos” no es esencial ni en el

diseño muestral ni en toda la administración de los datos. Pero las recomendaciones internacionales indican la conveniencia de que la muestra se despliegue a lo largo de todo un trimestre con captación semanal..La radiografía Apenas una tercera parte de la población activa trabaja en relación de dependencia en un empleo formal. Otra cuarta parte son asalariados que se desempeñan en negro, sin aportes a la Seguridad Social. Un 27% son cuentapropistas, pero muy pocos está registrados, y casi el 14%, equivalente a 2.000.000 de personas está desocupado. La misión de los estadígrafos no es cambiar la realidad sino captarla. Las estadísticas oficiales ya describen un escenario laboral preocupante. Ahora los estadígrafos prometen captar más ampliamente esta precarización laboral y también medir mejor los ingresos de los hogares” Económico- Clarín 22/11/98

La misión de los estadígrafos no es cambiar la realidad sino captarla y la estadística, -arte y ciencia con la que trabajan los estadígrafos- tiene como objetivo dar sentido a los datos numéricos; ahora bien para poder cumplir con esta misión es necesario tener en cuenta algunas definiciones básicas y realizar un conjunto de tareas organizadas a tal efecto -la administración de los datos-, que trataremos de detallar en el presente capítulo.

Cuánto gasta el país por cada alumno que va a la primaria, a la secundaria y a la universidad?

(2)

anuales en cada estudiante. Y en el universitario, la cifra sube a 1882 pesos por estudiante, cada año. El promedio annual es de 1287 pesos por estudiante.

Según el último informe de la UNESCO sobre el Estado Mundial de la Infancia, los problemas de la repitencia y de la deserción escolar obligan a los países de América latina a pagar casi cuatro años más de los necesarios para la formación de un mismo niño.

Cuál es la provincia que más invierte por cada alumno?

Si se considera sólo la inversión oficial, la que más destina es Tierra del Fuego. Cada año, gasta 2318 pesos por chico en la primaria 4411 por estudiante secundario.

Y la que gasta menos?

En la primaria , Formosa , con 588 pesos por alumno. En el nivel medio, la que gasta menos es Salta, con 987 pesos anuales invertidos en cada alumno.

.Por qué hay tantas diferencias entre una provincia y otra?

Porque el gasto por alumno depende de la cantidad de chicos que concurren a la escuela en cada provincia. Así, Tierra del Fuego reparte la torta de su inversión en muchos chicos menos que la provincia de Buenos Aires y, por tanto, las proporciones por cada alumno no son mayores .Algo similar ocurre similar con los salarios de los docentes .En cambio, si se considera el monto que se invierte en educación, y no el promedio por alumno, son las provincias de Bs.As., Córdoba, Sta. Fe y Mendoza las que más dinero destinan al sector.

La ley permite que la inversión sea distinta en cada provincia. Estas reciben del Estado nacional dinero de la coparticipación federal (recaudación de los impuestos nacionales). Desde 1992 , cuando el Gobierno transfirió las escuelas a las jurisdicciones provinciales, cada provincia puede decidir qué proporción de la coparticipación destina al educación .No hay piso mínimo garantizado. Extraído de La Nación.

Domingo 19 de abril de 2015 | Publicado en edición impresa

Manuel Carreiras: "Es clave el diagnóstico precoz en el aprendizaje"

Neurocientífico especializado en bilingüismo

Manuel Carreiras, un neurocientífico español que está especializado en lectura, bilingüismo y aprendizaje en segundas lenguas, participó, también, ayer de TEDxRíodelaPlataED. Además, es el director científico del Basque Center on Cognition, Brain and Language, en Donostia, San Sebastián.

-Antes se aprendía a leer y escribir a través de los fonemas. Hoy, a partir de palabras completas. ¿Qué le parece el cambio?

(3)

-¿Por qué se modificó?

-Porque el método global era considerado más progresista. Había muchos factores que lo impusieron como una nueva moda. Y está bien proponer diferencias. Sin embargo, el problema es que cuando el debate se transforma en algo ideológico y no en algo científico. De todas maneras, no hay que preocuparse: los chicos que son buenos en el estudio aprenden con cualquiera método. El problema se presenta en quienes tienen dificultades en el aprendizaje, como, por ejemplo, los chicos con dislexia.

-¿Qué avances logró la ciencia con relación a los problemas de aprendizaje?

-Estamos trabajando sobre la posibilidad de que uno de los trastornos de la dislexia sea la percepción del habla. Comprobamos que la sintonización que hacen nuestras neuronas con respecto a las frecuencias del habla, en el caso de los chicos con dislexia, puede ser diferente del resto. Ése podría ser un buen inicio para poder hacer un diagnóstico precoz. De todas maneras, aún faltan algunos años para poder llegar a ese tipo de diagnósticos. Sería interesante que la neurociencia, a través de una prueba biológica, pudiera avisar que el niño va a tener esos problemas, antes de que se manifiesten. Eso permitiría diseñar herramientas previas.

DE1.1 -Definiciones básicas:

Dato: es el resultado de una evaluación cuantitativa o cualitativa de un suceso. Por ejemplo, el valor de compra de una PC -medición cuantitativa- o el grado de satisfacción de un usuario respecto de un servicio médico-asistencial -medición cualitativa-. Piense y defina dos datos cuantitativos y dos cualitativos que puedan necesitarse en un establecimiento educativo

... ... ... ...

(4)

Información la componen datos que se han colocado en un contexto significativo y útil y se ha comunicado a un receptor, quien la utiliza para tomar decisiones... Especialmente en los negocios, la información debe dar señales oportunas de aviso y anticipar el futuro”

Ejemplo: La gerencia de compras de una empresa, analiza los precios de un determinado insumo, entre los diversos proveedores existentes en el mercado -varios valores para una misma variable-; o bien un analista financiero analiza el monto de inversiones de una empresa en las áreas: productiva, capacitación y perfeccionamiento del personal, mantenimiento y modernización de la infraestructura, y, administración comercial -varios valores que surgen de distintas variables-. Piense y defina qué información puede necesitarse en un establecimiento educativo:

... ... ... ...

Población: Conjunto de todos los valores que toma una característica predeterminada. Por ejemplo: los valores del salario básico correspondiente a los empleados de la administración pública central.

Enuncie por extensión y comprensión -es un conjunto-una población en un establecimiento educativo

... ...

Universo: Conjunto de todos los elementos que serán los portadores de la información sobre la característica en estudio. En nuestro ejemplo: todos los empleados de la administración pública central.

Enuncie el universo asociado a la población citada anteriormente por usted

... ...

Muestra: Subconjunto del universo en estudio; y consecuentemente subconjunto de la población respectiva; en nuestro ejemplo podríamos pensar en todos los empleados de la administración pública central que fueron seleccionados por alguna técnica muestral específica.

(5)

análisis de datos y generación de resultados, e interpretación de los resultados. Gráficamente:

Cabe observar, que la secuencia de los subprocesos es lineal; no se puede sintetizar y presentar, si no se dispone primeramente de los datos; y no se puede analizar si los datos no se encuentran arreglados para realizar operaciones lógicas sobre los mismos; por último la interpretación será posible siempre que se haya arribado a algún valor resultante. En el próximo acápite, se desarrollarán ideas fundamentales sobre cada una de las etapas citadas.

DE 1.2.1 RECOPILACIÓN O RELEVAMIENTO DE DATOS:

Para ser útiles, los datos se deben recopilar o relevar y estar disponibles en tiempo y forma para su posterior proceso. Si las horas extras efectivamente trabajadas en el período

Recopilación o relevamiento de datos

Síntesis y Presentación de los datos

Análisis de datos y ge-neración de resultados

(6)

por el personal de una empresa, no se registran oportunamente -antes del proceso de liquidación de sueldos y jornales del citado período- dichas horas extras no participarán en la determinación del monto de la liquidación, obligando a un proceso extraordinario y correctivo o a un reproceso del sistema.

Aceptada la necesidad de recopilar datos, la primera tarea asociada a la misma es determinar qué se quiere medir y cuáles son las variables que permiten tal medición. Por ejemplo si un productor desea analizar cuál es la demanda real de un producto A en un segmento de mercado determinado; deberá consultar a sus clientes respecto de las ventas del producto A; y no, tomar como válido los datos de las facturas emitidas a dichos clientes por el citado producto - ya que, demanda de mayoristas y/o minoristas puede no coincidir con demanda de consumidor final-

DE 1.2.2 SÍNTESIS Y PRESENTACIÓN DE DATOS:

Los datos tal como se los ha relevado en general no resultan de mucha utilidad; larga listas de valores, suelen ser imposibles de ser analizadas; por lo cual se les debe resumir o reagrupar a los efectos de facilitar su comprensión. Se puede afirmar que la síntesis es el primer paso en el análisis de datos.

Para elegir una aceptable manera de sintetizar los datos, es conveniente con anterioridad representarlos gráficamente, a los efectos de individualizar valores atípicos o de encontrar aspectos importantes de los mismos; el proceso de dar sentido a los datos generalmente comienza con una representación grafica, tarea que se ha convertido de uso cotidiano y que los softwares más sencillos de cálculo, ofrecen en su menúes amplia gama de modalidades.

Conjuntamente con la representación grafica, en general se intenta armar la llamada tabla de frecuencias, que muestra que valores toma la variable y la cantidad de veces que cada uno de ellos se ha presentado; generando de esta manera una primera aproximación a la distribución de la variable. En el caso que la cantidad de valores relevados sea abultada, es conveniente armar una tabla de frecuencias relativas de aparición de los valores de la variable; entendiéndose por frecuencia relativa a la proporción de las observaciones que toman un determinado valor. Para calcularla hay que tomar el cociente entre la cantidad de veces que se presenta el valor observado y la cantidad de observaciones totales.

Ejemplo 1: Un locutorio dispone de 5 cabinas; y el parte de utilización de las mismas para la hora de mayor demanda ha sido: 1-1-1-1-1-2-2-2-2-3-3-3-3-3-4-4-4-4-5-5-5-5-5-5; la tabla de distribución de frecuencias y de frecuencias relativas correspondientes serán: Cabina Frecuencia

de

utilización

(7)

1 5 0.21

2 4 0.17

3 5 0.21

4 4 0.17

5 6 0.25

Total 24 1

Para representar los datos anteriormente expuestos, utilizaremos un grafico de barras, donde las bases de los rectángulos representan cada uno de los valores de la variable y las alturas representan las frecuencias de los datos.

G ráfico de frecuencia de utilización de cabinas

0 1 2 3 4 5 6

1 2 3 4 5

F re cue ncia d e utiliza cio n

Ejemplo 2: Un servicio de distribución, informa que en el fin de semana ultimo ha realizado las siguientes entregas: Zona 1: 2; Zona 3: 3; Zona 1: 4; Zona 2: 2; Zona 3: 2; Zona 4: 1; Zona 2: 3; Zona 1: 1; Zona 3: 2.

Realice la tabla de frecuencias y de frecuencias relativas, y el correspondiente diagrama de barras.

Cuando hay muchos valores posibles, lo mas apropiado es agruparlos o combinarlos por clases; obteniendo una serie de datos agrupados por cuantías similares. La elección de los grupos o clases, es mas o menos arbitraria; pero la practica indica atender a las siguientes consideraciones:

1- El numero de clases, debe facilitar el trabajo; por lo tanto no deberían aparecer clases con gran cantidad de datos y clases con uno o ningún dato.

(8)

N rango Amp

log 3322 . 3 1

int  _

3- Todos los valores observados deben caer en una y solo una clase y el elemento representante de las mismas accesible al entendimiento.

4- Los intervalos de clases deben ser contiguos; por lo tanto el limite superior de cada uno de ellos -a excepción del ultimo- debe coincidir con el limite inferior del siguiente.

Ejemplo 3:

Sean los salarios de los empleados de una determinada empresa:

$620 $850 $1,275 $890 $730 $950 $1,200 $1,150 $690 $875 $1,270 $880 $745 $950 $850 $1,230 $990 $755 $770 $1,150

$630 $850 $1270 $880 $730 $960 $1250 $1200 $660 $850

La tabla de frecuencias asociada será: Limite

inferior

Limite superior

Valor Representan te

Frecuencia Frecuencia Relativa

500 750 625 7 0.23333

750 1000 875 14 0.46667

1000 1250 1125 6 0.2

1250 1500 1375 3 0.1

Total 30 1

Y el histograma -grafico de barras, donde los rectángulos son adyacentes- correspondiente:

Monto de Salarios Remuneraciones

0 2 4 6 8 1 0 1 2 1 4

625 875 112

5

137 5

(9)

Observe, que hemos realizado la graficación de datos agrupados; para los cuales se utilizan histogramas. La diferencia entre graficas de barras e histogramas, se basa en distinguir entre variables cualitativas -que varían en clase y no en grado- y variables cuantitativas -varían de acuerdo a una norma, son el resultado de una medición- En nuestros ejemplos: las cabinas telefónicas han sido identificadas por números, pero bien pudieron ser identificadas por letras, en este caso numero de cabina responde a una clase o sea a variables cualitativas; los salarios de los empleados responden a una medición dentro de una escala, por lo tanto estamos ante un caso de variable cuantitativa.

Ejemplo 4: En un grupo de alumnos, se ha medido la altura de cada uno de ellos, a los efectos de realizar una selección para la integración de equipos deportivos; arrojando los siguientes datos en metros: 1.65; 1.70; 1.64; 1.79; 1.81; 1.66; 1.8; 1.88; 1.73; 1.69; 1.72; 1.75; 1.8; 1.75; 1.66; 1.76; 1.78; 1.66; 1.76; 1.75; 1.7; 1.65; 1.65; 1.76; 1.77; 1.8; 1.79; 1.73.

Arme la tabla de frecuencia y de frecuencia relativa, utilice un histograma para la graficación correspondiente.

El financiamiento universitario. Para el Banco Mundial, el arancel es una política social: (La Nación 29/8/99) “Para William Experton, de 52 años de edad, la prioridad es superar las desigualdades con las que los alumnos del secundario llegan a la enseñanza superior. Y para ello se apoya en cifras. por cada 100 alumnos que ingresan en la primaria sólo 55 terminan el secundario y no más de 7 pueden esperar graduarse en la Universidad. los que abandonan son los estudiantes de menores recursos. En el 20% más pobre de la población, sólo el 23% de los jóvenes de 18 a 24 años tiene el secundario completo. La proporción asciende al 75.8% en el 20 % más rico de la sociedad”.

Suele ser de utilidad la frecuencia acumulada de la variable; o sea la acumulación sucesiva de las frecuencias simples. Una distribución de frecuencias acumuladas nos permite ver cuántas observaciones están por encima de ciertos valores, o cuántas observaciones están por debajo de ciertos valores, en lugar de hacer una simple descripción del número de elementos que hay dentro de cada intervalo. La gráfica de una distribución de frecuencias acumuladas se conoce como ojivas. Se puede asimismo, construir una ojiva de una distribución de frecuencias relativas; a partir de la cual podremos ver qué porcentaje de observaciones por encima de ciertos valores, o qué porcentajes de observaciones están por debajo de ciertos valores..

Ejemplo 5: Retomemos el ejemplo 3 -de los salarios de una empresa- y construyamos la tabla correspondiente a la frecuencia acumulada absoluta y relativa. A posteriori grafiquemos los valores obtenidos.

(10)

inferior superior acumulada relativa acumulada

500 750 7 0.23333333

750 1000 21 0.7

1000 1250 27 0.9

1250 1500 30 1

Frecuencia absoluta acumulada de salarios

0 5 1 0 1 5 2 0 2 5 3 0

2 5 0 5 0 0 7 5 0 1 0 0 0 1 2 5 0 1 5 0 0

S e rie 1

Retome usted el ejemplo 4, y grafique la ojiva correspondiente para las frecuencias absolutas.

DE 1.2.3 ANALISIS DE DATOS Y GENERACION DE RESULTADOS:

A partir de la graficación -o toma fotográfica de la realidad-, surge la necesidad de generar medidas que representen a los valores de la serie, o lo que es lo mismo decir, que describan las características del conjunto de datos. Las características más relevantes para la toma de decisiones son: la tendencia central y la dispersión, y de menor relevancia son el sesgo y la curtosis. Las medidas de tendencia central nos indican el centro o ubicación general de los valores de los datos; nos posicionan en algún lugar del intervalo real que representa a aquéllos.; en tanto que las medidas de dispersión nos informan sobre el grado en que las observaciones se distribuyen. El sesgo nos informa si la distribución de los datos es simétrica con respecto a una recta perpendicular al eje de las abcisas y la curtosis nos da el grado de agudeza de la distribución.

(11)

Es un tipo de promedio, que depende de todos los valores de la serie. Cuando se habla del promedio de lluvia caída durante un período, o cuando se habla del promedio de gastos; generalmente se está haciendo referencia a la media aritmética.

La media viene definida de acuerdo a si los datos están o no agrupados; para el caso de datos no agrupados se tiene:

n x x

m

n

i i





 1

)

( -observe la denotación-

y para el caso en que los datos se presentan agrupados:

n f x x

m

i

i i





 1

* )

(

donde: xi es el punto medio de la clase i-ésima;

fi es el número de observaciones de la clase i-ésima;

m es la cantidad de clases, y

n es la cantidad total de observaciones.

Ejemplo 6: Los sueldos básicos de los empleados -presentes el 30/8/99- del área de sistemas en una empresa son:

7500 6500 4500 3800 3000 2500

2400 2300 2200 2100 2000 2000

2000 1800 1500 1300 1200 1200

Los datos se presentan ordenados de mayor a menor, pero generalmente la información que se releva no está ordenada de acuerdo a la variable que se estudia. Se tiene que el sueldo básico promedio surgido de los datos relevados son:

67 . 2766 )

(x 

m

Ejemplo 7: Calcule usted el promedio aritmético para los sueldos básicos detallados en la primer fila (m1); realice la misma tarea para los sueldos de la segunda fila (m2) y por último

para los de la tercer fila (m3).

(12)

Ejemplo 9 : Los sueldos básicos de los empleados -presentes el 30/8/99- en una empresa son los que a continuación se presentan en la tabla y ya agrupados -los intervalos tiene su límite superior abierto- :

Límite inferior

Límite superior

Frecuencia (f)

500 2000 100

2000 3500 200

3500 5000 50

5000 6500 20

6500 8000 15

8000 9500 5

Calcule el promedio aritmético del sueldo básico de los empleados presentes ; grafique.

Límite inferior

Límite superior

Punto medio (x)

Frecuencia (f)

(x)*(f)

500 2000 1250 100 125000

2000 3500 2750 200 550000

3500 5000 4250 50 212500

5000 6500 5750 20 115000

6500 8000 7250 15 108750

8000 9500 8750 5 43750

Total: 390 1155000

media: 2961.5384 6

(13)

Sueldos básicos

0 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 1 8 0 2 0 0

1

2

5

0

2

7

5

0

4

2

5

0

5

7

5

0

7

2

5

0

8

7

5

0

S e rie 1

Ejemplo 10: Calcule las horas promedio semanal que aplica un grupo de alumnos de la Facultad de Ciencias Económicas, al estudio y seguimiento de las materias. A continuación se detallan los datos ya agrupados -el límite superior es abierto-:

Límite inferior

Límite superior

Frecuencia

0 5 20

5 10 30

10 15 35

15 20 40

20 25 30

25 30 30

30 35 25

35 40 20

40 45 10

Ejemplo 11-1: Una empresa tiene dos locales de ventas, y ha tomado los datos de todas las horas extras efectuadas por su personal, llegando al siguiente cuadro:

Límite inferior

Límite superior

Frecuen cia Local 1

Frecuen cia Local 2

(14)

1 2 5 10 15

2 3 8 15 23

3 4 10 20 30

4 5 4 5 9

27 50 77

Se desea obtener:

11- 1 El Promedio aritmético de horas extras diarias.

11 -2 El promedio aritmético de horas extras diarias del local 1 11 -3 El promedio aritmético de horas extras diarias del local 2

11-4 El promedio aritmético de horas extras diarias, como media ponderada a partir del promedio de horas extras diarias del local 1 y del local 2.

Límite inferior

Límite superior

Frecuen cia Local 1

Frecuen cia Local 2

Frecuen cia Total

xi (xi)*fi Local 1

(xi)*fi Local 2

(xi)*fi Total

1 2 5 10 15 1.5 7.5 15 22.5

2 3 8 15 23 2.5 20 37.5 57.5

3 4 10 20 30 3.5 35 70 105

4 5 4 5 9 4.5 18 22.5 40.5

27 50 77 2.98148 2.9 2.92857

(27*2.98148+50*2.9)/77= 2.92857

La media aritmética es la medida de tendencia central que más se utiliza, y una de las causas es - más allá de su simpleza de cálculo-, como se pudo observar en el ejemplo 11, que es posible obtener la media de una grupo a partir de las medias de subgrupos de aquél; tarea usual dentro de la actividad empresarial. Para ello se tienen en cuenta los siguientes datos: m(x), frecuencia total de la variable x, m(y), y frecuencia total de la variable y, y se procede la siguiente manera:

m x y n m x n m y

n n

x y

(  ) * ( ) * ( ) 

Observe la última fila del cuadro presentado.

(15)

Ejemplo 11-2: La misma empresa, tiene registrado los tiempos -en minutos- de entrega de mercadería solicitada telefónicamente, durante un día de demanda normal. A continuación se detallan los mismos:

Límite inferior

Límite superior

Frecuen cia Local 1

Frecuen cia Local 2

10 15 10 15

15 20 15 12

20 25 25 20

25 30 10 8

30 35 5 5

65 60

Se desea obtener:

11-2- 1 El Promedio aritmético del tiempo de entrega, para un día de demanda normal. 11-2-2 El promedio aritmético del tiempo de entrega del local 1, para un día de demanda normal.

11 -2 -3 El promedio aritmético del tiempo de entrega del local 2, para un día de demanda normal.

11-2-4 El promedio aritmético del tiempo de entrega, como media ponderada a partir del promedio de horas extras diarias del local 1 y del local 2, para un día de demanda normal.

Ejemplo 11.3 -A continuación se detalla la distribución de edad para el personal de una empresa:

Edad 16-18 18-25 25-35 35-40 40-50 50-60 60-65 66

Cantidad 3 20 30 25 35 30 5 2

Se conoce asimismo, las edades promedios; que a continuación se detallan:

De los 30 jerarquizados: 55

De las mujeres 31,55

De los varones 45,5

Calcular:

11.3.1-La edad promedio de los no jerarquizados.

(16)

90 60 150 60 5 45 55 31 150 5 45 150 92 39 150 150 5 45 55 31 92 39 15 36 120 55 30 150 92 39 150 30 150 55 30 92 39                   v m m m m m nojerar nojerar C C C C C C e e * . * . * . * . ) ( * . * . . . * * , * ) ( * .

b- MEDIA GEOMETRICA

Está menos afectada por los valores extremos de la variable que la media aritmética, pero cuando uno de sus valores cero o menor que cero ya no se puede calcular.

Agrega multiplicando y viene dada por la fórmula:

n n n n n n i n n i g n

x

1

.

2

...

1 2 1 1





donde n es la cantidad de intervalos de clase, ni la cantidad de veces que se presenta la

variable en la clase i y xi el valor representativo de la clase.

c – MEDIA ARMONICA

Su uso es excepcional, o bien cuando la variable no puede ser medida per se y debe recurrirse a otras variables, caso típico la velocidad que se mide a partir de espacio y tiempo. No admite que la variable tome valor cero, pero puede tomar valores positivos como negativos. Se suele utilizar para comparación de salarios reales.

Es una media aritmética; es el recíproco de la media aritmética de los recíprocos de la variable.

(17)

 



 



_















_n

i _i

i n

i i

i a

x

f

N

x

f

N

x

m

x

1 1 .

1 1

1

1 (

12-a -Se detallan a continuación valores de edades de un grupo de personas, y se han determinado las medias:

Aritmética, geométrica y armónica. Compare los resultados obtenidos, qué puede concluir?

Límite inferior

Límite superior

x fi xi*fi fi/xi

43 48 45,5 60 2730 1,318681

48 53 50,5 27 1363,5 0,534653

53 58 55,5 15 832,5 0,270270

58 63 60,5 6 363 0,099173

63 68 65,5 3 196,5 0,045801

68 73 70,5 1 70,5 0,014184

Sumas: 112 5556 2,282764

Media Aritmética(x)= 49,60714

Media Geométrica(x)= 49,32284

Media Armónica(x)= 49,06331

Los valores son semejantes y se presentan en orden decreciente.

12-b Se detallan a continuación valores de consumo de nafta en 10 Km. para determinadas tareas realizadas por vehículos de la empresa. Calcular la media Aritmética, geométrica y armónica. Compare los resultados obtenidos, qué puede concluir?

Li Ls fi

0,75 0,8 5

0,8 0,9 7

0,9 1 10

1 1,1 15

1,1 1,2 9

(18)

MEDIANA

No es propiamente un promedio, ya que no depende de los valores particulares de la serie de datos observada, sino de la ordenación de los mismos y de su densificación. La mediana es un valor que separa a la serie ordenada, en dos grupos que contienen la misma cantidad de datos, de tal manera que en el primer grupo se encuentran todos aquellos valores menores o iguales a ella y en el segundo grupo el resto de los valores.

Para su cálculo, se debe tener en cuenta si los datos están o no agrupados. Se tiene entonces que para datos no agrupados, primeramente se procede a su ordenamiento de menor a mayor; y luego se analiza si la cantidad de datos es par o impar; para este último caso la mediana coincide con el valor del medio; caso contrario se toman los dos valores centrales y a partir de ellos se calcula el promedio aritmético -el valor así obtenido es el valor mediano-

Si los datos están agrupados, la modalidad de cálculo es:

m L

N F

f w

e ime

ai

i

  2  _*

Lime: límite inferior del intervalo donde se encuentra la mediana; N cantidad de datos;

Fai: frecuencia acumulada hasta el límite inferior del intervalo; w: amplitud del intervalo

fi: frecuencia del intervalo.

Ejemplo 13-1: Se ha tomado aleatoriamente la edad de 7 alumnos de la facultad de Ciencias Económicas de Bs. As. Se desea calcular la mediana; los datos son:

25 21 18 20 19 27 20

Si los ordenamos de menor a mayor, tenemos:

18 19 20 20 21 25 27

Resultando el valor mediano: 20 -coincidente con uno de los valores observados-; que podemos interpretar como el valor más grande o igual al cincuenta por ciento de los valores (en este caso es el valor más grande de los tres valores menores o iguales a 20; puede interpretarse como el menor....-inténtelo usted-).

Ejemplo 13-2: Se ha tomado aleatoriamente la edad de 6 alumnos de la facultad de Ciencias Económicas de Bs. As. Se desea calcular la mediana; los datos son:

18 23 19 21 30 24

(19)

18 19 21 23 24 30

Resultando el valor mediano: 22 -no es un valor observado-; en este caso se obtuvo como la semisuma de los valores centrales 21 y 23.

Ejemplo 14: Retomemos el ejemplo 9 de los sueldos básicos de los empleados, y obtengamos la mediana de este grupo de datos agrupados

Límite inferior

Límite superior

Punto medio (x)

Frecuen cia (f)

Frecuencia Acumulada

500 2000 1250 100 100

2000 3500 2750 200 300

3500 5000 4250 50 350

5000 6500 5750 20 370

6500 8000 7250 15 385

8000 9500 8750 5 390

5 . 2712 1500

* 200

100 195

2000  



e m

Por lo tanto, podemos aseverar que el 50% de los menores sueldos básicos, son menores o iguales a 2712.5.

Ejemplo 15: calcule usted, la mediana para el ejemplo 10.

MODO/A

Es el valor de variable que mayor observaciones presenta. En general, cuando la serie de datos está conformada por pocos valores, el modo no es relevante. En el caso que se tenga valores agrupados con amplitud constante, la modalidad de cálculo viene dada por la fórmula:

m L d

d d w

o imo

i

 

 1

2

*

Limo: límite inferior del intervalo donde se encuentra el modo -surge de la mera

observación de la tabla de datos-

d1: diferencia entre la frecuencia del intervalo donde se encuentra el modo y la frecuencia

del intervalo anterior.

d2: diferencia entre la frecuencia del intervalo donde se encuentra el modo y la frecuencia

del intervalo posterior.

(20)

En el caso que se tenga valores agrupados con amplitud no constante, la modalidad de cálculo viene dada por la fórmula:

rel frec w r w r d frecrel w r w r d abs frec w h w h d abs frec w h w h d i i i i i i i i i i i i i i i i . ; . ; . ; . . ; 1 1 2 1 1 1 1 1 2 1 1 1                

Ejemplo 16: Volvamos al ejemplo 9, se tiene:

Límite inferior

Límite superior

Frecuencia (f)

500 2000 100

2000 3500 200

3500 5000 50

5000 6500 20

6500 8000 15

8000 9500 5

m_o  

 

2000 100

100 150*1500 2600

Por lo tanto podemos decir que 2600 es el monto de los sueldos básicos que mayor cantidad de empleados perciben.

(21)

Límite inferior

Límite superior

Frecuencia (f)

200 400 100

400 600 200

600 1000 250

1000 1500 120

1500 2500 115

2500 4500 45

4500 10

Calcule el salario que mayor frecuencia de aparición tiene.

Límite Inferior

Límite

Superior Frecuencia

Frecuencia relativa a la distancia del

intervalo

200 400 100 0,5

400 600 200 1

600 1000 250 0,625

1000 1500 120 0,24

1500 2500 115 0,115

2500 4500 45 0,0225

4500 10

514,28 200

* 375 , 0 5 , 0

5 , 0

400 

  

o m

Ejemplo 17: calcule usted, la moda para el ejemplo 10.

CUARTILES, DECILES, PERCENTILES:

La mediana permite dividir a los términos ordenados de la serie en dos grupos que contiene la misma cantidad de elementos; pero se podría pensar en dividir a la serie en cuatro, diez, cien grupos, que contengan -cada uno de ellos- la misma cantidad de

elementos, surge entonces la idea de cuartiles -gene-ración de cuatro subgrupos-, deciles -de diez- y centiles -de cien-; para los cuales la modalidad de cálculo sigue la misma lógica que para la mediana -téngase presente que el cuartil 2º coincide con la mediana, lo mismo sucede con el decil 5º, etc.-.

(22)

qi L

i N F

f w

D L

i N F

f w

P L

i N F

f w

i

ai

i

i i

ai

i

i i

ai

i

  

*

* 4

10

100

Ejemplo 18: Retomemos el ejemplo 9 de los sueldos básicos de los empleados, y obtengamos el cuartil 2º; el decil 4º y el centil 90º; de este grupo de datos agrupados

Límite inferior

Límite superior

Punto medio (x)

Frecuen cia (f)

500 2000 1250 100 100

2000 3500 2750 200 300

3500 5000 4250 50 350

5000 6500 5750 20 370

6500 8000 7250 15 385

8000 9500 8750 5 390

5 . 2712 1500

* 200

100 195 2000

2 

  

q observe que coincide con el valor de

la mediana.

D

P

4

90

2000

4 390

10 100

200 1500 2420

5000

90 390

100 350

20 1500 5075

   

*

(23)

Con lo cual podemos decir que 2420 es el sueldo básico mayor para el 40% de los

empleados que menor sueldo básico registran; y que 5075 es el sueldo básico menor para el 10% de los empleados que mayor sueldo básico registran.

Ejemplo 18.1: calcule usted, el decil 3º, el centil 75 y el cuartil 3º, para el ejemplo 10.

Ejemplo 19: En la tabla adjunta se detalla la distribución porcentual del ingreso y la cantidad de hijos, por familia

Ingreso % de

familias

Cantidad Hijos

0 – 200 30 4

200 – 400 35 3

400 - 600 15 2

600 – 1000 10 2

1000 – 2400 6 4

2400 –10000 4 6

Calcular: 1 - El promedio de ingreso por familia; 2- El promedio de hijos por familia ;

3- El porcentaje de familias que tiene ingresos entre 200 y 600 pesos; 4 -El porcentaje de familias que tiene ingresos entre 250 y 850 pesos.

5– Calcule el ingreso que más familias ganan.

Para calcular el ingreso promedio por familia hay que definir el valor representativo del ingreso para cada intervalo. –columna 4º de la matriz de datos- Luego como el porcentaje representa la frecuencia relativa de aparición del suceso, si multiplica este valor por el de la variable correspondiente para cada intervalo y suma, obtiene el promedio solicitado.

Para calcular el promedio de hijos, si bien la variable cantidad de hijos no está

convenientemente agrupada, tenga presente que el porcentaje es distributivo con respecto a la suma por lo tanto: para cantidad de hijos 4 corresponde el porcentaje 36 que es lo mismo que: (30% +6%) para el valor 4. O sea que estamos en la misma situación que en lo pedido para el inciso 1.

Es por ello que hemos armado la siguiente matriz de datos:

Ingreso % de

familias

Cantidad Hijos

Ingreso

Representa-tivo

(Ingreso Representa-tivo)*(%flias)

(Cantidad Hijos)*(%flia)

0 - 200 30 4 100 3000 120 30

200 - 400 35 3 300 10500 105 65

400 - 600 15 2 500 7500 30 80

(24)

1000 - 2400 6 4 1700 10200 24 96

2400 -10000 4 6 6200 24800 24 100

100 64000 323

1-m(I)= 640

2-m(H)= 3,23

50 15 35 ) 600 200 %(

3 I    

4- %(250I 850)

Para ello tenemos que obtener, qué percentil corresponde al ingreso 250 y qué percentil al ingreso 850. 850 8625 , 0 100 80 400 10 * ) 600 850 ( 400 * 10 80 100 * 600 850 250 3875 , 0 100 30 200 35 * ) 200 250 ( 200 35 30 100 * 200 250 25 , 86 75 , 38               P x P x

Por lo tanto, el porcentaje acumulado será:

5 , 47 75 , 38 25 , 86 ) 850 250

%( I    

Que nos permite inferir que el 47,5 % de la población familiar tiene ingresos entre 250 y 850 u.m.; y que el 52,5% restante tiene ingresos o superiores a 850 u.m. o inferiores a 250 u.m.

5– Calcule el ingreso que más familias ganan en la población

Ingreso % de

familias

%/amplitud

0 – 200 30 0,0015

200 – 400 35 0,0075

400 – 600 15 0,00075

600 – 1000 10 0,00025

(25)

2400 –10000 4 0,0000052

240 200 * 2 , 0 05 , 0

05 , 0

200 

  

o m

1.2.3.2 - MEDIDAS DE DISPERSION

Estas medidas nos proporcionan información adicional a los efectos de juzgar sobre la confiabilidad de nuestra medida de tendencia central, en especial del promedio

aritmético; o sea para los casos que los datos se encuentren altamente dispersos estas medidas nos informarán que la media aritmética no es representativa, y para los casos que los datos estén fuertemente concentrados nos informarán que la media es altamente representativa de todos ellos. Tenga presente, que la variabilidad es de capital importancia en el control de la producción, en el tiempo de cancelación de las deudas por parte de los clientes, en las ganancias y/o pérdidas de la empresa, etc.

RANGO:

Es la distancia entre el mayor y menor de los valores observados. Nos permite analizar la extensión de las variaciones observadas. Es muy sensible a la presentación de valores atípicos.

Ejemplo 20-1: del ejemplo 13-1 se tiene que los valores observados son:

18 19 20 20 21 25 27

y el rango es 9; o sea la diferencia de edad, entre el mayor de los alumnos observados y el menor es de 9 años.

Ejemplo 20-2: Calcule usted el rango para el ejemplo 13-2 e interprete.

VARIANZA

Es una medida de variabilidad basada en las desviaciones respecto de la media de la variable; nos da una distancia promedio -en unidades cuadráticas- entre cualquier

observación del conjunto de datos y la media del mismo.

(26)









2

1 2 2 1 2 2 ) ( ) ( x m n x s n x m x s n i i n i i    



 

; para el caso de datos no agrupados -donde n

es la cantidad de observaciones-, y









2

1 2 2 1 2 2 ) ( * ) ( x m N f x s N f x m x s n i i i n i i i    



 

; para el caso de datos agrupados -donde n

es la cantidad de intervalos de clase y N es la cantidad de observaciones.

Ejemplo 21: Para los sueldos básicos de los empleados del ejemplo 6, calcule la varianza; tenga en cuenta que los datos no están agrupados.

A continuación se detallan los valores de cada valor del cuadrado de la diferencia entre cada valor de variable y la media; observe que hay valores expresados en notación científica, por ejemplo: 2.2E+07, que debe interpretarse como 2.2*107.

2.2E+07 1.4E+07 3004444 1067778 54444.4 71111.1

134444 217778 321111 444444 587778 587778

587778 934444 1604444 2151111 2454444 2454444

Por lo tanto, el promedio de los mismos -o sea la varianza- es: s2 = 2945556

Vamos a calcular la varianza para el mismo ejemplo, pero a partir del promedio de los cuadrados de los sueldos básicos y del promedio de los mismos.

5.6E+07 4.2E+07 2E+07 1.4E+07 9000000 6250000

5760000 5290000 4840000 4410000 4000000 4000000 4000000 3240000 2250000 1690000 1440000 1440000

O sea: m(x2) = 1.1E+07 y s2 =1.1E+07-2.766.672 = 2945556; como se puede apreciar los resultados obtenidos son congruentes.

(27)

Ejemplo 23: Retomemos el ejemplo 9 de los sueldos básicos de los empleados, y

obtengamos la varianza de este grupo de datos agrupados; primero como el valor promedio de los desvíos cuadráticos de los valores observados respecto de su valor promedio, y luego como la diferencia entre el promedio de la variable cuadrática y el cuadrado del promedio de la variable.

Límite inferior

Límite superior

Punto medio (x)

Frecuencia (f)

(x-2961.54)^2*(f) (x)^2*(f)

500 2000 1250 100 292936390.5 156250000

2000 3500 2750 200 8949704.142 1512500000

3500 5000 4250 50 83006656.8 903125000

5000 6500 5750 20 155510355 661250000

6500 8000 7250 15 275863535.5 788437500

8000 9500 8750 5 167531434.9 382812500

Total: 390 983798076.9 4404375000

varianza 2522559.172

media de la variable cuadrática: 11293269.23 varianza: 2522559.172

Como se puede apreciar, las dos manera de cálculo arrojan el mismo resultado; correrá por su cuenta , a partir de la práctica y de los elementos auxiliares de cálculo que disponga, decidir cuál modalidad utilizar para cada caso.

Ejemplo 24: Calcule usted la varianza para el ejemplo 10.

Ejemplo 25: Retomemos el ejercicio 11; Se desea obtener:

25- 1 La varianza para las horas extras diarias.

25 -2 La varianza para las horas extras diarias del local 1 25 -3 La varianza para las horas extras diarias del local 2

25-4 Conclusiones sobre distributividad del operador en estudio.

Límite inferior

Límite superior

Frecuen cia Local 1

Frecuen cia Local 2

Frecuen cia Total

xi (xi)^2*fi Local 1

(xi)^2*fi Local 2

(xi)^2*fi Total

1 2 5 10 15 1.5 11.25 22.5 33.75

2 3 8 15 23 2.5 50 93.75 143.75

3 4 10 20 30 3.5 122.5 245 367.5

(28)

27 50 77 9.8055555 6

9.25 9.4448051 9 varianzas: 0.9163237

3

0.84 0.8682745 8

Como puede observar, la varianza de las horas extras total no coincide con la suma de las varianzas de cada una de las obtenidas para las horas extras de cada local.; este operador no es distributivo -recuerde que es un operador cuadrático-.

Ejemplo 26: Retome el ejercicio 12; y calcule

26- 1 La varianza para el tiempo de entrega, para un día de demanda normal.

26 -2 La varianza para el tiempo de entrega del local 1, para un día de demanda normal. 26 -3 La varianza para el tiempo de entrega del local 2, para un día de demanda normal.

COEFICIENTE DE DISPERSION O DESVIACION ESTANDAR:

Como consecuencia de la modalidad de definición de la varianza, surge lo que ya hemos comentado con anterioridad, esta medida viene dada en unidades cuadráticas de la variable; es por ello que es conveniente generar otra medida -que se desprenda de aquélla- que esté dada en las mismas unidades de la variable. Esta nueva medida de dispersión es la desviación estándar y no es más que el valor positivo de la raíz cuadrada de la varianza, o sea:









s   s2   m xm x( ) 2   m x( 2) m x( ) 2 tenga presente que la raíz cuadrada no es distributiva con respecto a la diferencia.

Ejemplo 27-1: Obtengamos la desviación estándar para la variable del ejemplo 6.

Como la varianza es: 2945556, se tiene que:

s= 1716.26

Ejemplo 27-2: Calcule usted el coeficiente de dispersión para la variable del ejemplos4.

Ejemplo 28: Calcule la dispersión para el ejercicio 10

Ejemplo 29: Obtengamos las desviaciones estándares para las variables del ejemplo 11.

29.1 - Coeficiente de dispersión para las horas extras diarias:

(29)

29.2 - Coeficiente de dispersión para las horas extras diarias de los locales uno y dos:

s

1 2

0 91632373

0 84

  

 .

.

0.9572479981698

= + 0.9165151389912

Repiense lo indicado en el inciso 29.1.

Ejemplo 30: Obtenga usted las desviaciones estándares para las variables del ejemplo 12.

COMO INTERPRETAR A LA DESVIACION ESTANDAR:

1- SUPONIENDO QUE LOS DATOS MUESTREN UN HISTOGRAMA CAMPANULAR:

O sea cuando los datos graficados presentan un solo pico y presentan una disminución suave y simétrica respecto desde el pico hacia los extremos.

s x

m( ) este intervalo contiene aproximadamente el 68% de los valores observados.

s x

m( )2* este intervalo contiene aproximadamente el 95% de los valores observados.

s x

m( )3* este intervalo contiene aproximadamente el 99% de los valores observados. A continuación se detalla la distribución de edad para el personal de una empresa, del ejemplo 11.3:

Edad 16-18 18-25 25-35 35-40 40-50 50-60 60-65 66

Cantidad 3 20 30 25 35 30 5 2

Se conoce asimismo, las edades promedios; que a continuación se detallan:

De los 30 jerarquizados: 55

De las mujeres 31,55

De los varones 45,5

para cuál de todas las variables el promedio de edad es más representativo?; Justifique su respuesta.

Var(Categoría)= 56.8516 Var(sexo)= 46.704 Var(edad)= 153.970267

(30)

0.31083356 39.92 12.4084 CV 0.17134268 39.92 6.834 CV 0.18887776 39.92 7.54 CV EDAD SEXO CATEGORIA      

S/m(x) me da una medida comparable entre todas ellas - mide la dispersión en forma

relativa a su media-, la menor es la correspondiente a la variable sexo; por lo tanto es la más representativa; la menos dispersa.

De otra manera:

0.99 12.40) * 3 39.92 X 12.40 * 3 P(39.92 .99 6.834) * 3 39.92 X 6.834 * 3 P(39.92 0.99 7.54) * 3 39.92 X 7.54 * 3 P(39.92                0

El intervalo de menor longitud –que acumula la misma probabilidades el correspondiente a la variable sexo; por lo tanto la variable más homogénea es la variable sexo.

2- PARA CUALQUIER FORMA QUE PRESENTE EL HISTOGRAMA DE LOS

DATOS OBSERVADOS

A partir de la desigualdad de Chebyshev, se tiene que:

1 , * )

(x s c c

m contiene al menos 1 1₂

c de los valores; o sea:

el intervalo m(x)2*c,c2 contiene al menos ¾ ( 75%) de los valores.

el intervalo m(x)10*c,c10 contiene al menos 99/100 ( 99%) de los valores.

La regla citada en el inciso uno, da una buena aproximación en la mayoría de los casos, por lo tanto usted use la que considere pertinente, excepto que se le indique cuál debe usar para una situación particular.

Ejemplo 31: Para el ejemplo 11, realicemos la interpretación presentada en este acápite, queda para usted la misma tarea realizarla para el resto del ejemplo.

Para el local 1 el intervalo: [2.98148 + 0.95724 ; 2.98148-0.95724] representa aproximadamente al 68% de las horas extras realizadas en el local 1.

(31)

Y con la desigualdad de Chebyshev, para c=2, tenemos para el local 1 que:

[2.98148 +2* 0.95724 ; 2.98148-2*0.95724] acumula al menos al 75% de los datos.

1.2.3.3 - ANALISIS DE SIMETRIA

“La belleza de los genes:...Según Thornhill, citado por The Economist, hasta un milímetro o dos de asimetría en las proporciones corporales tienen su importancia en el balance final. El investigador y sus colegas sostienen que la simetría nos hace atractivos porque se relaciona íntimamente con la habilidad de los genes de ciertos individuos de rechazar agresiones durante el desarrollo de su embrión. Eso sería un indicador no sólo de la buena salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos”. Revista de La Nación del 28/9/97.

Si uno desea analizar si los datos están distribuidos simétricamente respecto de un patrón posicional -en nuestro caso respecto de la media-; hay tres maneras distintas de hacerlo.

1 - COMPARACION DE LA MEDIA CON LA MEDIANA Y EL MODO.

Para distribución que presenta un solo máximo:

Si las tres medidas de posición citadas: media, mediana y modo, son congruentes, se dice que la serie es simétrica; de lo contrario, es asimétrica.

Para distribución que presenta más de un máximo:

Si: media, y mediana, son congruentes, y ambos máximos (si son dos) son simétricos respecto de la media, se dice que la serie es simétrica; de lo contrario, es asimétrica.

Ejemplo 32 -1: Si retomamos el ejemplo 9, tenemos que:

m(x)= 2961.53; me(x)= 2712.5 y mo(x)= 2600;

por lo tanto la serie no es simétrica -analice la gráfica de la misma- Es asimétrica a derecha

mo(x)= 2600< me(x)= 2712,5< m(x)= 2961,53

Ejemplo 32-2: Haga lo mismo para el ejemplo 10.

(32)

31,4 –32 - 32,5 – 33 – 33,2 – 33,5 –33,6 – 34,3 – 34,5 –34,5 – 34,7 –45 – 35,2 – 35,2 –35,5 –35,7 – 35,8 –35,8 –35,9 –36,2 –36,2 – 37,5 –38 –38,1-39,1 –39,7

Recuerde:

N rango Amp

log 3322 . 3 1

int  

Los salarios de $400 son mayoría. Solamente el 1.6 por ciento de los habitantes recibe más de 2400 pesos.

Más de la mitad de los trabajadores argentinos gana hasta 400 pesos por mes, frente al 1.6 por ciento que percibe más de 2400, según un informe de la consultora Equis.

De esta manera, 4.498.088 empleados se ubican en el tramo salarial más bajo del país de acuerdo con la última medición oficial de ingresos, que se realiz6 en octubre pasado. Un año antes, esa cantidad llegaba a 4.195.877. Para Equis, “el crecimiento de esta

población de alta carencia en parte se explica por la incorporación de nuevos trabajadores a empleos precarios de baja remuneración y, adicionalmente, porque 300.000 trabajadores que ganaban entre 401 y 600 pesos mensuales se deslizaron hacia abajo, en tanto otros 150.000 trabajadores cayeron al segmento de 200 pesos o menos”.

El informe, al que accedió La Nación, concluye que en la Argentina actual la existencia de fuentes de trabajo precarias no supone “superar el umbral de pobreza”...

La radiografía elaborada por el Indec, demuestra que en mayo de 1998 había 1.248.107 empleados urbanos que ganaban hasta 200 pesos, equivalente al 14.6% del total. En octubre de 1999, esa cifra había pasado a 1.393.525, el 15.8% del total...

En el tramo salarial siguiente, hasta 400 pesos mensuales, se pasó de 2.809.850 (32.8%) a 3.104.562 (35.2%) en el mismo período....

Sueldos más altos:

Los datos del Indec, recogidos por la Encuesta Permanente de Hogares (EPH), registran en el otro extremo de la pirámide salarial que en esos 17 meses también creció, levemente, la cantidad de personas que ganan entre 2400 y 2600 pesos: de 36.071 (0.4%) a 44.095 (0.5%).

En un peldaño más alto, en cambio, hubo un ligero retroceso entre aquellos que ganan más de 2600 pesos: de 104.621 (1.2%) a 97.009 (1.1%).

En el medio de la escalera, el 22.8 por ciento de los trabajadores gana entre 401 y 600 pesos. El 17.9 gana entre 401 y 600 pesos, y el 8.3 por ciento, 1001 pesos o más. Nivel de calificación:

Entre los que ganan hasta 200 pesos, el 87.5% son trabajadores informales, un porcentaje que en el caso de los que ganan más de 2600 se reduce al 8.4 por ciento.

En el tramo salarial de 2000 a 2600 pesos no aparece registrado ningún trabajador informal. El nivel de preparación también refleja claras diferencias.

Entre los profesionales, sólo el 1% gana hasta 200 pesos y el 66,8% gana más de 2600. La relación es inversa entre los empleados sin calificación: el 67.1 por ciento gana hasta 200 pesos y el 0.3% gana más de 2600.

(33)

En el mismo tramo salarial sólo hay un 0.4% de trabajadores con educación primaria incompleta y un 3.7% con secundaria incompleta.

La investigación también demuestra la discriminación salarial hacia las mujeres: en el tramo hasta 200 pesos, el 59.1% son trabajadoras; en el tramo de 2600 pesos o más, sólo el 24,1% son mujeres...

RADIOGRAFIA SALARIAL ARGENTINA –para el total país en octubre de 1999 – Total: 8.819.781 trabajadores proyectados LA Nación 10/4/2000

Monto salarial Porcentaje de

trabajadores

comprendidos en el tramo

0 - 200 15.8

201 – 400 35.2

401 – 600 22.8

601 – 1000 17.9

1001 – 2400 6.7

2400 – 10000 1.6

Téngase presente que el valor 10000 lo estipuló quien escribe este apunte.

1 – Analice qué tipo de variable es el monto salarial – cuantitativa/cualitativa - - continua/discreta-, y cómo se han generado los tramos de montos salariales

2 – Relación los conceptos estudiados sobre probabilidades y las desagregaciones realizadas por la Redacción de La Nación.

3 – Realice un gráfico para la tabla de datos dada.

4 – Calcule la media del monto salarial del país; calcule su dispersión. 5 – Calcule la mediana, el cuartil primero y el tercero.

6 – Calcule el modo. Tenga presente que los intervalos no son constantes. Para calcular d1 y d2 tenga en cuenta:

(34)

donde frecabs. denota a frecuencia absoluta y frecrel denota frecuencia relativa. 5 – Cuál es el monto salarial mayor, del 80% de los asalariados que menos ganan.

6 – Cuál es el monto salarial menor, del 25% de los asalariados que más ganan. Compare este valor con el cuartil tercero hallado en el ítem 5.

2 - COMPARACION RELATIVA DE LA MEDIA CON LA MEDIANA

RESPECTO DE LA DESVIACION ESTANDAR .

Otra medida simple de la asimetría, pero que permite sacar el tipo de sesgo que presenta la serie -en el caso de ser asimétrica- es la que compara relativamente a la media con la mediana, de acuerdo a la siguiente forma:

A m x m x

s x

s

e  ( ) ( )

( )

Cabe consignar, que el denominador de esta relación siempre es positivo, por lo tanto el signo de As viene dado por el numerador -si es negativo se debe a que m(x) es

menor a me(x) y viceversa-. Y se dice, que si As es positivo los datos están sesgados a

derecha , o sea la cola se alarga a derecha o lo que se puede interpretar -si hay un solo pico- que existe cierta simetría a izquierda; y si As es negativo los datos están sesgados a

izquierda. Esto se debe a que en una distribución asimétrica, con una cola muy larga en una dirección y un único pico, la media se ve desplazada en la dirección de la cola más larga -téngase presente que la media se ve influenciada por los valores extremos de la variable y por las frecuencias de aparición de cada uno de los valores de la variable-.

Ejemplo 34: Si retomamos el ejemplo 9, tenemos que:

A_s  2961 53. 2037 5. 

1588.256645508 0.5817876166371 > 0; observe que la cola se alarga a

derecha.

Ejemplo 35: aplique este criterio al ejemplo 10

3- COEFICIENTE DE ASIMETRIA

(35)

alguna desviaciones positivas relativamente grandes. Si los datos tienen distribución aproximadamente campanular, este coeficiente se asemeja al valor cero.

3 2 3 )) ( ( )) ( (           _  



N x m x N x m x CA i i i i s

Si CAS < 0 datos sesgados hacia izquierda;

Si CAS >0 datos sesgados hacia derecha;

Si CAS = 0 datos no sesgados.

1.2.3.4 -MEDIDA DEL PESO DE LAS COLAS -O DE LA ALTURA DEL

HISTOGRAMA- CURTOSIS

Cuando los datos tienen una forma aproximadamente campanular la curtosis es aproximadamente igual a 3. Una distribución que tenga las colas más pesadas -más anchas- que una distribución campanular tiene una curtosis mayor a tres, en el caso de colas menos pesadas la curtosis es menor a tres. Debido a que depende de potencia cuartas,

modificaciones pequeñas en los valores extremos generan modificaciones sustantivas en el resultado de la medida; por lo tanto, siempre es recomendable realizar un análisis gráfico de los datos observados para detectar dichas situaciones.

4 2 4 ) ( ( )) ( (           _  



N x m x N x m x K i i i i

(36)

Li Ls XI fi Xi*fi (Xi-40.5)^2*fi (Xi-40.5)^3*fi (Xi-40.5)^4*fi

30 32 31 1 31 90.70294785 -863.8375985 8227.024748

32 34 33 4 132 226.430839 -1703.622503 12817.73121

34 36 35 6 210 183.0748299 -1011.270489 5586.065559

36 38 37 12 444 149.0068027 -525.0715905 1850.252271

38 40 39 13 507 30.18594104 -45.99762445 70.0916182

40 42 41 16 656 3.628117914 1.727675197 0.822702475

42 44 43 19 817 116.4988662 288.473383 714.3150436

44 46 45 6 270 120.2176871 538.117266 2408.715381

46 48 47 4 188 167.7641723 1086.472735 7036.20438

48 50 49 2 98 143.69161 1217.957456 10323.63939

50 52 51 1 51 109.7505669 1149.767844 12045.18693

84 40.524 15.96371882 1.579958968 727.1434433 CAs= 0.025 >0 Datos

leve-mente

sesga-dos a

dere-cha

La cola se alarga

leve-mente a derecha

K= 2.853 <3 Colas menos

pesa-das

En promed

io leveme nte baja

(37)

0 2 4 6 8 1 0 1 2 1 4 1 6 1 8 2 0

3 1 3 3 3 5 3 7 3 9 4 1 4 3 4 5 4 7 4 9 5 1

S e rie 1

Ejemplo 37: Realice usted el estudio para el ejemplo 9 y 10.

DE 1.2.4 INTERPRETACION DE LOS RESULTADOS:

Los datos generalmente están incompletos, o bien son una descripción de lo acontecido hasta el momento de su procesamiento; por lo tanto, y en general quien deba tomar decisiones en términos de las resultados obtenidos -de acuerdo a lo planteado en los incisos anteriores- deberá aceptar trabajar con un cierto grado de incertidumbre.

La teoría estadística; por medio de la medida de la incertidumbre -más precisamente la probabilidad- da técnicas para medir el error probable de cometer, ante una determinada acción definida a partir del análisis de los resultados observados.

EJERCITACION INTEGRADORA

38- El consumo de arroz –en cierta población- está relevado y sus datos se detallan a continuación

Edad Menos de

5 años

Menos de 10 años

Menos de 40 años

Hasta 60 años

Más de 60 años Cantidad

de personas

500 1000 2500 1500 1000

Consumo de arroz

10 15 12 7 20

(38)

38.3 Calcular la dispersión para el consumo de la población.

39– En la tabla adjunta se detalla la distribución porcentual del ingreso y la cantidad de horas diarias laborales por familia,

Ingreso % de

familias

Cantidad Horas diarias laborales

Tiempo insumido de

viaje hacia/desde

lugar de trabajo

Cantidad de hijos en edad

escolar

0 – 200 35 15 3 1

200 – 400 30 18 3 3

400 – 600 15 13 2 2

600 – 1000 9 20 2 3

1000 – 2400 6 18 1 1

2400 –10000 5 12 1 2

Calcular: 1 -El promedio de ingreso por familia;

2- El promedio de hijos en edad escolar por familia ;

3- El porcentaje de familias que tiene ingresos entre 400 y 1000 pesos; 4- El porcentaje de familias que tiene ingresos entre 250 y 800 pesos. 5- El promedio de horas diarias laborales

6- El promedio insumido de viaje hacia/desde lugar de trabajo.

7- El promedio insumido de viaje hacia/desde lugar de trabajo, para las familias con ingresos menores a 600 pesos.

8 -El promedio de hijos en edad escolar por familia, para familias con ingresos mayores a 600.

.

39 - La gerencia de operaciones de una sucursal bancaria estudia la distribución de los saldos deudores en cuentas corrientes con el fin de estudiar la comisión a aplicar. Al cierre del balance trimestral obtuvo la siguiente distribución:

Saldo deudor en miles de $

Cantidad de Ctas. Ctes.

Antigüedad en años promedio de las

cuentas

0-20 2 10

20-30 5 5

30-60 12 15

(39)

80-110 9 5

39.1 – Cuántas cuentas tiene un saldo deudor mayor o igual a los 60000$? 39.2 – Cuál es el saldo deudor promedio y cuál su desvío estándar?

39.3 – El gerente financiero opina que si el 10% de los saldos deudores superan los 70000$ existen serios problemas; debe preocuparse en este momento?

39.4 – Cuál es el saldo deudor con mayor ocurrencia

39.5 - Cuál es la antigüedad promedio de las cuentas deudoras?

40- La gerencia de operaciones de una sucursal bancaria estudia la distribución de los saldos deudores en cuentas corrientes con el fin de estudiar la comisión a aplicar. Al cierre del balance trimestral obtuvo la siguiente distribución:

Saldo deudor en miles de $

Cantidad de Ctas. Ctes.

Antigüedad Promedio de las Cuentas

0-25 10 1

25-55 30 2

55-80 45 3

80-105 25 1

105-130 15 2

40.1– Qué porcentaje de cuentas tienen un saldo deudor menor o igual a los 90000$ 40.2– Qué porcentaje de cuentas tienen saldo deudor entre 50000$ y 105000$? 40.3– Cuál es el saldo deudor promedio y cuál su desvío estándar?

40.4 – El gerente financiero opina que si el 15% de los saldos deudores superan los 75000$ existen serios problemas; debe preocuparse en este momento?

40.5 – Cuál es el saldo deudor con mayor ocurrencia

40.6 – Cuál es el promedio de Antigüedad de las Cuentas con saldo deudor?

40.7 – Resulta ser representativo el promedio de antigüedad de las cuentas con saldo deudor?

41 - Complete la siguiente tabla (si es posible) para que cumpla lo pedido:

X FRECUENCIA

RELATIVA 0

1

2 0.5

(40)

1) La moda sea 2 y la media sea mayor a 2. 2) La moda sea mayor a 2 .

3) La mediana, la moda y la media sean 2. 4) La dispersión sea 0.

5) Cómo haría para que la dispersión sea lo más pequeña posible. 6) Cómo haría para que la dispersión sea lo más grande posible. 7) La media sea 3.

8) La distribución sea simétrica.

9) La distribución sea simétrica pero con una mayor dispersión que en el ítem anterior. 10)La distribución sea simétrica pero con una menor dispersión que en el ítem 8.

42 - Supongamos que se toma una muestra de la altura de niños recién nacidos y se obtiene los siguientes datos, medidos en metros:

0.42 - 0.51 - 0.47 - 0.51 - 0.43 - 0.47 - 0.54 - 0.51 - 0.52 -0.52 1) Calcule la altura promedio. En qué unidades le dió? 2) Calcule la varianza. Qué unidades tiene la medida? 3) Calcule la dispersión. Qué unidades tiene la medida?

4) Calcule la mediana y la moda? Qué unidades tienen las medidas? 5) Calcule los coeficientes de asimetría y kurtosis. En qué unidades le dio? 6) Describa la simetría y kurtosis de la distribución. Grafique.

7) Qué pasaría si al registrar los datos se reemplaza por error el valor 0.42 por 0.11? Cuáles parámetros se verían más afectados? Saque conclusiones.

43 - Repita el ejercicio 42 pero tomando los valores medidos en cm. Qué parámetros se vieron modificados y cómo (mayores o menores)? Qué coeficientes se vieron modificados y cómo?

Saque conclusiones acerca de por qué es necesario tomar los coeficientes de asimetría y kurtosis, en vez de utilizar los momentos centrados correspondientes.

44 - Agrupe los datos obtenidos en el ejercicio 43, según los siguientes rangos [40, 44); [44,48); [48,52) y [52,56).Presente una tabla de distribución de frecuencias.

1) Calcule media, moda y mediana. 2) Calcule los percentiles 10 y 90.

3) Calcule qué porcentajes de bebés son mayores a 45 cm. 4) Calcule los coeficientes de asimetría y kurtosis.

5) Compare con los resultados obtenidos en el ejercicio 43.

GRAFICACION POR MEDIO DE CAJA Y BIGOTE