Las medidas de posición incluyen a las medidas de Tendencia Central y a las no centrales que son las de Orden.

Texto completo

(1)

UNIVERSIDAD NACIONAL DE LA PLATA

FACULTAD DE PSICOLOGÍA

CÁTEDRA: ESTADÍSTICA APLICADA A LA PSICOLOGÍA

Prof. TITULAR: Psic. Lilia Elba Rossi Casé

Prof. ADJUNTA: Psic. Rosa H. Neer

JEFE DE TRABAJOS PRACTICOS: Psic. Susana Lopetegui

APUNTE DE CATEDRA: Revisión 2010

ELABORADO POR: Psic. Susana LOPETEGUI

Psic. Rosa NEER

ESTADÍSTICA DESCRIPTIVA: MEDIDAS DE POSICIÓN

Una vez elaboradas las tablas y gráficos para una determinada serie de datos, se torna necesario continuar la tarea de síntesis. Esta tarea consiste en presentar sólo unas pocas características que den cuenta de la distribución de frecuencias. Así podremos relacionar y comparar distintos tipos de distribuciones más rápidamente.

Las medidas de posición incluyen a las medidas de Tendencia Central y a las no centrales que son las de Orden.

Con fines didácticos, y para mostrar conceptualmente qué representa cada una de las medidas estadísticas de posición, cómo se obtienen y qué datos intervienen para su resolución, cada medida será desarrollada aquí para datos sin agrupar y para datos agrupados en una tabla simple de frecuencias. No se trabajará con datos agrupados en intervalos pues cuando tenemos gran cantidad de datos, conviene la utilización de alguno de los programas estadísticos en los cuales los datos se cargan sin agrupar.

MEDIDAS DE TENDENCIA CENTRAL

Partimos del supuesto que cuando medimos algún rasgo o característica, la información tiende a concentrarse en un sector de la variable. En distribuciones pertenecientes al campo social, la mayoría de las observaciones se encuentran concentradas en el centro, disminuyendo gradualmente hacia ambos extremos.

Las medidas de Tendencia central brindan una rápida y adecuada descripción de las distribuciones. Se deberá seleccionar en cada caso la más adecuada.

Estas medidas constituyen un valor de la variable alrededor del cual se halla la mayor cantidad de observaciones. Al ser un valor de la variable se expresan en la misma unidad de medida que ella (Kg, CI, puntos, etc.). Del grupo de medidas existentes, cada una de las cuales implica una definición diferente de la puntuación central, utilizaremos las más comunes: Modo, Media y Mediana. El uso de cada una dependerá de la forma de la distribución y del nivel de medición con el que estemos trabajando.

(2)

MODO

Es la medida de tendencia central más simple ya que la podemos determinar con una rápida mirada a la distribución. Se define como aquel valor de la variable que se repite más veces o sea, el que posee la mayor frecuencia absoluta. Es importante distinguir que modo o

moda es la puntuación o valor de la variable más frecuente, pero no es la frecuencia de esa puntuación. Lo simbolizamos Mo.

Si nos remitimos a la variable cualitativa “nacionalidad de los integrantes de un grupo de estudio” desarrollada en el módulo anterior, vemos que el Mo es Argentino, puesto que ésta es la categoría que tiene la mayor frecuencia.

Con una variable cuantitativa puede ocurrir que tengamos los datos sin agrupar o agrupados.

Así para la siguiente serie de puntajes sin agrupar: 2 - 4 - 4 - 4 - 5 - 6

El Mo es 4 puntos, vemos que este valor se presenta tres veces mientras que el resto solo una. Esta es una distribución unimodal ya que el Mo es uno, si tuviese dos modos sería bimodal, también pueden presentar más de dos modos, siendo en esos casos polimodal. Si todas las puntuaciones o valores tuvieran la misma frecuencia diríamos que no hay Mo. En estos dos últimos casos el Mo pierde validez como medida resumen de tendencia central pero posibilita observar la dispersión de los datos.

Podemos concluir que el Mo es la única medida de tendencia central que podemos

hallar en todos los niveles de medición. En ocasiones podemos considerar que es la más

representativa de la distribución, de hecho, si vamos a hacer una selección por azar de un valor del grupo, tiene más probabilidad de ser seleccionado el valor que corresponde al modo. En grupos pequeños el modo puede ser muy fluctuante, pues la variación de un valor puede alterar el modo.

MEDIA ARITMÉTICA

La media aritmética es un promedio, es la suma de cada una de las observaciones divida por el total de casos. Cada uno de los valores tiene el mismo peso en la determinación de la media, por ello se la considera también como el centro de gravedad de la distribución. Esto se puede escribir:

M = n x

M = Media.

= Sumatoria de X = Valor de la variable n = Total de casos

(3)

La media sólo puede ser hallada cuando trabajamos con variables cuantitativas,

no podríamos hallar un promedio de nacionalidad.

La media es un valor tal que aunque nadie lo posea en el grupo, si lo multiplicamos por el número de observaciones obtengo el valor de la sumatoria de todas las observaciones . Es una síntesis de los valores dentro del grupo, siempre debe ser un valor posible dentro de la variable, es decir debe estar comprendido dentro de los valores de la misma.

Es la medida de posición más estable, pues se observan pocos cambios de una muestra a otra, por ello es tan utilizada en estadística inferencial.

Cálculo de la media para datos sin agrupar

Si tuviésemos los siguientes puntajes de un grupo de alumnos 2 - 3 - 4 - 5 - 6

tendríamos que

M = 2+3+4+5+6 = 20 = 4 puntos 5 5

Aquí vemos que en la determinación de la media intervienen todos los puntajes por igual.

Si reemplazamos el valor 6 de la serie anterior, por un puntaje de 21 qué pasaría con la media? M = 2+3+4+5+21 = 35 = 7 puntos

5 5

Observamos que la media se desplaza hacia el valor extremo. De esto podemos concluir que la media es sensible a los valores extremos no compensados. Si agregamos dos valores, uno en cada extremo, la media no variará demasiado porque las diferencias se compensarían. Por ello no conviene usar la media cuando hay valores extremos no

compensados.

Propiedades y características de la Media

• Si se suma, resta, multiplica o divide a cada valor de la variable por una constante, la media resultará sumada, restada, dividida o multiplicada por la misma constante. En el ejemplo anterior, si sumamos 2 a cada valor de la variable, tendríamos: 4 - 5 - 6 - 7 - 8

M = 6 puntos

• La sumatoria de los desvíos de cada puntaje en relación a la media es igual a 0, por eso hablamos de la media como centro de gravedad. Se expresa:

X - M = 0

en donde X - M es el desvío de cada valor a la media, o sea es la distancia entre cada puntaje y la media.

(4)

X X-M 4 -2 5 -1 6 0 7 +1 8 +2

= 0

• La suma de los cuadrados de las desviaciones de las puntuaciones de su media aritmética es menor que la suma de los cuadrados de las desviaciones respecto de cualquier punto que no sea la media.

• La media es susceptible de operaciones algebraicas, es decir pueden sumarse, restarse, etc., así si conocemos la media de diversos grupos de observaciones podríamos hallar la media del conjunto total. Usualmente llamada Media Total Supongamos que tenemos la edad de dos grupos y conocemos la media y el número de casos de cada uno.

Grupo 1: M= 18 años n = 100

Grupo 2: M = 30 años n = 200 La media total sería: Mt = 18.100+30.200 100+ 200

Mt = 26 años

Esto se podría expresar de la siguiente manera:

Mt = M 1. n 1 + M 2. n 2. n 1 + n 2

Si quisiéramos calcular un valor total a partir de la mediana o el modo de distintas distribuciones, necesitaríamos reconstruir los datos originales. Sólo con la media podemos manejarlo a partir del dato resumen.

Cálculo de la media para datos agrupados

Supongamos que realizamos la evaluación del rendimiento en estadística de un grupo de alumnos y hemos organizado los datos en una tabla simple de frecuencias:

(5)

X f X.f 4 5 20 5 7 35 6 8 48 7 10 70 8 8 64 9 7 63 10 5 50 n=50 ∑ = 350

En este caso para poder hallar la media tenemos que tener en cuenta que los datos están agrupados en frecuencias, vemos que en la tabla agregamos una columna de X.f, (pues es lo mismo hacer 6 por 2 que sumar 6 dos veces) por lo tanto aquí la media será igual a la sumatoria de cada valor de la variable multiplicado por la frecuencia dividido por el total de casos.

M = ∑ X.f = 350= 7 ptos. n 50

MEDIANA

La Mediana es aquel valor o categoría de la variable que divide la distribución en dos partes iguales, de manera tal que la mitad de los casos o individuos tienen valores inferiores a ella y la otra mitad tiene valores superiores a ese valor. Para ello, las observaciones deben estar ordenadas por lo que, esta medida de tendencia central, sólo podrá ser hallada a partir del nivel ordinal.

La simbolizamos de esta manera: Md

Por ejemplo, si tenemos las siguientes edades de un grupo de alumnos: 5 – 6 – 2 – 4 - 3

Primero debemos ordenar los datos de menor a mayor: 2 – 3 - 4 – 5 – 6

Si decimos que es el valor de la variable que divide la serie ordenada en dos partes iguales, deberemos determinar en primer lugar cuál es el orden que le corresponde.

Calculamos la Mediana de orden (Md)o. Ese orden resulta de dividir en dos el total de

casos y lo simbolizamos de la siguiente manera: (Md)o = n

2

Cuando el total de casos es menor de 30 se conviene en agregar una unidad al total de casos para disminuir el error. En nuestro ejemplo sería:

(6)

(Md)o = 5 + 1 2 (Md)o = 3

Esto significa que la Mediana será aquel valor de la variable que esté en el tercer lugar. Si contamos en nuestra serie el valor de la Mediana sería 4. Cuando el número de casos es impar, la mediana será simplemente el caso del medio. En caso de que n sea par, la Mediana resultará del promedio de los dos casos centrales.

Por ejemplo:

2 - 3 - 4 - 5 – 6 - 7 (Md)o = 6 + 1 = 3,5

2

Aquí 3,5 nos indica el orden donde se encuentra la Mediana, el valor resultará de dividir 4 más 5 por dos, es decir:

Md = 4,5 años

Recordemos que (Md)o no nos da el valor de la variable sino el número de orden

del sujeto que divide las frecuencias en dos. Cuando los datos son muchos es habitual que

se utilice directamente n/2. El valor de la Md es un valor de la variable, por lo tanto estará expresado en la misma unidad de medida que ella, sea Kg, puntos, años, etc.

Para calcular la mediana sólo intervienen los valores medios y no todos los valores como en el cálculo de la media. Si volvemos al ejemplo de las edades (2,3,4,5, y 6)

y reemplazamos el valor 6 por 21, veremos que la media se desplaza y da por resultado 7, mientras que el valor de la Md sería el mismo, es decir no se ve afectada por valores extremos

Cálculo de la Md para datos agrupados

Para poder hallar el valor de la Md en caso de que los datos estén agrupados (ya sea en una tabla simple de frecuencias o en intervalos), necesitamos incorporar otro concepto, el de

frecuencias acumuladas, que simbolizamos con F.

A partir de las F podemos determinar cuántos sujetos se encuentran por debajo de un puntaje determinado. Para obtener las F (frecuencias acumuladas) sumamos a cada f (frecuencia absoluta) de un intervalo las F del intervalo anterior.

Retomando el ejemplo utilizado para hallar la media:

X f F

4 5 5

(7)

6 8 20 7 10 30 8 8 38 9 7 45 10 5 50 n=50

Esto significaría que hasta el puntaje 7, tengo 30 sujetos, que hasta el puntaje 8 hay 38 sujetos y así sucesivamente hasta llegar al último puntaje en el que estén comprendidos todos los sujetos.

Para hallar la Md con estos datos, primero deberemos hallar la mediana de orden, como n en este caso de 50, tendríamos que:

(Md)o = 50 = 25 2

Ubicamos ese orden hallado en la primera frecuencia acumulada que lo contenga (en este caso es 30), y allí vemos cuál es el valor de variable que le corresponde. Por lo tanto, la Md en nuestra serie de puntajes sería de 7 puntos.

Sintetizando, para calcular el valor de la mediana debemos: 1.- Ordenar los valores de la variable

2.- Hallar las frecuencias acumuladas F 3.- Calcular la mediana de orden (Md)o

4.- Hallar el valor de la mediana.

CUANDO USAR CADA UNA DE LAS MEDIDAS DE TENDENCIA CENTRAL

Si bienel cálculo de las medidas es un procedimiento mecánico y puederealizarse con suma facilidad con las computadoras, no reemplaza por el momento, la conceptualización del investigador o usuario de las técnicas para la elección de la medida más adecuada y su interpretación.

MODO

* Es la única medida de Tendencia central que se puede calcular en todos los niveles.

* Cuando sólo queremos tener una idea aproximada de dónde está la mayor concentración de observaciones

MEDIA

* En escalas de intervalos iguales y por cociente. * Cuando la distribución es más o menos simétrica.

* Cuando conocemos todos los valores de la distribución, ya que en el cálculo de la media intervienen todos por igual.

* Cuando queremos hallar otras medidas estadísticas.

MEDIANA

(8)

* Cuando la distribución es asimétrica. * Cuando hay intervalos abiertos.

MEDIDAS DE ORDEN

Las medidas de Orden conforman junto a las de Tendencia Central, el conjunto de medidas de Posición.

La Mediana es una medida de tendencia central y también de orden por cuanto divide la serie ordenada en dos partes iguales.

Existen otras medidas de orden que son muy utilizadas en Psicología. Ellas son:

Cuartiles, Deciles y Percentiles.

Los cuartiles son tres y dividen el área o la frecuencia en cuatro partes iguales, de

25% cada una. Es decir que el 25% de las observaciones se van a encontrar entre el valor

menor de la distribución y el valor que corresponda al C1. El C1, C2, C3 dejan por debajo el 25, 50 y 75% de los casos respectivamente. Así, si decimos que un sujeto obtuvo un rendimiento que lo ubicó en el C1, significa que ese sujeto superó al 25% del grupo. Todas

las medidas de orden se definen por el porcentaje de casos que dejan por debajo.

Los deciles son nueve y dividen la distribución en diez partes iguales de 10% cada una. Si decimos que un sujeto obtuvo el D8 en una prueba, esto significa que este sujeto superó en su rendimiento al 80% del grupo.

Los percentiles son 99 y dividen el área en cien partes iguales del 1% cada una. Obtener el P35 significa haber superado al 35% del grupo.

El cálculo de estas medidas de orden es exactamente igual al cálculo de la Md, siendo la única diferencia al cálculo del orden correspondiente a la medida deseada.

(Md)o= n (C1)o = 1.n (D1)o = 1.n (P1)o = 1.n 2 4 10 100

Para hallar el valor correspondiente se aplica la misma fórmula que para la Md.

X f F 4 5 5 5 7 12 6 8 20 7 10 30 8 8 38 9 7 45 10 5 50 n=50

Si quisiéramos hallar el valor del P 30, sería: (P30)o = 30 . n = 30 . 50

100 100 (P30)o = 15

(9)

Buscamos 15 en la columna F (frecuencia acumulada), está contenido en F = 20. Nos desplazamos al valor de variable que le corresponde y es 6 puntos, o sea, P30 = 6 puntos.

Transformación de puntajes en percentiles

Puntaje bruto o directo, es aquel que se obtiene por ej. al sumar los aciertos que ha

tenido un sujeto al responder determinadas cuestiones requeridas en una prueba o test. Este tipo de puntaje no nos permite comparar el rendimiento del sujeto en pruebas diferentes. No es lo mismo obtener 10 puntos en una prueba que contiene 20 preguntas, que ese puntaje en una prueba que contenga 50. Por esto se hace necesaria la transformación a una escala común. Entre las transformaciones más usadas tenemos los percentiles y los deciles. Gran parte de los test Psicológicos se expresan en percentiles.

Hay diferentes métodos para construir una escala percentilar, uno de ellos es hallando los valores de los percentiles 10, 20, 30, 40, 50, 60, 70, 80. También podríamos considerarlos de 5 en 5. Generalmente no se hallan todos puesto que daría la impresión de una exagerada exactitud de cómputo que no existe.

Hallemos con los datos de la tabla anterior, el valor de los percentiles 10, 20, 50 y 60 a modo de ejemplo. (P10)o = 10 . 50 = 5 (P20)o = 20 . 50 = 10 100 100 P10 = 4 ptos. P20 = 5 ptos. (P50)o = 50 . 50 = 25 (P60)o = 60 . 50 = 30 100 100 P50 = 7 ptos. P60 = 7 ptos. P10 = 4 ptos. P50 = 7 ptos. P20 = 5 ptos. P60 = 7 ptos.

Si observamos los puntajes obtenidos para estos percentiles, vemos que la diferencia es mayor entre el P10 y P20 que entre P50 y P60, mientras entre los dos primeros hay 1 punto de diferencia, en los segundos el puntaje obtenido es el mismo. Esto es así puesto que los

puntajes son una escala que divide en partes iguales la variable, mientras que los percentiles dividen el área o las frecuencias en partes iguales (y a la variable en partes desiguales). Como el área en una curva normal tiene mayor altura en el centro y menor hacia

ambos lados, los percentiles tienden a concentrarse en el medio y a dispersase en los

extremos. Esta es la desventaja de la escala percentilar. Cuando un sujeto obtiene un

puntaje bajo deberá esforzarse mucho más que uno que tiene un puntaje medio para poder avanzar en la escala percentilar.

(10)

Ante una distribución y refiriéndonos a las medidas de Orden, podemos hacer tres planteos distintos:

* Qué número de orden o lugar ocupa la persona que obtuvo el P5 en esa distribución? Respondemos esto utilizando la fórmula:

(P5)o = 5 . n 100

* Qué percentil o posición corresponden a la persona que se halla en el orden 5? Aquí la fórmula surge del pasaje de términos de la fórmula anterior:

P = 5 . 100 n

* Qué valor o puntaje corresponden a la persona que obtuvo el P5?

Una vez ubicado el orden en la frecuencia acumulada que lo contiene, buscamos en la columna de la variable, el valor del mismo.

BIBLIOGRAFÍA:

BLALOCK, Hubert M. Estadística Social. (1986)Fondo de Cultura Económica. México CORTADA de KOHAN, Nuria Diseño Estadístico (1994) EUDEBA, Bs.As.

Figure

Actualización...

Referencias

Actualización...