Curso de Estadística Unidad de Medidas Descriptivas Lección 1: Medidas de Tendencia Central para Datos Crudos - Lecc 1-Tendencia Central Datos Crudos

Texto completo

(1)

Curso de Estadística

Unidad de Medidas Descriptivas

Lección 1:

Medidas de Tendencia Central para

Datos Crudos

Creado por: Dra. Noemí L. Ruiz Limardo,

EdD

(2)

Objetivos

1. Definir las Medidas de Tendencia Central: media, moda y

mediana.

2.

Identificar las características de cada una de las medidas de

tendencia central.

3.

Calcular las medidas de tendencia central para datos crudos.

4.

Definir el concepto de valor típico.

5.

Seleccionar la medida de tendencia central que mejor

represente el valor típico de un grupo de datos.

6.

Distinguir cuándo debe utilizarse una medida de tendencia

central en preferencia de otras, según la situación que se

(3)

Introducción

En nuestra vida diaria utilizamos frecuentemente términos como los siguientes: estudiante más típico, edad promedio de la población, promedio de bateo,

actividades de un día típico, características del puertorriqueño promedio, efectos secundarios típicos de un medicamento, precios promedios, entre otros. Cada uno de estos conceptos representa una medida de tendencia central.

Las medidas de tendencia central son medidas o valores que tienden hacia el centro en un conjunto de datos. Se llaman medidas de “tendencia central” porque tienden de alguna manera hacia el centro del conjunto de datos que se esté considerando. Las medidas de tendencia central son indicadores

estadísticos que muestran hacia qué valor central (o valores centrales) se agrupan los datos. Se conocen también como los promedios de un grupo de datos. Representan el valor más típico en una distribución de datos. El valor típico de un grupo de datos es aquella medida de tendencia central que mejor representa el grupo. Las medidas de tendencia central que más se utilizan son:

– Media Aritmética – Mediana

– Moda

Estas medidas se utilizan:

a. Para mostrar en qué lugar se ubica el dato promedio o típico del grupo.

b. Como método para comparar o interpretar cualquier valor en relación con el dato típico en el grupo.

c. Como método para comparar resultados medios entre dos o más grupos.

En la presente lección sólo se presentarán las medidas de tendencia central de una muestra ya que es muy difícil obtener estos parámetros para poblaciones enteras. A continuación se discuten las características particulares de cada medida y presentan ejemplos de cada una de ellas.

A. MEDIA ARITMÉTICA

La media aritmética se conoce también como el promedio aritmético de una lista de valores. A veces se conoce simplemente como la media. La media aritmética es el valor que balancea o distribuye en partes iguales un grupo de valores. Es por esto, que para obtener la media de un grupo se suman todos los valores (xi) y luego se divide ese resultado por el total de datos (n). Recuerde

(4)

n

x

x

n

i i 1

x

- Es el símbolo que se utiliza para representar la media aritmética

n

- Es la cantidad total de datos que haya en el conjunto

i

x

-Representa cada dato (

x

1es el dato 1,

x

2es el dato 2, hasta

x

nque es el último dato)

-Este es el símbolo de sumatoria y significa que se suma la serie de valores que están definidos por el símbolo. En este caso, como

i

comienza en 1 (

i

1

) y termina en

n

, se suma desde el valor

x

1

hasta el valor

x

n.

(La fórmula anterior se utiliza cuando los datos no están agrupados. En las lecciones 2 y 3 se estudiará cómo calcular la media cuando los datos están agrupados.)

Algunas características de la media son las siguientes:

1. La media aritmética aplica cuando tenemos datos cuantitativos.- Si los datos no son cuantitativos no se puede calcular la media ya que no se pueden sumar variables categóricas.

2. Siempre existe una media y ésta es única, esto es, una muestra no puede tener más de una media.-No importa la forma en que sumen los valores de un grupo, al sumar y dividir se obtendrá la misma media. Por tanto, los valores se pueden sumar en cualquier orden.

3. La media aritmética considera todos los valores de la muestra.- Esta característica hace que la media sea una de las preferidas entre todas las medidas de tendencia central ya que la mayoría de las veces uno desea considerar todos los valores en el grupo.

4. Se afecta por valores extremos (mínimo y máximo).-Si un grupo tiene valores extremos máximos, la media tenderá a ser un valor que quede cerca de los números más altos del grupo. De igual manera, si un grupo tiene valores extremos mínimos, la media tenderá a ser un valor que quede cerca de los números más pequeños del grupo. Si la

(5)

extremos, ya sea mínimos o máximos, no se acostumbra utilizar la media como el valor típico del grupo. En cambio se prefiere utilizar la mediana o la moda que se discutirán más adelante en esta lección.

Para entender mejor este concepto, considere la situación de un estudiante que obtiene las siguientes cinco notas de exámenes: 89, 92, 97, 95, 10.

6 . 76 5 10 95 97 92 89 x

Si se calcula la media aritmética de este grupo, se obtiene 76.6. El valor obtenido es “como” si el estudiante hubiera sacado 76.6 en todos los exámenes. Observe que como había un valor extremo mínimo (10) en relación a las otras notas, el promedio aritmético tiende hacia los valores mínimos y no hacia las puntuaciones más típicas que obtuvo el estudiante. La nota promedio del estudiante baja con una sola nota baja que obtuvo aunque todas las demás notas hayan sido altas. En este caso, la media no representa un valor típico. Cuando hay valores extremos en una muestra no se puede utilizar la media como el valor típico del grupo.

5. Es bastante confiable ya que las medias tomadas de muchas muestras aleatorias de la misma población no varían mucho. -Esta confiabilidad que ha sido probada, permite que la media aritmética sea la medida de tendencia central por excelencia para hacer inferencias sobre la población. Es por esto, que la mayoría de las personas le atribuyen mayor importancia entre las demás medidas de tendencia central.

Ejemplo-1

Considere los siguientes 12 datos:

1 2 3 5 2 1 4 4 6 2 1 7

El tamaño de la muestra es n = 12. La media aritmética de este grupo es:

(6)

Ejemplo-2

Se recopiló información de una muestra de 11 marcas de un cereal sobre el contenido de gramos de grasa que una persona ingiere al comerse una ración del cereal, y se encontraron los valores que aparecen en la tabla a continuación. Halla la media aritmética del contenido de gramos de grasa de esta muestra.

Marca Gramos de grasa

1 6.5

2 6.5

3 9.5

4 8.0

5 14.0

6 8.5

7 3.0

8 7.5

9 16.5

10 7.0

11 8.0

La media aritmética de este grupo es:

64 . 8 11 95 11 0 . 8 0 . 7 5 . 16 5 . 7 0 . 3 5 . 8 0 . 14 0 . 8 5 . 9 5 . 6 5 . 6 x

El contenido de gramos de grasa promedio en una ración de este cereal, para esta muestra es 8.64 gramos. Esto es “como” si todas las marcas tuviesen 8.64 gramos de grasa.

Ejemplo-3

Los siguientes datos representan temperaturas en grados Farenheit de varias ciudades de los Estados Unidos para un día de invierno en 2008. Halla la media aritmética de este grupo.

65°, 38°, 56°, -11°, -5°, 45°, 40°, -22°, -14°, 12°, 25°, 3°, -2°

La media aritmética de este grupo aproximada a dos lugares decimales es:

69 . 17 13 230 13 2 3 25 12 14 22 40 45 5 11 56 38 65 x

(7)

B. MEDIANA

La mediana es el valor que está localizado en el mismo centro (el medio) de un grupo de datos ordenados. Para poder determinar el centro de una distribución ordenada, se necesita primero ordenar los datos de menor a mayor. La mediana es el valor que representa donde está localizado el 50% de la muestra. Esto significa que bajo la mediana está localizado el 50% de los datos y sobre la mediana está localizado el 50% restante.

La mediana, además de ser una medida de tendencia central, también es una Medida de Posición. Como medida de posición, la mediana representa el segundo cuartil (Q2) o la percentila 50 (P50). Las medidas de posición se

discutirán en otra lección más adelante.

A continuación se demuestra cómo se calcula la mediana usando el siguiente ejemplo:

Ejemplo-4

Un grupo de siete jóvenes van a iniciar un programa de pérdida de peso. Antes de entrar al programa se registra el peso en libras de cada participante. Los resultados fueron:

180, 201, 220, 191, 219, 209, 186 Cómo calcular la mediana

1. Para calcular la mediana, primero se colocan los datos en orden de menor a mayor.

Ejemplo: Si se colocan en orden los datos anteriores se obtiene lo siguiente:

180, 186, 191, 201, 209, 219, 220

2. Luego, hay que determinar la localización del centro de la distribución, que es la posición donde está localizada la mediana, usando la fórmula siguiente:

Posición donde está localizada la mediana =

50% de los datos 50% de los datos

Valor Menor Mediana Valor Mayor

2 1

(8)

(La fórmula anterior se utiliza cuando los datos no están agrupados. En las lecciones 2 y 3 se estudiará cómo calcular la mediana cuando los datos están agrupados.)

Ejemplo: Se aplica la fórmula anterior para conocer dónde está localizada la mediana:

La mediana de este grupo se encuentra en la 4ta posición.

3. Después de determinar la posición donde se encuentra localizada la mediana, se determina qué valor de la muestra ocupa esa posición.

a. Si la muestra tiene un número impar de datos, la mediana es un valor de la lista.

Ejemplo: Como en este conjunto n = 7, y 7 es un número impar, para determinar la mediana se busca en la lista de datos ordenados, el dato que ocupa la 4ta posición (resultado de la fórmula anterior)

180, 186, 191, 201, 209, 219, 220

La mediana de este grupo es 201 lb.

b. Si la muestra tiene un número par de datos, la mediana se halla buscando el punto medio de los dos valores centrales. El punto medio se halla sumando los dos valores centrales y luego dividiendo ese total por 2.

Ejemplo: Si al grupo de datos anteriores se le une un joven que pesa 195 lbs, la muestra tendría 8 sujetos. Como n sería igual a 8, y 8 es un número par, repitiendo el proceso anterior para la nueva muestra, se obtiene:

La mediana está localizada en la posición 4.5, o sea, entre la 4ta y 5ta posición. La 4ta y 5ta posición lo son: 195 y 201, por tanto los dos valores centrales son: 195 y 201.

180, 186, 191, 195, 201, 209, 219, 220

4 2 8 2

1 7 2

1

n

Mediana

5 . 4 2 9 2

1 8 2

1

(9)

En este caso para obtener la mediana se halla el punto medio de estos dos valores centrales. Para hallar el punto medio se suman ambos valores y luego se divide por 2.

La mediana de este grupo es 198 lbs.

Algunas características de la mediana son las siguientes:

1. La mediana aplica cuando tenemos datos cuantitativos.- Si los datos no son cuantitativos no se puede calcular la mediana ya que no se puede determinar el punto medio de variables categóricas.

2. Siempre existe la mediana de un grupo de datos cuantitativos y ésta es única al igual que la media.- No importa cuáles sean las cantidades, al colocarse en orden siempre habrá un valor central en el grupo. El valor central podría ser un valor de la muestra (si n es impar) o podría ser el punto medio de los dos valores centrales del grupo, si n es par.

3. No es afectada por valores extremos. - La mediana no se afecta con la existencia de valores extremo ya que sólo considera el(los) valor(es) que queda(n) en el centro. Es por esto, que cuando hay valores extremos en un grupo, se prefiere la mediana como valor típico, en vez de la media.

4. No es tan confiable como la media.- No es tan confiable ya que solo considera un sólo valor del grupo: el valor central. En el caso de la media, como considera todos los valores, es más confiable que la mediana.

Ejemplo -5

Considere los mismos datos que aparecen en el Ejemplo -1. Si ordenamos la muestra de manera ascendente obtenemos lo siguiente:

1 1 1 2 2 2 3 4 4 5 6 7

Se determina la posición de la mediana. Se sustituye n = 12 y se obtiene:

198 2

396 2

201 195

5 . 6 2 13 2

1 12 2

1

(10)

Observe que n = 12, es par, por tanto la mediana está localizada entre los dos valores centrales que están sombreados: 2 y 3

Ahora se determina la mediana buscando el punto medio de 2 y 3, que es: 2.5

5

.

2

2

3

2

mediana

Ejemplo –6

Los siguientes datos representan edades de un grupo de pacientes de cáncer:

23 12 45 15 67

La muestra ordenada es:

12 15 23 45 67

Observe que n = 5, es impar. El dato sombreado es el dato central, por lo tanto la mediana es 23.

Ejemplo –7

Halla la mediana del grupo de datos ilustrados en el Ejemplo 3. Los datos del ejemplo son:

65°, 38°, 56°, -11°, -5°, 45°, 40°, -22°, -14°, 12°, 25°, 3°, -2° Se coloca en orden ascendente los datos y se obtiene:

-22°, -14°, -11°, -5°, -2°, 3°,12°, 25°, 38°, 40°, 45°, 56°, 65° Como n = 13, la mediana está localizada en la 7ma posición:

La mediana es 12° (valor sombreado) ya que es el dato que ocupa la 7ma posición.

C. MODA

La moda es el dato que más se repite o que aparece con mayor frecuencia en una lista de datos. La misma es muy fácil de calcular, pero tiene sus

7 2 14 2

1 13 2

1

(11)

limitaciones. Si ningún dato se repite, entonces no hay moda. Así también, es posible que existan dos datos que se repitan igual número de veces más que los demás. En ese caso decimos que la muestra es bimodal. Por lo general, si tenemos una muestra que tiene tres o más datos que se repiten igual número de veces más que los demás se opta por usar otras medidas de tendencia central como valores típicos. No existe una fórmula matemática para calcular la moda ya que se halla sólo por inspección visual, mirando cuál es la frecuencia de los valores.

Algunas características de la moda son las siguientes:

1. No siempre existe.- A veces no hay moda porque no hay un valor que se repite más que los demás.

2. Si existe, no necesariamente es única.- A veces hay más de una moda. Cuando hay dos modas, decimos que el grupo es bimodal. 3. Cuando existe, la moda es siempre un valor del grupo de datos

En general, si la muestra se distribuye normalmente, las tres medidas de tendencia central deben tener valores cercanos. En ese caso, cualquiera de las tres podría ser el valor más representativo o típico del grupo.

Ejemplo-8

Considere los mismos datos en el Ejemplo-1.

1 2 3 5 2 1 4 4 6 2 1 7

Para poder ver cuáll es la moda, a veces conviene agrupar los datos por frecuencias para ver cuál es la frecuencia mayor:

Dato Frecuencia

1 3

2 3

3 1

4 2

5 1

6 1

7 1

(12)

Se observa que el 1 y el 2 se repiten ambos tres veces y esta es la frecuencia mayor. Esto significa que la muestra es bimodal y que las modas son 1 y 2.

EJERCICIOS EJERCICIO-1

Considere los siguientes datos crudos y halle la media, moda y mediana:

9 12 8 10 9 11 12

15 15 20 9 14 15 21

EJERCICIO- 2

Halla la media aritmética, mediana y moda del siguiente grupo de datos: 84, 90, 65, 52, 90

EJERCICIO- 3

En la librería de la universidad se vendió el libro de estadísticas por 8 semanas. A continuación aparece la cantidad de libros que se vendió cada semana:

14, 21, 12, 18, 15, 17, 15, 16 a). ¿Cuál fue la media aritmética de libros vendidos? b). ¿Cuál fue la mediana de libros vendidos?

c). ¿Cuál fue la moda de libros vendidos?

d). ¿Qué promedio representa el valor más típico?

EJERCICIO- 4

(13)

RESPUESTAS A EJERCICIOS

EJERCICIO – 1 Media = 12.86 Mediana = 12

Moda: La muestra es bimodal y las modas son 9 y 15

EJERCICIO- 2

Media Aritmética = 76.2 Mediana = 84

Moda = 90

EJERCICIO- 3

Media Aritmética = 16 Mediana = 15.5

Moda = 15

El valor más típico de este grupo, como no hay valores extremos, podría ser cualquiera de las tres medidas. Si se desea considerar todos los valores, se podría usar la media. Si se desea considerar los valores que están justo en el medio de la distribución, se podría usar la mediana. Si se desea considerar la cantidad de libros que se vendió con mayor frecuencia, se podría usar la moda.

EJERCICIO- 4

Para hacer la mejor selección, convendría conocer el valor más típico de los precios de las casas en ese nuevo vecindario. Si Ana escogiera la media, podría haber precios extremos lo cual no representarían los valores típicos reales. En este caso, conviene mejor conocer la mediana. Si Ana quiere saber cuáles son los precios que más abundan en el nuevo vecindario, entonces convendría conocer la moda. Si Ana desea que se consideren todos los valores,

independientemente de si hay precios extremos o no, entonces podría decidir conocer la media.

Figure

Actualización...

Referencias

Actualización...