MEDIDAS DE TENDENCIA CENTRAL

Texto completo

(1)

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE CIENCIAS MÉDICAS

FASE I, PRIMER ANO Documento elaborado por: U.D. ESTADISTICA Dra. Olivia de Higueros

MEDIDAS DE TENDENCIA CENTRAL

Con anterioridad se ha dicho que las distribuciones de frecuencias (simple o en intervalos de clase) son útiles para resumir los datos, pero existen situaciones en las que se necesita un tipo de resumen más conciso. Lo que se necesita en muchas situaciones es condensar los datos, es cuando se recurre a las medidas de tendencia central.

Las medidas de tendencia central son medidas descriptivas. Son valores numéricos que tienden a localizar, en algún sentido, la parte central de un conjunto de datos, algo así como la zona en donde los mismos tienden a concentrarse. Una medida de tendencia central es un solo valor representativo de todo el conjunto de datos, que pueden provenir de una muestra o una población.

Las medidas de tendencia central conllevan información respecto al valor típico o promedio de un conjunto de valores. Las más utilizadas son tres: la media aritmética, la mediana y la moda.

Moda

Su símbolo es: Mo, que se utiliza indistintamente para un parámetro o un estadístico. La moda es el valor de la variable que aparece repetido en mayor número de veces, es el valor con mayor frecuencia, por lo que no requiere de cálculo, es localizada por simple inspección, a excepción de cuando los datos se encuentren en una distribución en intervalos de clase, en cuyo caso se utilizará una forma para su cálculo.

Propiedades:

 Es la más simple de cálculo y sencilla de interpretación.

 Puede haber más de una moda, en cuyo caso podrá encontrarse distribuciones bimodales o trimodales, pero, si existiesen más de tres datos que se repiten en la misma magnitud, o todos los datos son diferentes, se dice que la distribución es amodal.

 Puede utilizarse para describir datos cualitativos o cuantitativos.

(2)

Medidas de Tendencia Central y de Dispersión Ciclo 2018

2

Ejemplo:

*Datos tomados de: “Estadística para Biología y Ciencias de la Salud”. J.Susan Milton, 3ª. Ed. Editorial McGraw. Pp 31.

** Datos tomados de: “Bioestadística” Wayne W, Daniel 3ª. Ed. Editorial Limusa. Pp. 142. Con objeto de estudio se asumirá que estos datos corresponden a una población.

Mediana

Su símbolo es: Me o Md, cualquiera de los dos puede utilizarse, y es indistinto para parámetro o estadístico.

La mediana es el valor que divide al conjunto de datos en dos partes iguales, de tal forma que el número de valores mayor o igual a la mediana es igual al número de valores menores o iguales a ella.

La mediana también es una medida de posición que se sitúa a la mitad de la distribución, por lo que requiere del ordenamiento previo de los datos, un ordenamiento en forma ascendente.

Propiedades:

 Es simple de cálculo y sencilla de interpretación. En una distribución en intervalos su cálculo es más laborioso. En su momento se desarrollara la formula.

 Es única, solamente existe una mediana para cada distribución.

Arreglo ordenado o

Serie Simple

Niveles séricos de creatinina cinasa (en unidades por litro) medidos en 24 pacientes jóvenes con la enfermedad de Duchenne*

Para localizar la moda no se requiere ordenar los datos, sin embargo facilita el procedimiento.

1500 2055 3790 1505 2360 3796 1571 3340 3802 1573 3345 3805 1835 3577 5500 1840 3580 5504 1995 3720 5595 2000 3723 5600

Interpretación

: La distribución es amodal, ninguno de los datos de la distribución se repite.

(3)

3

 No es influenciada por valores extremos, al ser una medida de posición, se localiza a la mitad de la distribución, no importando en sí, la magnitud de los datos.

 Se utiliza para describir datos cuantitativos, aunque algunos autores1 refieren que puede usare en datos cualitativos a escala ordinal; sin embargo, para unificación de criterios, nos quedaremos con la primera propuesta.

Ejemplo:

Como la mediana también es una medida de posición, el primer paso es calcular precisamente esa posición; lo que se hace de la siguiente forma:

Me (posición) = (n+1)/2 (en la formula N=si es población o n= si es muestra)

Media Aritmética

_

Su símbolo es: μ cuando se trate de un parámetro y x cuando sea un estadístico.

Por lo general, al hablar de un promedio sin especificar el tipo, lo más seguro es que se está haciendo referencia a la media aritmética. La media es la medida de tendencia central más conocida, y a la que con más frecuencia se reconoce con el nombre de promedio, principalmente para su interpretación.

Propiedades: 1

Jack Levin “Fundamentos de Estadística en la Investigación Social” 2ª. Edición, Editorial Harla, México. pp. 45.

Arreglo ordenado o

Serie Simple

Niveles séricos de creatinina cinasa (en unidades por litro) medidos en 24 pacientes jóvenes con la enfermedad de Duchenne.

Me = (24+1)/2= 12.5 => se toman los datos de la posición 12 y 13, se suman y se divide entre 2: 3345 + 3577= 3461 1. 1500 9. 2055 17. 3790 2. 1505 10. 2360 18. 3796 3. 1571 11. 3340 19. 3802 4. 1573 12. 3345 20. 3805 5. 1835 13. 3577 21. 5500 6. 1840 14. 3580 22. 5504 7. 1995 15. 3720 23. 5595 8. 2000 16. 3723 24. 5600

Interpretación

: El 50% de los pacientes presenta 3461 u/lt , de creatinina cinasa en sangre, o menos

(4)

Medidas de Tendencia Central y de Dispersión Ciclo 2018

4

 Es simple de cálculo y sencilla de interpretación. En una distribución en intervalos su cálculo es más laborioso. En su momento se desarrollara la formula.

 Es única, ya que para un conjunto de datos existe una sola media aritmética.

 Es influenciada por valores extremos, puesto que todos los datos del conjunto entran en juego para su cálculo, de tal manera que, valores tan pequeños o tan grandes pueden distorsionarla.

 Se utiliza para describir datos cuantitativos.

Ejemplo:

Para calcular la media aritmética se utilizaran las siguientes formulas:

Para Arreglo ordenado:

Media = = n

El numerador es la sumatoria de cada dato de la variable (x) y el denominador es el total de datos (N o n).

Arreglo ordenado o

Serie Simple

Niveles séricos de creatinina cinasa (en unidades por litro) medidos en 24 pacientes jóvenes con la enfermedad de Duchenne.

1. 1500 9. 2055 17. 3790 2. 1505 10. 2360 18. 3796 3. 1571 11. 3340 19. 3802 4. 1573 12. 3345 20. 3805 5. 1835 13. 3577 21. 5500 6. 1840 14. 3580 22. 5504 7. 1995 15. 3720 23. 5595 8. 2000 16. 3723 24. 5600 _ X = 76911/24 = 3204.625

Interpretación

: El promedio o el valor medio de creatinina cinasa en sangre que presentan los pacientes es de 3204.625 u/lt.

(5)

5

COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA

2

Luego de calcular las medidas de tendencia central, surge la pregunta ¿Cuál será la más apropiada a utilizar para describir la distribución?

La decisión debe involucrar algunos factores como:

 El tipo de variable

 La forma de distribución de los datos

 El objetivo de la investigación.

EL TIPO DE VARIABLE

La moda por ejemplo, puede utilizarse para cualquier tipo de variable, porque requiere solamente de un conteo, solamente se trata de localizar el dato que más se repite o el dato con mayor frecuencia.

La mediana es para variables cuantitativas o numéricas al igual que la media aritmética. Es importante recordar que la media aritmética es influenciada por valores extremos, por lo que, si la distribución cuenta con este tipo de valores, ésta medida no será la mejor opción.

FORMA DE LA DISTRTIBUCIÓN

La forma de la distribución es otro factor importante en la elección de la medida de tendencia central.

Cuando el investigador trabaja con una distribución simétrica, su elección se basará principalmente en sus objetivos de investigación. Sin embargo, cuando trabaja con una distribución sesgada, su decisión estará influenciada por la forma que presenten sus datos.

En una distribución sesgada, la mediana se ubica en algún punto entre la media y la moda, ésta característica la convierte en la medida de tendencia central más deseable para describir una distribución sesgada.

2

Jack Levin “Fundamentos de Estadística en la Investigación Social” 2ª. Edición, Editorial Harla, México. pp. 45

(6)

6

Medidas de Tendencia Central y de Dispersión Ciclo 2018

EL OBJETIVO DE LA INVESTIGACIÓN

Si se busca una medición rápida, sencilla pero crudamente descriptiva o si está trabajando con una distribución bimodal, empleará generalmente la moda. Sin embargo, ésta sólo tiene utilidad como un indicador preliminar de la tendencia central.

Si el investigador busca una medición precisa de la tendencia central, la decisión está generalmente entre la media y la mediana. Para describir una distribución sesgada, se recomienda utilizar la mediana, porque tiende a equilibrar los datos de la distribución. Para una medida precisa de las distribuciones simétricas, se tiende a preferir la media aritmética, ya que, puede utilizarse en el análisis estadístico más avanzado. Otra característica importante de la media es que, es más estable que la mediana, esto significa que, al tomar varias muestras de una misma población, y calcularles la media y la mediana a cada una, el valor de la mediana tenderá a variar más de una muestra a otra, que el valor de la media aritmética.

En resumen podría decirse que:3

La Moda es la medida de tendencia central menos confiable. Su utilización es “prioritariamente” con datos cualitativos.

La mediana, es adecuado utilizarla cuando una distribución se aparta de lo normal (distribuciones sesgadas).

 La Media, su uso es adecuado cuando las distribuciones son simétricas o aproximadas a la forma normal.

MEDIDAS DE DISPERSIÓN

Las medidas de tendencia central permiten resumir una serie de datos a un solo valor. Sin embargo cuando se utiliza una de ellas, puede proporcionar un cuadro incompleto del conjunto de datos, por lo que podría conducir tanto a conclusiones erróneas o distorsionadas, como a una posible aclaración.

Por ejemplo, podría decirse que se están realizando un estudio con dos medicamentos para el tratamiento de cefalea4; se ha encontrado que el medicamento “xx” ha mostrado una media de duración del efecto, de 6 horas y el medicamento “YY” ha mostrado también una media de 6 horas. ¿Podría concluirse entonces que los dos medicamentos presentan la misma duración del efecto? ¿Podría entonces un médico, recetar cualquiera de los dos medicamentos?, etc.

Se considera que simplemente con la media no es posible llegar a esas conclusiones, porque, que tal si los datos recopilados para el medicamento “XX” son más variados que los datos recolectados con el medicamento “YY”. Se necesita entonces, además de una medida de tendencia central, una medida que indique ¿Cómo están diseminados los datos?, se necesita una medida de dispersión.

3 “Métodos Estadísticos Aplicados”. Norville M. Downie. 5a. Edición. Editorial Harla. México. 4

(7)

7

Las medidas de dispersión5 son las que miden la variedad que muestran los datos de una distribución. Una medida de dispersión conlleva información respecto a la cantidad total de variabilidad presente en un conjunto de datos. Si en una distribución se encuentra que todos los datos son iguales, esto indica que no hay dispersión; pero si no son iguales, entonces existe dispersión. Si los datos de una distribución son cercanos entre sí, la magnitud de la dispersión será pequeña; por el contrario, si los datos están ampliamente esparcidos, la dispersión será mayor.

Existen varias medidas de dispersión, entre ellas: El rango o amplitud, la Varianza o Variancia, La Desviación Estándar y El Coeficiente de Variación.

Rango, Recorrido o Amplitud

Su símbolo es: R no importando si es un parámetro o un estadístico.

Es la forma más sencilla de medir la variación de un conjunto de datos; y se trata simplemente de la diferencia que existe entre el valor más pequeño y el valor más grande de la distribución. Sin embargo su utilidad es limitada, por el hecho de que toma solamente dos valores de la distribución, ignorando la magnitud así como el número total de los demás datos, lo que la hace una medida poco confiable.

Su fórmula es: R = XL – XS

Ejemplo:

5

Sinónimos de dispersión: variación, expansión, esparcimiento, fluctuación.

Arreglo ordenado o

Serie Simple

Niveles séricos de creatinina cinasa (en unidades por litro) medidos en 24 pacientes jóvenes con la enfermedad de Duchenne.

En los datos ordenados, el cálculo es fácil.

1. 1500 9. 2055 17. 3790 2. 1505 10. 2360 18. 3796 3. 1571 11. 3340 19. 3802 4. 1573 12. 3345 20. 3805 5. 1835 13. 3577 21. 5500 6. 1840 14. 3580 22. 5504 7. 1995 15. 3720 23. 5595 8. 2000 16. 3723 24. 5600 R= XL – XS = 5600 – 1500 = 4100

Interpretación

: Los datos oscilan a lo largo de, o la amplitud de la variables es de 4100 u/lt.

(8)

8

Medidas de Tendencia Central y de Dispersión Ciclo 2018

El rango o amplitud se considera meramente como índice preliminar o aproximado de la variabilidad de una distribución.

Se utiliza sólo cuando hay urgencia, para dar una idea de la dispersión, pero no como una medida definitiva de dispersión. Es útil también para detectar si se ha cometido algún error en el cálculo de la desviación estándar, ya que ésta última, es “aproximadamente” la sexta parte del rango (ésta regla empírica es aplicable cuando el número de datos es grande).

Varianza o Variancia

Su símbolo es: σ2 cuando se trate de un parámetro y s2 cuando sea un estadístico. La varianza o variancia mide la dispersión de los datos, en función del esparcimiento alrededor de su media. Por lo tanto, toma en cuenta todos los datos de la distribución. Para su cálculo:

 Se mide la distancia existente entre cada uno de los datos y la media aritmética de la distribución.

 Cada una de las distancias se eleva al cuadrado; luego se suman todas las distancias.

 El producto de la sumatoria se divide entre N (para datos de una población) o entre n-1 (para datos de una muestra).

 El resultado presenta entonces, es una media de las distancias6.

 Debido a que las distancias se elevan al cuadrado, para evitar una sumatoria de “cero”, el resultado que la varianza ofrece es en unidades al cuadrado, lo que la hace una medida de dispersión inadecuada si se pretende expresar el resultado en unidades originales, en otras palabras, esta situación impide su interpretación.

Ejemplo:

Para el cálculo se utilizarán las siguientes formulas:

Para Arreglo ordenado:

Varianza = S2 = Ʃ(X-X)2

n-1

Varianza = S2 = Ʃ

El numerador es la sumatoria de cada dato de la variable (x) menos la media aritmética, elevado al cuadrado y el denominador es el total de datos menos 1 si los datos provienen de una muestra

(9)

9

Dra. Olivia de Higueros

Medidas de Tendencia Central y de Dispersión Ciclo 2018

6 “Fundamentos de Estadística en la Investigación Social”. Jack Levin. 2ª. Edición. Editorial Harla. México. pp. 59.

(10)

10

Medidas de Tendencia Central y de Dispersión Ciclo 2018

Desviación estándar o Desviación típica

Su símbolo es: σ cuando se trate de un parámetro y s cuando sea un estadístico.

La desviación estándar no es más que la raíz cuadrada de la varianza, por lo tanto, al igual que ésta, mide la dispersión de los datos, en función del esparcimiento alrededor de su media. Al obtener la raíz cuadrada de la varianza, el resultado regresa a la unidad de medida original, por lo que la información se hace interpretable.

La desviación estándar se utiliza siempre que una distribución se aproxime a la distribución normal. Es la base para gran parte de la Estadística. Como la medida más confiable de variabilidad, se emplea con datos de intervalo y de razón7.

Tanto la varianza como la desviación estándar son medidas de dispersión ampliamente utilizadas en análisis estadísticos, principalmente en el contexto de la toma de decisiones en estadística.

(11)

11

Coeficiente de Variación

Su símbolo es: C.V. indistintamente para parámetro o estadístico.

El coeficiente de variación es una medida de variabilidad relativa que expresa la desviación estándar como un porcentaje de la media. Es útil para comparar la dispersión de dos o más conjuntos de datos, no importando si se trata de los datos de muestras o poblaciones diferentes, o si se compara los datos de dos o más variables en el mismo grupo.

En virtud de que, tanto la desviación estándar como la media aritmética de la distribución se expresan en la misma unidad de medida, ésta se cancela al calcular el coeficiente de variación, obteniéndose una medida independiente a la unidad de medición de la variable, por lo tanto una medida susceptible de comparación.

Ejemplo:

Para el cálculo se utilizará la siguientes formula: C.V = σ/µ o

Como la utilidad del C.V. es la comparación de la variabilidad entre grupos; de las distribuciones anteriores se puede decir que: los niveles de glucosa presentan menos dispersión que los niveles de creatinina cinasa.

Figure

Actualización...

Referencias

Actualización...