Jimena S. Zugazagoitia Ahylim Zamayoa Mónica Gutiérrez
1
Medidas
de
Tendencia
Central
Media aritmética Mediana Moda
2
Media
Aritmética
Se le conoce comúnmente como promedio. Es la suma de todos los valores de los datos X
dividida entre el total de datos n. Se obtiene con la siguiente fórmula:
3
Media Aritmética
Se usa en situaciones en las que se tiene variables con escalas de medición de:
Intervalo(distancia igual entre los puntos), como: puntaje en pruebas de inteligencia, temperatura, escalas de actitud.
Razón(cero absoluto), como: horas de exposición a la TV, número de hijos, ingresos, días de
antigüedad.
4
Propiedades
Desventajas
Media Aritmética
Puede ser calculada endistribuciones continuas o de intervalos.
Incluye a todos los valores.
Sólo hay una media aritmética para un determinado conjunto de datos.
Resulta muy útil para
Si alguno de los valores del conjunto de datos es muy pequeño o muy grande, no queda bien representado por la media aritmética.
Ejemplo: Se les preguntó a 9 jóvenes de 20 años cuántos libros han leído por gusto y no por obligación y se obtuvieron los siguientes datos: x1=10, x2=13, x3=10,
x4=13,x5=14, x6=10, x7=13, x8=10 y x9=15.
La media aritmética es de 12 libros y se obtiene:
Media
Aritmética
Mediana
Es el punto que se encuentra justo en el centro de los valores de los datos.
La mediana divide a los datos en dos mitades exactas: la mitad de los casos (o datos) quedan por arriba del valor de la mediana y la otra mitad, por debajo.
Se usa cuando se trabaja con variables ordinales, de intervalo y de razón.
7
Propiedades
Mediana
No es afectada por las observaciones que extremas (muy alejadas del promedio o media aritmética).
Es fácil de calcular.
Siempre toma una de los valores de la variable.
Divide el área total de un histograma en dos mitades iguales.
8
Mediana
Ejemplo: Considerando los datos del ejemplo anterior, se tenían 10, 13, 10, 13, 14, 10, 13, 10 y 15; hay que ordenarlos de menor a mayor y buscar en número del centro.
10, 10, 10, 10, 13, 13, 13, 14, 15
La mediana es de 13 libros.
9
Mediana
En caso de que el número de datos sea par, se saca el promedio de los dos datos centrales. Ejemplo: Se tienen los siguientes datos, 10, 13, 14, 10, 11, 10, 13, 13, 10, 15. Ordenados: 10, 10, 10, 10, 11, 13, 13, 13, 14, 15 La mediana sería (11+13)/2 = 12 10
Moda
Es el valor de la variable que más veces se repite (es decir, que tiene mayor frecuencia).
Es especialmente útil en variables nominales: afiliación política, color de ojos, sexo, raza.
Moda
Moda
Ejemplo 1 (unimodal): Considerando los datos del primer ejemplo 10, 13, 10, 13, 14, 10, 13, 10 y 15, el dato que más se repite es 10.
Moda: 10
13
Moda
Ejemplo 2 (multimodal): Se les pregunta a los mismos 9 jóvenes el tipo de libros que prefieren y contestan lo siguiente: ciencia ficción, fantasía, fantasía,
superación personal, novela histórica, ciencia ficción, novela histórica, poesía, biografías. Tanto ciencia ficción como fantasía y novela histórica se repiten 2 veces y son las que más se repite.
Moda: ciencia ficción, fantasía y novela histórica
14
Moda
Ejemplo 3 (no hay moda): Se les pregunta 5 personas que tipo de comida es su favorita y las respuestas son las siguiente: japonesa, china, italiana, francesa y mexicana. Ninguna se repite.
Moda: no hay moda
15
Medidas de Dispersión
Desviación Estándar (S) Varianza (S2) 16Desviación Estándar
Indica cuánto tienden a alejarse los valores puntuales de un promedio en una distribución. Se define como el promedio de la distancia de cada
punto con respecto al promedio.
Desviación Estándar
Si la DESVIACIÓN ESTÁNDAR es grande, entonces los puntos están lejos de la media, mientras que si es pequeña, entonces los puntos están más cerca de la media.
Desviación Estándar
Desviación estándar grande:
Gran dispersión de los datos con respecto a la media aritmética
Desviación estándar pequeña:
Poca dispersión de los datos con respecto a la media aritmética
19
Desviación Estándar
Ejemplo. Regresemos al ejemplo de la cantidad de libros que lee cada joven.
Se tenían los siguientes datos:
x1=10, x2=13, x3=10,x4=13,x5=14, x6=10, x7=13, x8=10 y
x9=15,
media
La desviación estándar se obtiene:
20
Desviación Estándar
Desviación estándar S = 1.89
21
Varianza
Es el cuadrado de la desviación estándar. Se utiliza para hacer cálculos de estadística
inferencial. 22 Distribución Normal y Varianza
Varianza
Es un parámetro que representa la variabilidad de la población libre de sesgo; siempre es positiva.
Varianza
Si la varianza resulta ser un número pequeño, entonces habrá una gran concentración de valores x alrededor de la media y la curva de la distribución será alargada o aguda.
Si “S2” es un número grande, entonces habrá una
gran dispersión de valores xalrededor de la media y la curva de la distribución será bastante plana o achatada.
Poca dispersión Mayor dispersión
Varianza
25Varianza
Ejemplo. Regresemos al ejemplo de la cantidad de libros que lee cada joven.
Se tenían los siguientes datos:
x1=10, x2=13, x3=10,x4=13,x5=14, x6=10, x7=13, x8=10 y x9=15, media = Desviación estándar S= 1.89 26
Varianza
Varianza S2= (Desviación estándar)2= (1.89)2= 3.56
27
Varianza
El objetivo del análisis de varianza es comparar entre: La variabilidad entre los promedios de las
poblaciones que se comparan, y
La variabilidad interna en cada una de ellas.
Si las variabilidades resultan ser iguales o muy semejantes, se considera que las variaciones internas en las poblaciones también lo son y entre ellas no hay diferencias significativas. Si esto ocurre, entonces los promedios son estadísticamente iguales.
28
Varianza
Problema: Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de
entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos empleados, en minutos, se encuentran registrados en la tabla siguiente.
Varianza
Si se analiza sólo el promedio (media aritmética), se optaría por el método 3 de entrenamiento, puesto que el promedio de recorrido de los 9 km es menor. Sin embargo, si se analiza la varianza, el método 3 de entrenamiento es el que mayor dispersión de valores tiene (su varianza
Varianza
El método 1 y el método 2, por otra parte, tienen una varianza menor que el método 3, lo que habla de una homogeneidad en el rendimiento de los miembros del equipo. Como ambos métodos tienen el mismo valor de varianza, el siguiente parámetro de decisión es el promedio: aquél método que además de mostrar mayor homogeneidad entre la condición de los miembros del equipo tenga un promedio más bajo de recorrido de 9km (mejor tiempo), será el óptimo. El método 2 es el mejor.
31
Fuentes
de
Información
Zugazagoitia, J.S. y Zayas, H. (2012). Módulo 5 REPRESENTACIÓN GRÁFICA DE DATOS Y REGRESIÓN LINEAL [presentación]. México: Universidad Virtual del Tecnológico de Monterrey