Investigación Científica y Tecnológica

Descargar (0)

Texto completo

(1)

Jimena S. Zugazagoitia Ahylim Zamayoa Mónica Gutiérrez

1

Medidas

 

de

 

Tendencia

 

Central

Media aritmética Mediana Moda

2

Media

 

Aritmética

Se le conoce comúnmente como promedio. Es la suma de todos los valores de los datos X

dividida entre el total de datos n. Se obtiene con la siguiente fórmula:

3

Media Aritmética

Se usa en situaciones en las que se tiene variables con escalas de medición de:

Intervalo(distancia igual entre los puntos), como: puntaje en pruebas de inteligencia, temperatura, escalas de actitud.

Razón(cero absoluto), como: horas de exposición a la TV, número de hijos, ingresos, días de

antigüedad.

4

Propiedades

Desventajas

Media Aritmética

Puede ser calculada en

distribuciones continuas o de intervalos.

Incluye a todos los valores.

Sólo hay una media aritmética para un determinado conjunto de datos.

Resulta muy útil para

Si alguno de los valores del conjunto de datos es muy pequeño o muy grande, no queda bien representado por la media aritmética.

Ejemplo: Se les preguntó a 9 jóvenes de 20 años cuántos libros han leído por gusto y no por obligación y se obtuvieron los siguientes datos: x1=10, x2=13, x3=10,

x4=13,x5=14, x6=10, x7=13, x8=10 y x9=15.

La media aritmética es de 12 libros y se obtiene:

Media

 

Aritmética

(2)

Mediana

Es el punto que se encuentra justo en el centro de los valores de los datos.

La mediana divide a los datos en dos mitades exactas: la mitad de los casos (o datos) quedan por arriba del valor de la mediana y la otra mitad, por debajo.

Se usa cuando se trabaja con variables ordinales, de intervalo y de razón.

7

Propiedades

Mediana

No es afectada por las observaciones que extremas (muy alejadas del promedio o media aritmética).

Es fácil de calcular.

Siempre toma una de los valores de la variable.

Divide el área total de un histograma en dos mitades iguales.

8

Mediana

Ejemplo: Considerando los datos del ejemplo anterior, se tenían 10, 13, 10, 13, 14, 10, 13, 10 y 15; hay que ordenarlos de menor a mayor y buscar en número del centro.

10, 10, 10, 10, 13, 13, 13, 14, 15

La mediana es de 13 libros.

9

Mediana

En caso de que el número de datos sea par, se saca el promedio de los dos datos centrales. Ejemplo: Se tienen los siguientes datos, 10, 13, 14, 10, 11, 10, 13, 13, 10, 15. Ordenados: 10, 10, 10, 10, 11, 13, 13, 13, 14, 15 La mediana sería (11+13)/2 = 12 10

Moda

Es el valor de la variable que más veces se repite (es decir, que tiene mayor frecuencia).

Es especialmente útil en variables nominales: afiliación política, color de ojos, sexo, raza.

Moda

(3)

Moda

Ejemplo 1 (unimodal): Considerando los datos del primer ejemplo 10, 13, 10, 13, 14, 10, 13, 10 y 15, el dato que más se repite es 10.

Moda: 10

13

Moda

Ejemplo 2 (multimodal): Se les pregunta a los mismos 9 jóvenes el tipo de libros que prefieren y contestan lo siguiente: ciencia ficción, fantasía, fantasía,

superación personal, novela histórica, ciencia ficción, novela histórica, poesía, biografías. Tanto ciencia ficción como fantasía y novela histórica se repiten 2 veces y son las que más se repite.

Moda: ciencia ficción, fantasía y novela histórica

14

Moda

Ejemplo 3 (no hay moda): Se les pregunta 5 personas que tipo de comida es su favorita y las respuestas son las siguiente: japonesa, china, italiana, francesa y mexicana. Ninguna se repite.

Moda: no hay moda

15

Medidas de Dispersión

Desviación Estándar (S) Varianza (S2) 16

Desviación Estándar

Indica cuánto tienden a alejarse los valores puntuales de un promedio en una distribución. Se define como el promedio de la distancia de cada

punto con respecto al promedio.

Desviación Estándar

Si la DESVIACIÓN ESTÁNDAR es grande, entonces los puntos están lejos de la media, mientras que si es pequeña, entonces los puntos están más cerca de la media.

(4)

Desviación Estándar

Desviación estándar grande:

Gran dispersión de los datos con respecto a la media aritmética

Desviación estándar pequeña:

Poca dispersión de los datos con respecto a la media aritmética

19

Desviación Estándar

Ejemplo. Regresemos al ejemplo de la cantidad de libros que lee cada joven.

Se tenían los siguientes datos:

x1=10, x2=13, x3=10,x4=13,x5=14, x6=10, x7=13, x8=10 y

x9=15,

media

La desviación estándar se obtiene:

20

Desviación Estándar

Desviación estándar S = 1.89

21

Varianza

Es el cuadrado de la desviación estándar. Se utiliza para hacer cálculos de estadística

inferencial. 22 Distribución Normal y Varianza

Varianza

Es un parámetro que representa la variabilidad de la población libre de sesgo; siempre es positiva.

Varianza

Si la varianza resulta ser un número pequeño, entonces habrá una gran concentración de valores x alrededor de la media y la curva de la distribución será alargada o aguda.

Si “S2” es un número grande, entonces habrá una

gran dispersión de valores xalrededor de la media y la curva de la distribución será bastante plana o achatada.

(5)

Poca dispersión Mayor dispersión

Varianza

25

Varianza

Ejemplo. Regresemos al ejemplo de la cantidad de libros que lee cada joven.

Se tenían los siguientes datos:

x1=10, x2=13, x3=10,x4=13,x5=14, x6=10, x7=13, x8=10 y x9=15, media = Desviación estándar S= 1.89 26

Varianza

Varianza S2= (Desviación estándar)2= (1.89)2= 3.56

27

Varianza

El objetivo del análisis de varianza es comparar entre: La variabilidad entre los promedios de las

poblaciones que se comparan, y

La variabilidad interna en cada una de ellas.

Si las variabilidades resultan ser iguales o muy semejantes, se considera que las variaciones internas en las poblaciones también lo son y entre ellas no hay diferencias significativas. Si esto ocurre, entonces los promedios son estadísticamente iguales.

28

Varianza

Problema: Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de

entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos empleados, en minutos, se encuentran registrados en la tabla siguiente.

Varianza

Si se analiza sólo el promedio (media aritmética), se optaría por el método 3 de entrenamiento, puesto que el promedio de recorrido de los 9 km es menor. Sin embargo, si se analiza la varianza, el método 3 de entrenamiento es el que mayor dispersión de valores tiene (su varianza

(6)

Varianza

El método 1 y el método 2, por otra parte, tienen una varianza menor que el método 3, lo que habla de una homogeneidad en el rendimiento de los miembros del equipo. Como ambos métodos tienen el mismo valor de varianza, el siguiente parámetro de decisión es el promedio: aquél método que además de mostrar mayor homogeneidad entre la condición de los miembros del equipo tenga un promedio más bajo de recorrido de 9km (mejor tiempo), será el óptimo. El método 2 es el mejor.

31

Fuentes

 

de

 

Información

Zugazagoitia, J.S. y Zayas, H. (2012). Módulo 5 REPRESENTACIÓN GRÁFICA DE DATOS Y REGRESIÓN LINEAL [presentación]. México: Universidad Virtual del Tecnológico de Monterrey

Figure

Actualización...

Referencias