• No se han encontrado resultados

Curso de Estadística Unidad de Medidas Descriptivas. Lección 7: Medidas de Posición para Datos Crudos

N/A
N/A
Protected

Academic year: 2021

Share "Curso de Estadística Unidad de Medidas Descriptivas. Lección 7: Medidas de Posición para Datos Crudos"

Copied!
13
0
0

Texto completo

(1)

Curso de Estadística

Unidad de Medidas Descriptivas

Lección 7:

Medidas de Posición para Datos

Crudos

Creado por: Dra. Noemí L. Ruiz Limardo,

EdD

© 2010 Derechos de Autor

(2)

Objetivos

1. Definir las medidas de posición: mediana, cuartiles y percentiles.

2. Calcular las medidas de posición para datos crudos.

3. Identificar equivalencias entre algunas de las medidas de

posición.

4. Realizar análisis estadístico relacionado con medidas de

posición para datos crudos.

(3)

Introducción

Las medidas de posición permiten conocer otras características de una muestra, además de la tendencia central y la variación del grupo. Son medidas que establecen la posición o localización exacta de un valor específico de un conjunto de datos. Se utilizan para comparar la posición que ocupa un valor específico en relación a los demás valores del grupo. Estas medidas son una serie de valores que dividen en partes iguales la muestra ordenada de manera ascendente o descendente. Algunos ejemplos de las medidas de posición son: mediana, cuartiles y percentiles. En algunos libros de referencia en español, también se nombran estas medidas como cuartilas y percentilas. Para propósitos de este curso, se utilizarán los términos cuartiles y percentiles. A continuación se describen estas medidas de posición.

A. MEDIANA

En la Lección 1, se estudió la mediana. En aquella ocasión se mencionó que, además de ser una medida de tendencia central, también es considerada como una medida de posición. En este caso la muestra ordenada se ha dividido en dos partes iguales y la mediana es el dato que está localizado a la mitad de la muestra. Esto significa que la mitad de los datos se encuentran a la izquierda de la mediana (son menores que la mediana) y la otra mitad se encuentran a la derecha de ésta (son mayores que la mediana). En las lecciones 10,11 y 12 se estudiaron las fórmulas para calcular la mediana como medida de tendencia central. En esta lección se verá que además de las fórmulas estudiadas previamente, se puede calcular la mediana con la fórmula de segundo cuartil o del percentil 50, como se presentará en las secciones a continuación.

B. CUARTILES

Los cuartiles son 3 valores que dividen la muestra ordenada en 4 partes iguales. Estos valores son: Q1 (primer cuartil), Q2 (segundo cuartil), y Q3 (tercer cuartil).

El primer cuartil (Q1) es el punto tal que una cuarta parte (

4

1) de los datos se hallan por debajo de él, y tres (

4

3) cuartas partes de los datos se hallan por encima de él.

(4)

Recuerde que:

4

1 = 0.25 = 25%

El segundo cuartil (Q2) es el punto tal que dos cuartas partes (

4

2 ) de los datos se hallan por debajo de él, y dos cuartas partes (

4

2 ) de los datos se hallan por encima de él.

Recuerde que:

4 2 =

2

1 = 0.50 = 50%

Observe que el segundo cuartil (Q2) divide el grupo en dos partes iguales o sea, en la mitad. Por eso, Q2 equivale a la mediana.

El tercer cuartil (Q3) es el punto tal que tres cuartas partes (

4

3 ) de los datos se hallan por debajo de él y una cuarta parte (

4

1 ) de los datos se hallan por encima de él.

Recuerda que:

4

3 = 0.75 = 75%

A continuación se presenta un ejemplo de representación gráfica de los cuartiles, en este caso el conjunto de datos está representado por la curva

Dato Menor

Dato Mayor

Dato Menor

Dato Mayor

Dato Menor

Dato Mayor

(5)

normal (en forma de campana). Véase la posición de los cuartiles y el por ciento de datos que se acumulan hasta cada cuartil.

Por ciento de acumulación de los datos

Proceso para calcular un cuartil:

Paso 1: Ordenar los datos de menor a mayor (forma ascendente)

Paso 2: Hallar la posición donde está localizado el cuartil correspondiente usando una de las siguientes fórmulas:

4 1

1

Q n

4 ) 1 ( 2

2

Q n

4 ) 1 ( 3

3

Q n

Observaciones:

¿Por qué no tenemos una fórmula para Q4? Porque Q4 es el dato mayor y éste se conoce, no hay que determinarlo.

Observe que el segundo cuartil corresponde a la mediana. Cuando se estudió la mediana como medida de tendencia central, se vio que la fórmula para conocer su localización era:

0% 25% 50% 75% 100%

(6)

2 1 Mediana n

Vea que esta fórmula es equivalente a la fórmula del segundo cuartil:

2 1 4

) 1 ( 2

2

n Q n

Paso 3: Después de conocer dónde está localizado el cuartil deseado, para hallar el valor que corresponde a este cuartil se aplica lo siguiente:

A. Si el resultado de la fórmula utilizada en el paso 2 es un número entero, se encuentra el dato que está localizado en la posición indicada por ese entero.

B. Si el resultado de la fórmula utilizada en el paso 2 es un número fraccionario y la fracción es igual a 0.5, se localizan los dos valores centrales que corresponden a esa fracción. Luego se halla el punto medio de estos dos valores centrales, sumando ambos valores y dividiendo por 2.

C. Si el resultado de la fórmula utilizada en el paso 2 es un número fraccionario y la fracción no es igual a 0.5, se redondea hacia arriba o hacia abajo, al entero más cercano, y se encuentra el dato que está localizado en la posición indicada por ese entero.

A continuación se presenta un ejemplo para calcular los tres cuartiles: Q1, Q2, y Q3.

Ejemplo – 1

Los siguientes datos representan el número de hijos por familia en una muestra de 10 familias. Halle los tres cuartiles e interprete los resultados.

2 0 1 4 1 3 0 2 1 1

1

2

(7)

El primer paso para hallar los cuartiles es ordenar la muestra en forma ascendente. Ordenando los datos se obtiene:

0 0 1 1 1 1 2 2 3 4

El segundo paso es determinar las respectivas posiciones donde están localizados los cuartiles.

a. Posición de Q1:

3 75 . 4 2 11 4

1 10 4

1

1

Q n

Como se obtuvo una posición que representa un número fraccionario, y la fracción no es igual a 0.5, se redondea el resultado a 3. Esto significa que el primer cuartil está localizado en la tercera posición.

b. Posición de Q2:

5 . 2 5 11 2

1 10 2

) 1 (

2

Q n

Como se obtuvo una posición que representa un número fraccionario, y la fracción es igual a 0.5, se localizan los dos valores centrales que corresponden a la posición 5ta y 6ta, y se halla el punto medio, sumando ambos valores y dividiendo por 2.

c. Posición de Q3:

8 25 . 4 8 33 4

) 11 ( 3 3 4

) 1 10 ( 3 4

) 1 ( 3

3

Q n

Como se obtuvo una posición que representa un número fraccionario, y la fracción no es igual a 0.5, se redondea el resultado a 8. Esto significa que el tercer cuartil está localizado en la octava posición.

El último paso es localizar los valores que corresponden a las posiciones encontradas:

(8)

a. Q1:

En la fórmula anterior se obtuvo que el primer cuartil está localizado en la tercera posición, o sea, es el dato número tres en la lista ordenada. El tercer dato es 1, Q1 = 1.

0 0 1 1 1 1 2 2 3 4

b. Q2:

En la fórmula anterior se obtuvo que el segundo cuartil está localizado en el punto medio de los valores que están en la 5ta y 6ta posición. Se obtiene el punto medio sumando ambos valores y dividiendo por 2.

El punto medio es: 1 2 2 2

1 1

Por tanto, Q2 = 1.

0 0 1 1 1 1 2 2 3 4

c. Q3:

En la fórmula anterior se obtuvo que el tercer cuartil está localizado en la octava posición, o sea, es el dato número ocho en la lista ordenada. El octavo dato es 2, Q3 = 2.

0 0 1 1 1 1 2 2 3 4

El valor obtenido en esta muestra de 10 familias para Q1 significa que hay 25% de los datos que están bajo la cantidad de 1 hijo por familia. Q2 significa que hay

Tercer dato

Quinto dato y Sexto dato

Octavo dato Punto medio es igual a 1.

(9)

50% de los datos que están bajo la cantidad de 1 hijo por familia. Q3 significa que hay 75% de los datos bajo la cantidad de 2 hijos por familia.

C. PERCENTILES

Los percentiles son 99 valores que dividen la muestra ordenada en 100 partes iguales. Estos valores son: P1 (Percentil 1), P2 (Percentil 2), ... , P99 (Percentil 99).

El primer percentil (P1) es el punto tal que 1% de los datos se hallan por debajo de él. El percentil 25 (P25) es el punto tal que 25% de los datos se hallan por debajo de él. El percentil 50 (P50) es el punto tal que 50% de los datos se hallan por debajo de él. Observe que P25 = Q1 y P50 = Q2 = Mediana. ¿A qué percentil equivale el tercer cuartil? Observe que P75 = Q3.

Para hallar un percentil dado, de manera similar a los cuartiles, se debe hallar primero las posiciones en donde ubican los percentiles. Para hallar estas posiciones se multiplica el tamaño de muestra n por el por ciento (en su forma decimal) que representa cada percentil. Si se obtiene un número fraccionario, se redondea al entero más cercano. Por ejemplo, si deseamos saber la posición de P5, entonces multiplicamos n por 0.05, o sea: n(0.05). El percentil número cinco (P5) es el dato que ocupa esa posición en la muestra ordenada. Bajo ese dato se concentra 5% de los datos de la muestra.

Los percentiles son muy útiles cuando se desea conocer la cantidad de datos de una muestra que están bajo un valor dado. Por ejemplo, un estudiante toma una prueba estandarizada cuyos resultados se informan en términos de percentiles. Suponga que este estudiante recibe los resultados y observa que su puntuación representa el percentil 80: P80. Esto significa que la puntuación que obtuvo este estudiante está sobre el 80% de los estudiantes que tomaron dicha prueba, o sea, 80% de las puntuaciones de los demás estudiantes de la muestra que tomaron la prueba están bajo la puntuación que obtuvo este estudiante. Solo 20% de la muestra está sobre la puntuación que obtuvo el estudiante. En términos generales se puede decir que este estudiante ejecutó bastante bien en esa prueba.

Puntuaciones obtenidas por el 100% de la muestra ordenada Dato

Menor

Dato Mayor

80% 20%

P80

(10)

Ejemplo – 2

Las puntuaciones a continuación representan resultados del examen de estadística en un grupo de 50 estudiantes. Los resultados se presentan ordenados en forma ascendente.

39, 44, 47, 50, 55, 58, 58, 60, 63, 64, 64, 66, 67, 68, 68, 70, 70, 70, 72, 72, 72, 72, 74, 74, 75, 76, 77, 77, 77, 78, 78, 80, 82, 82, 83, 85, 86, 86, 88, 88, 89, 90, 90, 91, 92, 94, 95, 95, 97, 98

A. Halle P25 e interprete este resultado. B. Halle P90 e interprete este resultado.

C. Si un estudiante obtiene 90 en el examen, ¿Está esa puntuación bajo o sobre el percentil P90?

Como la muestra ya está ordenada en forma ascendente, se puede proceder a contestar los ejercicios. En caso de que la muestra no estuviera ordenada, se ordenan los datos primeramente.

A. Para hallar P25 se busca primero la posición que ocupa este percentil. Se busca la posición 25 multiplicando n por 0.25. Como n es 50, se obtiene:

50 (0.25) = 12.5

Como se obtuvo un valor fraccionario, se redondea al entero más cercano y se obtiene que la posición del percentil 25 es la décimo tercera, o sea, P25 es el dato número 13. Ahora se localiza este dato en la lista ordenada. 39, 44, 47, 50, 55, 58, 58, 60, 63, 64, 64, 66, 67, 68, 68, 70, 70, 70, 72, 72, 72, 72, 74, 74, 75, 76, 77, 77, 77, 78, 78, 80, 82, 82, 83, 85, 86, 86, 88, 88, 89, 90, 90, 91, 92, 94, 95, 95, 97, 98

El dato número 13 es 67, por tanto P25 = 67. Esto significa que bajo 67 se concentra 25% de los datos de la muestra.

B. Para hallar P90 se busca primero la posición que ocupa este percentil. Se busca la posición 90 multiplicando n por 0.90. Como n es 50, se obtiene:

50 (0.90) = 45

(11)

Como se obtuvo un valor entero, significa que el percentil 90 está en la posición 45, o sea, P90 es el dato número 45. Ahora se localiza este dato en la lista ordenada.

39, 44, 47, 50, 55, 58, 58, 60, 63, 64, 64, 66, 67, 68, 68, 70, 70, 70, 72, 72, 72, 72, 74, 74, 75, 76, 77, 77, 77, 78, 78, 80, 82, 82, 83, 85, 86, 86, 88, 88, 89, 90, 90, 91, 92, 94, 95, 95, 97, 98

El dato número 45 es 92, por tanto P90 = 92. Esto significa que bajo 92 se concentra 90% de los datos de la muestra.

C. Un estudiante que haya obtenido 90 es este examen está bajo el percentil 90.

EJERCICIOS EJERCICIO – 1

Una línea aérea realizó un estudio para conocer la cantidad de pasajeros que viajó durante los últimos 50 días. Los resultados se muestran en la tabla a continuación.

Tabla 1: Total de Pasajeros en la Línea Aérea durante los últimos 50 días

68 71 77 83 79 72 74 57 67 69 50 60 70 66 76 70 84 59 75 94 65 72 85 79 71 83 84 74 82 97 77 73 78 93 95 78 81 79 90 83 80 84 91 101 86 93 92 102 80 69 a. Ordene la muestra en forma ascendente b. Halle Q1,Q2 y Q3

c. Halle P70

d. Verifique que Q2 sea igual a P50, y que ambas son equivalentes a la mediana.

e. De acuerdo a esta muestra, el día que viajaron 85 pasajeros ¿está bajo o sobre el percentil P70?

(12)

EJERCICIO – 2

El número de calorías en una muestra de 12 alimentos congelados para microondas se muestra a continuación. Determine la mediana, Q1 y P75. Interprete los resultados obtenidos.

560, 832, 780, 650, 470, 920, 1090, 970, 495, 550, 605, 735

(13)

RESPUESTAS A EJERCICIOS EJERCICIO – 1

a. Muestra ordenada de manera ascendente

50 70 76 81 90

57 70 77 82 91

59 71 77 83 92

60 71 78 83 93

65 72 78 83 93

66 72 79 84 94

67 73 79 84 95

68 74 79 84 97

69 74 80 85 101

69 75 80 86 102

b. Los tres cuartiles son: Q1 = 71

Q2 = 78 Q3 = 84 c. P70 = 83

d. Se observa que Mediana = Q2 = P50 = 78. Todos son equivalentes y representan el 50% de la muestra.

e. 85 pasajeros está sobre P70.

EJERCICIO – 2

Los datos ordenados son:

470, 495, 550, 560, 605, 650, 735, 780, 832, 920, 970, 1090 Mediana = Q2 = 692.5 Q1 = 550 P75 = 832

Bajo 550 se concentra 25% de los datos. Bajo 692.5 está el 50% de los datos. Bajo 832 está el 75% de los datos.

Referencias

Documento similar

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

El nuevo Decreto reforzaba el poder militar al asumir el Comandante General del Reino Tserclaes de Tilly todos los poderes –militar, político, económico y gubernativo–; ampliaba

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

La complejidad de las redes y diagramas que se han analizado es atribuible casi por entero al número de nodos —y, por tanto, de proposiciones— que tienen estas redes y diagramas.

D) El equipamiento constitucional para la recepción de las Comisiones Reguladoras: a) La estructura de la administración nacional, b) La su- prema autoridad administrativa

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

La siguiente y última ampliación en la Sala de Millones fue a finales de los años sesenta cuando Carlos III habilitó la sexta plaza para las ciudades con voto en Cortes de

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de