• No se han encontrado resultados

Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

N/A
N/A
Protected

Academic year: 2022

Share "Tablas de contingencia Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez."

Copied!
11
0
0

Texto completo

(1)

Tablas de contingencia

Las tablas de frecuencia pueden organizar datos de sólo una variable a la vez.

Si se desea examinar o comparar dos variables, una tabla de contingencia resulta de mucha utilidad.

Ejemplo: Supongamos que se recolecta información sobre el número de pasajeros de una línea aérea, también se obtuvieron datos sobre las edades de los pasajeros y el número de vuelos en los que se registraron cada año.

Ambas variables pueden verse en detalle mediante una tabla de contingencia.

30

También se podría mostrar la información en cada celda según sexo. Todas las otras características relevantes de los pasajeros también podrían incorporarse en la tabla. Dicho perfil descriptivo podría ser muy útil en la identificación del pasajero típico y en el establecimiento de políticas de marketing efectivas.

(2)

32

3.- Parámetros y Estadísticos

(3)

34

3. Parámetros y Estimadores

 Parámetro:

Es una cantidad numérica calculada sobre una población

 La altura media de los individuos de un país

 La idea es resumir toda la información que hay en la población en unos pocos números (parámetros).

 Estimador:

Ídem (cambia población por muestra)

 El cálculo de la estatura media de una m.a. de 1.000 individuos del país.

 La altura media de los que estamos en este aula.

Somos una muestra (¿representativa?) de la población.

Parámetros y estimadores

Cualquier característica medible de una muestra se llama dato estadístico.

Cualquier característica medible de una población, como la media, se denomina parámetro

.

Normalmente nos interesa conocer un parámetro…

…Como no es posible estudiar a TODA la población, calculamos un: estimador sobre una muestra y “confiamos” en que sean próximos.

(4)

4.Estadísticos Descriptivos

36

4. Estadísticos descriptivos

 Tendencia central o Centralización:Media, mediana y moda Indican valores con respecto a los que los datos parecen agruparse.

 Dispersión: Desviación típica, coeficiente de variación, rango, varianza

Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización.

 Posición: Cuantiles, percentiles, cuartiles, deciles,...

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.

 Forma Asimetría

Apuntamiento o curtosis

(5)

38

4.1 Medidas de Tendencia Central

Medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.

Las medidas de tendencia central, que por lo común se emplean:

• Media aritmética

• Mediana

• Moda

(6)

40

4.1 Medidas de Tendencia Central MEDIA

Media (‘mean’:) La media aritmética (promedio) es la medida de tendencia central más utilizada.

Es el promedio aritmético de una distribución o la suma de los valores dividido por el tamaño muestral.

Es una medida solamente aplicable a mediciones por intervalos o de razón.

Ej: Media de 2,2,3,7 es (2+2+3+7)/4=3,5

Conveniente cuando los datos se concentran simétricamente con respecto a ese valor.

Muy sensible a valores extremos.

Media de una muestra

muestra la

en valores de

total número el

es n

X

X las todos de suma la indica X

donde n

X

=

población la

en nes observacio de

total número el es N

l.

poblaciona media

la indica µ

µ N

X

=

Media de una población

(7)

42

4.1 Medidas de Tendencia Central MEDIANA

Mediana (‘median’)

 Es el valor céntrico en un conjunto de valores ordenados de menor a mayor o de mayor a menor.

 Es decir, es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales.

 Una forma fácil de localizar la posición del elemento medio para datos no agrupados es por medio de:

4.1 Medidas de Tendencia Central MEDIANA

EJ:

Mediana de1,2,4,5,6,6,8es 5

Mediana de1,2,4,5,6,6,8,9 es (5+6)/2=5,5

Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos.

 Mediana de1,2,4,5,6,6,800 es 5.

¡La media es 117,7!

•Es una medida de tendencia central propia de los niveles de medición ordinal, por intervalos y de razón.

•No es influenciada por valores extremos.

• 50%de las observaciones son mayores que la mediana.

• No necesita ser uno de los valores del conjunto de datos

• Es única para un conjunto de observaciones.

(8)

Altura mediana

Ejemplo: Suponga que intenta adquirir una casa en un condominio en una linda comuna de Santiago. El agente de ventas le indicó que el precio promedio de las casas disponibles en este momento es de 4225 UF.

Si tuviera un presupuesto máximo de 2800UF, podría pensar que está fuera de sus posibilidades. Sin embargo, al verificar los precios individuales de las casas podría cambiar de idea. Los precios son 2300UF, 2600UF, 3500UF y 8500UF.

El precio 8500UF está haciendo que la media se incline hacia arriba, por lo que es un promedio no representativo. Un precio entre 2600 y 3500 es una referencia más representativa. En casos como éste la mediana proporciona una medida más exacta de la tendencia central

(9)

La Moda (mode): Valor de la observación que aparece con más frecuencia.

Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.

La moda es útil en especial al describir los niveles nominal y ordinal de medición (aunque puede determinarse para todos los niveles de datos)

Un conjunto de datos puede tener más de una moda

4.1 Medidas de Tendencia Central MODA

46

4.1 Medidas de Tendencia Central MODA

Ejemplo: Una empresa ha desarrollado cinco lociones para baño. En el diagrama se muestran los resultados de una investigación de mercado diseñada para determinar qué loción para baño prefieren los consumidores

La mayor cantidad de respuestas favoreció a la llamada Lamoure, según lo indica la barra más alta. Por tanto tal producto es la moda

(10)

Usos de media, mediana y moda Datos poblacionales

La moda puede ser útil como medida descriptiva de un grupo de la población, aunque sólo si existe una moda claramente perceptible.

La mediana es siempre una medida excelente para representar el nivel típico de los valores observados, como los índices de salud, de una población. Esto es así independientemente de la existencia de más de una moda o de que la distribución de la población sea asimétrica o simétrica.

La media aritmética es excelente como valor representativo de una población, aunque sólo si la distribución de datos de la población es claramente simétrica. En datos no simétricos, los valores extremos distorsionarán el valor de la media como valor representativo.

48

Datos muestrales

La moda: La moda no es una medida aceptable de posición respecto de datos muestrales, porque su valor puede variar ampliamente de una muestra a otra.

La mediana: es mejor que la moda, porque su valor es más estable entre muestra y muestra.

La media: es la más estable de las tres medidas.

Uso de media, mediana y moda

(11)

 Ejemplo: Se han recopilado los índices salariales de los 650 empleados por hora de una empresa manufacturera.

La medida más representativa del índice salarial típico es la mediana, porque en este caso está implicada una población y la mediana no se ve relativamente afectada por la posible falta de simetría de los índices salariales.

 Ejemplo: Una muestra aleatoria de n=100 índices salariales se obtiene en una compañía con varios miles de empleados por hora.

El índice salarial más representativo de estos varios miles de empleados es la media muestral. Aunque es improbable que la media muestral sea exactamente igual al índice salarial medio de toda la población, por lo general se hallará mucho más cerca de la media poblacional que la mediana muestral como estimador del índice salarial mediano de la población50

Nota:

Es mejor usar la mediana que la media como medida de tendencia central, cuando un conjunto de datos contiene valores extremos.

Otra medida que se usa a veces cuando hay

valores extremos es la media recortada al

5%, que se obtiene eliminando el 5% de los

valores mayores y el 5% de los menores, en

un conjunto de datos, procediendo entonces

a calcular el promedio de los valores

restantes.

Referencias

Documento similar

Para ello, trabajaremos con una colección de cartas redactadas desde allí, impresa en Évora en 1598 y otros documentos jesuitas: el Sumario de las cosas de Japón (1583),

dente: algunas decían que doña Leonor, "con muy grand rescelo e miedo que avía del rey don Pedro que nueva- mente regnaba, e de la reyna doña María, su madre del dicho rey,

Gastos derivados de la recaudación de los derechos económicos de la entidad local o de sus organis- mos autónomos cuando aquélla se efectúe por otras enti- dades locales o

L ’ ENSEMBLE S ’ EST FAIT CONNAÎTRE À TRAVERS LA REDÉCOUVERTE D ’ OEUVRES INÉDITES ISSUES , POUR LA PLUPART , DE LA MUSIQUE SICILIENNE TELLES QUE IL DILUVIO UNIVERSALE ET

Consecuentemente, en el siglo xviii hay un cambio en la cosmovi- sión, con un alcance o efecto reducido en los pueblos (periferia), concretados en vecinos de determinados pueblos

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..