• No se han encontrado resultados

Estadística Descriptiva (MA147 y CE19),

N/A
N/A
Protected

Academic year: 2022

Share "Estadística Descriptiva (MA147 y CE19),"

Copied!
208
0
0

Texto completo

(1)

Item Type info:eu-repo/semantics/LearningObject

Authors Gutierrez, Silvia; Luna, Walter

Publisher Universidad Peruana de Ciencias Aplicadas (UPC)

Download date 07/06/2022 15:16:56

Link to Item

http://hdl.handle.net/10757/550527

(2)

EPE

AUTORES : Silvia Gutiérrez Flores

Walter Luna Flores

TÍTULO : Cuaderno de trabajo

FECHA : Abril 2015

CURSO : Estadística Descriptiva

CODIGO : MA147 y CE19

ÁREA : Ciencias

CICLO : 2015-1

(3)

Contenido

EPE 2

Capítulo 1. Organización de datos 5

Subdivisión de la Estadística 5

Definiciones básicas 6

Métodos de recolección de datos 9

Variable 12

Escalas de medición 15

Organización y presentación de datos 25

Tabla de frecuencias para variables cualitativas 28

Representación gráfica de variables cualitativas 31

Representación gráfica de variables discretas 60

Representación gráfica de variables cuantitativas continuas 69

Capítulo 2. Resúmenes de datos 87

Medidas de tendencia central 87

El ingreso promedio mensual en Lima aumentó un 3,9% 87

Medidas de dispersión 112

Medidas de asimetría 121

Capítulo 3. Probabilidades 129

Definiciones básicas de probabilidad 129

Probabilidad condicional 139

Eventos independientes 143

Teorema de la probabilidad total 146

Teorema de Bayes 147

Capítulo 4. Variable aleatoria y distribución de probabilidad 153

Variable aleatoria 153

Variable aleatoria discreta 154

Variable aleatoria continua 163

Distribuciones discretas especiales 164

Distribuciones continuas especiales 176

Capítulo 5 Muestreo 185

Muestreo probabilístico 187

(4)
(5)

Capítulo 1. Organización de datos

Subdivisión de la Estadística

Estadística

Es una ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, organizar, presentar y

analizar datos.

La finalidad y utilidad es describir, numérica o gráficamente al conjunto de datos, así como también realizar inferencias, entendidas como generalizaciones de lo observado, de manera que

se puedan obtener conclusiones adecuadas.

Estadística Descriptiva

Son métodos y técnicas de recolección, caracterización,

resumen y presentación que permite describir apropiadamente las características de un conjunto de

datos.

Comprende el uso de gráficos, tablas,

diagramas y criterios para el análisis. Existen diversos tipos de

gráficos adecuados a los

distintos datos que se desean

representar.

Estadística Inferencial

Son métodos y técnicas que hacen

posible estimar una o más características de

una población o tomar decisiones

referentes a la población basados

en el resultado de muestras elegidas adecuadamente.

Estas conclusiones no tienen que ser

totalmente válidas, pueden

tener cierto margen de error, por eso se dan con

una medida de confiabilidad o probabilidad.

(6)

Definiciones básicas

Población

•Es el conjunto de todas las unidades elementales de interés en un determinado estudio.

•Pueden ser personas, animales, objetos, conceptos, etc. de los cuales sacamos conclusiones a partir de una o más características observables de naturaleza cualitativa o cuantitativa.

Muestra

•Es una parte o un subconjunto de la población que se selecciona

adecuadamente para obtener información acerca de la población de la cual proviene.

•Una muestra será representativa si es elegida de forma aleatoria.

Unidad elemental

•Es el objeto sobre el cual se hace la medición.

•También se le denomina unidad de análisis, unidad estadística o elemento.

•Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.

Dato

•Es el resultado de medir una característica de una unidad elemental.

•Los datos pueden ser cualitativos o cuantitativos ya que dependerán del tipo de variable.

Observación

•Es el conjunto de datos de una unidad elemental.

•La observación se tiene para cada unidad elemental.

(7)

Ejemplo 1

El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.

Para conocer qué características del hotel es conveniente resaltar en la publicidad, se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:

N° Edad Género País de procedencia

Precio dispuesto a pagar por habitación en

dólares

Número de acompañantes

por viaje

Criterio de selección del hotel

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio

2 35 Femenino Argentina 60 2 Precio

3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas

4 65 Masculino Francia 45 0 Precio

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados

6 28 Masculino Estados Unidos 65 2 Precio

7 45 Femenino Estados Unidos 60 1 Precio

8 85 Masculino China 70 2 Precio

9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio

10 35 Femenino Francia 45 1 Precio

11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

a. Determine la población, la muestra y la unidad elemental.

b. De la base de datos, proporcione un ejemplo de dato y uno de observación.

Solución

Población Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada entre enero y mayo del presente año.

Muestra 115 huéspedes extranjeros que se hospedaron en el hotel La Posada entre enero y mayo del presente año.

Unidad elemental Un huésped extranjero que se hospedó en el hotel La Posada entre enero y mayo del presente año.

Dato X4 = 65 años

Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio

(8)

Ejercicio 1

De los universitarios que estudian en la ciudad de Lima, se quiere estimar el porcentaje de universitarios que trabajan. Determine la población, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

Ejercicio 2

Se desea estimar el promedio diario de clientes que ingresan a un supermercado, para lo cual se eligieron cinco días al azar del presente mes y se registró el número de clientes que ingresó cada día al supermercado. Los resultados registrados fueron los siguientes: 554, 789, 487, 553 y 625 personas. Determine la población, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

Ejercicio 3

La Oficina de Turismo de Cusco recopiló datos sobre los turistas que llegaron a la ciudad. Entre las 16 preguntas de un cuestionario que se entregó a los pasajeros que llegaron en el mes de enero del presente año, figuraban, entre otras, las siguientes preguntas:

 Esta visita a Cusco es la: ……… vez (primera, segunda, tercera, etc.).

 El motivo principal de este viaje es: ……… (16 categorías incluyendo vacaciones, trabajo).

 Voy a estar alojado en: ……… (10 categorías incluyendo hotel, apartamento, parientes).

 Mi estadía en Cusco va a durar: ………. días.

Población

Unidad elemental

(9)

Métodos de recolección de datos

La forma de obtener la información original de las unidades elementales por investigar puede ser efectuada a través de:

Censo

• Es una encuesta de todos los elementos de la población.

Encuesta muestral

• Es una encuesta de una parte de la población.

El uso de la encuesta ha ido en rápido aumento, debido a:

1. Que las instituciones que producen información disponen de personal capacitado para efectuar su organización, diseño y análisis.

2. Su menor costo con respecto al censo que, en

determinadas circunstancias, la información resulta más exacta que la de un censo. Esto se debe a que los errores en la recolección y procesamiento de los datos pueden ser reducidos a través de una mejor capacitación de los empadronadores y la utilización de métodos de

captación de información más objetivos.

(10)

Ejemplo 2

Aprobación de Ollanta Humala cayó a 39% según reveló encuesta de Datum

ElComercio.pe lunes 8 de julio del 2013

La aprobación del jefe de Estado, Ollanta Humala, registró su porcentaje más bajo desde que se inició la gestión presidencial. En una encuesta realizada por Datum, la popularidad de Humala apenas alcanzó 39%. Esto es siete puntos menos que el mes anterior y un retroceso de 21 unidades respecto de abril.

El estudio puntualizó además que el nivel de desconfianza hacia Humala Tasso aumentó de 69% a 81%, también tomando en cuenta las cifras del mes que pasó. La esposa del jefe de Estado, Nadine Heredia, obtuvo 47% de respaldo. Un 46% la desaprobó.

(11)

Registro administrativo

Existen oficinas públicas que llevan registros administrativos para sus propios fines.

Por ejemplo:

 los Registros Civiles registran nacimientos, casamientos o defunciones,

 el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar,

 la Aduana que registra las importaciones y exportaciones.

Los registros administrativos constituyen la forma más económica de obtener información estadística.

Sin embargo, esta información se obtiene tal como está disponible. Los fines del registro administrativo no siempre coinciden con los de nuestra investigación.

Por ejemplo, se puede consultar las páginas web de las siguientes instituciones:

• Ministerio de Educación http://minedu.gob.pe/

• Ministerio de Salud http://www.minsa.gob.pe/

• Superintendencia Nacional de Aduanas y de Administración Tributaria SUNAT http://www.sunat.gob.pe/

• Registro Nacional de Identificación y Estado Civil http://www.reniec.gob.pe/

• Ministerio de Economía y Finanzas http://www.mef.gob.pe/

• Sistema Integrado de Información de Comercio Exterior http://www.siicex.gob.pe/

• Instituto Nacional de Estadística e Informática INEI. http://www.inei.gob.pe/

 Ministerio de Trabajo y Promoción del Empleo. http://www.mintra.gob.pe/

(12)

Variable

Variable

Se define así a una característica que presentan los elementos de una población y que puede asumir diferentes valores cuando se realiza su medición

Variables cualitativas

Son aquellas variables que al ser medidas quedan expresadas por

etiquetas o nombres que se utilizan para

identificar una característica o atributo.

Variables cuantitativas

Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para

identificar una característica o atributo.

Estas a su vez pueden clasificarse en discretas o continuas.

Variable cuantitativa discreta

Es aquella variable cuyo número de posible de valores es finito o infinito

numerable; es decir, que sólo puede tomar ciertos valores en un intervalo

determinado.

Variable cuantitativa continua

Es aquella variable cuyo número posible de valores es infinito no numerable, es decir, que

puede tomar cualquier valor en un intervalo

determinado.

En una variable continua, para dos valores cualesquiera, siempre se puede encontrar un tercer

valor entre los dos primeros.

(13)

Ejemplos de variables

Las siguientes variables corresponden a una encuesta aplicada a un postulante de una agencia publicitaria:

Ejemplo 3

El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.

Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A continuación se presenta parte de la base de datos:

N° Edad Género País de procedencia

Precio dispuesto a pagar por habitación, en

dólares

Número de acompañantes

por viaje

Criterio de selección del hotel

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio

2 35 Femenino Argentina 60 2 Precio

3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas

4 65 Masculino Francia 45 0 Precio

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados

6 28 Masculino Estados Unidos 65 2 Precio

Identifique cada una de las variables que se presenta en la base de datos según su tipo.

Solución

Variable Tipo de variable

Edad Cuantitativa continua

Género Cualitativa

País de procedencia Cualitativa

Precio dispuesto a pagar por habitación, en dólares Cuantitativa continua Número de acompañantes por viaje Cuantitativa discreta

Criterio de selección del hotel Cualitativa

Variable

Cualitativa

Lugar de nacimiento

Grado de instrucción

Cuantitativa discreta

Número de capacitaciones

llevadas en el presente año

Número de hijos

Cuantitativa continua

Tiempo de demoran para trasladarse de

su casa al trabajo (en

minutos)

Salario actual (en nuevos

soles)

(14)

Ejercicio 4

Los clientes que se suscriben a la revista “Economía al Día” deben llenar un formato con información personal. Identifique el tipo de variable.

Variable Tipo de variable

Género Profesión

Distrito donde vive

Ingreso mensual familiar (en nuevos soles) Grado de instrucción

Número de teléfono Estado civil

Ejercicio 5

El gerente de una red de librerías, con sucursales en Santiago de Surco, San Borja y San Luis ha observado que en los últimos meses las ventas han disminuido, y desea conocer los factores que originan este problema. Por ello, realizó una encuesta a 210 clientes seleccionados aleatoriamente de todas las sucursales. Algunas de las variables recolectadas mediante la encuesta son las siguientes:

 Ingreso mensual familiar (en nuevos soles)

 Distrito de residencia

 Número de hijos en edad escolar

 Nivel de satisfacción con la atención recibida (muy buena, buena, mala, muy mala)

a. Del enunciado anterior identifique la población en estudio, la muestra y la unidad elemental.

Población Muestra

Unidad elemental

b. Identifique las variables en estudio con su respectivo tipo.

Variable Tipo de variable

Ingreso mensual familiar (en nuevos soles) Distrito de residencia

Número de hijos en edad escolar

Nivel de satisfacción con la atención recibida

(15)

Escalas de medición

La medición de una variable consiste en asignar un valor a la característica observada.

Por ejemplo, si la característica observada es el

género de las personas, hacemos una medición de la característica y le asignamos un valor, el de femenino.

El proceso de medición utiliza las escalas:

nominal, ordinal, intervalo y razón.

•Sólo permite asignar un nombre, etiqueta o valor al elemento sometido a medición.

•Los números que se puedan asignar a las propiedades de los elementos se utilizan sólo como etiquetas con la finalidad de clasificarlos.

•Con esta escala no tiene sentido realizar operaciones aritméticas.

Nominal

•Los datos son etiquetas y además el orden es significativo.

•Los datos se pueden ordenar en forma ascendente o descendente, de tal manera que puedan expresar grados de la

característica medida.

Ordinal

•Además de asignar un nombre o etiqueta y establecer un orden entre los elementos, esta escala permite calcular diferencias entre los números asignados a las mediciones (el intervalo entre

observaciones que se expresa en términos de una unidad fija de medida).

•Los datos son numéricos.

Intervalo

•Los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es significativo.

•Tiene un punto cero absoluto, es decir, el cero indica la ausencia de la característica medida.

•Se puede realizar las operaciones aritméticas a los números asignados.

Razón

(16)

Ejemplos de variables y sus escalas de medición

•El género de las personas

•La marca de celular

•La línea aérea de su preferencia

•La religión que profesa una persona

•El número de DNI

•………...………

•………...……

Nominal

•El orden de mérito de los alumnos de la UPC

•El grado académico de los empleados de un banco

•La opinión sobre la atención en un supermercado (bueno, regular, malo)

•………..…...

Ordinal

•Las escalas de la temperatura. Por ejemplo, T(°F) = 1.8 x T(°C) + 32

•El año 2000 fue 2753 en el calendario romano, 2749 en el calendario babilónico, 6236 en el egipcio, 2544 en el budista, 5119 en el maya

•La ubicación en una carretera respecto de un punto de referencia

•………...………

Intervalo

•El sueldo de los trabajadores de un banco

•La altura de una persona.

•La velocidad de un auto en la carretera

•………

•………..…….………...

Razón

(17)

Ejemplo 4

El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.

Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A continuación se presenta parte de la base de datos:

N° Edad Género País de procedencia

Precio dispuesto a pagar por habitación, en

dólares

Número de acompañantes

por viaje

Criterio de selección del hotel

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio

2 35 Femenino Argentina 60 2 Precio

3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas

4 65 Masculino Francia 45 0 Precio

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados

6 28 Masculino Estados Unidos 65 2 Precio

7 45 Femenino Estados Unidos 60 1 Precio

8 85 Masculino China 70 2 Precio

9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio

10 35 Femenino Francia 45 1 Precio

11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base de datos.

Solución

Variable Tipo de variable Escala de medición

Edad Cuantitativa continua Razón

Género Cualitativa Nominal

País de procedencia Cualitativa Nominal

Precio dispuesto a pagar por habitación, en

dólares Cuantitativa continua Razón

Número de acompañantes por viaje Cuantitativa discreta Razón

Criterio de selección del hotel Cualitativa Nominal

(18)

Ejercicio 6

Indique el tipo y la escala de medición que corresponde a cada una de las siguientes variables.

Variable Tipo de variable Escala de medición

Edad

Marca de automóvil

Número de personas a favor de la pena de muerte

Ventas anuales (en dólares) Tamaño de bebida (pequeño, mediano, grande)

Ejercicio 7

La Oficina de Turismo de Cusco recopila datos sobre los turistas que llegan a la ciudad. Entre las 16 preguntas de un cuestionario que se repartió a los pasajeros en los vuelos de llegada durante el mes pasado figuraban, entre otras, las siguientes:

 Esta visita a Cusco es la: ___________________ vez. (1°, 2°, 3°, etc.)

 El motivo principal de este viaje es: _______________ (16 categorías incluyendo vacaciones, trabajo, etc.)

 Voy a estar alojado en: ________________ (11 categorías incluyendo hotel, apartamento, parientes, etc.)

 Mi estadía en Cusco va a durar: ________ días.

Identifique el tipo y la escala de medición de cada una de las variables:

Variable Tipo de variable Escala de medición

(19)

Parámetro y estimador

Algunos parámetros y estadísticos importantes

Nombre

Notación

Parámetro Estadístico

Media

N x

N i

i

1

n

x x

n i

i

1

Varianza

 

N x

N

i

i

1

2 2

 

1

1

2 2

n x x s

n i

i

Desviación estándar   2 ss2

Proporción

N pK

n pˆk

Moda Mo mo

Parámetro

Representa , en valor numérico, la característica

de la población.

Para obtener su valor se hace necesario

contar con toda la información que brindan los elementos

de una población.

Estimador

Representa, en valor numérico, la característica

de una muestra.

Para obtener su valor se

utiliza la información

muestral.

Al valor numérico del estimador se le

conoce como estimación.

Al estimador, se le llama

también estadígrafo o

estadístico.

(20)

Ejemplo 5

Este fue el flash electoral de CPI para las elecciones presidenciales del 2011.

Identifique la variable en estudio, un estadístico para esta variable y el valor del estadístico.

Solución

 Variable en estudio: candidato de preferencia

 Estadístico para esta variable: proporción del candidato de preferencia

 El valor del estadístico es: 52,5% prefiere a Ollanta Humala y 47,5% prefiere a Keiko Fujimori.

Ejemplo 6

El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.

Desea conocer qué características del hotel es conveniente resaltar en la publicidad, para ello aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:

N° Edad Género País de procedencia

Precio dispuesto a pagar por habitación en

dólares

Número de acompañantes

por viaje

Criterio de selección del hotel

1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio

2 35 Femenino Argentina 60 2 Precio

3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas

4 65 Masculino Francia 45 0 Precio

5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados

6 28 Masculino Estados Unidos 65 2 Precio

7 45 Femenino Estados Unidos 60 1 Precio

8 85 Masculino China 70 2 Precio

9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio

10 35 Femenino Francia 45 1 Precio

11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

(21)

Después de procesar la información se obtuvieron los siguientes resultados:

 El 34% de los huéspedes extranjeros procede de los Estados Unidos.

 La edad promedio de los huéspedes es de 35,2 años.

 El número de acompañantes por huésped extranjero más frecuente es de dos personas.

 El criterio de selección más frecuente es el precio.

Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.

Solución

Variable Estimador Notación Valor del estimador

Lugar de procedencia Proporción EEUU 0,34

Edad de los huéspedes Promedio x 35,2 años

Número de acompañantes Moda mo 2

Criterio de selección del hotel Moda mo Precio

Ejercicio 8

Un banco estatal ha estudiado la información que dieron sus clientes en el mes de marzo al solicitar un préstamo vehicular. Al seleccionar una muestra de 180 clientes algunos resultados fueron:

• El 12% declaró tener un trabajo independiente.

• La edad promedio de los clientes al solicitar un préstamo fue de 41,3 años.

• El 50% declaró ser casado.

• El monto promedio de las solicitudes fue de 3025 nuevos soles.

Identifique el estimador y el valor del estimador para cada una de las variables.

Solución

Variable Estimador Notación Valor

(22)

Ejercicio 9

Como parte de un estudio de mercado se aplicó este año una encuesta a un grupo de 245 estudiantes de la universidad A. Se sabe que en esta universidad el 72% del alumnado pertenece al área de Humanidades y el resto al área de Ciencias.

Después de procesar la información se obtuvo que 56% de los encuestados era de sexo femenino, el 33,2% de los encuestados prefiere el rock como género musical, el 45,7% gusta de la emisora 104.7 VIVA F.M. Se sabe, además, que la media del número de veces que un oyente llamó a la radio en el último mes fue de 2,86 llamadas y la moda de esa misma variable fue igual a uno.

Identifique el estimador o parámetro y su valor para cada una de las variables.

Solución

Variable Parámetro o estimador Notación Valor

(23)

Ejercicios de aplicación

1. Conteste las siguientes preguntas justificando adecuadamente las respuestas:

a. ¿Qué diferencias existe entre la escala de intervalos y la escala de razón? Muestre ejemplos que sustenten su respuesta.

b. ¿Qué diferencia existe entre dato y observación? Muestre ejemplos que sustenten su respuesta.

2. Se quiere estimar el ingreso mensual de los niños y adolescentes que viven en Iquitos.

Identifique la población, la muestra, el elemento y la variable en estudio.

Población

Muestra

Elemento

Variable

3. La entidad bancaria Tubanco tiene presencia en Lima y Callao. Cuenta actualmente con 9 784 clientes distribuidos en diferentes agencias. Su gerente general desea determinar la situación de la entidad y la de sus clientes. Para ello, seleccionó una muestra de 120 clientes que solicitaron préstamo durante el último semestre. Parte de la base de datos correspondiente a la muestra se presenta a continuación:

Número de tarjetas

Edad del cliente (años)

Tipo de préstamo

Monto del préstamo (en dólares)

Número de cuotas del préstamo (meses)

Tipo de moneda del

préstamo

Giro del negocio

1 53 Capital trabajo 5000 6 Soles Bodega

3 36 Cuota fija 1500 12 Soles Restaurante

5 54 Cuota fija 4500 18 Soles Abarrotes

2 45 Mi local 12000 36 Soles Abarrotes

4 43 Mi local 6000 36 Dólares Mueblería

a. De acuerdo con el enunciado identifique la población, la muestra y la unidad elemental.

b. Identifique un ejemplo de dato y uno de observación.

c. Para cada una de las variables identifique su tipo y escala de medida.

d. ¿Qué estadístico puede calcularse para la variable Monto del préstamo y cuál para la variable Tipo de préstamo?

4. Fernando, estudiante de administración, tiene la labor de conseguir información acerca de los turistas que llegaron a la ciudad del Cusco. En su búsqueda, encontró que la agencia de viajes Turismo Perú realizó un estudio a sus 15 000 turistas extranjeros que llegaron al Cusco el año pasado. Como parte de la información encontró que todos hablaban más de un idioma, el 35%

eran americanos y el gasto promedio que hicieron en la ciudad fue de 2 000 nuevos soles.

(24)

De acuerdo con el enunciado anterior:

a. Identifique la población, la muestra y la unidad elemental.

b. Para cada una de las variables identifique su tipo y escala de medida.

c. Mencione dos parámetros y un estadígrafo de utilidad para cada variable.

5. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos de los inmigrantes peruanos en Estados Unidos. El estudio se llevó a acabo aplicando encuestas a una muestra de 400 inmigrantes peruanos. Algunas de las preguntas del cuestionario fueron las siguientes:

 Nivel educativo alcanzado en el Perú.

 Monto enviado (en dólares) el último mes a sus familiares en el Perú.

 ¿Presenta alguno de los siguientes problemas? (indocumentado, discriminado, vivienda no adecuada, salud y otros).

 Número de veces que ha visitado el Perú desde que viajó por primera vez a los Estados Unidos.

a. De acuerdo con el enunciado anterior identifique la población y la muestra.

b. Para las respuestas generadas por cada una de las preguntas mostradas identifique el tipo de variable y su respectiva escala de medida.

c. Para cada una de las variables, proponga el estadístico más adecuado.

6. Edificar es una empresa dedicada al rubro de la construcción que ha crecido notablemente durante el último año. El gerente de Recursos Humanos ha recibido algunas quejas de los trabajadores y antes este problema ha decidido estudiar la situación laboral de los trabajadores para obtener algunas medidas de interés que le permita tomar algunas decisiones. Al seleccionar una muestra de 115 trabajadores obtuvo la siguiente información:

Trabajador Género Edad (en años)

Número

de hijos Cargo Ingreso mensual (en nuevos soles)

Motivo de la queja

1 M 32 1 Maestro de obra 2862 Mal remunerado

2 M 32 2 Peón 742 Sin bonificación

3 M 25 0 Oficial 2256 Sin horas extras

4 F 21 0 Operario 1696 Mal trato

115 M 37 3 Oficial 1438 Mal remunerado

De acuerdo con el enunciado anterior:

a. Identifique la población, la muestra y la unidad elemental.

b. Para cada una de las variables, proponga el estadístico más adecuado que ayude al gerente.

c. Complete la siguiente tabla:

Variable en estudio Tipo de variable Escala de medida Ingreso mensual (en nuevos soles)

Razón Nominal Cuantitativa discreta

(25)

Organización y presentación de datos

Luego de aplicar una encuesta a una muestra de treinta empleados, una empresa obtiene la siguiente base de datos. Se pide redactar un informe que resuma la información.

Tabla. Datos sobre satisfacción laboral

Género Función Edad

Tiempo en la empresa

Ingreso anual

Número de promocione

s

Promoción posible

Número de capacitaciones

Relación con la gerencia

Femenino Obrero 19 1 11 400 0 Improbable 1 Buenas

Masculino Profesional 31 5 210 600 2 No está seguro 2 Buenas

Masculino Profesional 34 8 193 400 1 Probable 2 Buenas

Masculino Servicios 36 15 30 800 1 Improbable 0 Buenas

Masculino Obrero 44 4 9 850 0 Improbable 1 Regulares

Masculino Obrero 44 10 9 800 0 Improbable 1 Regulares

Masculino Técnico/ventas 31 5 40 840 0 Improbable 3 Buenas

Femenino Profesional 37 8 93 700 1 No está seguro 2 Buenas

Masculino Obrero 45 23 10 150 0 Improbable 1 Regulares

Masculino Obrero 54 18 9 050 0 Muy improbable 1 Regulares

Femenino Profesional 26 2 62 200 2 No está seguro 2 Buenas

Masculino Obrero 44 14 10 200 0 Probable 0 Regulares

Masculino Técnico/ventas 31 2 40 335 0 Muy improbable 2 Buenas

Femenino Producción 28 10 30 990 1 Muy improbable 1 Buenas

Femenino Obrero 23 5 9 360 1 Muy improbable 1 Buenas

Femenino Producción 38 20 33 800 0 Muy improbable 1 Buenas

Masculino Producción 38 9 35 500 1 Muy improbable 2 Buenas

Masculino Técnico/ventas 32 2 40 540 0 Improbable 2 Buenas

Masculino Servicios 36 18 27 500 1 Muy improbable 1 Buenas

Femenino Obrero 48 25 10 200 0 Muy improbable 1 Buenas

Masculino Obrero 45 20 9 650 0 Improbable 1 Regulares

Femenino Técnico/ventas 22 2 44 000 0 No está seguro 2 Buenas

Masculino Técnico/ventas 32 6 48 560 1 Improbable 2 Buenas

Masculino Obrero 46 20 10 300 0 Muy improbable 1 Regulares

Masculino Profesional 28 1 108 700 3 Improbable 5 Buenas

Femenino Producción 27 5 30 550 1 Muy improbable 2 Buenas

Masculino Producción 38 14 32 300 0 Muy improbable 1 Buenas

Masculino Obrero 40 20 9 130 0 No está seguro 0 Regulares

Masculino Profesional 24 1 70 000 1 Probable 3 Buenas

Masculino Obrero 56 30 9 740 0 Muy improbable 1 Regulares

¿Qué podemos hacer para resumir esta información?

Una vez recopilada la información, con las variables consideradas de mayor importancia, el siguiente paso es presentarla a través de una tabla de frecuencias o un gráfico que describa adecuadamente las características más importantes.

(26)

Distribución de frecuencias

Frecuencias absolutas, relativas y porcentuales

La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa clase.

La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa clase.

 

n

f datos de número

absoluta frecuencia

h relativa

Frecuencia i   i

La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.

 

pi hi100%

porcentual Frecuencia

Ejemplo

Tomado de Revista Peruana de Epidemiología. Prácticas laborales de riesgo en cultivadores de arroz del valle del Alto Mayo, Región San Martín, Perú. Romina Tejada Caminiti, Franco Romaní Romaní, Paolo Wong Chero, Jorge Alarcón Villaverde. Junio 2011

http://rpe.epiredperu.net/rpe_ediciones/2011_V15_N01/AO8_Vol15_No1_2011_Tb1.gif.

Es el resumen de un conjunto de datos, presentado en una tabla

llamada la tabla de distribución de frecuencias

Esta tabla muestra las frecuencias absolutas, las frecuencias relativas y los

porcentajes

Las categorías o clases no se traslapan.

(27)

Elementos de un cuadro estadístico

Una tabla de frecuencias o cuadro estadístico debe presentar los siguientes elementos básicos:

Elementos de un gráfico estadístico

La presentación gráfica de la información permite, en la mayoría de casos, obtener conclusiones descriptivas del comportamiento de la variable que se está analizando.

(28)

Tabla de frecuencias para variables cualitativas

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera.

Título: ………..……….

Categorías Frecuencia absoluta fi Frecuencia relativa hi

Categoría 1 f1

n h1f1

Categoría 2 f2

n h2f2

… … …

Categoría k fk

n hkfk

Fuente: ………..

Tabla de frecuencias para variables cualitativas en Excel

• Asegúrese que cada columna represente una variable en estudio.

• Ubique el cursor en cualquier celda de los datos.

• Haga clic en la opción Insertar de la barra de menú.

• Seleccione Tabla dinámica y haga clic en Aceptar,

• Arrastre la variable de la cual desea el cuadro a la zona de Etiquetas de fila y también a la zona de ∑ Valores.

• Copie la tabla sin incluir los títulos, en otra celda.

• Calcule la frecuencia relativa (hi)

Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la

variable.

Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias

absolutas y relativas.

Para elaborar el gráfico de Pareto es necesario que la tabla de distribución de

frecuencias presente los valores de las frecuencias acumuladas, absolutas y relativas, con la finalidad de elaborar la

curva creciente .

Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las

frecuencias acumuladas absolutas y relativas.

(29)

Ejemplo 7

La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continuación:

Derecho Periodismo Ingeniería Administración Derecho

Ingeniería Futbolista Chef Ingeniería Administración

Periodismo Ingeniería Periodismo Chef Periodismo

Administración Chef Futbolista Administración Ingeniería

Derecho Chef Ingeniería Derecho Futbolista

Ingeniería Ingeniería Chef Chef Administración

a. Obtenga la tabla de distribución de frecuencia.

b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.

Solución

a. Obtenga la tabla de distribución de frecuencia.

Distribución de estudiantes de acuerdo a su preferencia profesional

Preferencia profesional fi hi pi

Administración 5 0,1667 16,67%

Chef 6 0,2000 20,00%

Derecho 4 0,1333 13,33%

Futbolista 3 0,1000 10,00%

Ingeniería 8 0,2667 26,67%

Periodismo 4 0,1333 13,33%

Total general 30 1,0000 100,00%

Fuente: universidad América. 2013

b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.

f3= de un total de treinta jóvenes, cuatro prefieren la carrera de Derecho.

p3 = el 13,3% de los jóvenes prefieren el Derecho como carrera profesional.

(30)

Ejercicio 10

Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su Función. Los datos se presentan a continuación:

Obrero Profesional Profesional Servicios Obrero Obrero

Profesional Obrero Técnico/ventas Producción Obrero Producción Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción

Obrero Obrero Obrero Profesional Servicios Obrero

Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional a. Presente la tabla de distribución de frecuencias.

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.

Solución

a. Presente la tabla de distribución de frecuencias.

Título: ……….

Función fi hi pi

Obrero Producción Profesional Servicios Técnico/ventas

Total general

Fuente: ………

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.

f1= de un total de ……….……. trabajadores, ………. son ………

p1 = el ……….……% de los trabajadores son ……….……

(31)

Representación gráfica de variables cualitativas

Gráfico de barras

En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las frecuencias absolutas, relativas o porcentuales.

Gráfico de barras en Excel

• Seleccione las celdas de la variable y de la de frecuencia absoluta o relativa. Use la tecla Ctrl si necesita seleccionar celdas no contiguas.

• Haga clic en la opción Insertar de la barra de menú y active el icono Columnas. Seleccione la opción Columna y presione Aceptar.

• Elimine la leyenda que aparece en el lado derecho del gráfico.

• Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las opciones: Diseño, Presentación y Formato. Seleccione Presentación, luego escoja los botones Título de gráfico, Rótulo del eje o Etiquetas de datos para darle el formato deseado a su gráfico.

• Para cambiar a porcentaje los valores del eje vertical haga doble clic en el eje vertical, seleccione la opción Número y haga clic en Porcentaje.

(32)

Ejemplo 8

La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continuación:

Derecho Periodismo Ingeniería Administración Derecho

Ingeniería Futbolista Chef Ingeniería Administración

Periodismo Ingeniería Periodismo Chef Periodismo

Administración Chef Futbolista Administración Ingeniería

Derecho Chef Ingeniería Derecho Futbolista

Ingeniería Ingeniería Chef Chef Administración

Presente el gráfico de barras porcentuales para los datos.

Solución

Interpretación

Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería mientras que el 10% prefiere la carrera de futbolista.

26.7%

20.0%

16.7%

13.3% 13.3%

10.0%

0%

5%

10%

15%

20%

25%

30%

Ingeniería Chef Administración Derecho Periodismo Futbolista

Porcentaje de alumnos

Preferencia profesional

Distribución de estudiantes que culminan el colegio de acuerdo a su preferencia profesional

Fuente: Universidad América. 2013

(33)

Ejercicio 11

Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los datos se presentan a continuación:

Obrero Profesional Profesional Servicios Obrero Obrero

Profesional Obrero Técnico/ventas Producción Obrero Producción Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción

Obrero Obrero Obrero Profesional Servicios Obrero

Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional Realice e interprete el gráfico de barras porcentuales.

Solución

Interpretación 0 2 4 6 8 10 12 14

Obrero Producción Profesional Servicios Técnico/ventas Función

Cuenta de Preferencia

Fuente: ...

(34)

Gráfico circular

En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es proporcional a la frecuencia que representan. También se denomina diagrama de sector circular, gráfico tipo torta o pastel.

Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras

Gráfico circular en Excel

• Seleccione las columnas de la variable y la de frecuencia absoluta o relativa . Use la tecla Ctrl si necesita seleccionar celdas no contiguas.

• Haga clic en la opción Insertar de la barra de menú y active el icono Circular. Seleccione la opción Circular y presione Aceptar.

• Haciendo doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las opciones: Diseño, Presentación y Formato.

• Seleccione Presentación y escoja el botón Título de gráfico y Etiquetas de datos.

(35)

Ejemplo 9

La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continuación:

Derecho Periodismo Ingeniería Administración Derecho

Ingeniería Futbolista Chef Ingeniería Administración

Periodismo Ingeniería Periodismo Chef Periodismo

Administración Chef Futbolista Administración Ingeniería

Derecho Chef Ingeniería Derecho Futbolista

Ingeniería Ingeniería Chef Chef Administración

Presente el gráfico circular.

Solución

Interpretación

Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y solo el 10% prefiere la carrera de Derecho.

Administración 17%

Chef 20%

Derecho Futbolista 13%

10%

Ingeniería 27%

Periodismo 13%

Distribución de estudiantes de acuerdo a su preferencia profesional

Fuente: Universidad América. 2013

(36)

Ejercicio 12

Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los datos se presentan a continuación:

Obrero Profesional Profesional Servicios Obrero Obrero

Profesional Obrero Técnico/ventas Producción Obrero Producción Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción

Obrero Obrero Obrero Profesional Servicios Obrero

Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional Realice e interprete el gráfico circular.

Solución

Interpretación

Fuente: ...

(37)

Diagrama de Pareto

El diagrama de Pareto permite ver que, en muchos casos, pocos factores pueden producir la mayoría de las consecuencias, lo que se podría resumir como “pocos factores son vitales y muchos son triviales”. Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los defectos surgen de un número pequeño de causas.

Los pasos para realizar un diagrama de Pareto son los siguientes:

Diagrama de Pareto en Excel

Elija Insertar del menú principal y como tipo de gráfico Columna.

 Haga clic derecho en cualquiera de las barras Hi y haga clic en Cambiar tipo de gráfico en serie y elija tipo de gráfico Líneas y presione Aceptar.

Haga clic derecho sobre el eje Y. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima ponga el valor 1 en Fija.

Haga clic derecho sobre cualquiera de los puntos de la línea y elija la opción Dar Formato de serie de datos... En el recuadro Opciones de serie, seleccione Eje secundario.

Haga clic derecho sobre el eje Y derecho. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima ponga el valor 1 en Fija.

Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.

Construya la tabla de distribución de frecuencias, ordenando las categorías en forma descendente

respecto de la frecuencia absoluta o relativa.

De existir la categoría Otros colóquela en la última

posición.

Grafique dos ejes verticales

y un eje horizontal.

En el eje vertical derecho,

use una escala de 0% a 100%.

En el eje vertical izquierdo, marque una escala de:

•0 hasta el número total de observaciones, si usa las frecuencias absolutas

•0 a 100%, si usa las frecuencias porcentuales

En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de las

categorías, incluida la categoría Otros.

Elabore el diagrama de barras y dibuje la línea de

frecuencias acumuladas (curva de Pareto).

(38)

Ejemplo 10

En el cuadro se muestran, según la página web de la Oficina Nacional de Procesos Electorales, los resultados de las elecciones presidenciales del 2011 en el Perú. Elabore el diagrama de Pareto correspondiente. Agrupe en la categoría Otros a los candidatos que obtuvieron menos del 1%.

Organización política Votos Organización política Votos

Gana Perú 4,643,064 Despertar Nacional 21,574

Fuerza 2011 3,449,595 Adelante 17,301

Alianza por el Gran Cambio 2,711,450 Fuerza Nacional 16,831

Perú Posible 2,289,561 Justicia, Tecnología, Ecología 11,275

Alianza Solidaridad Nacional 1,440,143 Partido Descentralista Fuerza Social 9,358

Fonavistas del Perú 37,011

Solución

Ordene las categorías en orden decreciente. La categoría Otros siempre va al final independientemente de su valor.

 Calcule las frecuencias porcentuales (pi ) y las porcentuales acumuladas (Pi )

Distribución de los encuestados según organización política

Organización política Votos pi Pi

Gana Perú 4,643,064 31,70% 31,70%

Fuerza 2011 3,449,595 23,55% 55,25%

Alianza por el Gran Cambio 2,711,450 18,51% 73,76%

Perú Posible 2,289,561 15,63% 89,39%

Alianza Solidaridad Nacional 1,440,143 9,83% 99,23%

Otros 113,350 0,77% 100,00%

Fuente: Web de la Oficina de Procesos Electores ONPE

El resultado debe ser:

(39)

Del gráfico, vemos que el 73,76% de las personas votó por las organizaciones políticas Gana Perú, Fuerza 2011 y Alianza por el gran cambio.

Ejercicio 13

Tito´s, empresa de venta de comida rápida por delivery, desea elevar el nivel de satisfacción de sus clientes. Para ello, llevó a cabo una encuesta por teléfono entre 100 clientes que realizaron pedidos durante el último mes. Las quejas manifestadas por estos clientes se resumen a continuación:

Quejas hi

Tiempo de entrega del pedido 0,40 Calidad del producto entregado 0,15

Error en el pedido 0,20

Otros 0,10

Cordialidad del empleado 0,10

No existe variedad 0,03

Precio 0,02

a. Presente la tabla de distribución de frecuencias.

b. Complete el gráfico mostrado con los valores y títulos apropiados.

c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el gráfico obtenido?

Solución

a. Presente la tabla de distribución de frecuencias.

Título: ……….

Quejas fi hi Hi

Tiempo de entrega del pedido Error en el pedido

Calidad del producto entregado Cordialidad del empleado No existe variedad Precio

Otros

Fuente: ………

(40)

b. Complete el gráfico mostrado con los valores y títulos apropiados.

Fuente: ………..………

c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el gráfico obtenido?

qqqq

qqqq

Referencias

Documento similar

Where possible, the EU IG and more specifically the data fields and associated business rules present in Chapter 2 –Data elements for the electronic submission of information

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos