Item Type info:eu-repo/semantics/LearningObject
Authors Gutierrez, Silvia; Luna, Walter
Publisher Universidad Peruana de Ciencias Aplicadas (UPC)
Download date 07/06/2022 15:16:56
Link to Item
http://hdl.handle.net/10757/550527EPE
AUTORES : Silvia Gutiérrez Flores
Walter Luna Flores
TÍTULO : Cuaderno de trabajo
FECHA : Abril 2015
CURSO : Estadística Descriptiva
CODIGO : MA147 y CE19
ÁREA : Ciencias
CICLO : 2015-1
Contenido
EPE 2
Capítulo 1. Organización de datos 5
Subdivisión de la Estadística 5
Definiciones básicas 6
Métodos de recolección de datos 9
Variable 12
Escalas de medición 15
Organización y presentación de datos 25
Tabla de frecuencias para variables cualitativas 28
Representación gráfica de variables cualitativas 31
Representación gráfica de variables discretas 60
Representación gráfica de variables cuantitativas continuas 69
Capítulo 2. Resúmenes de datos 87
Medidas de tendencia central 87
El ingreso promedio mensual en Lima aumentó un 3,9% 87
Medidas de dispersión 112
Medidas de asimetría 121
Capítulo 3. Probabilidades 129
Definiciones básicas de probabilidad 129
Probabilidad condicional 139
Eventos independientes 143
Teorema de la probabilidad total 146
Teorema de Bayes 147
Capítulo 4. Variable aleatoria y distribución de probabilidad 153
Variable aleatoria 153
Variable aleatoria discreta 154
Variable aleatoria continua 163
Distribuciones discretas especiales 164
Distribuciones continuas especiales 176
Capítulo 5 Muestreo 185
Muestreo probabilístico 187
Capítulo 1. Organización de datos
Subdivisión de la Estadística
Estadística
Es una ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, organizar, presentar y
analizar datos.
La finalidad y utilidad es describir, numérica o gráficamente al conjunto de datos, así como también realizar inferencias, entendidas como generalizaciones de lo observado, de manera que
se puedan obtener conclusiones adecuadas.
Estadística Descriptiva
Son métodos y técnicas de recolección, caracterización,
resumen y presentación que permite describir apropiadamente las características de un conjunto de
datos.
Comprende el uso de gráficos, tablas,
diagramas y criterios para el análisis. Existen diversos tipos de
gráficos adecuados a los
distintos datos que se desean
representar.
Estadística Inferencial
Son métodos y técnicas que hacen
posible estimar una o más características de
una población o tomar decisiones
referentes a la población basados
en el resultado de muestras elegidas adecuadamente.
Estas conclusiones no tienen que ser
totalmente válidas, pueden
tener cierto margen de error, por eso se dan con
una medida de confiabilidad o probabilidad.
Definiciones básicas
Población
•Es el conjunto de todas las unidades elementales de interés en un determinado estudio.
•Pueden ser personas, animales, objetos, conceptos, etc. de los cuales sacamos conclusiones a partir de una o más características observables de naturaleza cualitativa o cuantitativa.
Muestra
•Es una parte o un subconjunto de la población que se selecciona
adecuadamente para obtener información acerca de la población de la cual proviene.
•Una muestra será representativa si es elegida de forma aleatoria.
Unidad elemental
•Es el objeto sobre el cual se hace la medición.
•También se le denomina unidad de análisis, unidad estadística o elemento.
•Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.
Dato
•Es el resultado de medir una característica de una unidad elemental.
•Los datos pueden ser cualitativos o cuantitativos ya que dependerán del tipo de variable.
Observación
•Es el conjunto de datos de una unidad elemental.
•La observación se tiene para cada unidad elemental.
Ejemplo 1
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.
Para conocer qué características del hotel es conveniente resaltar en la publicidad, se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:
N° Edad Género País de procedencia
Precio dispuesto a pagar por habitación en
dólares
Número de acompañantes
por viaje
Criterio de selección del hotel
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
a. Determine la población, la muestra y la unidad elemental.
b. De la base de datos, proporcione un ejemplo de dato y uno de observación.
Solución
Población Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada entre enero y mayo del presente año.
Muestra 115 huéspedes extranjeros que se hospedaron en el hotel La Posada entre enero y mayo del presente año.
Unidad elemental Un huésped extranjero que se hospedó en el hotel La Posada entre enero y mayo del presente año.
Dato X4 = 65 años
Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio
Ejercicio 1
De los universitarios que estudian en la ciudad de Lima, se quiere estimar el porcentaje de universitarios que trabajan. Determine la población, la muestra y la unidad elemental.
Población
Muestra
Unidad elemental
Ejercicio 2
Se desea estimar el promedio diario de clientes que ingresan a un supermercado, para lo cual se eligieron cinco días al azar del presente mes y se registró el número de clientes que ingresó cada día al supermercado. Los resultados registrados fueron los siguientes: 554, 789, 487, 553 y 625 personas. Determine la población, la muestra y la unidad elemental.
Población
Muestra
Unidad elemental
Ejercicio 3
La Oficina de Turismo de Cusco recopiló datos sobre los turistas que llegaron a la ciudad. Entre las 16 preguntas de un cuestionario que se entregó a los pasajeros que llegaron en el mes de enero del presente año, figuraban, entre otras, las siguientes preguntas:
Esta visita a Cusco es la: ……… vez (primera, segunda, tercera, etc.).
El motivo principal de este viaje es: ……… (16 categorías incluyendo vacaciones, trabajo).
Voy a estar alojado en: ……… (10 categorías incluyendo hotel, apartamento, parientes).
Mi estadía en Cusco va a durar: ………. días.
Población
Unidad elemental
Métodos de recolección de datos
La forma de obtener la información original de las unidades elementales por investigar puede ser efectuada a través de:
Censo
• Es una encuesta de todos los elementos de la población.
Encuesta muestral
• Es una encuesta de una parte de la población.
El uso de la encuesta ha ido en rápido aumento, debido a:
1. Que las instituciones que producen información disponen de personal capacitado para efectuar su organización, diseño y análisis.
2. Su menor costo con respecto al censo que, en
determinadas circunstancias, la información resulta más exacta que la de un censo. Esto se debe a que los errores en la recolección y procesamiento de los datos pueden ser reducidos a través de una mejor capacitación de los empadronadores y la utilización de métodos de
captación de información más objetivos.
Ejemplo 2
Aprobación de Ollanta Humala cayó a 39% según reveló encuesta de Datum
ElComercio.pe lunes 8 de julio del 2013
La aprobación del jefe de Estado, Ollanta Humala, registró su porcentaje más bajo desde que se inició la gestión presidencial. En una encuesta realizada por Datum, la popularidad de Humala apenas alcanzó 39%. Esto es siete puntos menos que el mes anterior y un retroceso de 21 unidades respecto de abril.
El estudio puntualizó además que el nivel de desconfianza hacia Humala Tasso aumentó de 69% a 81%, también tomando en cuenta las cifras del mes que pasó. La esposa del jefe de Estado, Nadine Heredia, obtuvo 47% de respaldo. Un 46% la desaprobó.
Registro administrativo
Existen oficinas públicas que llevan registros administrativos para sus propios fines.
Por ejemplo:
los Registros Civiles registran nacimientos, casamientos o defunciones,
el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar,
la Aduana que registra las importaciones y exportaciones.
Los registros administrativos constituyen la forma más económica de obtener información estadística.
Sin embargo, esta información se obtiene tal como está disponible. Los fines del registro administrativo no siempre coinciden con los de nuestra investigación.
Por ejemplo, se puede consultar las páginas web de las siguientes instituciones:
• Ministerio de Educación http://minedu.gob.pe/
• Ministerio de Salud http://www.minsa.gob.pe/
• Superintendencia Nacional de Aduanas y de Administración Tributaria SUNAT http://www.sunat.gob.pe/
• Registro Nacional de Identificación y Estado Civil http://www.reniec.gob.pe/
• Ministerio de Economía y Finanzas http://www.mef.gob.pe/
• Sistema Integrado de Información de Comercio Exterior http://www.siicex.gob.pe/
• Instituto Nacional de Estadística e Informática INEI. http://www.inei.gob.pe/
Ministerio de Trabajo y Promoción del Empleo. http://www.mintra.gob.pe/
Variable
Variable
Se define así a una característica que presentan los elementos de una población y que puede asumir diferentes valores cuando se realiza su medición
Variables cualitativas
Son aquellas variables que al ser medidas quedan expresadas por
etiquetas o nombres que se utilizan para
identificar una característica o atributo.
Variables cuantitativas
Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para
identificar una característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.
Variable cuantitativa discreta
Es aquella variable cuyo número de posible de valores es finito o infinito
numerable; es decir, que sólo puede tomar ciertos valores en un intervalo
determinado.
Variable cuantitativa continua
Es aquella variable cuyo número posible de valores es infinito no numerable, es decir, que
puede tomar cualquier valor en un intervalo
determinado.
En una variable continua, para dos valores cualesquiera, siempre se puede encontrar un tercer
valor entre los dos primeros.
Ejemplos de variables
Las siguientes variables corresponden a una encuesta aplicada a un postulante de una agencia publicitaria:
Ejemplo 3
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.
Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A continuación se presenta parte de la base de datos:
N° Edad Género País de procedencia
Precio dispuesto a pagar por habitación, en
dólares
Número de acompañantes
por viaje
Criterio de selección del hotel
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
Identifique cada una de las variables que se presenta en la base de datos según su tipo.
Solución
Variable Tipo de variable
Edad Cuantitativa continua
Género Cualitativa
País de procedencia Cualitativa
Precio dispuesto a pagar por habitación, en dólares Cuantitativa continua Número de acompañantes por viaje Cuantitativa discreta
Criterio de selección del hotel Cualitativa
Variable
Cualitativa
Lugar de nacimiento
Grado de instrucción
Cuantitativa discreta
Número de capacitaciones
llevadas en el presente año
Número de hijos
Cuantitativa continua
Tiempo de demoran para trasladarse de
su casa al trabajo (en
minutos)
Salario actual (en nuevos
soles)
Ejercicio 4
Los clientes que se suscriben a la revista “Economía al Día” deben llenar un formato con información personal. Identifique el tipo de variable.
Variable Tipo de variable
Género Profesión
Distrito donde vive
Ingreso mensual familiar (en nuevos soles) Grado de instrucción
Número de teléfono Estado civil
Ejercicio 5
El gerente de una red de librerías, con sucursales en Santiago de Surco, San Borja y San Luis ha observado que en los últimos meses las ventas han disminuido, y desea conocer los factores que originan este problema. Por ello, realizó una encuesta a 210 clientes seleccionados aleatoriamente de todas las sucursales. Algunas de las variables recolectadas mediante la encuesta son las siguientes:
Ingreso mensual familiar (en nuevos soles)
Distrito de residencia
Número de hijos en edad escolar
Nivel de satisfacción con la atención recibida (muy buena, buena, mala, muy mala)
a. Del enunciado anterior identifique la población en estudio, la muestra y la unidad elemental.
Población Muestra
Unidad elemental
b. Identifique las variables en estudio con su respectivo tipo.
Variable Tipo de variable
Ingreso mensual familiar (en nuevos soles) Distrito de residencia
Número de hijos en edad escolar
Nivel de satisfacción con la atención recibida
Escalas de medición
La medición de una variable consiste en asignar un valor a la característica observada.
Por ejemplo, si la característica observada es el
género de las personas, hacemos una medición de la característica y le asignamos un valor, el de femenino.
El proceso de medición utiliza las escalas:
nominal, ordinal, intervalo y razón.
•Sólo permite asignar un nombre, etiqueta o valor al elemento sometido a medición.
•Los números que se puedan asignar a las propiedades de los elementos se utilizan sólo como etiquetas con la finalidad de clasificarlos.
•Con esta escala no tiene sentido realizar operaciones aritméticas.
Nominal
•Los datos son etiquetas y además el orden es significativo.
•Los datos se pueden ordenar en forma ascendente o descendente, de tal manera que puedan expresar grados de la
característica medida.
Ordinal
•Además de asignar un nombre o etiqueta y establecer un orden entre los elementos, esta escala permite calcular diferencias entre los números asignados a las mediciones (el intervalo entre
observaciones que se expresa en términos de una unidad fija de medida).
•Los datos son numéricos.
Intervalo
•Los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es significativo.
•Tiene un punto cero absoluto, es decir, el cero indica la ausencia de la característica medida.
•Se puede realizar las operaciones aritméticas a los números asignados.
Razón
Ejemplos de variables y sus escalas de medición
•El género de las personas
•La marca de celular
•La línea aérea de su preferencia
•La religión que profesa una persona
•El número de DNI
•………...………
•………...……
Nominal
•El orden de mérito de los alumnos de la UPC
•El grado académico de los empleados de un banco
•La opinión sobre la atención en un supermercado (bueno, regular, malo)
•………..…...
Ordinal
•Las escalas de la temperatura. Por ejemplo, T(°F) = 1.8 x T(°C) + 32
•El año 2000 fue 2753 en el calendario romano, 2749 en el calendario babilónico, 6236 en el egipcio, 2544 en el budista, 5119 en el maya
•La ubicación en una carretera respecto de un punto de referencia
•………...………
Intervalo
•El sueldo de los trabajadores de un banco
•La altura de una persona.
•La velocidad de un auto en la carretera
•………
•………..…….………...
Razón
Ejemplo 4
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.
Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A continuación se presenta parte de la base de datos:
N° Edad Género País de procedencia
Precio dispuesto a pagar por habitación, en
dólares
Número de acompañantes
por viaje
Criterio de selección del hotel
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base de datos.
Solución
Variable Tipo de variable Escala de medición
Edad Cuantitativa continua Razón
Género Cualitativa Nominal
País de procedencia Cualitativa Nominal
Precio dispuesto a pagar por habitación, en
dólares Cuantitativa continua Razón
Número de acompañantes por viaje Cuantitativa discreta Razón
Criterio de selección del hotel Cualitativa Nominal
Ejercicio 6
Indique el tipo y la escala de medición que corresponde a cada una de las siguientes variables.
Variable Tipo de variable Escala de medición
Edad
Marca de automóvil
Número de personas a favor de la pena de muerte
Ventas anuales (en dólares) Tamaño de bebida (pequeño, mediano, grande)
Ejercicio 7
La Oficina de Turismo de Cusco recopila datos sobre los turistas que llegan a la ciudad. Entre las 16 preguntas de un cuestionario que se repartió a los pasajeros en los vuelos de llegada durante el mes pasado figuraban, entre otras, las siguientes:
Esta visita a Cusco es la: ___________________ vez. (1°, 2°, 3°, etc.)
El motivo principal de este viaje es: _______________ (16 categorías incluyendo vacaciones, trabajo, etc.)
Voy a estar alojado en: ________________ (11 categorías incluyendo hotel, apartamento, parientes, etc.)
Mi estadía en Cusco va a durar: ________ días.
Identifique el tipo y la escala de medición de cada una de las variables:
Variable Tipo de variable Escala de medición
Parámetro y estimador
Algunos parámetros y estadísticos importantes
Nombre
Notación
Parámetro Estadístico
Media
N x
N i
i 1
n
x x
n i
i 1
Varianza
N x
N
i
i
1
2 2
1
1
2 2
n x x s
n i
i
Desviación estándar 2 s s2
Proporción
N pK
n pˆk
Moda Mo mo
Parámetro
Representa , en valor numérico, la característica
de la población.
Para obtener su valor se hace necesario
contar con toda la información que brindan los elementos
de una población.
Estimador
Representa, en valor numérico, la característica
de una muestra.
Para obtener su valor se
utiliza la información
muestral.
Al valor numérico del estimador se le
conoce como estimación.
Al estimador, se le llama
también estadígrafo o
estadístico.
Ejemplo 5
Este fue el flash electoral de CPI para las elecciones presidenciales del 2011.
Identifique la variable en estudio, un estadístico para esta variable y el valor del estadístico.
Solución
Variable en estudio: candidato de preferencia
Estadístico para esta variable: proporción del candidato de preferencia
El valor del estadístico es: 52,5% prefiere a Ollanta Humala y 47,5% prefiere a Keiko Fujimori.
Ejemplo 6
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel.
Desea conocer qué características del hotel es conveniente resaltar en la publicidad, para ello aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron entre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:
N° Edad Género País de procedencia
Precio dispuesto a pagar por habitación en
dólares
Número de acompañantes
por viaje
Criterio de selección del hotel
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
Después de procesar la información se obtuvieron los siguientes resultados:
El 34% de los huéspedes extranjeros procede de los Estados Unidos.
La edad promedio de los huéspedes es de 35,2 años.
El número de acompañantes por huésped extranjero más frecuente es de dos personas.
El criterio de selección más frecuente es el precio.
Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.
Solución
Variable Estimador Notación Valor del estimador
Lugar de procedencia Proporción pˆEEUU 0,34
Edad de los huéspedes Promedio x 35,2 años
Número de acompañantes Moda mo 2
Criterio de selección del hotel Moda mo Precio
Ejercicio 8
Un banco estatal ha estudiado la información que dieron sus clientes en el mes de marzo al solicitar un préstamo vehicular. Al seleccionar una muestra de 180 clientes algunos resultados fueron:
• El 12% declaró tener un trabajo independiente.
• La edad promedio de los clientes al solicitar un préstamo fue de 41,3 años.
• El 50% declaró ser casado.
• El monto promedio de las solicitudes fue de 3025 nuevos soles.
Identifique el estimador y el valor del estimador para cada una de las variables.
Solución
Variable Estimador Notación Valor
Ejercicio 9
Como parte de un estudio de mercado se aplicó este año una encuesta a un grupo de 245 estudiantes de la universidad A. Se sabe que en esta universidad el 72% del alumnado pertenece al área de Humanidades y el resto al área de Ciencias.
Después de procesar la información se obtuvo que 56% de los encuestados era de sexo femenino, el 33,2% de los encuestados prefiere el rock como género musical, el 45,7% gusta de la emisora 104.7 VIVA F.M. Se sabe, además, que la media del número de veces que un oyente llamó a la radio en el último mes fue de 2,86 llamadas y la moda de esa misma variable fue igual a uno.
Identifique el estimador o parámetro y su valor para cada una de las variables.
Solución
Variable Parámetro o estimador Notación Valor
Ejercicios de aplicación
1. Conteste las siguientes preguntas justificando adecuadamente las respuestas:
a. ¿Qué diferencias existe entre la escala de intervalos y la escala de razón? Muestre ejemplos que sustenten su respuesta.
b. ¿Qué diferencia existe entre dato y observación? Muestre ejemplos que sustenten su respuesta.
2. Se quiere estimar el ingreso mensual de los niños y adolescentes que viven en Iquitos.
Identifique la población, la muestra, el elemento y la variable en estudio.
Población
Muestra
Elemento
Variable
3. La entidad bancaria Tubanco tiene presencia en Lima y Callao. Cuenta actualmente con 9 784 clientes distribuidos en diferentes agencias. Su gerente general desea determinar la situación de la entidad y la de sus clientes. Para ello, seleccionó una muestra de 120 clientes que solicitaron préstamo durante el último semestre. Parte de la base de datos correspondiente a la muestra se presenta a continuación:
Número de tarjetas
Edad del cliente (años)
Tipo de préstamo
Monto del préstamo (en dólares)
Número de cuotas del préstamo (meses)
Tipo de moneda del
préstamo
Giro del negocio
1 53 Capital trabajo 5000 6 Soles Bodega
3 36 Cuota fija 1500 12 Soles Restaurante
5 54 Cuota fija 4500 18 Soles Abarrotes
2 45 Mi local 12000 36 Soles Abarrotes
4 43 Mi local 6000 36 Dólares Mueblería
a. De acuerdo con el enunciado identifique la población, la muestra y la unidad elemental.
b. Identifique un ejemplo de dato y uno de observación.
c. Para cada una de las variables identifique su tipo y escala de medida.
d. ¿Qué estadístico puede calcularse para la variable Monto del préstamo y cuál para la variable Tipo de préstamo?
4. Fernando, estudiante de administración, tiene la labor de conseguir información acerca de los turistas que llegaron a la ciudad del Cusco. En su búsqueda, encontró que la agencia de viajes Turismo Perú realizó un estudio a sus 15 000 turistas extranjeros que llegaron al Cusco el año pasado. Como parte de la información encontró que todos hablaban más de un idioma, el 35%
eran americanos y el gasto promedio que hicieron en la ciudad fue de 2 000 nuevos soles.
De acuerdo con el enunciado anterior:
a. Identifique la población, la muestra y la unidad elemental.
b. Para cada una de las variables identifique su tipo y escala de medida.
c. Mencione dos parámetros y un estadígrafo de utilidad para cada variable.
5. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos de los inmigrantes peruanos en Estados Unidos. El estudio se llevó a acabo aplicando encuestas a una muestra de 400 inmigrantes peruanos. Algunas de las preguntas del cuestionario fueron las siguientes:
Nivel educativo alcanzado en el Perú.
Monto enviado (en dólares) el último mes a sus familiares en el Perú.
¿Presenta alguno de los siguientes problemas? (indocumentado, discriminado, vivienda no adecuada, salud y otros).
Número de veces que ha visitado el Perú desde que viajó por primera vez a los Estados Unidos.
a. De acuerdo con el enunciado anterior identifique la población y la muestra.
b. Para las respuestas generadas por cada una de las preguntas mostradas identifique el tipo de variable y su respectiva escala de medida.
c. Para cada una de las variables, proponga el estadístico más adecuado.
6. Edificar es una empresa dedicada al rubro de la construcción que ha crecido notablemente durante el último año. El gerente de Recursos Humanos ha recibido algunas quejas de los trabajadores y antes este problema ha decidido estudiar la situación laboral de los trabajadores para obtener algunas medidas de interés que le permita tomar algunas decisiones. Al seleccionar una muestra de 115 trabajadores obtuvo la siguiente información:
Trabajador Género Edad (en años)
Número
de hijos Cargo Ingreso mensual (en nuevos soles)
Motivo de la queja
1 M 32 1 Maestro de obra 2862 Mal remunerado
2 M 32 2 Peón 742 Sin bonificación
3 M 25 0 Oficial 2256 Sin horas extras
4 F 21 0 Operario 1696 Mal trato
115 M 37 3 Oficial 1438 Mal remunerado
De acuerdo con el enunciado anterior:
a. Identifique la población, la muestra y la unidad elemental.
b. Para cada una de las variables, proponga el estadístico más adecuado que ayude al gerente.
c. Complete la siguiente tabla:
Variable en estudio Tipo de variable Escala de medida Ingreso mensual (en nuevos soles)
Razón Nominal Cuantitativa discreta
Organización y presentación de datos
Luego de aplicar una encuesta a una muestra de treinta empleados, una empresa obtiene la siguiente base de datos. Se pide redactar un informe que resuma la información.
Tabla. Datos sobre satisfacción laboral
Género Función Edad
Tiempo en la empresa
Ingreso anual
Número de promocione
s
Promoción posible
Número de capacitaciones
Relación con la gerencia
Femenino Obrero 19 1 11 400 0 Improbable 1 Buenas
Masculino Profesional 31 5 210 600 2 No está seguro 2 Buenas
Masculino Profesional 34 8 193 400 1 Probable 2 Buenas
Masculino Servicios 36 15 30 800 1 Improbable 0 Buenas
Masculino Obrero 44 4 9 850 0 Improbable 1 Regulares
Masculino Obrero 44 10 9 800 0 Improbable 1 Regulares
Masculino Técnico/ventas 31 5 40 840 0 Improbable 3 Buenas
Femenino Profesional 37 8 93 700 1 No está seguro 2 Buenas
Masculino Obrero 45 23 10 150 0 Improbable 1 Regulares
Masculino Obrero 54 18 9 050 0 Muy improbable 1 Regulares
Femenino Profesional 26 2 62 200 2 No está seguro 2 Buenas
Masculino Obrero 44 14 10 200 0 Probable 0 Regulares
Masculino Técnico/ventas 31 2 40 335 0 Muy improbable 2 Buenas
Femenino Producción 28 10 30 990 1 Muy improbable 1 Buenas
Femenino Obrero 23 5 9 360 1 Muy improbable 1 Buenas
Femenino Producción 38 20 33 800 0 Muy improbable 1 Buenas
Masculino Producción 38 9 35 500 1 Muy improbable 2 Buenas
Masculino Técnico/ventas 32 2 40 540 0 Improbable 2 Buenas
Masculino Servicios 36 18 27 500 1 Muy improbable 1 Buenas
Femenino Obrero 48 25 10 200 0 Muy improbable 1 Buenas
Masculino Obrero 45 20 9 650 0 Improbable 1 Regulares
Femenino Técnico/ventas 22 2 44 000 0 No está seguro 2 Buenas
Masculino Técnico/ventas 32 6 48 560 1 Improbable 2 Buenas
Masculino Obrero 46 20 10 300 0 Muy improbable 1 Regulares
Masculino Profesional 28 1 108 700 3 Improbable 5 Buenas
Femenino Producción 27 5 30 550 1 Muy improbable 2 Buenas
Masculino Producción 38 14 32 300 0 Muy improbable 1 Buenas
Masculino Obrero 40 20 9 130 0 No está seguro 0 Regulares
Masculino Profesional 24 1 70 000 1 Probable 3 Buenas
Masculino Obrero 56 30 9 740 0 Muy improbable 1 Regulares
¿Qué podemos hacer para resumir esta información?
Una vez recopilada la información, con las variables consideradas de mayor importancia, el siguiente paso es presentarla a través de una tabla de frecuencias o un gráfico que describa adecuadamente las características más importantes.
Distribución de frecuencias
Frecuencias absolutas, relativas y porcentuales
La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa clase.
La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa clase.
nf datos de número
absoluta frecuencia
h relativa
Frecuencia i i
La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.
pi hi100%porcentual Frecuencia
Ejemplo
Tomado de Revista Peruana de Epidemiología. Prácticas laborales de riesgo en cultivadores de arroz del valle del Alto Mayo, Región San Martín, Perú. Romina Tejada Caminiti, Franco Romaní Romaní, Paolo Wong Chero, Jorge Alarcón Villaverde. Junio 2011
http://rpe.epiredperu.net/rpe_ediciones/2011_V15_N01/AO8_Vol15_No1_2011_Tb1.gif.
Es el resumen de un conjunto de datos, presentado en una tabla
llamada la tabla de distribución de frecuencias
Esta tabla muestra las frecuencias absolutas, las frecuencias relativas y los
porcentajes
Las categorías o clases no se traslapan.
Elementos de un cuadro estadístico
Una tabla de frecuencias o cuadro estadístico debe presentar los siguientes elementos básicos:
Elementos de un gráfico estadístico
La presentación gráfica de la información permite, en la mayoría de casos, obtener conclusiones descriptivas del comportamiento de la variable que se está analizando.
Tabla de frecuencias para variables cualitativas
La distribución de frecuencias es un cuadro que se calcula de la siguiente manera.
Título: ………..……….
Categorías Frecuencia absoluta fi Frecuencia relativa hi
Categoría 1 f1
n h1 f1
Categoría 2 f2
n h2 f2
… … …
Categoría k fk
n hk fk
Fuente: ………..
Tabla de frecuencias para variables cualitativas en Excel
• Asegúrese que cada columna represente una variable en estudio.
• Ubique el cursor en cualquier celda de los datos.
• Haga clic en la opción Insertar de la barra de menú.
• Seleccione Tabla dinámica y haga clic en Aceptar,
• Arrastre la variable de la cual desea el cuadro a la zona de Etiquetas de fila y también a la zona de ∑ Valores.
• Copie la tabla sin incluir los títulos, en otra celda.
• Calcule la frecuencia relativa (hi)
Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la
variable.
Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias
absolutas y relativas.
Para elaborar el gráfico de Pareto es necesario que la tabla de distribución de
frecuencias presente los valores de las frecuencias acumuladas, absolutas y relativas, con la finalidad de elaborar la
curva creciente .
Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las
frecuencias acumuladas absolutas y relativas.
Ejemplo 7
La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continuación:
Derecho Periodismo Ingeniería Administración Derecho
Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración
a. Obtenga la tabla de distribución de frecuencia.
b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.
Solución
a. Obtenga la tabla de distribución de frecuencia.
Distribución de estudiantes de acuerdo a su preferencia profesional
Preferencia profesional fi hi pi
Administración 5 0,1667 16,67%
Chef 6 0,2000 20,00%
Derecho 4 0,1333 13,33%
Futbolista 3 0,1000 10,00%
Ingeniería 8 0,2667 26,67%
Periodismo 4 0,1333 13,33%
Total general 30 1,0000 100,00%
Fuente: universidad América. 2013
b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.
f3= de un total de treinta jóvenes, cuatro prefieren la carrera de Derecho.
p3 = el 13,3% de los jóvenes prefieren el Derecho como carrera profesional.
Ejercicio 10
Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su Función. Los datos se presentan a continuación:
Obrero Profesional Profesional Servicios Obrero Obrero
Profesional Obrero Técnico/ventas Producción Obrero Producción Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional a. Presente la tabla de distribución de frecuencias.
b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
Solución
a. Presente la tabla de distribución de frecuencias.
Título: ……….
Función fi hi pi
Obrero Producción Profesional Servicios Técnico/ventas
Total general
Fuente: ………
b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
f1= de un total de ……….……. trabajadores, ………. son ………
p1 = el ……….……% de los trabajadores son ……….……
Representación gráfica de variables cualitativas
Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las frecuencias absolutas, relativas o porcentuales.
Gráfico de barras en Excel
• Seleccione las celdas de la variable y de la de frecuencia absoluta o relativa. Use la tecla Ctrl si necesita seleccionar celdas no contiguas.
• Haga clic en la opción Insertar de la barra de menú y active el icono Columnas. Seleccione la opción Columna y presione Aceptar.
• Elimine la leyenda que aparece en el lado derecho del gráfico.
• Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las opciones: Diseño, Presentación y Formato. Seleccione Presentación, luego escoja los botones Título de gráfico, Rótulo del eje o Etiquetas de datos para darle el formato deseado a su gráfico.
• Para cambiar a porcentaje los valores del eje vertical haga doble clic en el eje vertical, seleccione la opción Número y haga clic en Porcentaje.
Ejemplo 8
La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continuación:
Derecho Periodismo Ingeniería Administración Derecho
Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración
Presente el gráfico de barras porcentuales para los datos.
Solución
Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería mientras que el 10% prefiere la carrera de futbolista.
26.7%
20.0%
16.7%
13.3% 13.3%
10.0%
0%
5%
10%
15%
20%
25%
30%
Ingeniería Chef Administración Derecho Periodismo Futbolista
Porcentaje de alumnos
Preferencia profesional
Distribución de estudiantes que culminan el colegio de acuerdo a su preferencia profesional
Fuente: Universidad América. 2013
Ejercicio 11
Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los datos se presentan a continuación:
Obrero Profesional Profesional Servicios Obrero Obrero
Profesional Obrero Técnico/ventas Producción Obrero Producción Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional Realice e interprete el gráfico de barras porcentuales.
Solución
Interpretación 0 2 4 6 8 10 12 14
Obrero Producción Profesional Servicios Técnico/ventas Función
Cuenta de Preferencia
Fuente: ...
Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es proporcional a la frecuencia que representan. También se denomina diagrama de sector circular, gráfico tipo torta o pastel.
Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras
Gráfico circular en Excel
• Seleccione las columnas de la variable y la de frecuencia absoluta o relativa . Use la tecla Ctrl si necesita seleccionar celdas no contiguas.
• Haga clic en la opción Insertar de la barra de menú y active el icono Circular. Seleccione la opción Circular y presione Aceptar.
• Haciendo doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las opciones: Diseño, Presentación y Formato.
• Seleccione Presentación y escoja el botón Título de gráfico y Etiquetas de datos.
Ejemplo 9
La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continuación:
Derecho Periodismo Ingeniería Administración Derecho
Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración
Presente el gráfico circular.
Solución
Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y solo el 10% prefiere la carrera de Derecho.
Administración 17%
Chef 20%
Derecho Futbolista 13%
10%
Ingeniería 27%
Periodismo 13%
Distribución de estudiantes de acuerdo a su preferencia profesional
Fuente: Universidad América. 2013
Ejercicio 12
Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los datos se presentan a continuación:
Obrero Profesional Profesional Servicios Obrero Obrero
Profesional Obrero Técnico/ventas Producción Obrero Producción Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional Realice e interprete el gráfico circular.
Solución
Interpretación
Fuente: ...
Diagrama de Pareto
El diagrama de Pareto permite ver que, en muchos casos, pocos factores pueden producir la mayoría de las consecuencias, lo que se podría resumir como “pocos factores son vitales y muchos son triviales”. Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los defectos surgen de un número pequeño de causas.
Los pasos para realizar un diagrama de Pareto son los siguientes:
Diagrama de Pareto en Excel
Elija Insertar del menú principal y como tipo de gráfico Columna.
Haga clic derecho en cualquiera de las barras Hi y haga clic en Cambiar tipo de gráfico en serie y elija tipo de gráfico Líneas y presione Aceptar.
Haga clic derecho sobre el eje Y. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima ponga el valor 1 en Fija.
Haga clic derecho sobre cualquiera de los puntos de la línea y elija la opción Dar Formato de serie de datos... En el recuadro Opciones de serie, seleccione Eje secundario.
Haga clic derecho sobre el eje Y derecho. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima ponga el valor 1 en Fija.
Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.
Construya la tabla de distribución de frecuencias, ordenando las categorías en forma descendente
respecto de la frecuencia absoluta o relativa.
De existir la categoría Otros colóquela en la última
posición.
Grafique dos ejes verticales
y un eje horizontal.
En el eje vertical derecho,
use una escala de 0% a 100%.
En el eje vertical izquierdo, marque una escala de:
•0 hasta el número total de observaciones, si usa las frecuencias absolutas
•0 a 100%, si usa las frecuencias porcentuales
En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de las
categorías, incluida la categoría Otros.
Elabore el diagrama de barras y dibuje la línea de
frecuencias acumuladas (curva de Pareto).
Ejemplo 10
En el cuadro se muestran, según la página web de la Oficina Nacional de Procesos Electorales, los resultados de las elecciones presidenciales del 2011 en el Perú. Elabore el diagrama de Pareto correspondiente. Agrupe en la categoría Otros a los candidatos que obtuvieron menos del 1%.
Organización política Votos Organización política Votos
Gana Perú 4,643,064 Despertar Nacional 21,574
Fuerza 2011 3,449,595 Adelante 17,301
Alianza por el Gran Cambio 2,711,450 Fuerza Nacional 16,831
Perú Posible 2,289,561 Justicia, Tecnología, Ecología 11,275
Alianza Solidaridad Nacional 1,440,143 Partido Descentralista Fuerza Social 9,358
Fonavistas del Perú 37,011
Solución
Ordene las categorías en orden decreciente. La categoría Otros siempre va al final independientemente de su valor.
Calcule las frecuencias porcentuales (pi ) y las porcentuales acumuladas (Pi )
Distribución de los encuestados según organización política
Organización política Votos pi Pi
Gana Perú 4,643,064 31,70% 31,70%
Fuerza 2011 3,449,595 23,55% 55,25%
Alianza por el Gran Cambio 2,711,450 18,51% 73,76%
Perú Posible 2,289,561 15,63% 89,39%
Alianza Solidaridad Nacional 1,440,143 9,83% 99,23%
Otros 113,350 0,77% 100,00%
Fuente: Web de la Oficina de Procesos Electores ONPE
El resultado debe ser:
Del gráfico, vemos que el 73,76% de las personas votó por las organizaciones políticas Gana Perú, Fuerza 2011 y Alianza por el gran cambio.
Ejercicio 13
Tito´s, empresa de venta de comida rápida por delivery, desea elevar el nivel de satisfacción de sus clientes. Para ello, llevó a cabo una encuesta por teléfono entre 100 clientes que realizaron pedidos durante el último mes. Las quejas manifestadas por estos clientes se resumen a continuación:
Quejas hi
Tiempo de entrega del pedido 0,40 Calidad del producto entregado 0,15
Error en el pedido 0,20
Otros 0,10
Cordialidad del empleado 0,10
No existe variedad 0,03
Precio 0,02
a. Presente la tabla de distribución de frecuencias.
b. Complete el gráfico mostrado con los valores y títulos apropiados.
c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el gráfico obtenido?
Solución
a. Presente la tabla de distribución de frecuencias.
Título: ……….
Quejas fi hi Hi
Tiempo de entrega del pedido Error en el pedido
Calidad del producto entregado Cordialidad del empleado No existe variedad Precio
Otros
Fuente: ………
b. Complete el gráfico mostrado con los valores y títulos apropiados.
Fuente: ………..………
c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el gráfico obtenido?
qqqq
qqqq