Elementos b´
asicos de probabilidad y estad´ıstica
matem´
atica I
Prof. John Freddy Moreno Trujillo
Docente Investigador
CIPE-ODEON
Universidad Externado de Colombia
´
Indice general
Pr´
ologo
5
1. Elementos b´
asicos
7
1.1. Sumatorias . . . .
7
1.1.1. Propiedades . . . .
8
1.2. Sumas dobles . . . .
9
1.3. Productorias
. . . .
11
1.3.1. Propiedades . . . .
11
1.4. Logaritmaci´
on . . . .
12
1.5. Ejercicios . . . .
13
2. Estad´
ıstica descriptiva
16
2.1. Definiciones b´
asicas . . . .
16
2.1.1. Tipos de muestreo . . . .
16
2.1.2. Tipos de datos . . . .
18
2.2. Representaciones gr´
aficas
. . . .
18
2.3. Medidas de tendencia central . . . .
22
2.4. Medidas de posici´
on relativa . . . .
29
2.5. Medidas de dispersi´
on . . . .
30
2.6. Gr´
afico de caja y bigotes . . . .
32
2.7. Medidas de forma . . . .
34
2.8. Medidas de concentraci´
on . . . .
37
2.9. Ejercicios sugeridos . . . .
39
3. Probabilidad y variables aleatorias
45
3.1. Definiciones b´
asicas . . . .
45
3.2. Probabilidad condicional . . . .
48
3.3. Ley de probabilidades totales y teorema de Bayes . . . .
49
3.4. Eventos independientes
. . . .
50
3.5. Variables aleatorias . . . .
52
3.5.1. Funci´
on de distribuci´
on de probabilidad
f
X(x) . . . .
52
3.5.2. Funci´
on de distribuci´
on acumulada
F
X(x) . . . .
53
3.5.3. Valor esperado y Varianza . . . .
54
3.5.4. Algunas distribuciones b´
asicas
. . . .
55
Pr´
ologo
Las presentes notas se escriben con el ´
animo de servir como elemento de referencia en algunos
de los cursos de posgrado que se dictan en la Facultad de Finanzas, Gobierno y Relaciones
Internacionales de la Universidad Externado de Colombia.
Si bien los conceptos aqu´ı presentados son resultados cl´
asicos de la estad´ıstica y la probabilidad,
contar con estos elementos en un documento referente corto y sencillo es de gran utilidad en
muchos casos, como lo ha indicado mi experiencia al frente de varios de estos cursos durante los
´
ultimos a˜
nos.
De igual forma, los ejemplos utilizados y los ejercicios sugeridos responden a una intencionalidad
espec´ıfica de las asignaturas, de forma que estos muestran a los estudiantes la aplicabilidad de
las herramientas estad´ısticas en sus programas de estudio y en temas de investigaci´
on.
Para lograr este fin, el documento se ha estructurado como sigue: en el cap´ıtulo 1 se presentan
algunos elementos b´
asicos de matem´
aticas sobre notaci´
on de sumatorias, productorias y
loga-ritmaci´
on con sus propiedades b´
asicas; en el cap´ıtulo 2 se describen resultados relevantes de la
estad´ıstica descriptiva, y en el cap´ıtulo 3 se hace una introducci´
on a los elementos b´
asicos de la
teor´ıa de probabilidad y al concepto de variable aleatoria. Tambi´
en se presentan en este cap´ıtulo
algunas distribuciones de probabilidad b´
asicas.
Si bien este documento solo cubre aspectos introductorios, esperamos sea una buena referencia,
y que prontamente se pueda contar con una segunda parte que incluya aspectos de estad´ıstica
inferencial y an´
alisis de datos cualitativos.
John Freddy Moreno Trujillo
Docente Investigador CIPE-ODEON
Cap´ıtulo 1
Elementos b´
asicos
En este cap´ıtulo se presentan algunos elementos b´asicos sobre notaci´on de sumatorias y productorias, que ser´an de utilidad m´as adelante en el desarrollo de algunos conceptos estad´ısticos.
1.1.
Sumatorias
La notaci´on sigma o notaci´on de sumatoria es utilizada para representar de forma compacta la suma de cantidades indexadas en los enteros positivos, de forma que six1, x2, ..., xn son un conjunto de observa-ciones, entonces:
x1+x2+· · ·+xn= n X
i=1
xi
La letra que se utiliza para denotar las distintas observaciones es denominada´ındicede la sumatoria y su aporte es solamente notacional, es decir:
n X
i=1
xi= n X
k=1
xk= n X
j=1
xj
El valor en el que inicia el ´ındice es denominadol´ımite inferiorde la sumatoria y el ´ultimo valor que toma es denominadol´ımite superior. De acuerdo con esto, el l´ımite inferior de la siguiente sumatoria es 5 y el l´ımite superior es 42.
42 X
i=5
xi
1.1.1.
Propiedades
Algunas propiedades de la sumatoria son:
1.
n X
i=1
cxi=cx1+cx2+· · ·+cxn=c(x1+x2+· · ·+xn) =c n X
i=1
xi
Si una constante est´a multiplicando los t´erminos de la sumatoria, podemos sacarla de la misma por factorizaci´on.
2.
n X
i=1
(xi±yi) = n X
i=1
xi± n X
i=1
yi
La sumatoria de una suma o resta de t´erminos es igual a la suma o resta de las sumatorias de cada t´ermino.
3.
n X
i=1
c=nc
La sumatoria de una constanten-veces es igual an-veces la constante, y en general: n
X
i=m
c= (n−m+ 1)c
4.
n X
i=1
xi= p X
i=1
xi+ n X
i=p+1
xi dondepes un valor entero positivo entre 1 yn.
Ejemplo 1 Utilicemos algunas de las propiedades enumeradas arriba para determinar el valor de la siguiente suma:
7 X
n=4
(5n−2)
Tenemos que:
7 X
n=4
(5n−2) = 7 X
n=4 5n−
7 X
n=4 2 = 5
7 X n=4 n− 7 X n=4
Otro conjunto de resultados de gran utilidad son los siguientes:
n X
i=1
i=n(n+ 1) 2
n X
i=1
i2= n(n+ 1)(2n+ 1) 6
n X
i=1
i3= n
2(n+ 1)2 4
La demostraci´on de estos resultados se realiza por inducci´on matem´atica, una t´ecnica de demostraci´on en la cual se prueba que el resultado es v´alido para un primer elemento, se supone v´alido para un k-´esimo elemento y se demuestra para el siguiente al k-´esimo. De esta forma, queda demostrado para todos los elementos.
Ejemplo 2 Utilicemos los resultados anteriores para determinar el valor de la suma:
100 X
k=1
3k2−2k+ 4
Tenemos que:
100 X
k=1
3k2−2k+ 4 = 3 100 X
k=1
k2−2 100 X
k=1
k+ 100 X
k=1 4
= 3100·101·201
6 −2
100·101
2 + 4(100) = 1015050−10100 + 400 = 1005350
1.2.
Sumas dobles
Es normal que en algunas situaciones, como por ejemplo, en el proceso descriptivo de alg´un conjunto de datos, sea necesario realizar sumas sobre un conjunto de observaciones m´as de una vez, lo que nos lleva al concepto de suma doble.
n X i=1 m X j=1
xiyj= n X i=1 m X j=1
xiyj = n X i=1
(xiy1+xiy2+· · ·+xiym)
= (x1y1+x1y2+· · ·+x1ym) + (x2y1+x2y2+· · ·+x2ym) +· · ·(xny1+xny2+· · ·+xnym)
Ejemplo 3 Determinar el valor de la siguiente suma doble:
2 X i=1 3 X j=1
(2i+j)
Tenemos que: 2 X i=1 3 X j=1 (2i+j)
= 2 X
i=1
[(2i+ 1) + (2i+ 2) + (2i+ 3)]
= [(2(1) + 1) + (2(1) + 2) + (2(1) + 3)] + [(2(2) + 1) + (2(2) + 2) + (2(2) + 3)]
= [3 + 4 + 5] + [5 + 6 + 7] = 12 + 18 = 30
Tambi´en se consideran sumas dobles al trabajar con cantidades que tienen asociados dos o m´as sub´ındices, como por ejemplo, las cantidades que forman una matriz y que se ubican dentro de la misma indicando la fila y la columna a la cual pertenecen.
En este caso, la suma doble se define de forma an´aloga,
n X i=1 m X j=1
aij= n X i=1 m X j=1 aij = n X i=1
(ai1+ai2+· · ·+aim)
= (a11+a12+a13+· · ·+a1m) + (a21+a22+a23+· · ·+a2m) +· · ·(an1+an2+an3+· · ·+anm)
n X i=1 xi !2 = n X i=1
x2i + 2 n X i=1 n X j=1 | {z } i>j
xixj
1.3.
Productorias
As´ı como en algunos casos resulta de inter´es la suma de una serie de t´erminos, en otros, la cantidad de inter´es es la multiplicaci´on de una serie de t´erminos. Para denotar de forma compacta este tipo de operaci´on, se utiliza la siguiente notaci´on:
x1x2x3· · ·xn = n Y
i=1
xi
De forma an´aloga a la sumatoria, la variablei se denomina ´ındice de la productoria y los valores 1 yn
son los l´ımites inferior y superior respectivamente.
1.3.1.
Propiedades
Algunas propiedades de la productoria son:
1.
n Y
i=1
cxi=cn n Y
i=1
xi dondeces una constante.
2.
n Y
i=1
(xiyizi) = n Y
i=1
xi ! n
Y
i=1
yi ! n
Y i=1 zi ! 3. n Y i=1 x i yi = Qn
i=1xi Qn
i=1yi paraQn
i=1yi6= 0.
4. M´as adelante se estudia la funci´on logaritmo, que es de much´ısima utilidad en diferentes contextos por sus propiedades. Una de estas es que el logaritmo transforma productos en sumas, es decir, ln(xy) = ln(x) + ln(y), que aplicada a productorias es:
1.4.
Logaritmaci´
on
La multiplicaci´on de una cantidad por ella misma un determinado n´umero de veces puede denotarse en forma compacta mediante el uso de lapotenciaci´on. De esta forma, la expresi´on:
xn=xxx· · ·x
| {z } n−veces
=y
indica que el producto de la cantidadx(base) por ella misman-veces (exponente), da como resultadoy
(potencia).
Si se conocen la base y la potencia, y se busca determinar el exponente, la operaci´on que realiza este c´alculo se conoce como logaritmaci´on y se denota como:
logxy=n
interpretando este resultado como: logxy=nsi y solo si xn =y. Como ejemplo, si se busca determinar el logaritmo en base 5 de 25, se tiene que:
log525 = 2 ya que 52= 25
Algunas propiedades importantes de la funci´on logaritmo son1: 1.
loga(xy) = loga(x) + loga(y) 2.
loga x
y
= loga(x)−loga(y) 3.
loga(xm) =mloga(x) Como ejemplo del uso de estas propiedades, consideremos la expresi´on:
log4
2x3y4 7zw
5
Por la aplicaci´on de las propiedades del logaritmo, esta expresi´on puede simplificarse en:
1La demostraci´on de estas propiedades est´a basada en las propiedades de la potenciaci´on. Por ejemplo, si en la
log4
2x3y4 7zw
5
= 5 log4
2x3y4 7zw
= 5log4(2x 3
y4)−log4(7zw)
= 5log4(2x3) + log4(y4)−log4(7)−log4(z)−log4(w)
= 5 [3(log4(2) + log4(x)) + 4 log4(y)−log4(7)−log4(z)−log4(w)]
Se puede ver que el uso de las propiedades del logaritmo permite simplificar la expresi´on original hasta llegar a sumas y restas. Esta es precisamente una de las grandes ventajas de trabajar con logaritmos, y la raz´on de que en muchas situaciones se apliquen transformaciones logar´ıtmicas sobre los datos que se est´an considerando.
Un logaritmo de uso muy com´un es el logaritmo natural, denotado por ln(x) y que corresponde al logaritmo de un valorxen el cual la base del logaritmo es el n´umero irracionale, es decir: ln(x) = loge(x). Este logaritmo se denomina natural por su constante presencia en muchas de las aplicaciones del logaritmo en diferentes ´areas.
Las propiedades de este logaritmo son las mismas que las enunciadas antes, y en adelante asumiremos que al considerar el logaritmo de alguna cantidad este se refiere al logaritmo natural.
1.5.
Ejercicios
1. Determine cu´al es el ´ındice y los l´ımites de las siguientes sumatorias:
a)
17 X
i=12
(8t2−5t+ 3)
b)
450 X
m=3
(8m−4)
2. Determine el resultado de las siguientes operaciones:
a) 7 X i=1 6i b) 4 X p=0 10p c) 9 X k=3
(10k+ 16)
d)
11 X
n=7
(2n−3)
3. Exprese las siguientes sumas en notaci´on de sumatoria:
b) 1 + 4 + 9 + 16 + 25
c) 53+ 54+ 55+ 56+ 57+ 58
d) 10 + 100 + 1000 +· · ·+ 1000000000
4. Determine el valor de las siguientes sumas:
a) n X k=1 51 n b) 100 X k=51 10k c) 100 X k=1
5k2+ 3k
d)
100 X
k=1
(k+ 5)2
5. Cu´al es el resultado de:
200 X i=1 100 X i=1 4
6. Cu´al es el valor deM si:
M = (1 + 2 + 3 +· · ·+ 100) + (100 + 99 +· · ·+ 1)
7. Debido a combates por control territorial se presenta un desplazamiento de poblaci´on del pa´ıs A hacia el pa´ıs B, iniciando con 15 personas y agregando una persona m´as cada d´ıa, con relaci´on al d´ıa anterior. Ante esto el presidente del pa´ıs B decide cerrar la frontera, de forma que el ´ultimo d´ıa de paso libre lograron cruzar 53 personas. ¿Cu´antas personas pasaron en total?
8. La siguiente tabla recoge los valores de una variablex, indexada por dos ´ındiceseyd:
H H H H H e d
1 2 3
1 -4 4 -8
2 1 9 12
3 6 -3 5
4 0 6 2
5 -2 7 0
Determine a partir de la tabla el valor de las siguientes sumas:
b) 5 X e=1 X d<e xed c) 5 X e=1 3 X
d=e
xed d) 5 X e=1 3 X d=1
x2ed
e) 3 X e=1 3 X d=1
(3x2ed−28)
f) 3 X e=1 3 X d=1
(2xed−1)2
9. La siguiente tabla recoge los valores de dos variablesxyy, medidas sobre 6 individuos. Individuo x y
1 -4 2
2 -1 6
3 5 3
4 0 1
5 -2 -4
6 1 1
Calcule el valor de las siguientes sumas:
a) 6 X a=1 6 X b=1
xayb
b) 6 X a=1 3 X b=1
(xa+yb)
c) 3 X a=1 6 X
b=a
Cap´ıtulo 2
Estad´ıstica descriptiva
Podemos considerar a la estad´ıstica como la ciencia que nos permite, a trav´es de la observaci´on de datos imperfectos, inferir sobre alguna o algunas caracter´ısticas o par´ametros de una poblaci´on objeto de estudio.
Para esto, la estad´ıstica puede dividirse en tres grandes bloques:estad´ıstica descriptiva,probabilidad y es-tad´ıstica inferencial. Es este cap´ıtulo consideramos algunas definiciones b´asicas para el trabajo estad´ıstico, y se presentan algunos resultados relevantes sobre estad´ıstica descriptiva.
2.1.
Definiciones b´
asicas
Poblaci´on:conjunto de elementos de los cuales se quiere conocer una o varias caracter´ısticas o par´ametros. (Un algunos casos se hace referencia ala poblaci´on como poblaci´on te´orica o poblaci´on bajo estudio).
Censo:es la situaci´on en la cual es posible tener informaci´on de todos los elementos de la poblaci´on.
Muestra:subconjunto de la poblaci´on que es representativo de la misma en la caracter´ıstica objeto de estudio.
En general, la forma como se selecciona la muestra depende de m´ultiples elementos como: disponi-bilidad de tiempo, recursos, acceso a la poblaci´on, representatividad, tipo de informaci´on para ser registrada, etc. Por esto, existen diferentes m´etodos para la determinaci´on de la misma, algunos de los cuales son descritos en la siguiente secci´on.
2.1.1.
Tipos de muestreo
Dentro de este tipo de muestreo se encuentran:
• Muestreo aleatorio simple: en este caso se identifica a los elementos de la poblaci´on mediante un n´umero o etiqueta y se seleccionan de forma aleatoria n´umeros o etiquetas, hasta alcanzar el tama˜no de muestra deseado.
• Muestreo aleatorio sistem´atico: considerando de nuevo que la poblaci´on est´a numerada o etiquetada, se selecciona de forma aleatoria un elemento (i) de la poblaci´on. A partir de este, se toman los elementosi+k,i+ 2k,i+ 3k, ..., conk=N/n, dondeN es el tama˜no de la poblaci´on ynel tama˜no de la muestra. El valor deise toma entre 1 yk.
• Muestreo aleatorio estratificado: la poblaci´on se separa en estratos o clases homog´eneas respecto a alguna caracter´ıstica particular (profesi´on, lugar de residencia, lugar de nacimiento, salario, nivel de formaci´on, sexo,... ), y dentro de cada uno de los estratos se realiza muestreo aleatorio simple o sistem´atico.
La distribuci´on de la muestra dentro de cada uno de los estratos se llama afijaci´on. Esta puede ser:afijaci´on simple, cuando a cada estrato le toca un n´umero igual de elementos de la muestra;afijaci´on proporcional, la distribuci´on se hace de acuerdo con el pesos de la poblaci´on en cada estrato, oafijaci´on ´optima, que es el caso en el cual se considera la proporci´on y la desviaci´on.
• Muestreo aleatorio por conglomerados: en este caso, la unidad muestral es un grupo de elementos de la poblaci´on (partidos pol´ıticos, facultades, agremiaciones,...). Se selecciona de forma aleatoria un cierto n´umero de conglomerados, hasta completar el tama˜no de muestra requerido.
M´etodos no probabil´ısticos:en general, estos tipos de muestro no permiten realizar inferencias sobre la poblaci´on, porque no se conoce la representatividad de la muestra, pero en determinadas situaciones pueden ser el ´unico tipo de muestreo aplicable y deseable. Dentro de este tipo de muestreo se encuentran:
• Muestreo por cuotas: se fijan unas cuotas (caracter´ısticas espec´ıficas de la poblaci´on), y se eligen para la muestra los primeros individuos que se consigan con estas caracter´ısticas.
• Muestreo intencional: se realiza un esfuerzo por incluir en la muestra conjuntos de ele-mentos poblacionales considerados como t´ıpicos. Por ejemplo, sondeos preelectorales en zonas donde hist´oricamente hay tendencia marcada de voto.
• Muestreo causal: el investigador selecciona directamente los individuos que van en la mues-tra.
2.1.2.
Tipos de datos
Es claro que los individuos de una poblaci´on poseen muchas caracter´ısticas que pueden ser de inter´es, pero aquella o aquellas que son objeto de estudio por parte del investigador se denominar´an en adelante
variables, y su valor puede cambiar entre los diferentes individuos en la poblaci´on. Los datos ser´an el resultado de las observaciones del valor de la variable en los individuos seleccionados de la poblaci´on.
Si el conjunto de observaciones realizadas (muestra) corresponde a una sola variable, se dice que el con-junto de datos es univariado. Ahora, el conjunto de observaciones puede sercateg´oricoocualitativo
si las observaciones responden a categor´ıas, o puede sernum´erico o cuantitativosi cada observaci´on es un n´umero.
Si el conjunto de observaciones son el resultado de obtener una categor´ıa o valor para dos o m´as atributos, se dice que los datos sonmultivariados; por ejemplo, considere los datos que se tienen si se pregunta a una persona seleccionada al azar acerca de su peso, su estatura y su edad.
En el caso particular de datos num´ericos, estos pueden clasificarse en discretos, cuando los posibles valores de la variable corresponden a puntos aislados en la recta num´erica, o continuos cuando el conjunto de posibles valores de la variable forma un intervalo en la recta num´erica.
Por ejemplo, si se considera el n´umero de hermanos que puede tener una persona, esta es una variable discreta, mientras que si se considera la temperatura que hace en el centro de Bogot´a durante el d´ıa, esta es una variable continua.
Una vez se tiene los datos, la estad´ıstica descriptiva considera las siguientes medidas de car´acter com´un para su an´alisis:
Medidas de tendencia central.
Medidas de posici´on relativa.
Medidas de dispersi´on.
Medidas de forma.
Medidas de concentraci´on.
Un componente muy ´util dentro de la estad´ıstica descriptiva, tanto para el an´alisis preliminar de informa-ci´on como para la presentaci´on de resultados y conclusiones, es larepresentaci´on y el an´alisis gr´afico de los datos. En la siguientes secci´on se presentan algunas de las formas m´as comunes de representaci´on gr´afica de informaci´on.
2.2.
Representaciones gr´
aficas
Gr´afico de tallo y hojas:
1. Separamos las observaciones en dos partes (Tallo y Hojas). Para el tallo consideramos tantos d´ıgitos como se necesite, tomando siempre el mismo n´umero de d´ıgitos en cada observaci´on, y para la hojas se toma solo un d´ıgito.
2. Se listan los tallos verticalmente en orden ascendente y trazamos una l´ınea vertical.
3. A cada tallo se le agregan las hojas correspondientes de menor a mayor. Los tallos sin hojas se ubican de este modo, no se agregan ceros.
Ejemplo 4 Las siguientes observaciones corresponden al porcentaje del presupuesto anual que 10 municipios destinan al apoyo a la formaci´on docente.
Municipio
Porcentaje
1
0,00
2
1,28
3
1,67
4
2,87
5
3,16
6
3,21
7
3,84
8
4,92
9
5,50
10
8,07
La representaci´on de tallo y hojas en este caso es:
Tallo
Hojas
0
0
1
2 6
2
8
3
1 2 8
4
9
5
5
8
0
Gr´afico de barras:
Este tipo de gr´afico es de mucha utilidad para la representaci´on de datos categ´oricos, asignando a cada categor´ıa una barra representa la frecuencia (n´umero de observaciones) de la misma.
Candidato
Frecuencia
Frecuencia relativa
A
50
29.4 %
B
45
26.5 %
C
30
17.6 %
D
45
26.5 %
Total
170
100 %
Cuadro 2.1:
Figura 2.1:
Mediante este tipo de gr´aficos, tambi´en es posible realizar comparaciones entre los resultados de una categor´ıa en muestras distintas, como lo muestra el siguiente ejemplo.
Ejemplo 6 Retomando el ejemplo anterior sobre intenci´on de voto, se consideran los resultados de las 170 personas de una ciudad A, y los resultados de 100 encuestados de una ciudad B. Los resultados se presentan en el cuadro 2.2, y la representaci´on del diagrama de barras para este caso se muestra en la figura 2.2
Gr´afico de torta: en este caso la frecuencia relativa (fr) del dato se asocia con un ´angulo en la circunferencia (θ), de acuerdo con:θ=f r·100 %360◦.
Candidato
Frecuencia Ciudad A
Frecuencia Ciudad B
A
50
60
B
45
20
C
30
10
D
45
10
Total
170
100
Cuadro 2.2:
Figura 2.2:
1. Dividir el rango total de observaciones enclases o intervalos. (Por lo general estas clases se toman de igual longitud, pero no es necesario que esto siempre sea as´ı).
2. Una vez establecidas las clases, se calcula lamarca de clase de cada una de estas, definida como:Mj =lim.Sup+2lim.Inf.
3. Para cada clase se calcula: lafrecuencia absoluta(fj), definida como el n´umero de observa-ciones que caen dentro de la clase; lafrecuencia relativa (hj), definida como la frecuencia absoluta de la clase dividida entre el total de observaciones; lafrecuencia acumulada (Fj), definida como la suma de la frecuencia absoluta de cada clase con las frecuencias absolutas de las clases anteriores, y lafrecuencia relativa acumulada (Hj), definida como la suma de la frecuencia relativa de cada clase con las frecuencias relativas de las clases anteriores.
El histograma se construye mediante barras que representan la frecuencia asociada a cada clase, en el ´area de la barra y no en su altura. Desde luego, si las longitudes de las clases son iguales, el ´
En el caso en el cual las clases son de diferente longitud, para leer el gr´afico de forma correcta, se recalcula la altura de las barras mediante lo que se conoce comoescala de densidad, donde:
Altura de la barra = frecuencia relativa de la clase longitud de la clase
Figura 2.3:
Pol´ıgono de frecuencias: este gr´afico se puede obtener del histograma uniendo mediante seg-mentos de recta los puntos medios en las barras del histograma (las marcas de clase). Se busca dar una idea de la forma de la distribuci´on de los datos (ver figura 2.4).
Ojiva:es la representaci´on gr´afica de la frecuencia relativa acumuladaHj, y describe el porcentaje de los datos que se han cubierto hasta una determinada clase (ver figura 2.5).
2.3.
Medidas de tendencia central
Este tipo de medidas nos permiten determinar alg´un valor o valores alrededor de los cuales se agrupan las observaciones. A continuaci´on se describen algunas de estas para datos agrupados y no agrupados.
Media aritm´etica
¯
x= Pn
i=1xi
Figura 2.4:
Si se tiene un censo, la media se denota conµy se define como:
µ= PN
i=1xi
N
siendoN el tama˜no de toda a poblaci´on. En el caso de datos agrupados, la media se define como:
¯
x= Pm
j=1fjMj Pm
j=1fj
dondefj es la frecuencia absoluta de clasej yMjla marca de clase.
Ejemplo 7 Las observaciones del cuadro 2.3 corresponden al n´umero de unidades exportadas en los ´ultimos 24 meses por una compa˜n´ıa multinacional.
24
14
17
16
18
12
18
14
21
22
25
21
15
25
23
16
14
14
21
14
23
21
18
12
Cuadro 2.3:
Se tiene que la media del n´umero de unidades exportadas por la compa˜n´ıa es:
¯
x= P24
i=1
Figura 2.5:
Clase
M
jf
j5.2-6.1
5.65
3
6.1-7.0
6.55
5
7.0-7.9
7.45
9
7.9-8.8
8.35
7
8.8-9.7
9.25
5
9.7-10.6
10.15
3
32
Cuadro 2.4:
Ejemplo 8 Las tabla de frecuencia del cuadro 2.5 corresponde al n´umero de horas extra trabajadas por los empleados de una empresa en el ´ultimo mes.
Se tiene que la media del n´umero horas extra trabajadas es:
¯
x=251,9 32 = 7,87 Algunas propiedades de la media aritm´etica son:
1. Representa el centro de gravedad de las observaciones.
n X
i=1
(xi−x¯) = n X
i=1
xi− n X i=1 ¯ x = n X i=1
xi−nx¯
= n X
i=1
xi−n n X
i=1
xi/n
= n X
i=1
xi− n X
i=1
xi= 0
3. Aunque la media aritm´etica ¯xes la medida de tendencia central m´as utilizada, presenta el inconveniente de ser muy sensible a la presencia de datos at´ıpicos en el conjunto de obser-vaciones. Algunas formas de tratar con este inconveniente ser´an presentadas m´as adelante al definir otras medidas de este tipo.
Media ponderada
Si consideramos un conjunto de observaciones en las que a cada observaci´onxile podemos asignar un valor wi asociado a alguna caracter´ıstica particular (como por ejemplo valores m´as grandes dewi a datos m´as cercanos en el tiempo), o cuando los datos xi tienen frecuencias diferentes fi, entonces podemos definir la media ponderada de los datos como:
¯
x= n X
i=1
wixi con wi=
fi
n
Ejemplo 9 Se sabe que el n´umero de unidades exportadas anualmente por 20 pa´ıses es:
Unidades (Millones)
Num. de pa´ıses
Peso(w
i)
12
6
6/20=0.3
14
10
10/20=0.5
16
4
4/20=0.2
Cuadro 2.5:
El valor promedio del n´umero de unidades exportadas, ponderando por el n´umero de pa´ıses es:
¯
x= (0,3)(12) + (0,5)(14) + (0,2)(16) = 13,8.
Media geom´etrica
La media geom´etrica de un conjunto de observaciones que se define como:
¯
xg= n
√
y corresponde al valor central representativo de observaciones secuenciales y estrechamente rela-cionadas (intereses, inflaci´on, devaluaci´on, crecimiento, disminuci´on, variaci´on, etc).
En el caso de datos agrupados, la media geom´etrica se puede calcular como:
¯
xg= n v u u t
m Y
j=1
xfj j
Ejemplo 10 Las siguientes observaciones corresponden a los porcentajes de incremento del salario m´ınimo en 6 pa´ıses de Am´erica Latina: 4 %, 11 %, 10 %, 6 %, 11 %, 3 %.
La media geom´etrica de estos porcentajes es:
¯
xg= 6,658 %
Ejemplo 11 ¿Cu´al es la tasa de inter´es promedio pagada en el siguiente pr´estamo?
Mes
1
2
3
Tasa
0,15
0,10
0,16
¯
xg= 13,38 %
Mediana
La mediana es una medida de tendencia central que separa el conjunto de observaciones ordenadas por su centro, es decir, la mediana es un valor tal que el 50 % de las observaciones es menor o igual a dicho valor y el otro 50 % es mayor. Para calcular la mediana procedemos de la siguiente manera:
1. Ordenar el conjunto de observaciones.
2. Determinar si el n´umero de observaciones (n) es par o impar. Si el n´umero de observaciones es impar, el valor ubicado en la posici´on n+1
2 corresponde a la mediana (˜x). Si el n´umero de observaciones es par, considerados los datos en las posiciones n
2 y n 2 + 1, los cuales promediamos, el valor obtenido del promedio corresponde a la mediana (˜x) del conjunto de observaciones.
Ejemplo 12 Consideremos el conjunto de observaciones: {4, 5, 5, 6, 7, 8, 9}. Para este caso la medina esx˜= 6.
Si ahora el conjunto de observaciones es: {3, 4, 5, 5, 6, 7, 8, 9}, en este caso la mediana es
˜
La mediana poblacional (˜µ) es el valor que separa el 50 % inferir de la poblaci´on del 50 % superior, y en el caso de datos agrupados, la mediana muestral se calcula como:
˜
x=Lj+ n
2 −Fj−1
C fj
=Lj+
[0,5−Hj−1]C
hj
donde:
• Lj= l´ımite inferior de la mediana (la primera clase en la cual la frecuencia acumulada iguala o supera el 50 %).
• Fj−1= frecuencia acumulada de la clase anterior a la clase mediana.
• fj= frecuencia absoluta de la clase mediana.
• Hj−1= frecuencia relativa acumulada de la clase anterior a la clase mediana.
• hj = frecuencia relativa de la clase mediana.
• C= longitud de la clase mediana. Algunas propiedades de la mediana son:
1. Si se tiene una distribuci´on sim´etrica de las observaciones, entonces ¯x= ˜x. 2. Si hay asimetr´ıa en las observaciones que muestra cola larga a derecha ˜x <x¯. 3. Si hay asimetr´ıa en las observaciones que muestra cola larga a izquierda ˜x >¯x.
4. La mediana es una medida de tendencia central robusta ya que no es sensible a la presencia de datos at´ıpicos.
Moda
La moda hace referencia al dato que m´as se repite dentro del conjunto de observaciones. Como medida de tendencia central puede resultar ineficiente ya que podemos encontrar casos en los que la distribuci´on sea multimodal. Por ejemplo si consideramos el siguiente conjunto de observaciones:
{2,2,3,3,4,4,5,5,6,6,7,7}
entonces la moda de este conjunto de observaciones son los datos 2,3,4,5,6,7 ya que todos se repiten 2 veces.
En el caso de datos agrupados, la moda se estima como:
Xmoda=Lj+C
d
1
d1+d2
• fj= frecuencia absoluta de la clase modal (la clase con mayor frecuencia absoluta).
• Lj= l´ımite inferior de la case modal.
• C= longitud de la clase modal.
Media recortada (Mediaα-podada)
En este caso, se descartann·αdatos de cada extremo de la lista ordenada de observaciones, con el objetivo de no considerar datos at´ıpicos. Con los datos restantes se calcula la media aritm´etica.
Ejemplo 13 Hallar la media recortada al 20 % del siguiente conjunto de observaciones.
{85,98,99,95,98}
Lo primero que debemos hacer es considerar el conjunto de observaciones ordenado de menor a mayor.
{856,95,98,98,99}
Como α= 0,2, se tiene que:n·α= (5)(0,2) = 1, lo que nos indica que de la lista ordenada se descarta un datos de cada extremo.
Con los datos restantes se calcula la media aritm´etica, entonces:
¯
x0,2=
95 + 98 + 98 3 = 97
Rango medio
El rango medio de un conjunto de observaciones est´a definido como el promedio entre el mayor valor observadoxm´ax y el menor valor observadoxm´ın, es decir:
Rango medio=xm´ax+xm´ın 2
Media arm´onica
Esta media se emplea regularmente para promediar variaciones con respecto al tiempo y est´a defi-nida como:
¯
x= 1 n x1 +
1
x2 +· · ·+
Ejemplo 14 Una familia sale de viaje en autom´ovil entre dos ciudades. Cubre los primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los ´ultimos 100 km a 80 km/h. ¿Cu´al es la velocidad media realizada?
Tenemos entonces que:
¯
x= 1 3 60+
1 70+
1 80
= 69,041km/h
2.4.
Medidas de posici´
on relativa
En este caso buscamos desarrollar medidas que describen el lugar en el que est´an ubicados los datos con relaci´on a la totalidad de los mismos. La medida por excelencia para este caso son los percentiles.
El percentilK de un conjunto de observaciones es un valor tal que elK% de las observaciones es menor o igual que dicho valor. Para determinar el percentilK de un conjunto de observaciones procedemos de la siguiente manera:
1. Ordenar los datos de menor a mayor.
2. Calcular:
i=nK 100
dondencorresponde al n´umero de observaciones yK al percentil que se quiere determinar. 3. Si el valor calculado dei es un decimal, se redondea al valor siguiente y dicho valor determina la
posici´on en la lista ordenada de observaciones en el que se encuentra el percentilK.
4. Si el valor deies un entero, el percentil es el promedio de los valores en las posicionesiei+ 1 de la lista ordenada.
Algunos percentiles reciben nombres espec´ıficos de acuerdo con el n´umero de partes en las que dividen el conjunto de observaciones. En particular, son muy utilizados los cuartiles, deciles y quintiles. Loscuartiles
dividen el conjunto de observaciones de acuerdo con los percentiles 25, 50, 75 y 100. Estos son denotados regularmente como Q1, Q2, Q3 y Q4. Los deciles dividen el conjunto de observaciones en 10 partes de acuerdo con los percentiles 10, 20, 30, ...,100 y de forma an´aloga los quintiles dividen el conjunto de observaciones en 20 partes iguales de acuerdo con los percentiles 5, 10, 15, ...,100.
Ejemplo 15 Que el percentil 30 del ingreso mensual promedio de mujeres cabezas de hogar en Colombia sea de 400.000, significa que el 30 % del ingreso percibido por estas mujeres es menor o igual a 400.000, y el 70 % es mayor.
104, 112, 134, 146, 155, 168, 179, 195, 246, 302, 338, 412, 678.
i=(13)(25)100 = 3,25→4 entonces Q1= 146
i=(13)(50)100 = 6,5→7 entonces Q2= 170 = ˜x
i=(13)(75)100 = 9,75→10 entoncesQ3= 302
i=(13)(100)100 = 13→13entonces Q4= 678
En el caso de datos agrupados, el percentilK se calcula mediante la expresi´on:
PK =Lj+ Kn
100+Fj−1
fj donde,
Lj= l´ımite inferior del intervalo que contiene al percentil.
Fj−1= frecuencia acumulada de la clase anterior a la k-´esima.
fj= frecuencia absoluta de la clase que contiene al percentil.
C= longitud de la clase que contiene al percentil.
K= percentil buscado.
n= n´umero total de observaciones.
2.5.
Medidas de dispersi´
on
Una vez establecida una medida de tendencia central, es importante considerar qu´e tan separadas o dis-persas se encuentran las observaciones con relaci´on a dicha medida, o, de forma general, cu´anta dispersi´on presentan los datos en s´ı. Para esto estudiamos las siguientes medidas de dispersi´on.
Rango muestral
El rango de un conjunto de observaciones mide la longitud del intervalo que contiene la totalidad de las mismas, y se calcula como:
Rango = xmax−xmin
Rango intercuartil
El rango intercuartil mide la longitud del intervalo que contiene el 50 % central de las observaciones y es calculado como:
Desviaci´on media
La desviaci´on media de un conjunto de observaciones es la distancia promedio de cada observaci´on a la media, es decir:
DM = Pn
i=1|xi−x¯|
n
Mediana de las desviaciones absolutas (MAD)
Esta es una medida de dispersi´on respecto a la mediana de un conjunto de observaciones, y se define como:
M AD=mediana{|xi−x˜|}
Varianza y desviaci´on est´andar
La varianza de un conjunto de observaciones, cuando estas constituyen un muestra de la poblaci´on total, se denominavarianza muestral y es definida como:
S2= Pn
i=1(xi−x¯)2
n−1
Si el conjunto de observaciones corresponde a toda la poblaci´on, lavarianza poblacional se define como:
σ2= PN
i=1(xi−µ)2
N
dondeN denota el n´umero total de elementos en la poblaci´on yµes la media poblacional. Una forma equivalente de representar la varianza muestral es:
S2= Pn
i=1x 2 i −nx¯2
n−1
y en el caso de datos agrupados, la varianza muestral es:
S2== Pm
j=1fjMj2−nx¯ 2
n−1
Asociada a la varianza muestral y poblacional se considera la desviaci´on muestral y poblacional, que es una medida de dispersi´on pero que est´a considerada en las unidades originales de los datos. Estas se definen respectivamente como:
σ=
√
σ2
Teniendo los conceptos de media y desviaci´on podemos enunciar un resultado importante relacionado con los mismos, elteorema de Tchebychev, el cual establece:
Para cualquier poblaci´on con media µ y varianza σ2, por lo menos el 100(1− 1
k2) % de los valores de
la poblaci´on est´a a una distancia menor que k veces la desviaci´on est´andar para k > 1, es decir, en el intervalo(µ−kσ, µ+kσ)est´a el100(1− 1
k2) %de los valores de la poblaci´on.
Al considerar algunos valores para k podemos establecer el porcentaje de la poblaci´on dentro de cada intervalo, para cada valor dek:
k 1.5 2 2.5 3 3.5 4 100(1− 1
k2) % 55.6 % 75 % 84 % 88.9 % 91.18 % 93.7 %
Coeficiente de variaci´on de Pearson
Este coeficiente permite comparar las dispersiones de dos conjuntos de observaciones, ya que no est´a influenciado por la escala de los datos.
CV =s ¯
x
100 %
2.6.
Gr´
afico de caja y bigotes
Este gr´afico, propuesto por Tukey, permite representar informaci´on de los datos basado en cuartiles. Para realizar esta representaci´on se deben seguir estos pasos:
1. Ordenar los datos de menor a mayor.
2. Hallar ˜x, Q1 yQ3.
3. Hallar los l´ımites, dondeRIC es el rango intercuartil. 2◦ l´ımite inferior =Q1−3(RIC).
1◦ l´ımite inferior =Q1−1,5(RIC). 1◦ l´ımite superior =Q
3+ 1,5(RIC). 2◦ l´ımite superior =Q3+ 3(RIC).
Las observaciones entre el primer y segundo l´ımite inferior o entre el primer y segundo l´ımite superior son outliers (datos at´ıpicos). Las observaciones por fuera de los segundos l´ımites son
outliers severos.
4. Se traza una escala que cubra el rango de observaciones, y en esta se ubican ˜x, Q1 yQ3.
5. Formar una caja cuyos lados vayan deQ1a Q3, y en su interior un segmento de recta que indique ˜
6. Partiendo deQ1, trazar un segmento de recta (bigote) hasta el ´ultimo dato dentro del primer l´ımite inferior.
7. Partiendo deQ3, trazar un segmento de recta (bigote) hasta el ´ultimo dato dentro del primer l´ımite superior.
8. Marcar losoutliers (◦) y losoutliers severos (*).
Figura 2.6: Gr´
afico de caja y bigotes. Fuente: Wikipedia
Ejemplo 17 Realizar el gr´afico de caja y bigotes para el siguiente conjunto de observaciones: 104, 112, 134, 146, 155, 168, 179, 195, 246, 302, 338, 412, 678.
Calculamos las cantidades necesarias para la construcci´on del gr´afico: Q1 = 140, Q3 = 302, x˜ = 170,
RIC= 156.
El valor de los l´ımites es:
2◦ l´ımite inferior = Q1−3(RIC) =−322.
1◦ l´ımite inferior = Q1−1,5(RIC) =−88.
1◦ l´ımite superior = Q3+ 1,5(RIC) = 536.
100 200 300 400 500 600 700 *
La forma del gr´afico de cajas tambi´en nos permite inferir acerca de la forma de la distribuci´on de las observaciones, como lo muestra la figura anterior.
2.7.
Medidas de forma
Consideramos ahora medidas sobre la forma descrita por el conjunto de observaciones en relaci´on con su simetr´ıa y su apuntamiento o levantamiento respecto al eje horizontal. Iniciamos con elsesgo, definido como una medida del grado de simetr´ıa de la curva descrita por las observaciones con relaci´on a su media. Supongamos que la siguiente gr´afica representa la curva descrita por un conjunto de datos.
¯
x=˜x=moda
En este caso podemos observar que la curva es sim´etrica respecto a su media, lo cual implica que la mediana y la moda coinciden con el valor de la media. Entonces decimos que los datos siguen una distribuci´on sim´etrica unimodal.
De igual forma, es posible considerar distribuciones que son sim´etricas pero multimodales. Por ejemplo, la siguiente gr´afica representa el caso de una distribuci´on de observaciones que es sim´etrica bimodal:
moda ˜x ¯x
o distribuciones consesgo a izquierda, como la siguiente:
moda ˜
x
¯
x
Para cuantificar el grado de asimetr´ıa de la distribuci´on de las observaciones podemos considerar:
´Indice de asimetr´ıa de Yule-Bowley para variables ordinales
Como su nombre lo indica, este ´ındice es aplicable para variables ordinales, y est´a basado en la distancia entre cuartiles. Se define como:
AS =
(Q3−Q2)−(Q2−Q1) (Q3−Q1)
= Q1+Q3−2Q2 (Q3−Q1)
; −1≤AS ≤1
En este caso se tiene que:
As=
<0 sesgo negativo o cola larga a izquierda. = 0 sesgo cero o simetr´ıa.
>0 sesgo positivo o cola larga a derecha.
Coeficiente de asimetr´ıa de Pearson
Dado un conjunto de observaciones unimodal, este coeficiente se define como:
Ap= ¯
x−moda s
y es clasificado como:
Ap=
= 0 sim´etrica
<0 sesgo negativo o a izquierda
Coeficiente de asimetr´ıa de Fisher
Dado un conjunto de observacionesx1, x2, ..., xn, este coeficiente se define como:
g1= Pn
i=1(xi−x¯)3
nS3
dondeS denota la desviaci´on est´andar de las observaciones. Se clasifica en este caso como:
g1=
= 0 sim´etrica
<0 sesgo negativo o a izquierda
>0 sesgo positivo o a derecha
En el caso de datos agrupados se tiene que:
g1= Pm
j=1(Mi−x¯)3fj
nS3
Consideramos ahora una medida para el apuntamiento de la curva con relaci´on al eje horizontal. Esta medida es llamada curtosis, y es una medida del grado de concentraci´on de los datos alrededor de la media, es decir, es una medida del grado en el que se acumulan observaciones en las colas de la distribuci´on. Se define como:
Curtosis= Pn
i=1(xi−x¯)4
nS4
Para dar un mayor sentido a esta medida se utiliza como referente la campana Gaussina o curva normal, la cual tiene una curtosis de 3, por lo que es com´un trabajar con el exceso de curtosis, medida definida como:
Exceso de curtosis =g2= Pn
i=1(xi−x¯)4
nS4 −3 Para el caso del exceso de curtosis se define:
g2=
= 0 Mesoc´urtica.
<0 Platic´urtica.
leptoc´urtica
mesoc´urtica
platic´urtica
En algunos caso tambi´en se utiliza el coeficiente de apuntamiento (Ku) definido como:
Ku=
Q3−Q1 2(P90−P10) y en este caso:
Ku=
= 0,263 Mesoc´urtica.
<0,263 Platic´urtica.
>0,263 Leptoc´urtica
2.8.
Medidas de concentraci´
on
El objetivo de este tipo de medidas es cuantificar el grado de desigualdad en la distribuci´on o el reparto de una magnitud (ventas, riqueza, beneficios,...), entre un n´umero determinado de elementos receptores (individuos, familias, empresas,...).
Al considerar estas situaciones, se puede tener:
m´ınima concentraci´on o m´axima igualdad: caso en el cual a todos los integrantes del conjunto receptor se les asigna la misma cantidad.
m´axima concentraci´on o m´ınima igualdad: un receptor recibe todo.
Para la cuantificaci´on de esta relaci´on se considera el´ındice de Giniy la curva de Lorenz.
´Indice de Gini.Para el c´alculo de este ´ındice:
1. Se ordena el conjunto de receptores de menor a mayor cantidad recibida (se denota porvial valor recibido por el receptori).
2. Hallar las cantidades acumuladas del n´umero de receptores y de valor recibido.
3. Hallar las proporciones correspondientes a las cantidades acumuladas.
El cuadro 18 muestra el c´alculo de estas cantidades.
Receptores
v
iAcumulado receptores (i)
Valor acumulado (u
i)
p
i=
ni100
q
i=
uin100
1
◦v
11
u
1=
v
1p
1=
1n100
q
1=
uun1100
2
◦v
22
u
2=
v
1+
v
2p
2=
2n100
q
2=
uun2100
3
◦v
33
u
3=
v
1+
v
2+
v
3p
3=
3n100
q
3=
uun3100
..
.
..
.
..
.
..
.
..
.
..
.
n
◦v
nn
u
n=
v
1+
· · ·
+
v
np
n= 100
q
n= 100
Se debe notar que en caso de reparto equilibradopi=qi para todoi, y que en general la diferencia (pi−qi) indica la concentraci´on del reparto. Partiendo de lo anterior, se define el´ındice de Gini como:
IG= Pn−1
i=1(pi−qi) Pn−1
i=1 pi
; 0≤IG ≤1 y de esta definici´on se tiene que:
• IG= 0 implica m´ınima concentraci´on o m´axima igualdad.
• IG= 1 implica m´axima concentraci´on o m´ınima igualdad.
Ejemplo 18 La siguiente tabla de frecuencias describe los salarios mensuales recibidos por los empleados de una empresa en millones de pesos.
Salario
N
◦de empleados
3.5
10
4.5
12
6
8
8
5
10
3
15
1
20
1
Salario
f
iF
ip
iv
i=
x
if
iu
iq
i(p
i−
q
i)
3.5
10
10
25
35
35
13.6
10.83
4.5
12
22
55
54
89
34.6
18.97
6
8
30
75
48
147
57.2
19.53
8
5
35
87.5
40
187
72.8
15.84
10
3
38
95
30
217
84.4
11.19
15
1
39
97.5
15
232
90.3
7.62
25
1
40
100
25
257
100
0
435
83.99
Cuadro 2.6:
Curva de Lorenz. Es la representaci´on gr´afica de la concentraci´on.
pi
qi
100 100
(pi, qi)
El ´ındice de Gini puede interpretarse como la raz´on entre el ´area del tri´angulo bajo la diagonal y el ´area encerrada por la diagonal y la curva de Lorenzf(p).
IG= 1−2 Z 1
0
f(p)dp
2.9.
Ejercicios sugeridos
1. Los 21 estudiantes de un sal´on de clase tienen una estatura promedio de 167 cent´ımetros. Si entra un estudiante m´as, ¿qu´e estatura deber´ıa tener para que el promedio aumente un cent´ımetro?
3. El valor promedio de los salarios pagados a las mujeres con formaci´on profesional en determinado departamento de Colombia es de $1500000 con una desviaci´on de $300000. Encuentre un intervalo en el que se pueda garantizar que se encuentran por lo menos el 75 % de los salarios.
4. Considere las siguientes observaciones de la volatilidad del precio de una acci´on: 73.7; 36.6; 109.9; 4.4; 33.1; 66.7; 30.0; 81.5; 22.2, 40.4; 16.4. Determine el valor de la media y la mediana muestrales. ¿Qu´e puede concluir?
5. Los siguientes datos representan los salarios de 30 trabajadores:
Salario 550 600 700 800 3000 Frecuencia 8 6 7 5 4
a) Determine: la moda, la media aritm´etica, la media geom´etrica, el rango y el sesgo.
b) ¿Cu´al es el primer cuartil, el tercer cuartil y el sexto decil?
c) Determine la desviaci´on est´andar y el rango intercuartil.
6. Los siguientes datos corresponden a la informaci´on hist´orica mensual en millones, de la inversi´on realizada por el Estado en planes de formaci´on de deportistas:
122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9 128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4 131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5 132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2 133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0 134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7 134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4 135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9 135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4 136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8 137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5 138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0 140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4 143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7
7. Un diagrama Pareto es una variaci´on de un histograma para datos categ´oricos que resultan de un estudio. Considere una situaci´on en la que cada categor´ıa representa un tipo diferente de producto que incumple con alguna especificaci´on. Las categor´ıas est´an ordenadas de modo que la que tiene la frecuencia m´as grande aparezca en el extremo izquierdo, luego la categor´ıa de la segunda frecuencia m´as grande y as´ı sucesivamente. Suponga que se obtiene la siguiente informaci´on sobre discordancia en paquetes de circuitos: componentes con fallas, 126; componentes incorrectos, 210; soldadura insuficiente, 67; exceso de soldadura, 54; componentes faltantes, 131. Construya un diagrama de Pareto.
8. La frecuencia acumulada y la frecuencia relativa acumulada para un intervalo de clase particular son la suma de las frecuencias y frecuencias relativas, respectivamente, para ese intervalo y los intervalos que queden debajo de ´el. Si, por ejemplo, hay cuatro intervalos con frecuencias: 9, 16, 13 y 12, entonces las frecuencias acumuladas son: 9, 25, 38 y 50, y las frecuencias relativas acumuladas son 0.18; 0.50; 0.76 y 1. Calcule las frecuencias acumuladas y las frecuencias relativas acumuladas para los datos del ejercicio 6.
9. En un estudio realizado para investigar la distribuci´on de la riqueza en un determinado pa´ıs, se obtuvo el siguiente resumen de la distribuci´on: media = 535, mediana = 500, moda = 500, desviaci´on est´andar = 96, m´ınimo = 220, m´aximo = 925, percentil 5 = 400, percentil 10 = 430, percentil 90 = 640, percentil 95 = 720.
¿Qu´e se concluye en relaci´on con la forma de histograma de estos datos? Explique su razonamiento.
10. De acuerdo con una revista de informes a consumidores, los precios cobrados por 40 compa˜n´ıas de seguros por la venta de un seguro de vida a hombres de 35 a˜nos de edad es:
82 85 86 87 87 89 89 90 91 91 92 93 94 95 95 95 95 95 97 98 99 99 100 100 101 101 103 103 103 104 105 105 106 107 107 107 109 110 110 111
a. Separe los datos por intervalos de clase.
b. Determine la frecuencia relativa para cada uno de los intervalos.
c. Realice una histograma de los datos.
d. Calcule la frecuencia relativa acumulada de los datos.
e. Trace la ojiva para estos datos (la ojiva es la representaci´on gr´afica de la frecuencia relativa acumulada).
11. Dada la siguiente distribuci´on de frecuencias:
x 0 10 20 30 40 Frecuencia 2 4 7 5 2
a) La media, moda, mediana, primer y tercer cuartil.
b) Varianza, desviaci´on, coeficiente de variaci´on, mediana de las desviaciones absolutas, rango y rango intercuartil.
c) Coeficiente de asimetr´ıa y de curtosis.
d) ´Indice de concentraci´on de Gini y curva de Lorenz.
12. Las ayudas concedidas, en millones de pesos, por el Fondo para el Desarrollo Regional a 62 pro-yectos, vienen reflejadas en la siguiente tabla:
Importe de ayuda 0-100 100-250 250-500 500-1000 n◦ de proyectos 12 15 20 15
a) Calcular la ayuda media y la desviaci´on est´andar.
b) Representar el histograma pertinente.
c) Calcular la ayuda m´axima concedida al 60 % de los proyectos menos favorecidos en el reparto (ojiva).
d) Si para el a˜no siguiente las ayudas aumentan un 5 % sobre el valor inicial, manteni´endose el criterio del reparto, ¿cu´al ser´a ahora la ayuda media y la desviaci´on?
e) Supongamos que queremos contactar con el 15 % de las empresas a quienes han sido concedidas estas ayudas, pero no queremos que sean ni las empresas que m´as han recibido, ni las que menos, sino que queremos quedarnos con el 15 %central. ¿Entre qu´e valores se mueven las ayudas concedidas a este grupo de empresas?
f) Calcular la asimetr´ıa y la curtosis de esta distribuci´on.
13. En un barrio de una gran ciudad se ha constatado que las familias residentes se han distribuido, seg´un su composici´on, de la siguiente forma:
Composici´on 0-2 2-4 4-6 6-8 8-10 Familias 110 200 90 75 25
a) ¿Cu´al es el n´umero promedio de personas por familia?
b) ¿Cu´al es el tipo de familia m´as usual?
c) Si solo hubiera plazas de aparcamiento para el 50 % de las familias, y estas se atendieran de mayor a menor n´umero de miembros, ¿cu´antos componentes deber´ıa tener una familia para entrar en el cupo?
d) Si el coeficiente de variaci´on de Pearson de otro barrio de la misma ciudad es 1,8, ¿cu´al de los dos barrios puede ajustar mejor sus previsiones con base en el diferente n´umero de miembros de las familias que lo habitan?
f) N´umero de miembros que tienen como m´aximo el 85 % de las familias menos numerosas.
14. La distribuci´on de acciones de una sociedad es:
Acciones Accionistas
0-50 23
50-100 72 100-150 62 150-200 48 200-250 19 250-300 8 300-350 14 350-400 7 400-500 7
a) Calcular el n´umero medio de acciones que posee un accionista.
b) N´umero de acciones que m´as frecuentemente posee un accionista.
c) N´umero de acciones que debe poseer un accionista para que la mitad de los restantes accio-nistas tengan menos acciones que ´el.
d) El ´ındice de concentraci´on de Gini y la curva de Lorenz correspondiente.
e) Asimetr´ıa y curtosis de esta distribuci´on.
15. La siguiente tabla corresponde a dos muestras representativas de los cr´editos concedidos, en millones de pesos, por dos agencias de una entidad bancaria en el ´ultimo mes. Comparar la concentraci´on de ambas distribuciones.
Agencia A Agencia B Valor del cr´edito N◦ de cr´editos N◦ de cr´editos
0-0,5 3 10
0,5-1 4 12
1-2 6 8
2-4 58 30
4-7 78 12
7-12 90 15
12-14 20 5
14-18 6 6
18-20 4 16
16. Dos empresas A y B emplean a mil trabajadores cada una, clasificados en tres categor´ıas: I, II y III. En un mes determinado han distribuido una misma masa salarial de cien millones de d´olares, como se muestra m´as adelante:
b) A la vista de los resultados del apartado anterior critique y compare la equidad en el reparto de la masa salarial entre los empleados de las dos empresas.
17. En el siguiente gr´afico est´an representados en el eje de abscisas las proporciones acumuladas del n´umero de individuos entre los que se reparte cierta magnitud y en el eje de ordenadas las propor-ciones acumuladas de los valores repartidos. La funci´onf(p) representa una estimaci´on de la curva de Lorenz.
a) Defina el ´Indice de concentraci´on de Gini.
b) Enuncie su relaci´on con la curva de Lorenz.
c) Calcule el valor del ´Indice de Gini si la curva de Lorenz es:
Cap´ıtulo 3
Probabilidad y variables aleatorias
3.1.
Definiciones b´
asicas
La probabilidad puede ser interpretada como una medida de la posible ocurrencia de un evento de-terminado, donde dicho evento es un subconjunto de lo que se denominaespacio muestral, que es el conjunto de todos los posibles resultados de unexperimento aleatorio. Como ejemplo de estos concep-tos, consideremos el experimento aleatorio consistente en lanzar un dado normal de seis caras una sola vez.
El conjunto de posibles resultados del experimento, es decir, el espacio muestral, es Ω ={1,2,3,4,5,6}y posibles eventos sobre este espacio son:
A= el resultado del lanzamiento es primo y par.{2}.
B= el resultado del lanzamiento es par.{2,4,6}.
C= el resultado del lanzamiento mayor que 6. ∅.
Los eventos en general, pueden ser clasificados en: eventos simples que son aquellos que est´an com-puestos por un solo elemento, como el eventoAdel ejemplo anterior; loseventos compuestos que son aquellos conformados por dos o m´as elementos, como el evento B del ejemplo anterior, y los eventos nulosque son aquellos que no cuentan con ning´un elemento (son vac´ıos), como el eventoC del ejemplo anterior.
Podemos ver que los eventos son subconjuntos del conjunto Ω y, por tanto, es posible realizar sobre estos las operaciones b´asicas entre conjuntos, como por ejemplo: Uni´on (∪), Intersecci´on (∩), Complemento (0) o diferencia sim´etrica (∆). El mayor inter´es sobre los posibles eventos en un espacio muestral es calcular su probabilidad, para lo cual recurriremos, en este texto, a su definici´on frecuentista, la cual nos dice que la probabilidad de un evento se puede calcular como un n´umero ideal al que converge su frecuencia relativa cuando la frecuencia absoluta tiende a infinito.
P[A] = |A|
|Ω|
donde|A|denota el cardinal de A, es decir, el n´umero de elementos enAy|Ω|denota el cardinal de Ω. De esta forma el c´alculo de la probabilidad de un evento est´a determinada por el n´umero de elementos que lo conforman y por el n´umero de elementos en todo el espacio muestral.
Como ejemplo, si consideramos de nuevo el experimento aleatorio de lanzar una dado normal de seis caras y los eventos definidos antes, tenemos que:
P[A] = 1
6 ; P[B] = 3
6 ; P[C] = 0
Ejemplo 19 Consideremos ahora el experimento aleatorio consistente en lanzar dos dados normales de seis caras, uno rojo y uno verde. El conjunto de posibles resultados de este experimento aleatorio son las 36 posibles parejas:
Ω :{(a, b)|a, b∈ {1,2,3,4,5,6}}.
Sobre este espacio definimos los eventos:
A=al menos uno de los dados cay´o 6 ={(1,6),(2,6),(3,6),(4,6),(5,6),(6,6),(6,1),(6,2),(6,3),(6,4),(6,5)}.
B=la suma de los resultados es igual a 7 ={(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)}.
C=los dos resultados son iguales ={(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}. Tenemos entonces que:
P[A] = 11
36 ; P[B] = 6
36 ; P[C] = 6 36 ;
y dado que:
A∩B={(1,6),(6,1)} B∩C=∅ A∩C={(6,6)}
entonces:
P[A∩B] = 2
36 ; P[B∩C] = 0 ; P[A∩C] = 1 36
Podemos anotar que en este caso los eventos B y C son disyuntos, es decir, eventos con intersecci´on vac´ıa.
A partir de esta definici´on de probabilidad es f´acil deducir algunas propiedades importantes de la misma. Consideremos dos eventosAyB en Ω, entonces:
P[A∪B] =P[A] +P[B]−P[A∩B]
P[A0] = 1−P[A]
Ejemplo 20 Carlos se va a graduar al final del semestre. Despu´es de ser entrevistado en dos compa˜n´ıas A y B, ´el eval´ua que la probabilidad de obtener una oferta de la empresa A es de 0,8, y la probabilidad de obtener una oferta de la empresa B es 0,6. Si ´el cree que la probabilidad de que reciba ofertas de ambas compa˜n´ıas es de 0,5, ¿cu´al es la probabilidad de que reciba ofertas de al menos una de las compa˜n´ıas?, ¿cu´al es la probabilidad de que reciba oferta solamente de la compa˜n´ıa A?, ¿solamente de la compa˜n´ıa B?, ¿qu´e no reciba ofertas de ninguna compa˜n´ıa?
Los datos pueden representarse en un diagrama de Venn como el que se muestra a continuaci´on.
A B
0.3 0.1
0.1 0.5
Tenemos entonces que las respuestas a las preguntas consideradas son:
P[A∪B] = 0,9 =P[A] +P[B]−P[A∩B]
P[A−B] = 0,3
P[B−A] = 0,1
P[(A∪B)0] = 0,1
Ejemplo 21 ¿Cu´al es la probabilidad de obtener 7 u 11 al lanzar un par de dados?
Si denotamos por A el evento de que la suma sea 7, y por B el evento de que la suma sea 11, tenemos queP[A] = 6/36y P[B] = 2/36, luego:
P[A∪B] =P[A] +P[B] = 6 36+
2 36 =
8 36
observemos que en este caso no consideramos la intersecci´on ya que estos dos eventos son disyuntos.
Ejemplo 22 Si la probabilidad de los eventos disyuntos A, B y C es respectivamente 0.2; 0.4 y 0.1, ¿cu´al es la probabilidad de (A∪B∪C)0?
Tenemos que:
3.2.
Probabilidad condicional
Un concepto muy importante dentro de la probabilidad es el deprobabilidad condicional, en el cual, si consideramos dos eventosAyB en Ω, buscamos determinar la probabilidad del eventoAdado que ya sabemos que ocurri´o el eventoB. Esto lo denotamos comoP[A|B] y se define:
P[A|B] = P[A∩B]
P[B] dado queP[B]>0
Ejemplo 23 Considere el espacio muestral conformado por todos los individuos de una peque˜na ciudad que tienen titulo profesional, los cuales son clasificados por sexo y por su situaci´on laboral seg´un lo muestra la siguiente tabla.
Empleado Desempleado Total Masculino 460 40 500
Femenino 140 260 400
Total 600 300 900
Uno de los individuos es seleccionado para realizar un viaje a trav´es del pa´ıs publicitando las ventajas de establecer nuevas industrias en las ciudades. Si consideramos los eventos:
M =es seleccionado un hombre.
E=el seleccionado tiene empleo.
¿Cu´al es la probabilidad de que el seleccionado sea una hombre dado que tiene empleo?
En la notaci´on establecida, lo que buscamos calcular es:P[M|E], que de acuerdo con la definici´on es:
P[M|E] = P[M∩E]
P[E] =
460/900 600/900 =
460 600
Como podemos observar de los ejemplos anteriores, la probabilidad condicional es una probabilidad concentrada en el conjunto que impone la condici´on, de esta forma se tiene que:
P[B|B] = 1
Ejemplo 24 La probabilidad de que un vuelo regular despegue de acuerdo con el itinerario es P(D) = 0,83; la probabilidad de que aterrice a tiempo esP(A) = 0,82; y la probabilidad de que despegue a tiempo y aterrice a tiempo esP[D∩A] = 0,78. Encuentre la probabilidad de que un vuelo regular:
1. Aterrice a tiempo, dado que despeg´o a tiempo.
2. Despegue a tiempo dado que aterriz´o a tiempo.
En t´erminos de probabilidad de eventos, la primera probabilidad pedida es:
P[A|D] = P[D∩A]
y la segunda es:
P[D|A] = P[D∩A]
P[A] = 0,78 0,82 = 0,95
Cabe entonces destacar el papel de la probabilidad condicional ya que esta permite realizar c´alculos de probabilidad en los que se considera nueva informaci´on, estableciendo una expresi´on concreta para incorporar dicha informaci´on. De igual forma, la probabilidad condicional permite establecer con claridad la idea de eventos independientes que ser´a expuesta en la siguiente secci´on.
3.3.
Ley de probabilidades totales y teorema de Bayes
Para estudiar estos dos importantes resultados de la teor´ıa de probabilidad, necesitamos considerar pri-mero el concepto de partici´on de un espacio muestral Ω.
Definici´on 1 Una colecci´on de eventosA1, A2,· · · , An se dice unapartici´ondel espacio muestralΩsi
se cumple que:
Los eventos en la colecci´on son mutuamente excluyentes, es decir,Ai∩Aj =∅ para todo i6=j.
La uni´on de todos los elementos en la colecci´on da como resultadoΩ.
[
i
Ai= Ω
Una vez considerado el concepto de partici´on, la ley de probabilidades totales establece que si
A1,· · · , An es una partici´on de Ω, yB es otro evento en Ω, entonces:
P[B] = n X
k=1
P[B|Ai]P[Ai]
La prueba de este resultado es directa de considerar que la probabilidad del eventoB puede expresarse como la suma de las probabilidades deB interceptado con cada elemento de la partici´on y de la definici´on de probabilidad condicional, es decir:
P[B] = n X
i=1
P[Ai∩B] = n X
k=1
P[B|Ai]P[Ai]
Ejemplo 25 En una cierta planta de ensamblaje, tres m´aquinas M1,M2 y M3 hacen el 30,45 y 25 %
de los productos respectivamente. Por experiencia se sabe que2,3y 2 %de los productos hechos en cada m´aquina, respectivamente, son defectuosos. Si se selecciona un producto terminado de forma aleatoria, ¿cu´al es la probabilidad de que tenga defectos?
P[D] =P(D|M1)P[M1] +P(D|M2)P[M2] +P(D|M3)P[M3] = (0,02)(0,3) + (0,03)(0,45) + (0,02)(0,25)
= 0,0245
Consideramos ahora otro importante resultado conocido como regla de Bayes, que permite determinar la probabilidad de que se haya presentado un elemento de la partici´on, dado que ya se present´o el evento
B, como se muestra a continuaci´on.
3.3.1.
Teorema de Bayes
Sea A1,· · ·, An una partici´on de Ω tal que P[Ai] 6= 0 para todo i, y sea B otro evento en Ω tal que
P[B]6= 0. Entonces:
P[Aj|B] =
P[B|Aj]P[Aj] Pn
i=1P[B|Ai]P[Ai]
La demostraci´on de este resultado est´a basada simplemente en la definici´on de probabilidad condicional y en la ley de probabilidades totales, ya que:
P[Aj|B] =
P[Aj∩B]
P[B] =
P[B|Aj]P[Aj] Pn
i=1P[B|Ai]P[Ai]
Ejemplo 26 Continuando con el ejemplo anterior de la planta de ensamblaje y las tres m´aquinas, supon-gamos ahora que el producto seleccionado al azar est´a defectuoso, ¿cu´al es la probabilidad de que provenga de la m´aquina 3?
P[M3|D] =
P[D|M3]P[M3]
P[D|M1]P[M1] +P[D|M2]P[M2] +P[D|M3]P[M3]
= 0,005 0,0245
3.4.
Eventos independientes
Dos eventosAyBen el espacio muestral Ω se dicenestad´ısticamente independientessi y solo siP[A|B] =
P[A], es decir, la probabilidad de que ocurra el evento A no se ve afectada por la ocurrencia o no del eventoB, o de igual formaP[B|A] =P[B].
Si en las expresiones anteriores utilizamos la definici´on de probabilidad condicional, se tiene que:
P[A|B] =P[A] ⇒ P[A∩B]
P[B|A] =P[B] ⇒ P[B∩A]
P[A] =P[B] ⇒ P[B∩A] =P[B]P[A] luego se considera en lo que sigue, que dos eventosAyB son independientes si se tiene que:
P[A∩B] =P[A]P[B]
En general, si se consideranneventosA1, A2, ..., An, estos se dicen estad´ısticamente independientes si y solo si:
P[A1∩A2∩...∩An] =P[A1]P[A2]· · ·P[An]
Ejemplo 27 Cada d´ıa de la semana, de lunes a viernes, un lote de alimentos llega de un proveedor A
para ser inspeccionado por el departamento de salud. Dos d´ıas a la semana llega para inspecci´on un lote de un proveedor B. 80 % de todos los lotes enviados por el proveedor A pasan la inspecci´on, y el 90 % de lo enviado por el proveedor B la pasa. ¿Cu´al es la probabilidad de que un d´ıa seleccionado al azar dos lotes pasen la inspecci´on? Para responder a esta pregunta asumimos que los d´ıas en que los lotes son inspeccionados los resultados de la inspecci´on son independientes entre s´ı.
2 L 1 L
0.4
0.6 F
P 0.8
0.2
F P 0.8
0.2 P
F P
F
0.9
0.1 0.9
0.1
El gr´afico de ´arbol representa la situaci´on y podemos observar que:
P[2pasen] =P[2recibidos∩2 Pasen]