Estadistica Básica.pdf

(1)

Elementos b´

asicos de probabilidad y estad´ıstica

matem´

atica I

Prof. John Freddy Moreno Trujillo

Docente Investigador

CIPE-ODEON

Universidad Externado de Colombia

(2)

´

_{Indice general}

Pr´

ologo

5 1. Elementos b´

asicos

7 1.1. Sumatorias . . . .

7 1.1.1. Propiedades . . . .

8 1.2. Sumas dobles . . . .

9 1.3. Productorias

. . . .

11 1.3.1. Propiedades . . . .

11 1.4. Logaritmaci´

on . . . .

12 1.5. Ejercicios . . . .

13 2. Estad´

ıstica descriptiva

16 2.1. Definiciones b´

asicas . . . .

16 2.1.1. Tipos de muestreo . . . .

16 2.1.2. Tipos de datos . . . .

18 2.2. Representaciones gr´

aficas

. . . .

18 2.3. Medidas de tendencia central . . . .

22 2.4. Medidas de posici´

on relativa . . . .

29 2.5. Medidas de dispersi´

on . . . .

30 2.6. Gr´

afico de caja y bigotes . . . .

32 2.7. Medidas de forma . . . .

34 2.8. Medidas de concentraci´

on . . . .

37 2.9. Ejercicios sugeridos . . . .

39 3. Probabilidad y variables aleatorias

45 3.1. Definiciones b´

asicas . . . .

45 3.2. Probabilidad condicional . . . .

48 3.3. Ley de probabilidades totales y teorema de Bayes . . . .

49

(3)

3.4. Eventos independientes

. . . .

50 3.5. Variables aleatorias . . . .

52 3.5.1. Funci´

on de distribuci´

on de probabilidad

f

X

(x) . . . .

52 3.5.2. Funci´

on de distribuci´

on acumulada

F

X

(x) . . . .

53 3.5.3. Valor esperado y Varianza . . . .

54 3.5.4. Algunas distribuciones b´

asicas

. . . .

55

(4)

Pr´

ologo

Las presentes notas se escriben con el ´

animo de servir como elemento de referencia en algunos

de los cursos de posgrado que se dictan en la Facultad de Finanzas, Gobierno y Relaciones

Internacionales de la Universidad Externado de Colombia.

Si bien los conceptos aqu´ı presentados son resultados cl´

asicos de la estad´ıstica y la probabilidad,

contar con estos elementos en un documento referente corto y sencillo es de gran utilidad en

muchos casos, como lo ha indicado mi experiencia al frente de varios de estos cursos durante los

´

ultimos a˜

nos.

De igual forma, los ejemplos utilizados y los ejercicios sugeridos responden a una intencionalidad

espec´ıfica de las asignaturas, de forma que estos muestran a los estudiantes la aplicabilidad de

las herramientas estad´ısticas en sus programas de estudio y en temas de investigaci´

on.

Para lograr este fin, el documento se ha estructurado como sigue: en el cap´ıtulo 1 se presentan

algunos elementos b´

asicos de matem´

aticas sobre notaci´

on de sumatorias, productorias y

loga-ritmaci´

on con sus propiedades b´

asicas; en el cap´ıtulo 2 se describen resultados relevantes de la

estad´ıstica descriptiva, y en el cap´ıtulo 3 se hace una introducci´

on a los elementos b´

asicos de la

teor´ıa de probabilidad y al concepto de variable aleatoria. Tambi´

en se presentan en este cap´ıtulo

algunas distribuciones de probabilidad b´

asicas.

Si bien este documento solo cubre aspectos introductorios, esperamos sea una buena referencia,

y que prontamente se pueda contar con una segunda parte que incluya aspectos de estad´ıstica

inferencial y an´

alisis de datos cualitativos.

John Freddy Moreno Trujillo

Docente Investigador CIPE-ODEON

(5)

Cap´ıtulo 1

Elementos b´

asicos

En este cap´ıtulo se presentan algunos elementos básicos sobre notación de sumatorias y productorias, que serán de utilidad más adelante en el desarrollo de algunos conceptos estad´ısticos.

1.1. Sumatorias

La notaci´on sigma o notaci´on de sumatoria es utilizada para representar de forma compacta la suma de cantidades indexadas en los enteros positivos, de forma que six1, x2, ..., xn son un conjunto de observa-ciones, entonces:

x1+x2+· · ·+xn= n X

i=1

xi

La letra que se utiliza para denotar las distintas observaciones es denominada´ındicede la sumatoria y su aporte es solamente notacional, es decir:

n X

i=1

xi= n X

k=1

xk= n X

j=1

xj

El valor en el que inicia el ´ındice es denominadol´ımite inferiorde la sumatoria y el ´ultimo valor que toma es denominadol´ımite superior. De acuerdo con esto, el l´ımite inferior de la siguiente sumatoria es 5 y el l´ımite superior es 42.

42 X

i=5

xi

(6)

1.1.1. Propiedades

Algunas propiedades de la sumatoria son:

1.

n X

i=1

cxi=cx1+cx2+· · ·+cxn=c(x1+x2+· · ·+xn) =c n X

i=1

xi

Si una constante está multiplicando los términos de la sumatoria, podemos sacarla de la misma por factorización.

2.

n X

i=1

(xi±yi) = n X

i=1

xi± n X

i=1

yi

La sumatoria de una suma o resta de t´erminos es igual a la suma o resta de las sumatorias de cada t´ermino.

3.

n X

i=1

c=nc

La sumatoria de una constanten-veces es igual an-veces la constante, y en general: n

X

i=m

c= (n−m+ 1)c

4.

n X

i=1

xi= p X

i=1

xi+ n X

i=p+1

xi dondepes un valor entero positivo entre 1 yn.

Ejemplo 1 Utilicemos algunas de las propiedades enumeradas arriba para determinar el valor de la siguiente suma:

7 X

n=4

(5n−2)

Tenemos que:

7 X

n=4

(5n−2) = 7 X

n=4 5n−

7 X

n=4 2 = 5

7 X n=4 n− 7 X n=4

(7)

Otro conjunto de resultados de gran utilidad son los siguientes:

n X

i=1

i=n(n+ 1) 2

n X

i=1

i2= n(n+ 1)(2n+ 1) 6

n X

i=1

i3= n

2₍_n_{+ 1)}2 4

La demostración de estos resultados se realiza por inducción matemática, una técnica de demostración en la cual se prueba que el resultado es válido para un primer elemento, se supone válido para un k-ésimo elemento y se demuestra para el siguiente al k-ésimo. De esta forma, queda demostrado para todos los elementos.

Ejemplo 2 Utilicemos los resultados anteriores para determinar el valor de la suma:

100 X

k=1

3k2−2k+ 4

Tenemos que:

100 X

k=1

3k2−2k+ 4 = 3 100 X

k=1

k2−2 100 X

k=1

k+ 100 X

k=1 4

= 3100·101·201

6 −2

100·101

2 + 4(100) = 1015050−10100 + 400 = 1005350

1.2. Sumas dobles

Es normal que en algunas situaciones, como por ejemplo, en el proceso descriptivo de alg´un conjunto de datos, sea necesario realizar sumas sobre un conjunto de observaciones m´as de una vez, lo que nos lleva al concepto de suma doble.

(8)

n X i=1 m X j=1

xiyj= n X i=1   m X j=1

xiyj   = n X i=1

(xiy1+xiy2+· · ·+xiym)

= (x1y1+x1y2+· · ·+x1ym) + (x2y1+x2y2+· · ·+x2ym) +· · ·(xny1+xny2+· · ·+xnym)

Ejemplo 3 Determinar el valor de la siguiente suma doble:

2 X i=1 3 X j=1

(2i+j)

Tenemos que: 2 X i=1   3 X j=1 (2i+j)



= 2 X

i=1

[(2i+ 1) + (2i+ 2) + (2i+ 3)]

= [(2(1) + 1) + (2(1) + 2) + (2(1) + 3)] + [(2(2) + 1) + (2(2) + 2) + (2(2) + 3)]

= [3 + 4 + 5] + [5 + 6 + 7] = 12 + 18 = 30

Tambi´en se consideran sumas dobles al trabajar con cantidades que tienen asociados dos o m´as sub´ındices, como por ejemplo, las cantidades que forman una matriz y que se ubican dentro de la misma indicando la fila y la columna a la cual pertenecen.

En este caso, la suma doble se define de forma an´aloga,

n X i=1 m X j=1

aij= n X i=1   m X j=1 aij   = n X i=1

(ai1+ai2+· · ·+aim)

= (a11+a12+a13+· · ·+a1m) + (a21+a22+a23+· · ·+a2m) +· · ·(an1+an2+an3+· · ·+anm)

(9)

n X i=1 xi !2 = n X i=1

x2_i + 2 n X i=1 n X j=1 | {z } i>j

xixj

1.3. Productorias

As´ı como en algunos casos resulta de interés la suma de una serie de términos, en otros, la cantidad de interés es la multiplicación de una serie de términos. Para denotar de forma compacta este tipo de operación, se utiliza la siguiente notación:

x1x2x3· · ·xn = n Y

i=1

xi

De forma an´aloga a la sumatoria, la variablei se denomina ´ındice de la productoria y los valores 1 yn

son los l´ımites inferior y superior respectivamente.

1.3.1. Propiedades

Algunas propiedades de la productoria son:

1.

n Y

i=1

cxi=cn n Y

i=1

xi dondeces una constante.

2.

n Y

i=1

(xiyizi) = n Y

i=1

xi ! n

Y

i=1

yi ! n

Y i=1 zi ! 3. n Y i=1 _x i yi = Qn

i=1xi Qn

i=1yi paraQn

i=1yi6= 0.

4. M´as adelante se estudia la funci´on logaritmo, que es de much´ısima utilidad en diferentes contextos por sus propiedades. Una de estas es que el logaritmo transforma productos en sumas, es decir, ln(xy) = ln(x) + ln(y), que aplicada a productorias es:

(10)

1.4. Logaritmaci´

on

La multiplicación de una cantidad por ella misma un determinado número de veces puede denotarse en forma compacta mediante el uso de lapotenciación. De esta forma, la expresión:

xn=xxx· · ·x

| {z } n−veces

=y

indica que el producto de la cantidadx(base) por ella misman-veces (exponente), da como resultadoy

(potencia).

Si se conocen la base y la potencia, y se busca determinar el exponente, la operación que realiza este cálculo se conoce como logaritmación y se denota como:

log_xy=n

interpretando este resultado como: log_xy=nsi y solo si xn =y. Como ejemplo, si se busca determinar el logaritmo en base 5 de 25, se tiene que:

log525 = 2 ya que 52= 25

Algunas propiedades importantes de la funci´on logaritmo son1_: 1.

loga(xy) = loga(x) + loga(y) 2.

log_a _x

y

= log_a(x)−log_a(y) 3.

log_a(xm) =mlog_a(x) Como ejemplo del uso de estas propiedades, consideremos la expresi´on:

log₄

₂_x3_y4 7zw

5

Por la aplicaci´on de las propiedades del logaritmo, esta expresi´on puede simplificarse en:

1_{La demostraci´}_{on de estas propiedades est´}_{a basada en las propiedades de la potenciaci´}_{on. Por ejemplo, si en la}

(11)

log₄

₂_x3_y4 7zw

5

= 5 log₄

₂_x3_y4 7zw

= 5log4(2x 3

y4)−log4(7zw)

= 5log₄(2x3) + log₄(y4)−log₄(7)−log₄(z)−log₄(w)

= 5 [3(log₄(2) + log₄(x)) + 4 log₄(y)−log₄(7)−log₄(z)−log₄(w)]

Se puede ver que el uso de las propiedades del logaritmo permite simplificar la expresión original hasta llegar a sumas y restas. Esta es precisamente una de las grandes ventajas de trabajar con logaritmos, y la razón de que en muchas situaciones se apliquen transformaciones logar´ıtmicas sobre los datos que se están considerando.

Un logaritmo de uso muy común es el logaritmo natural, denotado por ln(x) y que corresponde al logaritmo de un valorxen el cual la base del logaritmo es el número irracionale, es decir: ln(x) = log_e(x). Este logaritmo se denomina natural por su constante presencia en muchas de las aplicaciones del logaritmo en diferentes áreas.

Las propiedades de este logaritmo son las mismas que las enunciadas antes, y en adelante asumiremos que al considerar el logaritmo de alguna cantidad este se refiere al logaritmo natural.

1.5. Ejercicios

1. Determine cu´al es el ´ındice y los l´ımites de las siguientes sumatorias:

a)

17 X

i=12

(8t2−5t+ 3)

b)

450 X

m=3

(8m−4)

2. Determine el resultado de las siguientes operaciones:

a) 7 X i=1 6i b) 4 X p=0 10p c) 9 X k=3

(10k+ 16)

d)

11 X

n=7

(2n−3)

3. Exprese las siguientes sumas en notaci´on de sumatoria:

(12)

b) 1 + 4 + 9 + 16 + 25

c) 53_{+ 5}4_{+ 5}5_{+ 5}6_{+ 5}7_{+ 5}8

d) 10 + 100 + 1000 +· · ·+ 1000000000

4. Determine el valor de las siguientes sumas:

a) n X k=1 51 n b) 100 X k=51 10k c) 100 X k=1

5k2+ 3k

d)

100 X

k=1

(k+ 5)2

5. Cu´al es el resultado de:

200 X i=1 100 X i=1 4

6. Cu´al es el valor deM si:

M = (1 + 2 + 3 +· · ·+ 100) + (100 + 99 +· · ·+ 1)

7. Debido a combates por control territorial se presenta un desplazamiento de población del pa´ıs A hacia el pa´ıs B, iniciando con 15 personas y agregando una persona más cada d´ıa, con relación al d´ıa anterior. Ante esto el presidente del pa´ıs B decide cerrar la frontera, de forma que el último d´ıa de paso libre lograron cruzar 53 personas. ¿Cuántas personas pasaron en total?

8. La siguiente tabla recoge los valores de una variablex, indexada por dos ´ındiceseyd:

H H H H H e d

1 2 3

1 -4 4 -8

2 1 9 12

3 6 -3 5

4 0 6 2

5 -2 7 0

Determine a partir de la tabla el valor de las siguientes sumas:

(13)

b) 5 X e=1 X d<e xed c) 5 X e=1 3 X

d=e

xed d) 5 X e=1 3 X d=1

x2_ed

e) 3 X e=1 3 X d=1

(3x2_ed−28)

f) 3 X e=1 3 X d=1

(2xed−1)2

9. La siguiente tabla recoge los valores de dos variablesxyy, medidas sobre 6 individuos. Individuo x y

1 -4 2

2 -1 6

3 5 3

4 0 1

5 -2 -4

6 1 1

Calcule el valor de las siguientes sumas:

a) 6 X a=1 6 X b=1

xayb

b) 6 X a=1 3 X b=1

(xa+yb)

c) 3 X a=1 6 X

b=a

(14)

Cap´ıtulo 2

Estad´ıstica descriptiva

Podemos considerar a la estad´ıstica como la ciencia que nos permite, a través de la observación de datos imperfectos, inferir sobre alguna o algunas caracter´ısticas o parámetros de una población objeto de estudio.

Para esto, la estad´ıstica puede dividirse en tres grandes bloques:estad´ıstica descriptiva,probabilidad y es-tad´ıstica inferencial. Es este cap´ıtulo consideramos algunas definiciones b´asicas para el trabajo estad´ıstico, y se presentan algunos resultados relevantes sobre estad´ıstica descriptiva.

2.1. Definiciones b´

asicas

Población:conjunto de elementos de los cuales se quiere conocer una o varias caracter´ısticas o parámetros. (Un algunos casos se hace referencia ala población como población teórica o población bajo estudio).

Censo:es la situación en la cual es posible tener información de todos los elementos de la población.

Muestra:subconjunto de la poblaci´on que es representativo de la misma en la caracter´ıstica objeto de estudio.

En general, la forma como se selecciona la muestra depende de múltiples elementos como: disponi-bilidad de tiempo, recursos, acceso a la población, representatividad, tipo de información para ser registrada, etc. Por esto, existen diferentes métodos para la determinación de la misma, algunos de los cuales son descritos en la siguiente sección.

2.1.1. Tipos de muestreo

(15)

Dentro de este tipo de muestreo se encuentran:

• Muestreo aleatorio simple: en este caso se identifica a los elementos de la población mediante un número o etiqueta y se seleccionan de forma aleatoria números o etiquetas, hasta alcanzar el tamaño de muestra deseado.

• Muestreo aleatorio sistemático: considerando de nuevo que la población está numerada o etiquetada, se selecciona de forma aleatoria un elemento (i) de la población. A partir de este, se toman los elementosi+k,i+ 2k,i+ 3k, ..., conk=N/n, dondeN es el tamaño de la población ynel tamaño de la muestra. El valor deise toma entre 1 yk.

• Muestreo aleatorio estratificado: la población se separa en estratos o clases homogéneas respecto a alguna caracter´ıstica particular (profesión, lugar de residencia, lugar de nacimiento, salario, nivel de formación, sexo,... ), y dentro de cada uno de los estratos se realiza muestreo aleatorio simple o sistemático.

La distribución de la muestra dentro de cada uno de los estratos se llama afijación. Esta puede ser:afijación simple, cuando a cada estrato le toca un número igual de elementos de la muestra;afijación proporcional, la distribución se hace de acuerdo con el pesos de la población en cada estrato, oafijación óptima, que es el caso en el cual se considera la proporción y la desviación.

• Muestreo aleatorio por conglomerados: en este caso, la unidad muestral es un grupo de elementos de la población (partidos pol´ıticos, facultades, agremiaciones,...). Se selecciona de forma aleatoria un cierto número de conglomerados, hasta completar el tamaño de muestra requerido.

Métodos no probabil´ısticos:en general, estos tipos de muestro no permiten realizar inferencias sobre la población, porque no se conoce la representatividad de la muestra, pero en determinadas situaciones pueden ser el único tipo de muestreo aplicable y deseable. Dentro de este tipo de muestreo se encuentran:

• Muestreo por cuotas: se fijan unas cuotas (caracter´ısticas espec´ıficas de la poblaci´on), y se eligen para la muestra los primeros individuos que se consigan con estas caracter´ısticas.

• Muestreo intencional: se realiza un esfuerzo por incluir en la muestra conjuntos de ele-mentos poblacionales considerados como t´ıpicos. Por ejemplo, sondeos preelectorales en zonas donde hist´oricamente hay tendencia marcada de voto.

• Muestreo causal: el investigador selecciona directamente los individuos que van en la mues-tra.

(16)

2.1.2. Tipos de datos

Es claro que los individuos de una población poseen muchas caracter´ısticas que pueden ser de interés, pero aquella o aquellas que son objeto de estudio por parte del investigador se denominarán en adelante

variables, y su valor puede cambiar entre los diferentes individuos en la población. Los datos serán el resultado de las observaciones del valor de la variable en los individuos seleccionados de la población.

Si el conjunto de observaciones realizadas (muestra) corresponde a una sola variable, se dice que el con-junto de datos es univariado. Ahora, el conjunto de observaciones puede sercateg´oricoocualitativo

si las observaciones responden a categor´ıas, o puede sernumérico o cuantitativosi cada observación es un número.

Si el conjunto de observaciones son el resultado de obtener una categor´ıa o valor para dos o m´as atributos, se dice que los datos sonmultivariados; por ejemplo, considere los datos que se tienen si se pregunta a una persona seleccionada al azar acerca de su peso, su estatura y su edad.

En el caso particular de datos numéricos, estos pueden clasificarse en discretos, cuando los posibles valores de la variable corresponden a puntos aislados en la recta numérica, o continuos cuando el conjunto de posibles valores de la variable forma un intervalo en la recta numérica.

Por ejemplo, si se considera el n´umero de hermanos que puede tener una persona, esta es una variable discreta, mientras que si se considera la temperatura que hace en el centro de Bogot´a durante el d´ıa, esta es una variable continua.

Una vez se tiene los datos, la estad´ıstica descriptiva considera las siguientes medidas de carácter común para su análisis:

Medidas de tendencia central.

Medidas de posici´on relativa.

Medidas de dispersi´on.

Medidas de forma.

Medidas de concentraci´on.

Un componente muy útil dentro de la estad´ıstica descriptiva, tanto para el análisis preliminar de informa-ción como para la presentación de resultados y conclusiones, es larepresentación y el análisis gráfico de los datos. En la siguientes sección se presentan algunas de las formas más comunes de representación gráfica de información.

2.2. Representaciones gr´

aficas

Gr´afico de tallo y hojas:

(17)

1. Separamos las observaciones en dos partes (Tallo y Hojas). Para el tallo consideramos tantos d´ıgitos como se necesite, tomando siempre el mismo n´umero de d´ıgitos en cada observaci´on, y para la hojas se toma solo un d´ıgito.

2. Se listan los tallos verticalmente en orden ascendente y trazamos una l´ınea vertical.

3. A cada tallo se le agregan las hojas correspondientes de menor a mayor. Los tallos sin hojas se ubican de este modo, no se agregan ceros.

Ejemplo 4 Las siguientes observaciones corresponden al porcentaje del presupuesto anual que 10 municipios destinan al apoyo a la formaci´on docente.

Municipio

Porcentaje

1 0,00

2 1,28

3 1,67

4 2,87

5 3,16

6 3,21

7 3,84

8 4,92

9 5,50

10 8,07

La representaci´on de tallo y hojas en este caso es:

Tallo

Hojas

0

1 2 6

2

8

3 1 2 8

4

9

5

8

0

Gr´afico de barras:

Este tipo de gráfico es de mucha utilidad para la representación de datos categóricos, asignando a cada categor´ıa una barra representa la frecuencia (número de observaciones) de la misma.

(18)

Candidato

Frecuencia

Frecuencia relativa

A

50 29.4 %

B

45 26.5 %

C

30 17.6 %

D

45 26.5 %

Total

170 100 %

Cuadro 2.1:

Figura 2.1:

Mediante este tipo de gr´aficos, tambi´en es posible realizar comparaciones entre los resultados de una categor´ıa en muestras distintas, como lo muestra el siguiente ejemplo.

Ejemplo 6 Retomando el ejemplo anterior sobre intenci´on de voto, se consideran los resultados de las 170 personas de una ciudad A, y los resultados de 100 encuestados de una ciudad B. Los resultados se presentan en el cuadro 2.2, y la representaci´on del diagrama de barras para este caso se muestra en la figura 2.2

Gr´afico de torta: en este caso la frecuencia relativa (fr) del dato se asocia con un ´angulo en la circunferencia (θ), de acuerdo con:θ=f r·_{100 %}360◦.

(19)

Candidato

Frecuencia Ciudad A

Frecuencia Ciudad B

A

50

60 B

45

20 C

30

10 D

45

10 Total

170

100 Cuadro 2.2:

Figura 2.2:

1. Dividir el rango total de observaciones enclases o intervalos. (Por lo general estas clases se toman de igual longitud, pero no es necesario que esto siempre sea as´ı).

2. Una vez establecidas las clases, se calcula lamarca de clase de cada una de estas, definida como:Mj =lim.Sup+₂lim.Inf.

3. Para cada clase se calcula: lafrecuencia absoluta(fj), definida como el n´umero de observa-ciones que caen dentro de la clase; lafrecuencia relativa (hj), definida como la frecuencia absoluta de la clase dividida entre el total de observaciones; lafrecuencia acumulada (Fj), definida como la suma de la frecuencia absoluta de cada clase con las frecuencias absolutas de las clases anteriores, y lafrecuencia relativa acumulada (Hj), definida como la suma de la frecuencia relativa de cada clase con las frecuencias relativas de las clases anteriores.

El histograma se construye mediante barras que representan la frecuencia asociada a cada clase, en el ´area de la barra y no en su altura. Desde luego, si las longitudes de las clases son iguales, el ´

(20)

En el caso en el cual las clases son de diferente longitud, para leer el gr´afico de forma correcta, se recalcula la altura de las barras mediante lo que se conoce comoescala de densidad, donde:

Altura de la barra = frecuencia relativa de la clase longitud de la clase

Figura 2.3:

Pol´ıgono de frecuencias: este gr´afico se puede obtener del histograma uniendo mediante seg-mentos de recta los puntos medios en las barras del histograma (las marcas de clase). Se busca dar una idea de la forma de la distribuci´on de los datos (ver figura 2.4).

Ojiva:es la representaci´on gr´afica de la frecuencia relativa acumuladaHj, y describe el porcentaje de los datos que se han cubierto hasta una determinada clase (ver figura 2.5).

2.3. Medidas de tendencia central

Este tipo de medidas nos permiten determinar alg´un valor o valores alrededor de los cuales se agrupan las observaciones. A continuaci´on se describen algunas de estas para datos agrupados y no agrupados.

Media aritm´etica

¯

x= Pn

i=1xi

(21)

Figura 2.4:

Si se tiene un censo, la media se denota conµy se define como:

µ= PN

i=1xi

N

siendoN el tama˜no de toda a poblaci´on. En el caso de datos agrupados, la media se define como:

¯

x= Pm

j=1fjMj Pm

j=1fj

dondefj es la frecuencia absoluta de clasej yMjla marca de clase.

Ejemplo 7 Las observaciones del cuadro 2.3 corresponden al número de unidades exportadas en los últimos 24 meses por una compañ´ıa multinacional.

24

14

17

16

18

12

18

14

21

22

25

21

15

25

23

16

14

21

14

23

21

18

12 Cuadro 2.3:

Se tiene que la media del n´umero de unidades exportadas por la compa˜n´ıa es:

¯

x= P24

i=1

(22)

Figura 2.5:

Clase

M

j

f

j

5.2-6.1

5.65

3 6.1-7.0

6.55

5 7.0-7.9

7.45

9 7.9-8.8

8.35

7 8.8-9.7

9.25

5 9.7-10.6

10.15

3

32 Cuadro 2.4:

Ejemplo 8 Las tabla de frecuencia del cuadro 2.5 corresponde al n´umero de horas extra trabajadas por los empleados de una empresa en el ´ultimo mes.

Se tiene que la media del n´umero horas extra trabajadas es:

¯

x=251,9 32 = 7,87 Algunas propiedades de la media aritm´etica son:

1. Representa el centro de gravedad de las observaciones.

(23)

n X

i=1

(xi−x¯) = n X

i=1

xi− n X i=1 ¯ x = n X i=1

xi−nx¯

= n X

i=1

xi−n n X

i=1

xi/n

= n X

i=1

xi− n X

i=1

xi= 0

3. Aunque la media aritmética ¯xes la medida de tendencia central más utilizada, presenta el inconveniente de ser muy sensible a la presencia de datos at´ıpicos en el conjunto de obser-vaciones. Algunas formas de tratar con este inconveniente serán presentadas más adelante al definir otras medidas de este tipo.

Media ponderada

Si consideramos un conjunto de observaciones en las que a cada observaciónxile podemos asignar un valor wi asociado a alguna caracter´ıstica particular (como por ejemplo valores más grandes dewi a datos más cercanos en el tiempo), o cuando los datos xi tienen frecuencias diferentes fi, entonces podemos definir la media ponderada de los datos como:

¯

x= n X

i=1

wixi con wi=

fi

n

Ejemplo 9 Se sabe que el n´umero de unidades exportadas anualmente por 20 pa´ıses es:

Unidades (Millones)

Num. de pa´ıses

Peso(w

i

)

12

6 6/20=0.3

14

10 10/20=0.5

16

4 4/20=0.2

Cuadro 2.5:

El valor promedio del n´umero de unidades exportadas, ponderando por el n´umero de pa´ıses es:

¯

x= (0,3)(12) + (0,5)(14) + (0,2)(16) = 13,8.

Media geom´etrica

La media geom´etrica de un conjunto de observaciones que se define como:

¯

xg= n

√

(24)

y corresponde al valor central representativo de observaciones secuenciales y estrechamente rela-cionadas (intereses, inflación, devaluación, crecimiento, disminución, variación, etc).

En el caso de datos agrupados, la media geom´etrica se puede calcular como:

¯

xg= n v u u t

m Y

j=1

xfj j

Ejemplo 10 Las siguientes observaciones corresponden a los porcentajes de incremento del salario m´ınimo en 6 pa´ıses de Am´erica Latina: 4 %, 11 %, 10 %, 6 %, 11 %, 3 %.

La media geom´etrica de estos porcentajes es:

¯

xg= 6,658 %

Ejemplo 11 ¿Cuál es la tasa de interés promedio pagada en el siguiente préstamo?

Mes

1

2

3 Tasa

0,15

0,10

0,16

¯

xg= 13,38 %

Mediana

La mediana es una medida de tendencia central que separa el conjunto de observaciones ordenadas por su centro, es decir, la mediana es un valor tal que el 50 % de las observaciones es menor o igual a dicho valor y el otro 50 % es mayor. Para calcular la mediana procedemos de la siguiente manera:

1. Ordenar el conjunto de observaciones.

2. Determinar si el número de observaciones (n) es par o impar. Si el número de observaciones es impar, el valor ubicado en la posición n+1

2 corresponde a la mediana (˜x). Si el n´umero de observaciones es par, considerados los datos en las posiciones n

2 y n 2 + 1, los cuales promediamos, el valor obtenido del promedio corresponde a la mediana (˜x) del conjunto de observaciones.

Ejemplo 12 Consideremos el conjunto de observaciones: {4, 5, 5, 6, 7, 8, 9}. Para este caso la medina esx˜= 6.

Si ahora el conjunto de observaciones es: {3, 4, 5, 5, 6, 7, 8, 9}, en este caso la mediana es

˜

(25)

La mediana poblacional (˜µ) es el valor que separa el 50 % inferir de la poblaci´on del 50 % superior, y en el caso de datos agrupados, la mediana muestral se calcula como:

˜

x=Lj+ n

2 −Fj−1

C fj

=Lj+

[0,5−Hj−1]C

hj

donde:

• Lj= l´ımite inferior de la mediana (la primera clase en la cual la frecuencia acumulada iguala o supera el 50 %).

• Fj−1= frecuencia acumulada de la clase anterior a la clase mediana.

• fj= frecuencia absoluta de la clase mediana.

• Hj−1= frecuencia relativa acumulada de la clase anterior a la clase mediana.

• hj = frecuencia relativa de la clase mediana.

• C= longitud de la clase mediana. Algunas propiedades de la mediana son:

1. Si se tiene una distribuci´on sim´etrica de las observaciones, entonces ¯x= ˜x. 2. Si hay asimetr´ıa en las observaciones que muestra cola larga a derecha ˜x <x¯. 3. Si hay asimetr´ıa en las observaciones que muestra cola larga a izquierda ˜x >¯x.

4. La mediana es una medida de tendencia central robusta ya que no es sensible a la presencia de datos at´ıpicos.

Moda

La moda hace referencia al dato que m´as se repite dentro del conjunto de observaciones. Como medida de tendencia central puede resultar ineficiente ya que podemos encontrar casos en los que la distribuci´on sea multimodal. Por ejemplo si consideramos el siguiente conjunto de observaciones:

{2,2,3,3,4,4,5,5,6,6,7,7}

entonces la moda de este conjunto de observaciones son los datos 2,3,4,5,6,7 ya que todos se repiten 2 veces.

En el caso de datos agrupados, la moda se estima como:

Xmoda=Lj+C

_d

1

d1+d2

(26)

• fj= frecuencia absoluta de la clase modal (la clase con mayor frecuencia absoluta).

• Lj= l´ımite inferior de la case modal.

• C= longitud de la clase modal.

Media recortada (Mediaα-podada)

En este caso, se descartann·αdatos de cada extremo de la lista ordenada de observaciones, con el objetivo de no considerar datos at´ıpicos. Con los datos restantes se calcula la media aritm´etica.

Ejemplo 13 Hallar la media recortada al 20 % del siguiente conjunto de observaciones.

{85,98,99,95,98}

Lo primero que debemos hacer es considerar el conjunto de observaciones ordenado de menor a mayor.

{856,95,98,98,99}

Como α= 0,2, se tiene que:n·α= (5)(0,2) = 1, lo que nos indica que de la lista ordenada se descarta un datos de cada extremo.

Con los datos restantes se calcula la media aritm´etica, entonces:

¯

x0,2=

95 + 98 + 98 3 = 97

Rango medio

El rango medio de un conjunto de observaciones est´a definido como el promedio entre el mayor valor observadoxm´ax y el menor valor observadoxm´ın, es decir:

Rango medio=xm´ax+xm´ın 2

Media arm´onica

Esta media se emplea regularmente para promediar variaciones con respecto al tiempo y est´a defi-nida como:

¯

x= ₁ n x1 +

1

x2 +· · ·+

(27)

Ejemplo 14 Una familia sale de viaje en automóvil entre dos ciudades. Cubre los primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los últimos 100 km a 80 km/h. ¿Cuál es la velocidad media realizada?

Tenemos entonces que:

¯

x= ₁ 3 60+

1 70+

1 80

= 69,041km/h

2.4. Medidas de posici´

on relativa

En este caso buscamos desarrollar medidas que describen el lugar en el que est´an ubicados los datos con relaci´on a la totalidad de los mismos. La medida por excelencia para este caso son los percentiles.

El percentilK de un conjunto de observaciones es un valor tal que elK% de las observaciones es menor o igual que dicho valor. Para determinar el percentilK de un conjunto de observaciones procedemos de la siguiente manera:

1. Ordenar los datos de menor a mayor.

2. Calcular:

i=nK 100

dondencorresponde al n´umero de observaciones yK al percentil que se quiere determinar. 3. Si el valor calculado dei es un decimal, se redondea al valor siguiente y dicho valor determina la

posici´on en la lista ordenada de observaciones en el que se encuentra el percentilK.

4. Si el valor deies un entero, el percentil es el promedio de los valores en las posicionesiei+ 1 de la lista ordenada.

Algunos percentiles reciben nombres espec´ıficos de acuerdo con el n´umero de partes en las que dividen el conjunto de observaciones. En particular, son muy utilizados los cuartiles, deciles y quintiles. Loscuartiles

dividen el conjunto de observaciones de acuerdo con los percentiles 25, 50, 75 y 100. Estos son denotados regularmente como Q1, Q2, Q3 y Q4. Los deciles dividen el conjunto de observaciones en 10 partes de acuerdo con los percentiles 10, 20, 30, ...,100 y de forma an´aloga los quintiles dividen el conjunto de observaciones en 20 partes iguales de acuerdo con los percentiles 5, 10, 15, ...,100.

Ejemplo 15 Que el percentil 30 del ingreso mensual promedio de mujeres cabezas de hogar en Colombia sea de 400.000, significa que el 30 % del ingreso percibido por estas mujeres es menor o igual a 400.000, y el 70 % es mayor.

(28)

104, 112, 134, 146, 155, 168, 179, 195, 246, 302, 338, 412, 678.

i=(13)(25)₁₀₀ = 3,25→4 entonces Q1= 146

i=(13)(50)₁₀₀ = 6,5→7 entonces Q2= 170 = ˜x

i=(13)(75)₁₀₀ = 9,75→10 entoncesQ3= 302

i=(13)(100)₁₀₀ = 13→13entonces Q4= 678

En el caso de datos agrupados, el percentilK se calcula mediante la expresi´on:

PK =Lj+ Kn

100+Fj−1

fj donde,

Lj= l´ımite inferior del intervalo que contiene al percentil.

Fj−1= frecuencia acumulada de la clase anterior a la k-´esima.

fj= frecuencia absoluta de la clase que contiene al percentil.

C= longitud de la clase que contiene al percentil.

K= percentil buscado.

n= n´umero total de observaciones.

2.5. Medidas de dispersi´

on

Una vez establecida una medida de tendencia central, es importante considerar qué tan separadas o dis-persas se encuentran las observaciones con relación a dicha medida, o, de forma general, cuánta dispersión presentan los datos en s´ı. Para esto estudiamos las siguientes medidas de dispersión.

Rango muestral

El rango de un conjunto de observaciones mide la longitud del intervalo que contiene la totalidad de las mismas, y se calcula como:

Rango = xmax−xmin

Rango intercuartil

El rango intercuartil mide la longitud del intervalo que contiene el 50 % central de las observaciones y es calculado como:

(29)

Desviaci´on media

La desviaci´on media de un conjunto de observaciones es la distancia promedio de cada observaci´on a la media, es decir:

DM = Pn

i=1|xi−x¯|

n

Mediana de las desviaciones absolutas (MAD)

Esta es una medida de dispersi´on respecto a la mediana de un conjunto de observaciones, y se define como:

M AD=mediana{|xi−x˜|}

Varianza y desviaci´on est´andar

La varianza de un conjunto de observaciones, cuando estas constituyen un muestra de la poblaci´on total, se denominavarianza muestral y es definida como:

S2= Pn

i=1(xi−x¯)2

n−1

Si el conjunto de observaciones corresponde a toda la poblaci´on, lavarianza poblacional se define como:

σ2= PN

i=1(xi−µ)2

N

dondeN denota el n´umero total de elementos en la poblaci´on yµes la media poblacional. Una forma equivalente de representar la varianza muestral es:

S2= Pn

i=1x 2 i −nx¯2

n−1

y en el caso de datos agrupados, la varianza muestral es:

S2== Pm

j=1fjMj2−nx¯ 2

n−1

Asociada a la varianza muestral y poblacional se considera la desviación muestral y poblacional, que es una medida de dispersión pero que está considerada en las unidades originales de los datos. Estas se definen respectivamente como:

(30)

σ=

√

σ2

Teniendo los conceptos de media y desviaci´on podemos enunciar un resultado importante relacionado con los mismos, elteorema de Tchebychev, el cual establece:

Para cualquier poblaci´on con media µ y varianza σ2_{, por lo menos el} ₁₀₀₍₁₋ 1

k2) % de los valores de

la población está a una distancia menor que k veces la desviación estándar para k > 1, es decir, en el intervalo(µ−kσ, µ+kσ)está el100(1− 1

k2) %de los valores de la poblaci´on.

Al considerar algunos valores para k podemos establecer el porcentaje de la poblaci´on dentro de cada intervalo, para cada valor dek:

k 1.5 2 2.5 3 3.5 4 100(1− 1

k2) % 55.6 % 75 % 84 % 88.9 % 91.18 % 93.7 %

Coeficiente de variaci´on de Pearson

Este coeficiente permite comparar las dispersiones de dos conjuntos de observaciones, ya que no est´a influenciado por la escala de los datos.

CV =s ¯

x

100 %

2.6. Gr´

afico de caja y bigotes

Este gráfico, propuesto por Tukey, permite representar información de los datos basado en cuartiles. Para realizar esta representación se deben seguir estos pasos:

1. Ordenar los datos de menor a mayor.

2. Hallar ˜x, Q1 yQ3.

3. Hallar los l´ımites, dondeRIC es el rango intercuartil. 2◦ l´ımite inferior =Q1−3(RIC).

1◦ l´ımite inferior =Q1−1,5(RIC). 1◦ _{l´ımite superior =}_Q

3+ 1,5(RIC). 2◦ l´ımite superior =Q3+ 3(RIC).

Las observaciones entre el primer y segundo l´ımite inferior o entre el primer y segundo l´ımite superior son outliers (datos at´ıpicos). Las observaciones por fuera de los segundos l´ımites son

outliers severos.

4. Se traza una escala que cubra el rango de observaciones, y en esta se ubican ˜x, Q1 yQ3.

5. Formar una caja cuyos lados vayan deQ1a Q3, y en su interior un segmento de recta que indique ˜

(31)

6. Partiendo deQ1, trazar un segmento de recta (bigote) hasta el ´ultimo dato dentro del primer l´ımite inferior.

7. Partiendo deQ3, trazar un segmento de recta (bigote) hasta el ´ultimo dato dentro del primer l´ımite superior.

8. Marcar losoutliers (◦) y losoutliers severos (*).

Figura 2.6: Gr´

afico de caja y bigotes. Fuente: Wikipedia

Ejemplo 17 Realizar el gr´afico de caja y bigotes para el siguiente conjunto de observaciones: 104, 112, 134, 146, 155, 168, 179, 195, 246, 302, 338, 412, 678.

Calculamos las cantidades necesarias para la construcci´on del gr´afico: Q1 = 140, Q3 = 302, x˜ = 170,

RIC= 156.

El valor de los l´ımites es:

2◦ l´ımite inferior = Q1−3(RIC) =−322.

1◦ l´ımite inferior = Q1−1,5(RIC) =−88.

1◦ l´ımite superior = Q3+ 1,5(RIC) = 536.

(32)

100 200 300 400 500 600 700 *

La forma del gráfico de cajas también nos permite inferir acerca de la forma de la distribución de las observaciones, como lo muestra la figura anterior.

2.7. Medidas de forma

Consideramos ahora medidas sobre la forma descrita por el conjunto de observaciones en relación con su simetr´ıa y su apuntamiento o levantamiento respecto al eje horizontal. Iniciamos con elsesgo, definido como una medida del grado de simetr´ıa de la curva descrita por las observaciones con relación a su media. Supongamos que la siguiente gráfica representa la curva descrita por un conjunto de datos.

¯

x=˜x=moda

En este caso podemos observar que la curva es simétrica respecto a su media, lo cual implica que la mediana y la moda coinciden con el valor de la media. Entonces decimos que los datos siguen una distribución simétrica unimodal.

De igual forma, es posible considerar distribuciones que son simétricas pero multimodales. Por ejemplo, la siguiente gráfica representa el caso de una distribución de observaciones que es simétrica bimodal:

(33)

moda ˜x ¯x

o distribuciones consesgo a izquierda, como la siguiente:

moda ˜

x

¯

x

Para cuantificar el grado de asimetr´ıa de la distribuci´on de las observaciones podemos considerar:

´_{Indice de asimetr´}_{ıa de Yule-Bowley para variables ordinales}

Como su nombre lo indica, este ´ındice es aplicable para variables ordinales, y est´a basado en la distancia entre cuartiles. Se define como:

AS =

(Q3−Q2)−(Q2−Q1) (Q3−Q1)

= Q1+Q3−2Q2 (Q3−Q1)

; −1≤AS ≤1

En este caso se tiene que:

As=   

 

<0 sesgo negativo o cola larga a izquierda. = 0 sesgo cero o simetr´ıa.

>0 sesgo positivo o cola larga a derecha.

Coeficiente de asimetr´ıa de Pearson

Dado un conjunto de observaciones unimodal, este coeficiente se define como:

Ap= ¯

x−moda s

y es clasificado como:

Ap=   

 

= 0 sim´etrica

<0 sesgo negativo o a izquierda

(34)

Coeficiente de asimetr´ıa de Fisher

Dado un conjunto de observacionesx1, x2, ..., xn, este coeficiente se define como:

g1= Pn

i=1(xi−x¯)3

nS3

dondeS denota la desviaci´on est´andar de las observaciones. Se clasifica en este caso como:

g1=   

 

= 0 sim´etrica

<0 sesgo negativo o a izquierda

>0 sesgo positivo o a derecha

En el caso de datos agrupados se tiene que:

g1= Pm

j=1(Mi−x¯)3fj

nS3

Consideramos ahora una medida para el apuntamiento de la curva con relación al eje horizontal. Esta medida es llamada curtosis, y es una medida del grado de concentración de los datos alrededor de la media, es decir, es una medida del grado en el que se acumulan observaciones en las colas de la distribución. Se define como:

Curtosis= Pn

i=1(xi−x¯)4

nS4

Para dar un mayor sentido a esta medida se utiliza como referente la campana Gaussina o curva normal, la cual tiene una curtosis de 3, por lo que es com´un trabajar con el exceso de curtosis, medida definida como:

Exceso de curtosis =g2= Pn

i=1(xi−x¯)4

nS4 −3 Para el caso del exceso de curtosis se define:

g2=   

 

= 0 Mesoc´urtica.

<0 Platic´urtica.

(35)

leptoc´urtica

mesoc´urtica

platic´urtica

En algunos caso tambi´en se utiliza el coeficiente de apuntamiento (Ku) definido como:

Ku=

Q3−Q1 2(P90−P10) y en este caso:

Ku=   

 

= 0,263 Mesoc´urtica.

<0,263 Platic´urtica.

>0,263 Leptoc´urtica

2.8. Medidas de concentraci´

on

El objetivo de este tipo de medidas es cuantificar el grado de desigualdad en la distribuci´on o el reparto de una magnitud (ventas, riqueza, beneficios,...), entre un n´umero determinado de elementos receptores (individuos, familias, empresas,...).

Al considerar estas situaciones, se puede tener:

m´ınima concentraci´on o m´axima igualdad: caso en el cual a todos los integrantes del conjunto receptor se les asigna la misma cantidad.

m´axima concentraci´on o m´ınima igualdad: un receptor recibe todo.

Para la cuantificaci´on de esta relaci´on se considera el´ındice de Giniy la curva de Lorenz.

´_{Indice de Gini.}_{Para el c´}_{alculo de este ´ındice:}

1. Se ordena el conjunto de receptores de menor a mayor cantidad recibida (se denota porvial valor recibido por el receptori).

(36)

2. Hallar las cantidades acumuladas del n´umero de receptores y de valor recibido.

3. Hallar las proporciones correspondientes a las cantidades acumuladas.

El cuadro 18 muestra el c´alculo de estas cantidades.

Receptores

v

i

Acumulado receptores (i)

Valor acumulado (u

i

)

p

i

=

_ni

100 q

i

=

ui_n

100

1

◦

v

1

1 u

1

=

v

1

p

1

=

1_n

100 q

1

=

u_un1

100

2

◦

v

2

2 u

2

=

v

1

+

v

2

p

2

=

2_n

100 q

2

=

u_un2

100

3

◦

v

3

3 u

3

=

v

1

+

v

2

+

v

3

p

3

=

3_n

100 q

3

=

u_un3

100 ..

.

..

.

..

.

..

.

..

.

..

.

n

◦

v

n

u

n

=

v

1

+

· · ·

+

v

n

p

n

= 100

q

n

= 100

Se debe notar que en caso de reparto equilibradopi=qi para todoi, y que en general la diferencia (pi−qi) indica la concentraci´on del reparto. Partiendo de lo anterior, se define el´ındice de Gini como:

IG= Pn−1

i=1(pi−qi) Pn−1

i=1 pi

; 0≤IG ≤1 y de esta definici´on se tiene que:

• IG= 0 implica m´ınima concentraci´on o m´axima igualdad.

• IG= 1 implica m´axima concentraci´on o m´ınima igualdad.

Ejemplo 18 La siguiente tabla de frecuencias describe los salarios mensuales recibidos por los empleados de una empresa en millones de pesos.

Salario

N

◦

de empleados

3.5

10

4.5

12

6

8

5

10

3

15

1

20

1

(37)

Salario

f

i

F

i

p

i

v

i

=

x

i

f

i

u

i

q

i

(p

i

−

q

i

)

3.5

10

25

35

13.6

10.83

4.5

12

22

55

54

89

34.6

18.97

6

8

30

75

48

147

57.2

19.53

8

5

35

87.5

40

187

72.8

15.84

10

3

38

95

30

217

84.4

11.19

15

1

39

97.5

15

232

90.3

7.62

25

1

40

100

25

257

100

0

435

83.99 Cuadro 2.6:

Curva de Lorenz. Es la representación gráfica de la concentración.

pi

qi

100 100

(pi, qi)

El ´ındice de Gini puede interpretarse como la razón entre el área del triángulo bajo la diagonal y el área encerrada por la diagonal y la curva de Lorenzf(p).

IG= 1−2 Z 1

0

f(p)dp

2.9. Ejercicios sugeridos

1. Los 21 estudiantes de un salón de clase tienen una estatura promedio de 167 cent´ımetros. Si entra un estudiante más, ¿qué estatura deber´ıa tener para que el promedio aumente un cent´ımetro?

(38)

3. El valor promedio de los salarios pagados a las mujeres con formaci´on profesional en determinado departamento de Colombia es de $1500000 con una desviaci´on de $300000. Encuentre un intervalo en el que se pueda garantizar que se encuentran por lo menos el 75 % de los salarios.

4. Considere las siguientes observaciones de la volatilidad del precio de una acci´on: 73.7; 36.6; 109.9; 4.4; 33.1; 66.7; 30.0; 81.5; 22.2, 40.4; 16.4. Determine el valor de la media y la mediana muestrales. ¿Qu´e puede concluir?

5. Los siguientes datos representan los salarios de 30 trabajadores:

Salario 550 600 700 800 3000 Frecuencia 8 6 7 5 4

a) Determine: la moda, la media aritm´etica, la media geom´etrica, el rango y el sesgo.

b) ¿Cu´al es el primer cuartil, el tercer cuartil y el sexto decil?

c) Determine la desviaci´on est´andar y el rango intercuartil.

6. Los siguientes datos corresponden a la información histórica mensual en millones, de la inversión realizada por el Estado en planes de formación de deportistas:

122.2 124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9 128.6 128.8 129.0 129.2 129.4 129.6 130.2 130.4 130.8 131.3 131.4 131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5 132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2 133.2 133.2 133.3 133.3 133.5 133.5 133.5 133.8 133.9 134.0 134.0 134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7 134.7 134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4 135.5 135.5 135.6 135.6 135.7 135.8 135.8 135.8 135.8 135.8 135.9 135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3 136.4 136.4 136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8 137.8 137.9 137.9 138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5 138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6 139.8 139.8 140.0 140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4 143.5 143.6 143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7

(39)

7. Un diagrama Pareto es una variación de un histograma para datos categóricos que resultan de un estudio. Considere una situación en la que cada categor´ıa representa un tipo diferente de producto que incumple con alguna especificación. Las categor´ıas están ordenadas de modo que la que tiene la frecuencia más grande aparezca en el extremo izquierdo, luego la categor´ıa de la segunda frecuencia más grande y as´ı sucesivamente. Suponga que se obtiene la siguiente información sobre discordancia en paquetes de circuitos: componentes con fallas, 126; componentes incorrectos, 210; soldadura insuficiente, 67; exceso de soldadura, 54; componentes faltantes, 131. Construya un diagrama de Pareto.

8. La frecuencia acumulada y la frecuencia relativa acumulada para un intervalo de clase particular son la suma de las frecuencias y frecuencias relativas, respectivamente, para ese intervalo y los intervalos que queden debajo de ´el. Si, por ejemplo, hay cuatro intervalos con frecuencias: 9, 16, 13 y 12, entonces las frecuencias acumuladas son: 9, 25, 38 y 50, y las frecuencias relativas acumuladas son 0.18; 0.50; 0.76 y 1. Calcule las frecuencias acumuladas y las frecuencias relativas acumuladas para los datos del ejercicio 6.

9. En un estudio realizado para investigar la distribución de la riqueza en un determinado pa´ıs, se obtuvo el siguiente resumen de la distribución: media = 535, mediana = 500, moda = 500, desviación estándar = 96, m´ınimo = 220, máximo = 925, percentil 5 = 400, percentil 10 = 430, percentil 90 = 640, percentil 95 = 720.

¿Qu´e se concluye en relaci´on con la forma de histograma de estos datos? Explique su razonamiento.

10. De acuerdo con una revista de informes a consumidores, los precios cobrados por 40 compa˜n´ıas de seguros por la venta de un seguro de vida a hombres de 35 a˜nos de edad es:

82 85 86 87 87 89 89 90 91 91 92 93 94 95 95 95 95 95 97 98 99 99 100 100 101 101 103 103 103 104 105 105 106 107 107 107 109 110 110 111

a. Separe los datos por intervalos de clase.

b. Determine la frecuencia relativa para cada uno de los intervalos.

c. Realice una histograma de los datos.

d. Calcule la frecuencia relativa acumulada de los datos.

e. Trace la ojiva para estos datos (la ojiva es la representaci´on gr´afica de la frecuencia relativa acumulada).

11. Dada la siguiente distribuci´on de frecuencias:

x 0 10 20 30 40 Frecuencia 2 4 7 5 2

(40)

a) La media, moda, mediana, primer y tercer cuartil.

b) Varianza, desviaci´on, coeficiente de variaci´on, mediana de las desviaciones absolutas, rango y rango intercuartil.

c) Coeficiente de asimetr´ıa y de curtosis.

d) ´Indice de concentraci´on de Gini y curva de Lorenz.

12. Las ayudas concedidas, en millones de pesos, por el Fondo para el Desarrollo Regional a 62 pro-yectos, vienen reflejadas en la siguiente tabla:

Importe de ayuda 0-100 100-250 250-500 500-1000 n◦ de proyectos 12 15 20 15

a) Calcular la ayuda media y la desviaci´on est´andar.

b) Representar el histograma pertinente.

c) Calcular la ayuda m´axima concedida al 60 % de los proyectos menos favorecidos en el reparto (ojiva).

d) Si para el año siguiente las ayudas aumentan un 5 % sobre el valor inicial, manteniéndose el criterio del reparto, ¿cuál será ahora la ayuda media y la desviación?

e) Supongamos que queremos contactar con el 15 % de las empresas a quienes han sido concedidas estas ayudas, pero no queremos que sean ni las empresas que m´as han recibido, ni las que menos, sino que queremos quedarnos con el 15 %central. ¿Entre qu´e valores se mueven las ayudas concedidas a este grupo de empresas?

f) Calcular la asimetr´ıa y la curtosis de esta distribuci´on.

13. En un barrio de una gran ciudad se ha constatado que las familias residentes se han distribuido, seg´un su composici´on, de la siguiente forma:

Composici´on 0-2 2-4 4-6 6-8 8-10 Familias 110 200 90 75 25

a) ¿Cu´al es el n´umero promedio de personas por familia?

b) ¿Cu´al es el tipo de familia m´as usual?

c) Si solo hubiera plazas de aparcamiento para el 50 % de las familias, y estas se atendieran de mayor a menor n´umero de miembros, ¿cu´antos componentes deber´ıa tener una familia para entrar en el cupo?

d) Si el coeficiente de variación de Pearson de otro barrio de la misma ciudad es 1,8, ¿cuál de los dos barrios puede ajustar mejor sus previsiones con base en el diferente número de miembros de las familias que lo habitan?

(41)

f) N´umero de miembros que tienen como m´aximo el 85 % de las familias menos numerosas.

14. La distribuci´on de acciones de una sociedad es:

Acciones Accionistas

0-50 23

50-100 72 100-150 62 150-200 48 200-250 19 250-300 8 300-350 14 350-400 7 400-500 7

a) Calcular el n´umero medio de acciones que posee un accionista.

b) N´umero de acciones que m´as frecuentemente posee un accionista.

c) N´umero de acciones que debe poseer un accionista para que la mitad de los restantes accio-nistas tengan menos acciones que ´el.

d) El ´ındice de concentraci´on de Gini y la curva de Lorenz correspondiente.

e) Asimetr´ıa y curtosis de esta distribuci´on.

15. La siguiente tabla corresponde a dos muestras representativas de los créditos concedidos, en millones de pesos, por dos agencias de una entidad bancaria en el último mes. Comparar la concentración de ambas distribuciones.

Agencia A Agencia B Valor del crédito N◦ de créditos N◦ de créditos

0-0,5 3 10

0,5-1 4 12

1-2 6 8

2-4 58 30

4-7 78 12

7-12 90 15

12-14 20 5

14-18 6 6

18-20 4 16

16. Dos empresas A y B emplean a mil trabajadores cada una, clasificados en tres categor´ıas: I, II y III. En un mes determinado han distribuido una misma masa salarial de cien millones de d´olares, como se muestra m´as adelante:

(42)

b) A la vista de los resultados del apartado anterior critique y compare la equidad en el reparto de la masa salarial entre los empleados de las dos empresas.

17. En el siguiente gráfico están representados en el eje de abscisas las proporciones acumuladas del número de individuos entre los que se reparte cierta magnitud y en el eje de ordenadas las propor-ciones acumuladas de los valores repartidos. La funciónf(p) representa una estimación de la curva de Lorenz.

a) Defina el ´Indice de concentraci´on de Gini.

b) Enuncie su relaci´on con la curva de Lorenz.

c) Calcule el valor del ´Indice de Gini si la curva de Lorenz es:

(43)

Cap´ıtulo 3

Probabilidad y variables aleatorias

3.1. Definiciones b´

asicas

La probabilidad puede ser interpretada como una medida de la posible ocurrencia de un evento de-terminado, donde dicho evento es un subconjunto de lo que se denominaespacio muestral, que es el conjunto de todos los posibles resultados de unexperimento aleatorio. Como ejemplo de estos concep-tos, consideremos el experimento aleatorio consistente en lanzar un dado normal de seis caras una sola vez.

El conjunto de posibles resultados del experimento, es decir, el espacio muestral, es Ω ={1,2,3,4,5,6}y posibles eventos sobre este espacio son:

A= el resultado del lanzamiento es primo y par.{2}.

B= el resultado del lanzamiento es par.{2,4,6}.

C= el resultado del lanzamiento mayor que 6. ∅.

Los eventos en general, pueden ser clasificados en: eventos simples que son aquellos que están com-puestos por un solo elemento, como el eventoAdel ejemplo anterior; loseventos compuestos que son aquellos conformados por dos o más elementos, como el evento B del ejemplo anterior, y los eventos nulosque son aquellos que no cuentan con ningún elemento (son vac´ıos), como el eventoC del ejemplo anterior.

Podemos ver que los eventos son subconjuntos del conjunto Ω y, por tanto, es posible realizar sobre estos las operaciones básicas entre conjuntos, como por ejemplo: Unión (∪), Intersección (∩), Complemento (0) o diferencia simétrica (∆). El mayor interés sobre los posibles eventos en un espacio muestral es calcular su probabilidad, para lo cual recurriremos, en este texto, a su definición frecuentista, la cual nos dice que la probabilidad de un evento se puede calcular como un número ideal al que converge su frecuencia relativa cuando la frecuencia absoluta tiende a infinito.

(44)

P[A] = |A|

|Ω|

donde|A|denota el cardinal de A, es decir, el número de elementos enAy|Ω|denota el cardinal de Ω. De esta forma el cálculo de la probabilidad de un evento está determinada por el número de elementos que lo conforman y por el número de elementos en todo el espacio muestral.

Como ejemplo, si consideramos de nuevo el experimento aleatorio de lanzar una dado normal de seis caras y los eventos definidos antes, tenemos que:

P[A] = 1

6 ; P[B] = 3

6 ; P[C] = 0

Ejemplo 19 Consideremos ahora el experimento aleatorio consistente en lanzar dos dados normales de seis caras, uno rojo y uno verde. El conjunto de posibles resultados de este experimento aleatorio son las 36 posibles parejas:

Ω :{(a, b)|a, b∈ {1,2,3,4,5,6}}.

Sobre este espacio definimos los eventos:

A=al menos uno de los dados cay´o 6 ={(1,6),(2,6),(3,6),(4,6),(5,6),(6,6),(6,1),(6,2),(6,3),(6,4),(6,5)}.

B=la suma de los resultados es igual a 7 ={(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)}.

C=los dos resultados son iguales ={(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}. Tenemos entonces que:

P[A] = 11

36 ; P[B] = 6

36 ; P[C] = 6 36 ;

y dado que:

A∩B={(1,6),(6,1)} B∩C=∅ A∩C={(6,6)}

entonces:

P[A∩B] = 2

36 ; P[B∩C] = 0 ; P[A∩C] = 1 36

Podemos anotar que en este caso los eventos B y C son disyuntos, es decir, eventos con intersecci´on vac´ıa.

A partir de esta definici´on de probabilidad es f´acil deducir algunas propiedades importantes de la misma. Consideremos dos eventosAyB en Ω, entonces:

(45)

P[A∪B] =P[A] +P[B]−P[A∩B]

P[A0] = 1−P[A]

Ejemplo 20 Carlos se va a graduar al final del semestre. Después de ser entrevistado en dos compañ´ıas A y B, él evalúa que la probabilidad de obtener una oferta de la empresa A es de 0,8, y la probabilidad de obtener una oferta de la empresa B es 0,6. Si él cree que la probabilidad de que reciba ofertas de ambas compañ´ıas es de 0,5, ¿cuál es la probabilidad de que reciba ofertas de al menos una de las compañ´ıas?, ¿cuál es la probabilidad de que reciba oferta solamente de la compañ´ıa A?, ¿solamente de la compañ´ıa B?, ¿qué no reciba ofertas de ninguna compañ´ıa?

Los datos pueden representarse en un diagrama de Venn como el que se muestra a continuaci´on.

A B

0.3 0.1

0.1 0.5

Tenemos entonces que las respuestas a las preguntas consideradas son:

P[A∪B] = 0,9 =P[A] +P[B]−P[A∩B]

P[A−B] = 0,3

P[B−A] = 0,1

P[(A∪B)0] = 0,1

Ejemplo 21 ¿Cu´al es la probabilidad de obtener 7 u 11 al lanzar un par de dados?

Si denotamos por A el evento de que la suma sea 7, y por B el evento de que la suma sea 11, tenemos queP[A] = 6/36y P[B] = 2/36, luego:

P[A∪B] =P[A] +P[B] = 6 36+

2 36 =

8 36

observemos que en este caso no consideramos la intersecci´on ya que estos dos eventos son disyuntos.

Ejemplo 22 Si la probabilidad de los eventos disyuntos A, B y C es respectivamente 0.2; 0.4 y 0.1, ¿cu´al es la probabilidad de (A∪B∪C)0?

Tenemos que:

(46)

3.2. Probabilidad condicional

Un concepto muy importante dentro de la probabilidad es el deprobabilidad condicional, en el cual, si consideramos dos eventosAyB en Ω, buscamos determinar la probabilidad del eventoAdado que ya sabemos que ocurri´o el eventoB. Esto lo denotamos comoP[A|B] y se define:

P[A|B] = P[A∩B]

P[B] dado queP[B]>0

Ejemplo 23 Considere el espacio muestral conformado por todos los individuos de una pequeña ciudad que tienen titulo profesional, los cuales son clasificados por sexo y por su situación laboral según lo muestra la siguiente tabla.

Empleado Desempleado Total Masculino 460 40 500

Femenino 140 260 400

Total 600 300 900

Uno de los individuos es seleccionado para realizar un viaje a trav´es del pa´ıs publicitando las ventajas de establecer nuevas industrias en las ciudades. Si consideramos los eventos:

M =es seleccionado un hombre.

E=el seleccionado tiene empleo.

¿Cu´al es la probabilidad de que el seleccionado sea una hombre dado que tiene empleo?

En la notaci´on establecida, lo que buscamos calcular es:P[M|E], que de acuerdo con la definici´on es:

P[M|E] = P[M∩E]

P[E] =

460/900 600/900 =

460 600

Como podemos observar de los ejemplos anteriores, la probabilidad condicional es una probabilidad concentrada en el conjunto que impone la condici´on, de esta forma se tiene que:

P[B|B] = 1

Ejemplo 24 La probabilidad de que un vuelo regular despegue de acuerdo con el itinerario es P(D) = 0,83; la probabilidad de que aterrice a tiempo esP(A) = 0,82; y la probabilidad de que despegue a tiempo y aterrice a tiempo esP[D∩A] = 0,78. Encuentre la probabilidad de que un vuelo regular:

1. Aterrice a tiempo, dado que despeg´o a tiempo.

2. Despegue a tiempo dado que aterriz´o a tiempo.

En t´erminos de probabilidad de eventos, la primera probabilidad pedida es:

P[A|D] = P[D∩A]

(47)

y la segunda es:

P[D|A] = P[D∩A]

P[A] = 0,78 0,82 = 0,95

Cabe entonces destacar el papel de la probabilidad condicional ya que esta permite realizar cálculos de probabilidad en los que se considera nueva información, estableciendo una expresión concreta para incorporar dicha información. De igual forma, la probabilidad condicional permite establecer con claridad la idea de eventos independientes que será expuesta en la siguiente sección.

3.3. Ley de probabilidades totales y teorema de Bayes

Para estudiar estos dos importantes resultados de la teor´ıa de probabilidad, necesitamos considerar pri-mero el concepto de partici´on de un espacio muestral Ω.

Definición 1 Una colección de eventosA1, A2,· · · , An se dice unaparticióndel espacio muestralΩsi

se cumple que:

Los eventos en la colecci´on son mutuamente excluyentes, es decir,Ai∩Aj =∅ para todo i6=j.

La uni´on de todos los elementos en la colecci´on da como resultadoΩ.

[

i

Ai= Ω

Una vez considerado el concepto de partici´on, la ley de probabilidades totales establece que si

A1,· · · , An es una partici´on de Ω, yB es otro evento en Ω, entonces:

P[B] = n X

k=1

P[B|Ai]P[Ai]

La prueba de este resultado es directa de considerar que la probabilidad del eventoB puede expresarse como la suma de las probabilidades deB interceptado con cada elemento de la partici´on y de la definici´on de probabilidad condicional, es decir:

P[B] = n X

i=1

P[Ai∩B] = n X

k=1

P[B|Ai]P[Ai]

Ejemplo 25 En una cierta planta de ensamblaje, tres m´aquinas M1,M2 y M3 hacen el 30,45 y 25 %

de los productos respectivamente. Por experiencia se sabe que2,3y 2 %de los productos hechos en cada m´aquina, respectivamente, son defectuosos. Si se selecciona un producto terminado de forma aleatoria, ¿cu´al es la probabilidad de que tenga defectos?

(48)

P[D] =P(D|M1)P[M1] +P(D|M2)P[M2] +P(D|M3)P[M3] = (0,02)(0,3) + (0,03)(0,45) + (0,02)(0,25)

= 0,0245

Consideramos ahora otro importante resultado conocido como regla de Bayes, que permite determinar la probabilidad de que se haya presentado un elemento de la partici´on, dado que ya se present´o el evento

B, como se muestra a continuaci´on.

3.3.1. Teorema de Bayes

Sea A1,· · ·, An una partici´on de Ω tal que P[Ai] 6= 0 para todo i, y sea B otro evento en Ω tal que

P[B]6= 0. Entonces:

P[Aj|B] =

P[B|Aj]P[Aj] Pn

i=1P[B|Ai]P[Ai]

La demostración de este resultado está basada simplemente en la definición de probabilidad condicional y en la ley de probabilidades totales, ya que:

P[Aj|B] =

P[Aj∩B]

P[B] =

P[B|Aj]P[Aj] Pn

i=1P[B|Ai]P[Ai]

Ejemplo 26 Continuando con el ejemplo anterior de la planta de ensamblaje y las tres máquinas, supon-gamos ahora que el producto seleccionado al azar está defectuoso, ¿cuál es la probabilidad de que provenga de la máquina 3?

P[M3|D] =

P[D|M3]P[M3]

P[D|M1]P[M1] +P[D|M2]P[M2] +P[D|M3]P[M3]

= 0,005 0,0245

3.4. Eventos independientes

Dos eventosAyBen el espacio muestral Ω se dicenestad´ısticamente independientessi y solo siP[A|B] =

P[A], es decir, la probabilidad de que ocurra el evento A no se ve afectada por la ocurrencia o no del eventoB, o de igual formaP[B|A] =P[B].

Si en las expresiones anteriores utilizamos la definici´on de probabilidad condicional, se tiene que:

P[A|B] =P[A] ⇒ P[A∩B]

(49)

P[B|A] =P[B] ⇒ P[B∩A]

P[A] =P[B] ⇒ P[B∩A] =P[B]P[A] luego se considera en lo que sigue, que dos eventosAyB son independientes si se tiene que:

P[A∩B] =P[A]P[B]

En general, si se consideranneventosA1, A2, ..., An, estos se dicen estad´ısticamente independientes si y solo si:

P[A1∩A2∩...∩An] =P[A1]P[A2]· · ·P[An]

Ejemplo 27 Cada d´ıa de la semana, de lunes a viernes, un lote de alimentos llega de un proveedor A

para ser inspeccionado por el departamento de salud. Dos d´ıas a la semana llega para inspección un lote de un proveedor B. 80 % de todos los lotes enviados por el proveedor A pasan la inspección, y el 90 % de lo enviado por el proveedor B la pasa. ¿Cuál es la probabilidad de que un d´ıa seleccionado al azar dos lotes pasen la inspección? Para responder a esta pregunta asumimos que los d´ıas en que los lotes son inspeccionados los resultados de la inspección son independientes entre s´ı.

2 L 1 L

0.4

0.6 F

P 0.8

0.2

F P 0.8

0.2 P

F P

F

0.9

0.1 0.9

0.1

El gráfico de árbol representa la situación y podemos observar que:

P[2pasen] =P[2recibidos∩2 Pasen]