DISTRIBUCIONES DE PROBABILIDAD..docx

(1)

DISTRIBUCIONES DE PROBABILIDAD

MAT II

1. DISTRIBUCIONES ESTADÍSTICAS

1.1. Gráficos: diagramas de barras e histogramas.

Observemos las dos distribuciones dadas gráficamente a la izquierda. Ambas son

distribuciones de frecuencia de variables cuantitativas (numéricas).

La de arriba corresponde a una variable discreta, pues solo puede tomar valores aislados (el número de aciertos puede ser, por ejemplo, 5 o 6, pero no un valor intermedio). Por eso la hemos representado mediante barras estrechas situadas sobre esos puntos y separadas unas de otras. Es un diagrama de barras. En él, las alturas de las barras son proporcionales a las respectivas frecuencias.

En la segunda distribución la variable es continua: cada individuo puede tener un valor situado en un punto cualquiera del intervalo al que pertenece. Por eso, en vez de barras, levantamos rectángulos que ocupan todo el intervalo. El gráfico se llama histograma.

En un histograma, las frecuencias correspondientes a los intervalos son

proporcionales a las áreas de los respectivos rectángulos. Por eso, si las bases de los rectángulos son iguales, sus alturas son también proporcionales a las frecuencias.

1.2. Cálculo de los parámetros

¯

x y σ

Cuando la distribución viene dada mediante una tabla de frecuencias, las fórmulas para el cálculo de los parámetros adoptan las siguientes formas:

MEDIA

:

¯

x

=

f

1

x

1

+

f

2

x

2

+

...

+

f

n

x

n

f

₁

+

f

₂

+

...

+

f

_n

=

∑

f

_i

x

_i

∑

f

_i

VARIANZA

:

σ

2

₌

f

1

(

x

1

− ¯

x

)

2

+

f

₂

₍

x

₂

− ¯

x

)

2

+

...

+

f

_n

₍

x

_n

− ¯

x

)

2

f

₁

+

f

₂

+

...

+

f

_n

=

∑

f

_i

₍

x

_i

− ¯

x

)

2

∑

f

_i

=

∑

f

_i

x

_i2

∑

f

_i

− ¯

x

2

DESVIACIÓN TÍPICA

:

σ

=

√

VARIANZA

2. DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA

2. 1. DEFINICIÓN.

Las distribuciones de probabilidad son idealizaciones de las distribuciones de frecuencias relativas (que se obtienen experimentando).

Una distribución de probabilidad de variable discreta es el resultado de asignar a cada valor de la variable xi, su probabilidad pi.

Cada pi es un número comprendido entre 0 y 1.

0≤

p

i

≤1

La suma de todas pi es 1.

∑

p

i

=

1

(2)

2. 2. PARÁMETROS.

Se definen de forma similar a los parámetros de las distribuciones estadísticas

MEDIA

μ

=

∑

p

i

· x

i

VARIANZA σ

2

=

∑

p_i·(x_i−μ)2=

∑

p_i· x

i2−μ

2

DESVIACIÓN TÍPICA

σ

=

√

var

ianza

=

√

∑

p

_i

· (

x

_i

−

μ

)

2

=

√

∑

p

_i

· x

i2

−

μ

2

2.3. LA DISTRIBUCIÓN BINOMIAL

Si en una experiencia aleatoria destacamos un suceso A y prestamos atención exclusivamente a si ocurre A o su

contrario, A´, se trata de una experiencia dicotómica.

Al suceso A se le llama éxito y a su probabilidad

p

(

A

)=

p

La probabilidad de su contrario, que se llama fracaso, es

p

(

A ´

)=1−

p

=

q

Por ejemplo son experiencias dicotómicas las siguientes:

a) Lanzar una moneda y ver si sale cara: A =”cara”, A´= ”no cara” = “ cruz”

p

=

p

(

cara

)=1/

2 q

=

p

(

cruz

)=1/

2

b) lanzar un dado y ver si sale 5:

A

=

{

5 }

,

A ´

=

{

1,2,3,4,6

}

p

=

p

(

A

)=1/

6 q

=

p

(

A ´

)=5/6

c) Extraer una carta de una baraja y ver si es figura:

A

=

{as,sota ,caballo,rey

},

A ´

=

{

1,2,3,4,6,7

}

p

=

p

(

figura

)=16/

40=0

´

4 q

=

p

(

nofigura

)=0

´

6

Partimos de una experiencia dicotómica en la que p es la probabilidad de éxito. La repetimos n veces y observamos el

número xide éxitos que se consiguen (la variable es discreta porque toma valores 0, 1, 2, …, n).

La distribución de probabilidad de x se llama distribución binomial B(n, p).

Ej:

Son distribuciones binomiales las siguientes:

a) Lanzamos 10 monedas y nos preguntamos por el número de caras.

Lanzar una moneda es una experiencia dicotómica. Éxito: cara; p(cara) = p = 0,5

Lanzar 10 monedas es equivalente a lanzar 10 veces una moneda. Es, por tato, una distribución binomial B(10; 0,5).

(3)

c) Dejamos caer al suelo 100 chinchetas y contamos cuántas caen con la punta hacia arriba.

Suponemos que las chinchetas son todas del mismo tipo. Si es una binomial con n = 100 y p(caer hacia arriba) = 0,3, entonces será B(100;0,3).

d) Extraemos una carta de una baraja, observamos si es o no figura y la devolvemos al mazo. Barajamos y volvemos a extraer. Repetimos cinco veces la experiencia.

Es una distribución binomial: n = 5, p = 0,4, entonces será B(5; 0,4).

3.1. CÁLCULO DE PROBABILIDADES EN UNA DISTRIBUCIÓN B(n, p)

Si x es una variable

B(n, p), la probabilidad de k éxitos es

p

[

x

=

k

]=

(

n

k

)

p

k

_·q

n−k

Se obtiene la siguiente distribución de probabilidad

Variable x

0 …

K

…

n

Probabilidad

p[x=k]

(

n

0 )

p

0

_·q

n−0

=

q

n

(

n

k

)

p

k

_·q

n−k

(

n

)

p

n

_·q

n−n

=

p

n

Los parámetros de esta distribución son

MEDIA μ=n·p

DESVIACIÓN TÍPICA

σ

=

√

n·p·q

Recuerda:

(

n

k

)

=

n!

k

!·

(

n

−

k

)

!

Ejemplo: La última novela de un autor ha tenido un gran éxito, hasta el punto que el 80% de los lectores ya la han

leído. Un grupo de 4 amigos son aficionados a la lectura.

a) ¿Cuál es la probabilidad de que dos personas del grupo hayan leído la novela?

n = 4, p = 0´8, q = 1 – 0´8 = 0´2

B(4, 0´8)

p

[

x

=

2 ]=

(

4

2 )

·

0 ´

8

2

_·

₀

_´

₂

4−2

=

4

·

3

2

·

0 ´

64

·

0 ´

02 =

0 ´

1536

b) ¿y cómo máximo 2?

p

[

x

≤

2 ]=

p

[

x

=

0 ]+

p

[

x

=

1 ]+

p

[

x

=

2 ]=

(

4

0 )

·

0 ´

8

0

_·

₀

_´

₂

4−0

+

(

4

1 )

·

0 ´

8

1

_·

₀

_´

₂

4−1

+

(

4

2 )

·

0 ´

8

2

_·

₀

_´

₂

4−2

(4)

Ejemplo: La probabilidad de que un artículo producido por una fábrica sea defectuoso es 0´02. Se envió un

cargamento de 10 000 artículos a unos almacenes. Hallar el número esperado de artículos defectuosos y la

desviación típica.

μ

=

10000

·

0 ´

02 =

200 σ

=

√

10000

·

0 ´

02

·

0 ´

98 =

14 3. DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE CONTINUA

3. 1. DEFINICIÓN.

Las distribuciones de probabilidad de variable continua son idealizaciones de las distribuciones estadísticas de variable continua. Estas se obtienen empíricamente (experimentando u observando) Por ejemplo, estaturas, pesos, tiempos…, son variables continuas.

Las distribuciones de probabilidad de variable continua se definen por medio de una función, y=f(x), que se llama función de probabilidad o función de densidad cuyas condiciones describimos a continuación.

Para que f(x) sea la función de densidad o función de probabilidad de una variable aleatoria, es necesario que:

¿ f(x) sea no negativa: f(x) ≥0 para todo x

(5)

¿ Par a hallar la probabilidad P

[

a≤x≤b

]

, obtenemos el área que hay bajo

la curva en el intervalo

[

a, b

]

:

P

[

a≤x≤b

]

=área bajo la curva en

[

a , b

]

¿ Las probabilidades de los sucesos puntuales son cero:

P

[

x=a

]

=0, P

[

x=b

]

=0,...

Por tanto:

P

[

a≤x≤b

]

=P

[

a<x<b

]

3.2. PARÁMETROS

La media μ , y la desviación típica σ , tienen los mismos significados que en las distribuciones estadísticas:

MEDIA

:

μ

:

centro de gravedad de la distribución

DESVIACIÓN TÍPICA

:

σ

:

medida de la dispersión

.

Cuantifica el grado de separación de los valores

respecto de la media

.

3.3. CÁLCULO DE PROBABILIDADES DE LA FUNCIÓN DE DENSIDAD y = f(x)

Ya sabemos que para calcular probabilidades en distribuciones de probabilidad de variable continua, hay que hallar las áreas bajo la curva que representa la función de densidad y= f(x). Pero, ¿cómo calcularlo de forma exacta cuando f(x) viene dada mediante su expresión analítica? El instrumento matemático que permite realizarlo es el cálculo integral. Sin embargo, hay distribuciones sencillas para las cuales la tarea es fácil. Por ejemplo, si la distribución es

uniforme,

[

f(x)= k

]

_{, (gráfica del margen), la}

P

[

a

≤

x

≤

b

]

_{es el área de un rectángulo de base b-a y altura k:}

P

[

a

≤

x

≤

b

]

_{= (b-a) · k}

3.4. LA DISTRIBUCIÓN NORMAL

La

curva normal

es una función de probabilidad

continua

y

simétrica

, cuyo máximo coincide con la media

μ _.

Esta curva fue descrita por el matemático alemán Carl Friedrich Gauss. Llegó a ella estudiando los errores que se producen al medir reiteradamente una cierta magnitud. Estas son su ecuación y su representación gráfica:

y= 1

σ

√

2π e

−1 2

(

x−μ σ

)

2

Por su forma acampanada se llama campana deGauss.

La gran importancia de esta distribución se debe a la enorme frecuencia con que aparece en las situaciones más variadas. Entre las muchas variables que se distribuyen “normalmente”, podemos citar:

Caracteres morfológicos de individuos: tallas, pesos, envergaduras, etc. Caracteres fisiológicos: efectos de un fármaco, de un abono, etc. Caracteres sociológicos. Consumo de ciertos productos.

Caracteres físicos: resistencia a la rotura de piezas aparentemente idénticas.

(6)

Para cada valor de μ (media), y cada valor de σ (desviación típica), hay una curva normal que se designa N( μ ,

σ ₎

Reparto del área bajo la curva normal

Por ser una distribución de probabilidad, el área bajo una curva normal cualquiera es 1. Pero esta Área se distribuye del siguiente modo:

Esto significa que, por ejemplo, si el cociente intelectual (C.I.) de las personas de un cierto colectivo se distribuye N(112, 6), entonces:

 El 68,26% de ellos tienen un C.I. entre 106 y 118.

Todas las curvas normales son esencialmente iguales

Si en lugar de tomar 0,5 desviaciones típicas a la izquierda y 1,2 a la derecha de la media hubiéramos tomado otras dos constantes, las mismas en las dos curvas también las áreas serían iguales.

Esto significa que, en esencia, todas las curvas normales son idénticas, salvo un cambio de origen y de escala.

Esta coincidencia permite conocer la distribución de áreas bajo una curva normal cualquiera si se conoce la de una de ella. Concretamente, la más sencilla, la normal de media 0 y desviación típica 1.

Las áreas bajo la curva normal N(0,1), es decir, sus probabilidades, son conocidas y están tabuladas. Con ellas podremos calcular probabilidades en una normal cualquiera, N( μ , σ ).

Tabla de áreas bajo la curva normal N(0,1)

Para facilitar las expresiones en los cambios de variable, en la distribución N(0,1), a la variable se la suele designar por la letra z. A las probabilidades de k, se las llama:

φ(k):

φ(k) =P

[

z≤k

]

, z se distribuye N0,1)

Recordemos que en una distribución de variable continua las probabilidades puntuales son nulas:

(7)

Cálculo de probabilidades en una distribución N(0,1)

¿

Si k

≥0

, las probabilidades P

[

z

≤

k

]

=

P

[

z

<

k

]

=

φ

(

k

)

se encuentran directamente en las tablas

⋅

P

[

z

≥

k

]

=

1 −

P

[

z

<

k

]

=

1 −

φ

(

k

)

⋅

Para las abcisas negativas , recordamos que la curva es simétrica ,

P

[

z

≤ −

k

]

=

P

[

z

≥

k

]

=

1 −

P

[

z

<

k

]

=

1 −

φ

(

k

)

Ejemplos

a)

P

[

z

≥1

,

73 ]

=

1 −

P

[

z

<1

,

73 ]

=

1 −

φ

(

1 ,

73 ) =

1 −

0 ,

9582

=

0 ,

0418

b)

P

[

0,2<

z

≤1

,

73 ]

=

φ

(1

,

43 ) −

φ

(

0 ,

21)=

0 ,

9099−

0 ,

5832

=

0 ,

3267

c)

P

[

−

0 ,

83 <

z

≤

2,3

]

=

P

[

z

≤

2,3

]

−

P

[

z

≤−

0 ,

83 ]

=

φ

(

2,3

) −

P

[

z

≥

0 ,

83 ]

=

φ

(

2,3

) − (

1 −

φ

(

0 ,

83 ) ) =

φ

(

2,3

) +

φ

(

0 ,

83 ) −

1 =

0 ,

9893

+

0 ,

7967

−

1 =

0 ,

7860

d)

P

[

−

1 ,

95 <

z

< −

1 ]

=

P

[

1 <

z

<−

1 ,

95 ]

=

φ

1 ,

95 ) −

φ

(

1 ) ) =

0 ,

9744

−

0 ,

8413

=

0 ,

1331

Cálculo de probabilidades en una distribución

N( μ , σ )

(8)

Para establecer la relación con la N(0,1), habrá que expresar los extremos de los intervalos en número de desviaciones típicas que se separan de la media. A eso se llama tipificar la variable.

Si x es N( μ , σ ), para calcular la probabilidad

P

[

h

<

x

<

k

]

se procede de la siguiente manera

:

P

[

h

<

x

<

k

]

=

P

[

h

−

μ

σ

<

z

<

k

−

μ

σ

]

El cambio k

→

k

−

μ

σ

_{se llama}_{tipificación de la variable}_.

La variable ya tipificada, z, sigue una distribución N(0,1)

La distribución binomial se aproxima a la normal

Para ciertos valores de n y p, las distribuciones binomiales tienen un extraordinario parecido con las correspondientes distribuciones normales.

En general, una binomial B(n, p) se parece a una curva normal tanto más cuanto mayor es el producto np (o nq, si q<p).

Cuando np y nq son ambos mayores que 3, la aproximación es bastante buena. Y si superan a 5, la aproximación es casi perfecta.

Naturalmente, la curva normal a la cual se aproxima tiene la misma media y la misma desviación típica que la binomial, es decir:

μ

=

np

σ

=

√

npq

Regla práctica para calcular probabilidades mediante el paso de una binomial a una normal