DISTRIBUCIONES DE PROBABILIDAD.pdf

(1)

DISTRIBUCIONES DE PROBABILIDAD

Distribuciones estadísticas

Gráficos: diagramas de barras e histogramas.

Observemos las dos distribuciones dadas gráficamente a la izquierda. Ambas son distribuciones de frecuencia de variables cuantitativas (numéricas).

La de arriba corresponde a una variable discreta, pues solo puede tomar valores aislados (el número de aciertos puede ser, por ejemplo, 5 o 6, pero no un valor intermedio). Por eso la hemos representado mediante barras estrechas situadas sobre esos puntos y separadas unas de otras. Es un diagrama de barras. En él, las alturas de las barras son proporcionales a las respectivas frecuencias.

En la segunda distribución la variable es continua: cada individuo puede tener un valor situado en un punto cualquiera del intervalo al que pertenece. Por eso, en vez de barras, levantamos rectángulos que ocupan todo el intervalo. El gráfico se llama histograma.

En un histograma, las frecuencias correspondientes a los intervalos son proporcionales a las áreas de los respectivos rectángulos. Por eso, si las bases de los rectángulos son iguales, sus alturas son también proporcionales a las frecuencias.

Cálculo de los parámetros

x

y



Cuando la distribución viene dada mediante una tabla de frecuencias, las fórmulas para el cálculo de los parámetros adoptan las siguientes formas:













 

VARIANZA

TÍPICA

DESVIACIÓN

x

f

x

f

x

f

x

f

x

f

x

f

bien

O

f

x

f

x

f

x

f

x

f

VARIANZA

f

x

f

x

f

x

f

x

f

x

MEDIA

i i i

n n n

i i i

n

n n i

i i

n n n







































:

...

,

...

:

...

:

2 2 2

2 1

2 2

2 2 2 1 1 2

2

2 1

2 2

2 2 2 1 1 2

2 1

2 2 1 1

Distribuciones de probabilidad de variable discreta

Las distribuciones de probabilidad son idealizaciones teóricas de las distribuciones de frecuencias relativas, que se obtienen empíricamente (experimentando u observando). Cuando la variable es discreta, unas y otras se representan mediante diagramas de barras.

(2)

 Cadap_iesunnúmerocomprendidoentre 0y1: 0p_i1  Lasumadetodoslospies1: p1 p2...pn

_

pi1

 Serepresentamedianteundiagramadebarras

Parámetros. Se definen de forma similar a los parámetros de las distribuciones estadísticas:

























_



 



 

 

  

 

      

    

2 2 2

2 2

2 2 2 1 1 2

2 2

2 2 2 2 1 1 2

2 2 1 1

: ...

... :

 



 



 

 

i i i

i i i n

n

i i n

n i i n n

x p x

p VARIANZA

TÍPICA DESVIACIÓN

x p x

p x

p x p bien o

x p x

p x

p VARIANZA

x p x p x p x p MEDIA

Observemos las dos fórmulas de la varianza:

En la primera se ve claro el significado de la varianza: es una suma ponderada de los cuadrados de las diferencias de cada valor a la media.

La segunda es mucho más cómoda para calcular la varianza a partir de los datos. Pero, naturalmente, ambas con equivalentes.

La distribución binomial

Experiencia dicotómica

Si en una experiencia aleatoria destacamos un suceso A y prestamos atención, exclusivamente, a si ocurre A o su contrario, Ac, se trata de una experiencia dicotómica.

Al suceso A se le denomina éxito,y a su probabilidad, p(A) =p. La probabilidad de su contrario es p(Ac) = 1 – p=q

Ejemplos.

1.- Lanzar una moneda.

2.- Lanzar un dado y ver si sale 5. 3.- Lanzar una chincheta.

4.- Extraer una carta de una baraja y ver si es figura.

Distribución Binomial

Partimos de una experiencia dicotómica en la que p es la probabilidad de éxito. La repetimos n veces y observamos el número, x, de éxitos que se consiguen (la variable x es discreta porque toma los valores 0, 1, 2, …, n).

La distribución de probabilidad de x se llama distribución binomialB(n,p).

Ejemplos

1.- Lanzamos 10 monedas y nos preguntamos por el número de caras.

Lanzar una moneda es una experiencia dicotómica. Éxito: cara; p(cara) = p = 0,5

Lanzar 10 monedas es equivalente a lanzar 10 veces una moneda. Es, por tato, una distribución binomial B(10; 0,5).

2.- Lanzamos 6 dados correctos y nos preguntamos por el número de “cincos”. Es una distribución binomial con n=6, p=1/6. Es, por tanto, una distribución B(6, 1/6).

3.- Dejamos caer al suelo 100 chinchetas y contamos cuántas caen con la punta hacia arriba.

Suponemos que las chinchetas son todas del mismo tipo. Si es una binomial con n = 100 y p(caer

hacia arriba) = 0,3, entonces será B(100;0,3).

4.- Extraemos una carta de una baraja, observamos si es o no figura y la devolvemos al mazo. Barajamos y volvemos a extraer. Repetimos cinco veces la experiencia.

(3)

Cálculo de probabilidades en una distribución B(n, p)

Si x es una variable B(n,p), la probabilidad de obtener k éxitos es:





k nk q p k n k x

P _ 

      

Se obtiene así la siguiente distribución de probabilidad:

VARIABLE x PROBABILIDAD



x k



p  n n _q q p n        0 0

…….. _k _n _k

q p k n        ……

… n pnq pn n        0

Los parámetros de esta distribución son:

npq TÍPICA

DESVIACIÓN np

MEDIA: :

Distribuciones de probabilidad de variable continua

Las distribuciones de probabilidad de variable continua son idealizaciones de las distribuciones estadísticas de variable continua. Estas se obtienen empíricamente (experimentando u observando) Por ejemplo, estaturas, pesos, tiempos…, son variables continuas.

Las distribuciones de probabilidad de variable continua se definen por medio de una función, y=f(x), que se llama función de probabilidad o función de densidad cuyas condiciones describimos a continuación.

Para que f(x) sea la función de densidad o función de probabilidad de una variable aleatoria, es necesario que: 1 ) ( 0 ) ( : ) ( a igual sea x f y curva la bajo área El x todo para x f negativa no sea x f    





 





 











a x b

 

Pa x b



(4)

Parámetros

La media , y la desviación típica



, tienen los mismos significados que en las distribuciones estadísticas:

.

:

media

la

de

respecto

valores

los

de

separación

de

grado

el

Cuantifica

dispersión

la

de

medida

TÍPICA

DESVIACIÓN

ón

distribuci

la

de

gravedad

de

centro

MEDIA





Cálculo de probabilidades de la función de densidad y = f(x)

Ya sabemos que para calcular probabilidades en distribuciones de probabilidad de variable continua, hay que hallar las áreas bajo la curva que representa la función de densidad y= f(x). Pero, ¿cómo calcularlo de forma exacta cuando f(x) viene dada mediante su expresión analítica? El instrumento matemático que permite realizarlo es el cálculo integral. Sin embargo, hay distribuciones sencillas para las cuales la tarea es fácil. Por ejemplo, si la distribución es uniforme,



f(x)=k



, (gráfica del

margen), la P



axb



es el área de un rectángulo de base b-a y altura k:



a x b



P   = (b-a) . k

La distribución normal

La

curva normal

es una función de probabilidad

continua

y

simétrica

, cuyo máximo

coincide con la media,

.

Esta curva fue descrita por el matemático alemán Carl Friedrich Gauss. Llegó a ella estudiando los errores que se producen al medir reiteradamente una cierta magnitud. Estas son su ecuación y su representación gráfica:

2 2 1

2

1 

      

 



 

x e y

Por su forma acampanada se llama campana deGauss.

La gran importancia de esta distribución se debe a la enorme frecuencia con que aparece en las situaciones más variadas. Entre las muchas variables que se distribuyen “normalmente”, podemos citar:

Caracteres morfológicos de individuos: tallas, pesos, envergaduras, etc. Caracteres fisiológicos: efectos de un fármaco, de un abono, etc.

Caracteres sociológicos. Consumo de ciertos productos.

Caracteres físicos: resistencia a la rotura de piezas aparentemente idénticas.

Y, en general, cualquier característica que se obtenga como suma de muchos factores.

(5)

Reparto del área bajo la curva normal

Por ser una distribución de probabilidad, el área bajo una curva normal cualquiera es 1. Pero esta Área se distribuye del siguiente modo:

Esto significa que, por ejemplo, si el cociente intelectual (C.I.) de las personas de un cierto colectivo se distribuye N(112, 6), entonces:

 El 68,26% de ellos tienen un C.I. entre 106 y 118.

Todas las curvas normales son esencialmente iguales

Si en lugar de tomar 0,5 desviaciones típicas a la izquierda y 1,2 a la derecha de la media hubiéramos tomado otras dos constantes, las mismas en las dos curvas también las áreas serían iguales.

Esto significa que, en esencia, todas las curvas normales son idénticas, salvo un cambio de origen y de escala.

Esta coincidencia permite conocer la distribución de áreas bajo una curva normal cualquiera si se conoce la de una de ella. Concretamente, la más sencilla, la normal de media 0 y desviación típica 1. Las áreas bajo la curva normal N(0,1), es decir, sus probabilidades, son conocidas y están tabuladas. Con ellas podremos calcular probabilidades en una normal cualquiera, N(,



).

Tabla de áreas bajo la curva normal N(0,1)

Para facilitar las expresiones en los cambios de variable, en la distribución N(0,1), a la variable se la suele designar por la letra z. A las

probabilidades de k, se las llama: (k):





, 0,1)

)

(k Pzk z se distribuye N



Recordemos que en una distribución de variable continua las probabilidades puntuales son nulas:



xk



0

(6)

Cálculo de probabilidades en una distribución N(0,1)



 













 



1 



1 (

)

,

)

(

1

1 )

(

,

0 k

k

z

P

k

z

P

k

z

P

simétrica

es

curva

la

que

recordamos

negativas

abcisas

las

Para

k

z

P

k

z

P

tablas

las

en

te

directamen

encuentran

se

k

z

P

k

z

P

ades

probabilid

las

k

Si

















































Ejemplos

1.-

P



z1,73



1P



z1,73



1



(1,73)10,95820,0418

2.-

P



0,2z1,73







(1,43)



(0,21)0,90990,58320,3267

3.-



 







7860 , 0 1 7967 , 0 9893 , 0 1 ) 83 , 0 ( ) 3 , 2 ( ) ) 83 , 0 ( 1 ( ) 3 , 2 ( 83 , 0 ) 3 , 2 ( 83 , 0 3 , 2 3 , 2 83 , 0                         

 P z

z P z P z P

4.-

P



1,95z1

 

P1z1,95



1,95)(1))0,97440,84130,1331

Cálculo de probabilidades en una distribución N(

,)

(7)

Para establecer la relación con la N(0,1), habrá que expresar los extremos de los intervalos en número de desviaciones típicas que se separan de la media. A eso se llama tipificar la variable.

Si x es N(,



), para calcular la probabilidad













_









_













k

z

h

P

k

x

h

P

manera

la

de

procede

se

k

x

h

P

:









k

cambio

El

se llama tipificación de la variable .

La variable ya tipificada, z, sigue una distribución N(0,1)

La distribución binomial se aproxima a la normal

Para ciertos valores de n y p, las distribuciones binomiales tienen un extraordinario parecido con las correspondientes distribuciones normales.

En general, una binomial B(n, p) se parece a una curva normal tanto más cuanto mayor es el producto np (o nq, si q<p).

Cuando np y nq son ambos mayores que 3, la aproximación es bastante buena. Y si superan a 5, la aproximación es casi perfecta.

Naturalmente, la curva normal a la cual se aproxima tiene la misma media y la misma desviación típica que la binomial, es decir:

npq

np 

 



Regla práctica para calcular probabilidades mediante el paso de una binomial a una

normal

Si x es B(n, p) y se parece mucho a x, N(np, npq), el cálculo de probabilidades de x puede hacerse

a partir de x del siguiente modo:

P



xk

 

Pk0,5xk0,5



Es decir, a cada valor puntual de x (0, 1, 2, …, k, …, n) se le asocia xun intervalo centrado en k y de radio 0,5. Por tanto:



axb

 

Pa0,5xb0,5



P



axb

 

Pa0,5xb0,5



P



a x

 

Pa x



(8)

Ejemplos



 





 





3 5

 

3 4 5

 

2,5 5,5



5 , 4 5

, 3 4 5

3

5 , 4 5

, 2 4 3

5 3

   

 

   

   

   

   

 

  

x P

x o x o x P x

P

x P

x P x

P

x P

x o x P x