1 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA. LA BINOMIAL

(1)

1 DISTRIBUCIONES DE PROBABILIDAD DE

VARIABLE DISCRETA. LA BINOMIAL

1.1 DISTRIBUCIONES ESTADÍSTICAS

Se usan diagramas de barras, donde la altura de éstas representa la frecuencia de cada variable, para variables discretas. Para variables continuas se usan histogramas, que son diagramas en que la frecuencia viene determinada por rectángulos que ocupan todo el intervalo.

1.1.1 Cálculo de los parámetros media y varianza

Media:

∑

= i i i f x f x Varianza: 2 2 2 2 ( ) _x f x f f x x f s i i i i i i − = − =

∑

Desviación típica: _x2 f x f s i i i − =

∑

1.2 CÁCLULO DE PROBABILIDADES

1.2.1 Sucesos aleatorios

Son los que dependen del azar. La proporción de veces que ocurre un suceso S es la

frecuencia relativa: fr(S) = f(S)/N 1.2.2 Probabilidad

[ ]

S lim fr(S) P N→∞ =

Si todos los sucesos son equiprobables, podemos aplicar la Ley de Laplace:

[ ]

s elementale sucesos de total n S consta que de s elementale sucesos de n S P º º =

(2)

1.2.3 Experiencias compuestas

Hay dos tipos:

– Extracciones con reemplazamiento: cada extracción se realiza en las mismas condiciones que la anterior.

– Extracciones sin reemplazamiento: las condiciones de cada extracción son distintas y dependen de cuál sea el elemento extraído anteriormente.

Son experiencias independientes si el resultado de una de ellas no influye en el resultado de las posteriores, y son dependientes si el resultado de una influye en las siguientes.

1.2.4 Cálculo de probabilidades en experiencias compuestas

Los descomponemos en sucesos simples

Experiencias independientes P[S1 en 1ª y S2 en 2ª] = P[S1 en 1ª] · P[S2 en 2ª] Experiencias dependientes P[S1 en 1ª y S2 en 2ª] = P[S1 en 1ª] · P[S2 en 2ª/S1 en 1ª] (probabilidad de S2 condicionada a S1)

1.3 NÚMEROS COMBINATORIOS

El número de combinaciones de m elementos tomados en grupos de n es

(

m_n

)

y se puede obtener por el triángulo de Tartaglia (que no veremos aquí) o por la siguiente fórmula:

(

m n

)

= m·(m−1)·(m−2)·...·(m−n+1) n ·(n−1)·(n−2)·...·3·2·1

(

m n

)

= m! n !·(m−n)!

1.4 DISTRIBUCIONES DE PROBABILIDAD

(3)

1.4.1 Parámetros en una distribución de probabilidad Media: µ=

∑

(p_i·x_i) Varianza: 2 =

∑

− 2 =

∑

2 − 2 ) · ( ) ( µ µ σ pi xi pi xi Desviación típica: _σ =

∑

₍ −_µ₎2 i i x p

1.5 DISTRIBUCIÓN BINOMIAL. DESCRIPCIÓN

Una experiencia dicotómica es una experiencia aleatoria en que prestamos atención a si ocurre un suceso A (éxito) o su contrario A’.

P[A] = p

P[A’] = 1 – p = q

Distribución binomial (B(n, p)) es la distribución de probabilidad de una repetición n veces de una experiencia dicotómica donde analizamos el número de éxitos.

1.5.1 Cálculo de probabilidades en una distribución binomial

Si x es una variable que sigue una distribución B(n, p), la probabilidad de obtener k éxitos es:

P[x=k] =

(

n_k

)

pk_{· q}n-k

Media: µ = n · p Desviación típica: σ=



n · p · q

1.5.2 Ajuste de un conjunto de datos a una distribución binomial

Para aceptar que un conjunto de datos empíricos se distribuyen según una binomial B(n, p), haremos lo siguiente:

– Igualamos la media de los datos obtenidos a la media de la teórica binomial. Así obtenemos el valor de p.

– Hallamos las probabilidades P[x=k] para cada valor de k , y lo multiplicamos por n para ver cómo se repartirían los n individuos en la distribución teórica. Según que la mayor diferencia entre el valor empírico y el teórico sea suficientemente pequeña, aceptamos o rechazamos la hipótesis de que los datos provengan de una binomial.

(4)

2 DISTRIBUCIONES DE VARIABLE CONTINUA

2.1 FUNCIONES DE PROBABILIDAD

f(x) es una función de densidad o función de probabilidad de una variable aleatoria si: – _f__x_≥₀_∀_x

– El área bajo la curva y = f(x) es igual a 1

P

[

a≤x≤b

]

= área bajo la curva en el intervalo [a, b]

La probabilidad de sucesos puntuales es cero, así que: P

[

a≤x≤b

]

= P[a < x < b] Media (µ): Centro de gravedad de la distribución

Desviación típica (σ): Medida de la dispersión (no las calcularemos)

2.1.1 Función de distribución

Función de distribución de una variable aleatoria t es la función F(x) que describe los valores que toma la probabilidad acumulada hasta la abscisa x:

Fx=P

[

t≤x

]

lim x−∞ Fx=0 lim x∞ Fx=1

Si sólo toma valores no nulos en un intervalo [a, b], entonces F(x) = 0 para x≤a y F(x) = 1 para x≥b .

2.2 DISTRIBUCIÓN NORMAL

La curva normal, o campana de Gauss es una función de probabilidad continua y simétrica cuyo máximo coincide con la media µ.

2.2.1 Distribución de probabilidades bajo una curva normal

P[µ−σ < x < µ+σ] = 0,6826 P[µ−2σ < x < µ+2σ] = 0,9544 P[µ−3σ < x < µ+3σ] = 0,9974

(5)

2.2.2 Cálculo de probabilidades de una distribución N(0, 1)

TABLA

– Si k ≥ 0. P[z < k] = Φ(k) – P[z > k] = 1 - P[z < k] = 1 – Φ(k) – Si k < 0. P[z < -k] = 1 – Φ(k)

2.2.3 Cálculo de probabilidades de una distribución N(µ, σ)

P

[

hxm

]

=P

[

h−μ σ z m−μ σ

]

Cambiom−μ σ k

Esto se llama tipificación de la variable (ahora sigue una distribución N(0, 1))

2.3 LA DISTRIBUCIÓN BINOMIAL SE APROXIMA A LA NORMAL

En una binomial B(n, p), cuando n·p y n·q son ambos mayores que 3, la aproximación es bastante buena, si son mayores que 5, es casi perfecta. Se aproxima a una normal N(np,

_

npq ).

Como en una normal la probabilidad de un valor puntual es cero, y en una binomial sólo hay valores discretos, para calcular las probabilidades de una binomial usando la tabla de la normal, asociamos a cada valor puntual de x un interrvalo centrado en k y de radio 0,5.

(6)

3 DISTRIBUCIONES BIDIMENSIONALES

3.1 NUBES DE PUNTOS. CORRELACIÓN

Si estudiamos dos variables x, y en un conjunto n de individuo:

Distribución bidimensional es el conjunto de pares de valores (x1, y1), (x2, y2),…, (xn,

yn).

Nube de puntos o diagrama de dispersión es la representación de esos pares de valores como puntos en un eje de coordenadas.

La correlación es la relación entre ambas variables para los n individuos. Puede ser más o menos fuerte según lo que se aproximen a una recta que marca la tendencia (recta de regresión). La correlación será positiva o negativa según el signo de la pendiente de la recta.

3.2 MEDIDA DE LA CORRELACIÓN

3.2.1 Centro de gravedad de una distribución bidimensional

Media de la variable x: ̄x=

∑

xi

n

Media de la variable y: ̄y=

∑

yi

n

El punto (̄x ,̄y ) es el centro de gravedad.

3.2.2 Covarianza σ_xy=

∑

(xi−̄x)(yi−̄y) n =

∑

x_iy_i n −̄x̄y 3.2.3 Correlación r= σxy σ_xσ_y siendo σx=



∑

x_i2 n −x 2 Propiedades: – No tiene dimensiones

(7)

3.3 RECTA DE REGRESIÓN

3.3.1 Método de los mínimos cuadrados

Es la recta en la cual la suma de los cuadrados de las distancias de todos los puntos es mínima. Pasa por el centro de gravedad de la nube de puntos. Su ecuación es:

y=̄y+σxy

σ2_x (x−̄x)

La pendiente σxy

σ_x2 es el coeficiente de regresión de Y sobre X. 3.3.2 Recta de regresión de X sobre Y

x=xσxy

σ2_y y−y

El coeficiente de regresión de Y sobre X, σxy

σ2_y no es la pendiente de esta recta sino su

inversa.

Según el valor de la correlación, el ángulo de ambas rectas de regresión será próximo a 90º cuando r sea próximo a 0, y será casi 0 cuando |r| sea próximo a 1.

3.4 TABLAS DE DOBLE ENTRADA

Una entrada son las x y otra las y. En cada casilla se pone la frecuencia correspondiente al par de valores.

Para representarlo gráficamente hay varios métodos:

– Hinchando los puntos proporcionalmente a su frecuencia

– Levantando barras de altura proporcional a las frecuencias de las correspondientes casillas.