1 DISTRIBUCIONES DE PROBABILIDAD DE
VARIABLE DISCRETA. LA BINOMIAL
1.1 DISTRIBUCIONES ESTADÍSTICAS
Se usan diagramas de barras, donde la altura de éstas representa la frecuencia de cada variable, para variables discretas. Para variables continuas se usan histogramas, que son diagramas en que la frecuencia viene determinada por rectángulos que ocupan todo el intervalo.
1.1.1 Cálculo de los parámetros media y varianza
Media:
∑
∑
= i i i f x f x Varianza: 2 2 2 2 ( ) x f x f f x x f s i i i i i i − = − =∑
∑
∑
∑
Desviación típica: x2 f x f s i i i − =∑
∑
1.2 CÁCLULO DE PROBABILIDADES
1.2.1 Sucesos aleatoriosSon los que dependen del azar. La proporción de veces que ocurre un suceso S es la
frecuencia relativa: fr(S) = f(S)/N 1.2.2 Probabilidad
[ ]
S lim fr(S) P N→∞ =Si todos los sucesos son equiprobables, podemos aplicar la Ley de Laplace:
[ ]
s elementale sucesos de total n S consta que de s elementale sucesos de n S P º º =1.2.3 Experiencias compuestas
Hay dos tipos:
– Extracciones con reemplazamiento: cada extracción se realiza en las mismas condiciones que la anterior.
– Extracciones sin reemplazamiento: las condiciones de cada extracción son distintas y dependen de cuál sea el elemento extraído anteriormente.
Son experiencias independientes si el resultado de una de ellas no influye en el resultado de las posteriores, y son dependientes si el resultado de una influye en las siguientes.
1.2.4 Cálculo de probabilidades en experiencias compuestas
Los descomponemos en sucesos simples
Experiencias independientes P[S1 en 1ª y S2 en 2ª] = P[S1 en 1ª] · P[S2 en 2ª] Experiencias dependientes P[S1 en 1ª y S2 en 2ª] = P[S1 en 1ª] · P[S2 en 2ª/S1 en 1ª] (probabilidad de S2 condicionada a S1)
1.3 NÚMEROS COMBINATORIOS
El número de combinaciones de m elementos tomados en grupos de n es
(
mn)
y se puede obtener por el triángulo de Tartaglia (que no veremos aquí) o por la siguiente fórmula:(
m n)
= m·(m−1)·(m−2)·...·(m−n+1) n ·(n−1)·(n−2)·...·3·2·1(
m n)
= m! n !·(m−n)!1.4 DISTRIBUCIONES DE PROBABILIDAD
1.4.1 Parámetros en una distribución de probabilidad Media: µ=
∑
(pi·xi) Varianza: 2 =∑
− 2 =∑
2 − 2 ) · ( ) ( µ µ σ pi xi pi xi Desviación típica: σ =∑
( −µ)2 i i x p1.5 DISTRIBUCIÓN BINOMIAL. DESCRIPCIÓN
Una experiencia dicotómica es una experiencia aleatoria en que prestamos atención a si ocurre un suceso A (éxito) o su contrario A’.
P[A] = p
P[A’] = 1 – p = q
Distribución binomial (B(n, p)) es la distribución de probabilidad de una repetición n veces de una experiencia dicotómica donde analizamos el número de éxitos.
1.5.1 Cálculo de probabilidades en una distribución binomial
Si x es una variable que sigue una distribución B(n, p), la probabilidad de obtener k éxitos es:
P[x=k] =
(
nk)
pk · qn-kMedia: µ = n · p Desviación típica: σ=
n · p · q1.5.2 Ajuste de un conjunto de datos a una distribución binomial
Para aceptar que un conjunto de datos empíricos se distribuyen según una binomial B(n, p), haremos lo siguiente:
– Igualamos la media de los datos obtenidos a la media de la teórica binomial. Así obtenemos el valor de p.
– Hallamos las probabilidades P[x=k] para cada valor de k , y lo multiplicamos por n para ver cómo se repartirían los n individuos en la distribución teórica. Según que la mayor diferencia entre el valor empírico y el teórico sea suficientemente pequeña, aceptamos o rechazamos la hipótesis de que los datos provengan de una binomial.
2 DISTRIBUCIONES DE VARIABLE CONTINUA
2.1 FUNCIONES DE PROBABILIDAD
f(x) es una función de densidad o función de probabilidad de una variable aleatoria si: – fx≥0∀x
– El área bajo la curva y = f(x) es igual a 1
P
[
a≤x≤b]
= área bajo la curva en el intervalo [a, b]La probabilidad de sucesos puntuales es cero, así que: P
[
a≤x≤b]
= P[a < x < b] Media (µ): Centro de gravedad de la distribuciónDesviación típica (σ): Medida de la dispersión (no las calcularemos)
2.1.1 Función de distribución
Función de distribución de una variable aleatoria t es la función F(x) que describe los valores que toma la probabilidad acumulada hasta la abscisa x:
Fx=P
[
t≤x]
lim x−∞ Fx=0 lim x∞ Fx=1Si sólo toma valores no nulos en un intervalo [a, b], entonces F(x) = 0 para x≤a y F(x) = 1 para x≥b .
2.2 DISTRIBUCIÓN NORMAL
La curva normal, o campana de Gauss es una función de probabilidad continua y simétrica cuyo máximo coincide con la media µ.
2.2.1 Distribución de probabilidades bajo una curva normal
P[µ−σ < x < µ+σ] = 0,6826 P[µ−2σ < x < µ+2σ] = 0,9544 P[µ−3σ < x < µ+3σ] = 0,9974
2.2.2 Cálculo de probabilidades de una distribución N(0, 1)
TABLA
– Si k ≥ 0. P[z < k] = Φ(k) – P[z > k] = 1 - P[z < k] = 1 – Φ(k) – Si k < 0. P[z < -k] = 1 – Φ(k)
2.2.3 Cálculo de probabilidades de una distribución N(µ, σ)
P
[
hxm]
=P[
h−μ σ z m−μ σ]
Cambiom−μ σ kEsto se llama tipificación de la variable (ahora sigue una distribución N(0, 1))
2.3 LA DISTRIBUCIÓN BINOMIAL SE APROXIMA A LA NORMAL
En una binomial B(n, p), cuando n·p y n·q son ambos mayores que 3, la aproximación es bastante buena, si son mayores que 5, es casi perfecta. Se aproxima a una normal N(np,
npq ).Como en una normal la probabilidad de un valor puntual es cero, y en una binomial sólo hay valores discretos, para calcular las probabilidades de una binomial usando la tabla de la normal, asociamos a cada valor puntual de x un interrvalo centrado en k y de radio 0,5.
3 DISTRIBUCIONES BIDIMENSIONALES
3.1 NUBES DE PUNTOS. CORRELACIÓN
Si estudiamos dos variables x, y en un conjunto n de individuo:
Distribución bidimensional es el conjunto de pares de valores (x1, y1), (x2, y2),…, (xn,
yn).
Nube de puntos o diagrama de dispersión es la representación de esos pares de valores como puntos en un eje de coordenadas.
La correlación es la relación entre ambas variables para los n individuos. Puede ser más o menos fuerte según lo que se aproximen a una recta que marca la tendencia (recta de regresión). La correlación será positiva o negativa según el signo de la pendiente de la recta.
3.2 MEDIDA DE LA CORRELACIÓN
3.2.1 Centro de gravedad de una distribución bidimensional
Media de la variable x: ̄x=
∑
xin
Media de la variable y: ̄y=
∑
yin
El punto (̄x ,̄y ) es el centro de gravedad.
3.2.2 Covarianza σxy=
∑
(xi−̄x)(yi−̄y) n =∑
xiyi n −̄x̄y 3.2.3 Correlación r= σxy σxσy siendo σx=
∑
xi2 n −x 2 Propiedades: – No tiene dimensiones3.3 RECTA DE REGRESIÓN
3.3.1 Método de los mínimos cuadrados
Es la recta en la cual la suma de los cuadrados de las distancias de todos los puntos es mínima. Pasa por el centro de gravedad de la nube de puntos. Su ecuación es:
y=̄y+σxy
σ2x (x−̄x)
La pendiente σxy
σx2 es el coeficiente de regresión de Y sobre X. 3.3.2 Recta de regresión de X sobre Y
x=xσxy
σ2y y−y
El coeficiente de regresión de Y sobre X, σxy
σ2y no es la pendiente de esta recta sino su
inversa.
Según el valor de la correlación, el ángulo de ambas rectas de regresión será próximo a 90º cuando r sea próximo a 0, y será casi 0 cuando |r| sea próximo a 1.
3.4 TABLAS DE DOBLE ENTRADA
Una entrada son las x y otra las y. En cada casilla se pone la frecuencia correspondiente al par de valores.
Para representarlo gráficamente hay varios métodos:
– Hinchando los puntos proporcionalmente a su frecuencia
– Levantando barras de altura proporcional a las frecuencias de las correspondientes casillas.