Estad´ıstica y sus aplicaciones en Ciencias Sociales
2. Modelos de probabilidad
Facultad de Ciencias Sociales Universidad de la Rep´ublica
´Indice
2.1. Variables aleatorias: funciones de distribuci´on, cuant´ıa, y
densidad. Modelos de probabilidad. Media y varianza de una variable aleatoria.
2.2. Modelos de probabilidad. Modelos discretos: Bernoulli, Binomial, Hipergeom´etrica, Poisson.
2.3. Modelos continuos: Uniforme, Normal, Chi-cuadrado y t-student. La Distribuci´on Normal Est´andar.
2.1. Funciones de distribuci´on, cuant´ıa y densidad
Para describir las probabilidades con que una variable aleatoria toma valores en distintos intervalos de la recta, de la forma (−∞,x] usamos una funci´on definida en los n´umeros reales, la funci´on de distribuci´on.
Def. Sea X una variable aleatoria definida en el espacio de probabilidad (Ω,=,P(·)). La funci´onF :R→[0,1] definida por:
FX(x) =P(X ≤x) =P(X(ω)≤x) =P[{ω:X(ω)≤x}] se denomina funci´on de distribuci´on de la v. a. X.
Propiedades de la funci´on de distribuci´on: 1.- 0≤FX(x)≤1 ∀x
2.- FX(−∞) = 0 3.- FX(+∞) = 1
4.- Mon´otona creciente: para
x0<x00, FX(x0)≤FX(x00)
5.- F(x) es “continua por la derecha”: l´ım
Funci´on de Distribuci´on
La funci´on de distribuci´on (acumulativa) muestra qu´e manera se acumula la probabilidad a medida que se avanza ordenadamente por el recorrido de la variable (gr´aficamente de izquierda a derecha seg´un los valores deX
(abscisas)).
Se denota con FX(x). Nos indica en cada puntox cu´al es la probabilidad acumulada hasta ese punto por los valores de X menores que ese x
Variables aleatorias discretas y continuas
-Variables aleatorias discretas: el n´umero de resultados del experimento asociado no es necesariamente finito, pero es contable: los resultados pueden ser puestos en correspondencia con los n´umeros naturales (enteros positivos). Se puede enumerar cada resultado del espacio muestral y la probabilidad a ´este asociada (funci´on de cuant´ıa).
-Variables aleatorias continuas: asociadas a un experimento aleatorio cuyo resultado puede ser descrito por cualquier n´umero real. El espacio de posibles resultados es infinito e incontable. La atribuci´on de probabilidades a eventos y a los valores reales que los describen no se realiza a puntos en particular sino a intervalos de los n´umeros reales, utilizando la funci´on de densidad.
Variables aleatorias discretas: funci´on de cuant´ıa
Def. La funci´on de cuant´ıapX(xi) de una variable aleatoria discreta se define como
pX(xi) =P(X =xi) para cada xi perteneciente al espacio muestral.
Propiedades: 1. 0≤pX(xi)≤1 ∀x
2.P
ipX(xi) = 1
La funci´on de distribuci´onFX(x) de una variable aleatoria discreta se define como:
FX(x0) =
X
x≤x0
Funciones de cuant´ıa y distribuci´on, variable discreta: 1 pX(x) Función de cuantía 1 2 3 4 1 FX(x) Función de distribución 1 2 3 4 x x
Variables aleatorias continuas y densidades
Una variable aleatoria X se define continua si existe una funci´onfX(x) tal que
FX(x) =
Z x −∞
fX(x)dx
para cada n´umero realx. La funci´onf(x) recibe el nombre de funci´on de densidad de la variable aleatoria X.
Propiedades:
1.fX(x)≥0
La funci´on de densidad distribuye masa de probabilidad sobre los distintos intervalos de la recta real. La probabilidad de un punto en particular es ahora irrelevante (para una variable aleatoria continua es igual a cero): interesan las probabilidades de intervalos.
El ´area bajo la curva en toda la recta es igual a 1 (la integral es la medida del ´area bajo una funci´on). La probabilidad de observar a la variable X en el intervalo [a,b] est´a dada por el ´area bajo la densidad entre a yb. El ´area bajo la densidad en el intervalo (−∞,x] recupera la funci´on de distribuci´on en el punto x.
En la pr´actica no es necesario calcular estas integrales pues sus valores se encuentran en tablas.
Probabilidad de observar una variable aleatoria continua en un intervalo: ´area bajo la funci´on de densidad
x1 x2 x f(x) P(x2 <X ≤x1) =FX(x2)−FX(x1) = Z x2 x1 fX(x)dx
Media o valor esperado de una variable aleatoria
Para una variable aleatoria discreta el valor esperado o media se define como:
µX =E(X) =
X
i
xipX(xi)
se suma los valores de la variable, ponderando por la probabilidad de cada uno de ellos. E(X) es una constante.
Para una variable aleatoria continua, el valor esperado se define como µX =E(X) =
Z +∞ −∞
xfX(x)dx
en este caso la media es una integral, donde ponderamos a todos los valores reales de x por la densidad.
Varianza de una variable aleatoria
La varianza de una variable aleatoria es el valor esperado de la desviaci´on de la media al cuadrado. Para una variable discreta:
σ2X =V(X) =X i
(xi−µX)2pX(xi)
(suma ponderada de los desv´ıos de la media al cuadrado). Para una variable continua:
σX2 =V(X) =
Z +∞ −∞
(x−µX)2fX(x)dx
en este caso la varianza es una integral, donde se pondera los desv´ıos al cuadrado por la densidad.
Modelos de probabilidad
La variable aleatoria nos permite simplificar el manejo de la incertidumbre asociada a los resultados de cierto experimento aleatorio.
La incertidumbre original respecto al resultado de un experimento, se transforma en incertidumbre respecto a los valores que toma una variable aleatoria, descrita por sus funciones de densidad, cuant´ıa y distribuci´on.
Estudiaremos formas funcionales “tipo” de distribuci´on, densidad o cuant´ıa, para definir modelos de probabilidad, tambi´en conocidos como distribuciones de probabilidad.
Modelos de probabilidad
Son una descripci´on ideal del proceso aleatorio que genera los datos: cuando se elige determinada familia param´etrica de densidades como modelo de determinado fen´omeno, se supone que los datos
observados son generados por el mecanismo aleatorio descrito por dichas densidades (o cuant´ıas).
Las densidades de una determinada familia comparten una forma funcional com´un, pero difieren en valores que las definen en forma completa, que reciben el nombre depar´ametros.
Si estamos convencidos acerca del modelo adecuado para describir los datos, nuestra incertidumbre se desplazar´a hacia determinar los valores de dichos par´ametros (estimaci´on).
Par´ametros. Espacio param´etrico
Definir un modelo implica especificar la forma funcional de la funci´on de distribuci´on o densidad. Adem´as de x, depender´a de los par´ametros, cantidades que usualmente designamos con la letra griega θ. Escribiremos el modelo de probabilidad como:
Φ ={f(x, θ), θ∈Θ}
Comprende un conjunto de funciones de densidad. 1. Tienen en com´un una forma funcional dadaf(x, θ). 2. Dependen de un vector de par´ametros desconocidosθ. Los par´ametros pertenecen a un conjunto de valores posibles Θ, denominado espacio param´etrico. La elecci´on de un valor para θ determina en forma ´unica una densidad particular.
2.2. Modelos de probabilidad discretos Modelo de Bernoulli
Describe experimentos (por ejemplo, el lanzamiento de una moneda) en los que s´olo pueden ocurrir dos resultados: uno de ellos con probabilidadp
(“´exito”) y el otro con probabilidad 1−p (“fracaso”): Ω ={E,F}. Asociamos X(E) = 1; X(F) = 0.
DEFINICI ´ON: Una variable aleatoriaX sigue una distribuci´on Bernoulli(p) si su cuant´ıa es la siguiente: pX(x) = p X = 1 1−p X = 0 0 en otro caso con 0≤p ≤1.
El ´unico par´ametro de la distribuci´on de Bernoulli esp (los par´ametros permiten describir completamente el comportamiento de una variable aleatoria). Se escribeX ∼Bernoulli(p), ”X se distribuye o sigue una
distribuci´on Bernoulli de par´ametro p”.
Conocidop, se puede definir la funci´on de cuant´ıa y la de distribuci´on. La media o valor esperado de la distribuci´on de Bernoulli es:
E(X) =X i xipX(xi) = 1·p+ 0·(1−p) =p La varianza es igual a: V(X) =X i (xi−µX)2pX(xi) = (1−p)2·p+ (0−p)2·(1−p) = (1−p) (1−p)·p+p2 =p(1−p)
Ejemplo: En el mercado de trabajo, la probabilidad de encontrar un trabajador desocupado es 0,07. Sea X la variable aleatoria que indica “el trabajador se encuentra desocupado” con el valor 1 y “no se encuentra desocupado” con el valor 0.
Funci´on de Cuant´ıa Funci´on de Distribuci´on
pX(xi) = 0,93 x = 0 0,07 x = 1 0 otro caso FX(xi) = 0 x <0 0,93 0≤x <1 1 x ≥1
Distribuci´on binomial
Si se repite n veces de forma independiente una prueba de Bernoulli se obtiene un nuevo experimento. En ´este se obtienex´exitos yn−x fracasos. La variable aleatoriaX que cuenta el n´umero de ´exitos en n realizaciones independientes de un experimento de Bernoulli con probabilidad p de “´exito” sigue una distribuci´on binomial (con par´ametros n yp). Esta distribuci´on se representa con la expresi´onX ∼B(x,n,p). La
distribuci´on de Bernoulli que vimos antes es un caso particular de la Binomial, d´onde n= 1. Binomial(x,1,p) =Bernoulli(p).
Ejemplo: Un examen de m´ultiple opci´on contiene 5 preguntas con seis alternativas cada una. S´olo una es correcta en cada caso. Un estudiante contesta al azar. Sea la variable aleatoria X = “n´umero de preguntas respondidas correctamente”. ¿Cu´al es la funci´on de cuant´ıa de X? (La de distribuci´on queda como ejercicio).
Contestaci´on al azar: lanzar un dado balanceado. Probabilidad de acertar la respuesta en cada pregunta = 1/6. Repite el procedimiento 5 veces. Se responde a las preguntas en forma independiente, con
Espacio de resultados: conjunto de vectores de cinco elementos que contienen fracasos y ´exitos:
Ω ={(EEEEE),(EEEEF),(EEEFE),(EEEFF), . . . ,(FFFFF)}
En total hay 25 = 32 resultados posibles (no son equiprobables).
Rec(X) ={0,1,2,3,4,5}. Encontrar la cuant´ıa pX(x) implica contar cu´antos de estos resultados dan exactamentex ´exitos (y n−x
fracasos).
En el caso de 0 ´exitos, un solo resultado produce este valor de X: (FFFFF). Hay 5 resultados que dan X = 1: (FFFFE), (FFFEF), (FFEFF), (FEFFF), (EFFFF) y as´ı sucesivamente.
Consideremos la probabilidad de un resultado particular, supongamos (EFFFF). La probabilidad de este resultado es la probabilidad conjunta del evento “´exito en la primera, fracaso en la segunda. . . etc.” Se trata de la intersecci´on de eventos independientes, por lo que las probabilidades del resultado en cada prueba se multiplican.
P(EFFFF) = 1 6 · 5 6 · 5 6 · 5 6 · 5 6 = 1 6 1 · 5 6 4
Para obtener la probabilidad de obtener x ´exitos y n−x fracasos en un orden dado se multiplica la probabilidad de ´exito en una prueba x veces por la probabilidad de fracason−x veces
1 6 x · 5 6 5−x
Pero cada par x, 5−x de ´exitos y fracasos puedo obtenerlo de muchas maneras. ¿De cu´antas maneras se puede obtener x ´exitos y n-x fracasos? Para contarlas es preciso considerar las pruebas (1,2,3, . . . ,n), y encontrar de cuantas maneras puedo ubicar en ellas losx ´exitos. El problema es equivalente a encontrar las maneras de seleccionar -de un conjunto de n -las x pruebas donde van a estar los ´exitos.
Deseo “extraer” –definir como ´exito- ax de las n pruebas. Supongamos
x = 2. Tengo n maneras de definir el primer ´exito, y n−1 de definir el segundo. Esta manera de contar ordenamientos considera que “12” es diferente de “21”. Los considera distintos, “el orden importa”.
El n´umero de conjuntos dex ´exitos tomados entre n pruebas en un orden dado es
n·(n−1)·...·(n−x+ 1) = n! (n−x)!
Pero en nuestro caso no importa el orden. “12” es igual a “21”. Si los cuento con la f´ormula, cada ordenamiento estar´a repetidox! veces. Por tanto para contar los posibles casos eliminando las repeticiones debemos dividir por x!.
La cuenta de los ordenamientos de x de lasn pruebas sin importar el orden est´a dada por
n·(n−1)·...·(n−x+ 1)
x! =
n! (n−x)!x! o ¸combinaciones de n tomadas de a x”.
Esto permite volver a la cuant´ıa de X. La probabilidad de obtenerx ´exitos yn−x fracasos se obtiene multiplicando la probabilidad dex ´exitos y
n−x fracasos en un orden dado por la cantidad de resultados que dan x
´
exitos y n−x fracasos:
En nuestro ejemplo: pX(x) = C05(0,167)0(0,833)5 = 5!0!5! ·0,401 = 0,401 x= 0 C15(0,167)1(0,833)4 = 1!4!5! ·0,08 = 0,402 x= 1 C25(0,167)2(0,833)3 = 2!3!5! ·0,016 = 0,160 x= 2 C35(0,167)3(0,833)2 = 3!2!5! ·0,003 = 0,032 x= 3 C45(0,167)4(0,833)1 = 4!1!5! ·0,0006 =,003 x= 4 C55(0,167)5(0,833)0 = 1·0,0001 = 0,0001 x= 5
Media de una variable Binomial
Si llamamos X1,X2, . . . ,Xn a las variables de Bernoulli que representan el resultado en cada uno de los ensayos, se cumple que:
X =X1+X2+. . .+Xn
Una suma de variables aleatorias es una variable aleatoria, que tiene su media. La media de la suma es la suma de las medias de los sumandos (no lo demostraremos). En este caso:
Varianza de una variable Binomial
En el caso de variables aleatorias independientes, se cumple adem´as que la varianza de la suma es igual a la suma de las varianzas. En este caso, como las variables X1,X2, . . . ,Xn son independientes, la varianza de
X es igual a:
Muestreo con reposici´on
El modelo binomial se asocia con la extracci´on de una muestra con reposici´on de una poblaci´on dada (la selecci´on de cada individuo para la muestra, verificando si posee cierto atributo, es una prueba).
Si el muestreo se realiza con reposici´on (luego de seleccionado un
elemento ´este es vuelto a considerar en la poblaci´on a muestrear) entonces la probabilidad p se mantiene incambiada y los resultados de las pruebas (tiene o no tiene el atributo) son independientes entre s´ı.
Distribuci´on Hipergeom´etrica
Seguimos considerando una variable X = no. de ´exitos en n pruebas con dos resultados posibles: Ω ={E,F}.
Cuando el muestreo se realiza sin reposici´on, cada extracci´on modifica la proporci´on de ´exitos en la poblaci´on. La probabilidad de ´exito (condicional a los resultados de otras extracciones) no permanece igual de una
extracci´on a otra y las pruebas no son independientes (por tantoX no sigue una distribuci´on binomial).
En estos casos, debe aplicarse la distribuci´on hipergeom´etricapara determinar la probabilidad de un n´umero espec´ıfico de “´exitos” o “fracasos”.
El espacio de resultados es el conjunto de subconjuntos posibles de tama˜non. Est´a dado por CnN
Entre los A”´exitos”, hayCxA formas de extraer x ´exitos. Entre los restantes N−A”fracasos“, pueden extraersen−x deCnN−−xA formas posibles. El n´umero de muestras conteniendo exactamentex ´exitos yn−x
fracasos es el producto de dichos n´umeros. Para contar los ´exitos y fracasos s´olo importa si un elemento est´a incluida en la extracci´on y no el orden en que sali´o.
Los resultados son equiprobables, ya que cada subconjunto de n elementos tiene la misma probabilidad de ser extra´ıdo que cualquier otro.
Funci´on de cuant´ıa hipergeom´etrica:
pX(x) =
CxACnN−−xA CN
n
- N : tama˜no de la poblaci´on.
- A: cantidad de elementos que poseen la caracter´ıstica “´exito”. - n : cantidad de elementos que se seleccionan sin reposici´on. Los par´ametros de la Hipergeom´etrica son N,Ayn.
Ejemplo: En una f´abrica trabajan tres hombres y tres mujeres. El capataz desea elegir dos trabajadores para una labor, al azar. X = n´umero de mujeres en la selecci´on. ¿Cu´al es la funci´on de cuant´ıa de X?
La selecci´on de dos personas para formar un grupo es del tipo “extracci´on sin reposici´on”. La probabilidad de selecci´on de la segunda persona cambia: los ensayos no son independientes.
La cantidad de maneras distintas de seleccionar dos personas entre los seis trabajadores es:
C26= 6! 2!4! =
6·5 2·1 = 15
Cada uno de estos grupos tiene la misma probabilidad de constituirse. En estos grupos puede haber 0, 1, o 2 mujeres.
Si en la selecci´on hay 0 mujeres, de los tres hombres dos son elegidos. ¿Cu´antas formas existen de esta particular combinaci´on?:
C03·C23 = 1· 3! 2!1! = 3
el primer n´umero corresponde a la selecci´on de las mujeres y el segundo a la de los hombres. Los grupos en que hay una mujer (y un hombre) y dos mujeres y ning´un hombre se calculan:
C13·C13= 3·3 = 9; C23·C03 = 3·1 = 3 La cuant´ıa es por lo tanto:
pX(x) = C03·C23/C26 = 3/15 x = 0 C3 1 ·C13/C26 = 9/15 x = 1 C03·C23/C26 = 3/15 x = 2 0 otro caso
Distribuci´on Poisson
Estamos interesados en contar la ocurrencia de sucesos “raros” (un n´umero entero, no negativo y en general peque˜no), que ocurren en un intervalo en un continuo como el espacio o tiempo. La variable aleatoria X
expresa el n´umero de eventos en un intervalo dado. La intensidad con que aparecen dichos sucesos se representa mediante el par´ametro positivo λ. Algunos ejemplos de experimentos aleatorios para los que se utiliza como modelo la distribuci´on de Poisson:
-La cantidad de fallas por intervalo en un flujo continuo de producci´on -El n´umero de conexiones a una red en un per´ıodo de tiempo.
La notaci´on esX ∼Poisson(λ). La cuant´ıa de una variable que se
distribuye Poisson est´a dada por:
pX(x) = e−λλx x! x= 0,1,2, ... 0 otro caso
λ >0 es el n´umero medio de eventos que ocurren en un intervalo unitario. En este sentido x debe estar referida al mismo largo de intervalo que λ. Es un ejemplo de una distribuci´on con un n´umero infinito, aunque contable, de puntos en el espacio muestral. Las probabilidades tienden a cero a medida que el n´umero de sucesos considerado se incrementa, ya que la suma de todas las probabilidades es igual a 1.
Poisson es una generalizaci´on de la distribuci´on binomial, en las
condiciones particulares en que n es muy grande mientras quep se hace muy peque˜no.
Consideremos los vuelos de avi´on, que son centenares de miles en un intervalo de tiempo dado. La probabilidad de un accidente a´ereo es muy, muy baja, pero dado el alto n´umero de vuelos se puede esperar un n´umero peque˜no de accidentes en dicho intervalo.
El modelo es aplicable a eventos que ocurren en un continuo (tiempo, espacio). En un intervalo finito hay infinidad de puntos, de los cuales s´olo muy pocos contienen eventos (de ah´ı ”sucesos raros”). El modelo binomial se vuelve complicado debido a los n´umeros extremadamente grandes y peque˜nos que se manejar´ıan. La distribuci´on Poisson puede verse como el caso l´ımite de la binomial cuandon →+∞ pero np→λ(fijo) con lo cual
La media o valor esperado de una variable aleatoria con distribuci´on de Poisson coincide con el par´ametro de intensidad, es decir:
E(X) =λ
En esta distribuci´on, la varianza toma el mismo valor que la media:
2.3. Modelos Continuos Distribuci´on Uniforme
Definici´on: La distribuci´on uniforme en un intervalo dado [a,b], (con la notaci´onX ∼U[a,b]), queda definida por la funci´on de densidad:
pX(x) = 1 (b−a) a≤x≤b 0 otro caso fX(x) x 1/(b a) a b
Una variable aleatoria que expresa un n´umero elegido al azar entrea yb
sigue una distribuci´on uniforme. Como la probabilidad de que el n´umero k
est´e en cualquier intervalo de una amplitud dada es la misma, la funci´on de densidad tiene la misma altura en todos los puntos.
Media: La media de una variable aleatoria X con distribuci´on uniforme entre a yb es el punto medio entre estos dos valores, o sea:
E(X) = a+b 2 Varianza: V(X) = (b−a) 2 12
Distribuci´on Normal
La distribuci´on normal (o gaussiana) describe a una variable con
distribuci´on sim´etrica con respecto a un valor central alrededor del cual se concentra gran parte de la masa de probabilidad y en la que los valores extremos son poco frecuentes. Es usual utilizarla como modelo para variables como peso, altura o calificaci´on obtenida en un examen. Densidad: fX(x) = 1 √ 2πσe −1 2( x−µ σ ) 2
Depende de dos par´ametros: mediaE(X) =µX, y desviaci´on est´andar
p
V(X) =σx. Cuanto menor la desviaci´on est´andar, mayor la concentraci´on alrededor de la media. Cada variable normal queda especificada por sus valores particulares de media y desv´ıo est´andar.
Simetr´ıa: es sim´etrica con respecto a la media, punto en que la funci´on de densidad alcanza su valor m´aximo.
f(µ−a) =f(µ+a) Tambi´en las ”probabilidades de las colas”son iguales:
P{x<(µ−a)}=P{x>(µ+a)}
lo que puede ponerse en t´erminos de la funci´on de distribuci´on como:
´
Areas bajo la curva normal
x f(x) µ µ+ µ µ+ 2 µ+ 3 µ 2 µ 3
El 68.3 % del ´area bajo la curva normal est´a comprendida en un intervalo una desviaci´on est´andar de amplitud centrado en la media. El 95.5 % del ´
area bajo la curva normal se encuentra a menos de dos desviaciones est´andar y el 99.7 % (casi la totalidad) a menos de tres desviaciones est´andar de la media.
Transformaciones
Una propiedad de las variables aleatorias normales es que sus transformaciones lineales tambi´en siguen una distribuci´on normal.
Si X ∼N(µx, σx2), entonces la variableY =aX+b tiene una distribuci´on normal con media aµx+b y desviaci´on est´andar|a|σx.
Ejemplo:
La variable X ∼N(1,5,0,01) representa el tiempo en horas de cierto
proceso. Si Y expresa el mismo tiempo en minutos (Y = 60X), entonces la distribuci´on deY es normal con media µy = 60(1,5) = 90 y desviaci´on est´andarσy = 60(0,1) = 6.
Normal est´andar
Si a una variable normal X ∼N(µx, σx2) le restamos su media y la
dividimos por su desviaci´on est´andar (.estandarizaci´on”), la variable normal
est´andarZ resultante se distribuye N(0,1) :
X −µx σx
=Z ∼N(0,1)
Los valores obtenidosz representan la distancia a la media de lasx medida en unidades de la desviaci´on est´andar. Las tablas de la Normal(0,1) muestran las probabilidades P{Z ≤b} – ´areas correspondiente a valores menores que b bajo la curva de la funci´on de densidad N(0,1).
Probabilidades de intervalos
Se puede calcular las probabilidades para cualquier variable normal utilizando las tablas disponibles para la distribuci´on normal est´andar.
Si X es una variable normal con mediaµX y desviaci´onσX y queremos hallar P(X <b), recordamos que siZ = (X −µX)/σX, entonces
X =σXZ +µx, y por lo tanto: P(X ≤b) =P(σXZ+µX ≤b) =P Z ≤ b−µx σX
Tabla Normal:
La fila y columna en conjunto determinan el valorc. En la celda se encuentra las ´areas 1−α para los valores c =z1−α, donde
P(Z ≤c) = 1−α, y dondeZ tiene una distribuci´onN(0,1).
Z .00 .01 .02 .03 .04 .05 .06 .07 ... ... 0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 ... ... 0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 ... ... 0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 ... ... 0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 ... ... 0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 ... ... ... ... ... ... ... ... ... ... ... ... ... 1 1
Para probabilidades de intervalos abiertos por la derecha se puede usar
P(Z >a) = 1−P(Z ≤a)
La tabla solamente incluye las probabilidades acumuladas hasta valores de
Z mayores que 0. Para obtenerlas para valores menores que 0 se debe usar
P(Z <−c) =P(Z >c) = 1−P(Z ≤c).
La probabilidad P(a<Z ≤b),puede obtenerse a partir de :
Ejemplo:
El peso medio de los estudiantes varones de la FCS es de 69 kg y la desviaci´on est´andar de 10 kg. Suponiendo que los pesos est´an distribuidos normalmente, hallar la proporci´on de estudiantes que pesan entre 48 y 72 kg.
Estandarizando los valores se tiene:
P(48<X ≤72) =P(48−69 10 < X−69 10 ≤ 72−69 10 ) = P(−2,1<Z ≤0,3) =P(Z ≤0,3)−P(Z ≤ −2,1) = Φ(0,3)−Φ(−2,1) Usando tablas se obtiene 0,6179−0,0179 = 0,6.
Propiedad:
La suma de variables aleatorias normales e independientes tambi´en se distribuye normal.
Si X ∼N(µx, σ2x),Y ∼N(µy, σy2) y X e Y son independientes, entonces la suma X +Y se distribuye:
Distribuciones t-student y chi-cuadrado
Las distribuciones son Chi cuadrado y T de Student son familias de distribuciones asociadas a sucesiones de variables aleatorias normales. Distribuci´on χ2
Se considera Z1,Z2, . . . ,Zn, una sucesi´on de variables aleatorias
independientes que siguen todas ellas una distribuci´onN(0,1). La variable
X construida como X =Pn
i=1Zi2 se dice que sigue una distribuci´onχ2 (n) siendo n los “grados de libertad”, que en este caso indican la cantidad de variables N(0,1) en la suma.
La funci´on de densidad chi-cuadrado depende de los grados de libertad. La variable siempre toma valores positivos.
70 30 40 20 50 60 10 0 80 0.2 0.05 0.15 0.1 n = 4 n = 8 n = 20 n = 30 n = 50
Distribuci´on t de Student
Est´a caracterizada tambi´en por el par´ametron, ”grados de libertad”, y usamos la notaci´onX ∼t(n). Las probabilidades para distintos valores de n se encuentran en tablas. Una variableX con esta distribuci´on tiene
E(X) = 0 yV(X) =n/(n−2).
Sea X1 ∼N(0,1) yX2∼χ2(n) dos variables aleatorias independientes,
entonces la expresi´on
t = pX1 X2/n
∼t(n)
El cociente entre una variable Normal (0,1) y la ra´ız de una chi-cuadrado dividida por sus grados de libertad sigue una distribuci´ont con n grados de libertad.
La densidad de la distribuci´ont se asemeja a la N(0,1) a medida que aumentan los grados de libertad.
x 0 5 -5 t(4) t(8) t(20) N(0,1)