Estadística y sus aplicaciones en Ciencias Sociales 2. Modelos de probabilidad

(1)

Estad´ıstica y sus aplicaciones en Ciencias Sociales

2. Modelos de probabilidad

Facultad de Ciencias Sociales Universidad de la Rep´ublica

(2)

´Indice

2.1. Variables aleatorias: funciones de distribuci´on, cuant´ıa, y

densidad. Modelos de probabilidad. Media y varianza de una variable aleatoria.

2.2. Modelos de probabilidad. Modelos discretos: Bernoulli, Binomial, Hipergeom´etrica, Poisson.

2.3. Modelos continuos: Uniforme, Normal, Chi-cuadrado y t-student. La Distribuci´on Normal Est´andar.

(3)

2.1. Funciones de distribuci´on, cuant´ıa y densidad

Para describir las probabilidades con que una variable aleatoria toma valores en distintos intervalos de la recta, de la forma (−∞,x] usamos una función definida en los números reales, la función de distribución.

Def. Sea X una variable aleatoria definida en el espacio de probabilidad (Ω,=,P(·)). La funci´onF :R→[0,1] definida por:

FX(x) =P(X ≤x) =P(X(ω)≤x) =P[{ω:X(ω)≤x}] se denomina funci´on de distribuci´on de la v. a. X.

(4)

Propiedades de la funci´on de distribuci´on: 1.- 0≤FX(x)≤1 ∀x

2.- FX(−∞) = 0 3.- FX(+∞) = 1

4.- Mon´otona creciente: para

x0<x00, FX(x0)≤FX(x00)

5.- F(x) es “continua por la derecha”: l´ım

(5)

Funci´on de Distribuci´on

La función de distribución (acumulativa) muestra qué manera se acumula la probabilidad a medida que se avanza ordenadamente por el recorrido de la variable (gráficamente de izquierda a derecha según los valores deX

(abscisas)).

Se denota con FX(x). Nos indica en cada puntox cu´al es la probabilidad acumulada hasta ese punto por los valores de X menores que ese x

(6)

Variables aleatorias discretas y continuas

-Variables aleatorias discretas: el número de resultados del experimento asociado no es necesariamente finito, pero es contable: los resultados pueden ser puestos en correspondencia con los números naturales (enteros positivos). Se puede enumerar cada resultado del espacio muestral y la probabilidad a éste asociada (función de cuant´ıa).

-Variables aleatorias continuas: asociadas a un experimento aleatorio cuyo resultado puede ser descrito por cualquier número real. El espacio de posibles resultados es infinito e incontable. La atribución de probabilidades a eventos y a los valores reales que los describen no se realiza a puntos en particular sino a intervalos de los números reales, utilizando la función de densidad.

(7)

Variables aleatorias discretas: funci´on de cuant´ıa

Def. La funci´on de cuant´ıapX(xi) de una variable aleatoria discreta se define como

pX(xi) =P(X =xi) para cada xi perteneciente al espacio muestral.

Propiedades: 1. 0≤pX(xi)≤1 ∀x

2.P

ipX(xi) = 1

La funci´on de distribuci´onFX(x) de una variable aleatoria discreta se define como:

FX(x0) =

X

x≤x0

(8)

Funciones de cuant´ıa y distribuci´on, variable discreta: 1 pX(x) Función de cuantía 1 2 3 4 1 FX(x) Función de distribución 1 2 3 4 x x

(9)

Variables aleatorias continuas y densidades

Una variable aleatoria X se define continua si existe una funci´onfX(x) tal que

FX(x) =

Z x −∞

fX(x)dx

para cada número realx. La funciónf(x) recibe el nombre de función de densidad de la variable aleatoria X.

Propiedades:

1.fX(x)≥0

(10)

La funci´on de densidad distribuye masa de probabilidad sobre los distintos intervalos de la recta real. La probabilidad de un punto en particular es ahora irrelevante (para una variable aleatoria continua es igual a cero): interesan las probabilidades de intervalos.

El área bajo la curva en toda la recta es igual a 1 (la integral es la medida del área bajo una función). La probabilidad de observar a la variable X en el intervalo [a,b] está dada por el área bajo la densidad entre a yb. El área bajo la densidad en el intervalo (−∞,x] recupera la función de distribución en el punto x.

En la pr´actica no es necesario calcular estas integrales pues sus valores se encuentran en tablas.

(11)

Probabilidad de observar una variable aleatoria continua en un intervalo: ´area bajo la funci´on de densidad

x1 x2 x f(x) P(x2 <X ≤x1) =FX(x2)−FX(x1) = Z x2 x1 fX(x)dx

(12)

Media o valor esperado de una variable aleatoria

Para una variable aleatoria discreta el valor esperado o media se define como:

µX =E(X) =

X

i

xipX(xi)

se suma los valores de la variable, ponderando por la probabilidad de cada uno de ellos. E(X) es una constante.

Para una variable aleatoria continua, el valor esperado se define como µX =E(X) =

Z +∞ −∞

xfX(x)dx

en este caso la media es una integral, donde ponderamos a todos los valores reales de x por la densidad.

(13)

Varianza de una variable aleatoria

La varianza de una variable aleatoria es el valor esperado de la desviaci´on de la media al cuadrado. Para una variable discreta:

σ2_X =V(X) =X i

(xi−µX)2pX(xi)

(suma ponderada de los desv´ıos de la media al cuadrado). Para una variable continua:

σ_X2 =V(X) =

Z +∞ −∞

(x−µX)2fX(x)dx

en este caso la varianza es una integral, donde se pondera los desv´ıos al cuadrado por la densidad.

(14)

Modelos de probabilidad

La variable aleatoria nos permite simplificar el manejo de la incertidumbre asociada a los resultados de cierto experimento aleatorio.

La incertidumbre original respecto al resultado de un experimento, se transforma en incertidumbre respecto a los valores que toma una variable aleatoria, descrita por sus funciones de densidad, cuant´ıa y distribuci´on.

Estudiaremos formas funcionales “tipo” de distribuci´on, densidad o cuant´ıa, para definir modelos de probabilidad, tambi´en conocidos como distribuciones de probabilidad.

(15)

Modelos de probabilidad

Son una descripción ideal del proceso aleatorio que genera los datos: cuando se elige determinada familia paramétrica de densidades como modelo de determinado fenómeno, se supone que los datos

observados son generados por el mecanismo aleatorio descrito por dichas densidades (o cuant´ıas).

Las densidades de una determinada familia comparten una forma funcional com´un, pero difieren en valores que las definen en forma completa, que reciben el nombre depar´ametros.

Si estamos convencidos acerca del modelo adecuado para describir los datos, nuestra incertidumbre se desplazará hacia determinar los valores de dichos parámetros (estimación).

(16)

Par´ametros. Espacio param´etrico

Definir un modelo implica especificar la forma funcional de la función de distribución o densidad. Además de x, dependerá de los parámetros, cantidades que usualmente designamos con la letra griega θ. Escribiremos el modelo de probabilidad como:

Φ ={f(x, θ), θ∈Θ}

Comprende un conjunto de funciones de densidad. 1. Tienen en común una forma funcional dadaf(x, θ). 2. Dependen de un vector de parámetros desconocidosθ. Los parámetros pertenecen a un conjunto de valores posibles Θ, denominado espacio paramétrico. La elección de un valor para θ determina en forma única una densidad particular.

(17)

2.2. Modelos de probabilidad discretos Modelo de Bernoulli

Describe experimentos (por ejemplo, el lanzamiento de una moneda) en los que s´olo pueden ocurrir dos resultados: uno de ellos con probabilidadp

(“´exito”) y el otro con probabilidad 1−p (“fracaso”): Ω ={E,F}. Asociamos X(E) = 1; X(F) = 0.

DEFINICI ´ON: Una variable aleatoriaX sigue una distribuci´on Bernoulli(p) si su cuant´ıa es la siguiente: pX(x) =    p X = 1 1−p X = 0 0 en otro caso con 0≤p ≤1.

(18)

El único parámetro de la distribución de Bernoulli esp (los parámetros permiten describir completamente el comportamiento de una variable aleatoria). Se escribeX ∼Bernoulli(p), ”X se distribuye o sigue una

distribuci´on Bernoulli de par´ametro p”.

Conocidop, se puede definir la función de cuant´ıa y la de distribución. La media o valor esperado de la distribución de Bernoulli es:

E(X) =X i xipX(xi) = 1·p+ 0·(1−p) =p La varianza es igual a: V(X) =X i (xi−µX)2pX(xi) = (1−p)2·p+ (0−p)2·(1−p) = (1−p) (1−p)·p+p2 =p(1−p)

(19)

Ejemplo: En el mercado de trabajo, la probabilidad de encontrar un trabajador desocupado es 0,07. Sea X la variable aleatoria que indica “el trabajador se encuentra desocupado” con el valor 1 y “no se encuentra desocupado” con el valor 0.

Función de Cuant´ıa Función de Distribución

pX(xi) =    0,93 x = 0 0,07 x = 1 0 otro caso FX(xi) =    0 x <0 0,93 0≤x <1 1 x ≥1

(20)

Distribuci´on binomial

Si se repite n veces de forma independiente una prueba de Bernoulli se obtiene un nuevo experimento. En éste se obtienexéxitos yn−x fracasos. La variable aleatoriaX que cuenta el número de éxitos en n realizaciones independientes de un experimento de Bernoulli con probabilidad p de “éxito” sigue una distribución binomial (con parámetros n yp). Esta distribución se representa con la expresiónX ∼B(x,n,p). La

distribuci´on de Bernoulli que vimos antes es un caso particular de la Binomial, d´onde n= 1. Binomial(x,1,p) =Bernoulli(p).

(21)

Ejemplo: Un examen de múltiple opción contiene 5 preguntas con seis alternativas cada una. Sólo una es correcta en cada caso. Un estudiante contesta al azar. Sea la variable aleatoria X = “número de preguntas respondidas correctamente”. ¿Cuál es la función de cuant´ıa de X? (La de distribución queda como ejercicio).

Contestaci´on al azar: lanzar un dado balanceado. Probabilidad de acertar la respuesta en cada pregunta = 1/6. Repite el procedimiento 5 veces. Se responde a las preguntas en forma independiente, con

(22)

Espacio de resultados: conjunto de vectores de cinco elementos que contienen fracasos y ´exitos:

Ω ={(EEEEE),(EEEEF),(EEEFE),(EEEFF), . . . ,(FFFFF)}

En total hay 25 = 32 resultados posibles (no son equiprobables).

Rec(X) ={0,1,2,3,4,5}. Encontrar la cuant´ıa pX(x) implica contar cu´antos de estos resultados dan exactamentex ´exitos (y n−x

fracasos).

En el caso de 0 ´exitos, un solo resultado produce este valor de X: (FFFFF). Hay 5 resultados que dan X = 1: (FFFFE), (FFFEF), (FFEFF), (FEFFF), (EFFFF) y as´ı sucesivamente.

(23)

Consideremos la probabilidad de un resultado particular, supongamos (EFFFF). La probabilidad de este resultado es la probabilidad conjunta del evento “´exito en la primera, fracaso en la segunda. . . etc.” Se trata de la intersecci´on de eventos independientes, por lo que las probabilidades del resultado en cada prueba se multiplican.

P(EFFFF) = 1 6 · 5 6 · 5 6 · 5 6 · 5 6 = 1 6 1 · 5 6 4

Para obtener la probabilidad de obtener x ´exitos y n−x fracasos en un orden dado se multiplica la probabilidad de ´exito en una prueba x veces por la probabilidad de fracason−x veces

1 6 x · 5 6 5−x

(24)

Pero cada par x, 5−x de éxitos y fracasos puedo obtenerlo de muchas maneras. ¿De cuántas maneras se puede obtener x éxitos y n-x fracasos? Para contarlas es preciso considerar las pruebas (1,2,3, . . . ,n), y encontrar de cuantas maneras puedo ubicar en ellas losx éxitos. El problema es equivalente a encontrar las maneras de seleccionar -de un conjunto de n -las x pruebas donde van a estar los éxitos.

Deseo “extraer” –definir como ´exito- ax de las n pruebas. Supongamos

x = 2. Tengo n maneras de definir el primer ´exito, y n−1 de definir el segundo. Esta manera de contar ordenamientos considera que “12” es diferente de “21”. Los considera distintos, “el orden importa”.

(25)

El n´umero de conjuntos dex ´exitos tomados entre n pruebas en un orden dado es

n·(n−1)·...·(n−x+ 1) = n! (n−x)!

Pero en nuestro caso no importa el orden. “12” es igual a “21”. Si los cuento con la f´ormula, cada ordenamiento estar´a repetidox! veces. Por tanto para contar los posibles casos eliminando las repeticiones debemos dividir por x!.

(26)

La cuenta de los ordenamientos de x de lasn pruebas sin importar el orden est´a dada por

n·(n−1)·...·(n−x+ 1)

x! =

n! (n−x)!x! o ¸combinaciones de n tomadas de a x”.

Esto permite volver a la cuant´ıa de X. La probabilidad de obtenerx ´exitos yn−x fracasos se obtiene multiplicando la probabilidad dex ´exitos y

n−x fracasos en un orden dado por la cantidad de resultados que dan x

´

exitos y n−x fracasos:

(27)

En nuestro ejemplo: pX(x) =                                      C₀5(0,167)0(0,833)5 = _5!0!5! ·0,401 = 0,401 x= 0 C₁5(0,167)1(0,833)4 = _1!4!5! ·0,08 = 0,402 x= 1 C₂5(0,167)2(0,833)3 = _2!3!5! ·0,016 = 0,160 x= 2 C₃5(0,167)3(0,833)2 = _3!2!5! ·0,003 = 0,032 x= 3 C₄5(0,167)4(0,833)1 = _4!1!5! ·0,0006 =,003 x= 4 C₅5(0,167)5(0,833)0 = 1·0,0001 = 0,0001 x= 5

(28)

Media de una variable Binomial

Si llamamos X1,X2, . . . ,Xn a las variables de Bernoulli que representan el resultado en cada uno de los ensayos, se cumple que:

X =X1+X2+. . .+Xn

Una suma de variables aleatorias es una variable aleatoria, que tiene su media. La media de la suma es la suma de las medias de los sumandos (no lo demostraremos). En este caso:

(29)

Varianza de una variable Binomial

En el caso de variables aleatorias independientes, se cumple adem´as que la varianza de la suma es igual a la suma de las varianzas. En este caso, como las variables X1,X2, . . . ,Xn son independientes, la varianza de

X es igual a:

(30)

Muestreo con reposici´on

El modelo binomial se asocia con la extracción de una muestra con reposición de una población dada (la selección de cada individuo para la muestra, verificando si posee cierto atributo, es una prueba).

Si el muestreo se realiza con reposici´on (luego de seleccionado un

elemento ´este es vuelto a considerar en la poblaci´on a muestrear) entonces la probabilidad p se mantiene incambiada y los resultados de las pruebas (tiene o no tiene el atributo) son independientes entre s´ı.

(31)

Distribuci´on Hipergeom´etrica

Seguimos considerando una variable X = no. de ´exitos en n pruebas con dos resultados posibles: Ω ={E,F}.

Cuando el muestreo se realiza sin reposición, cada extracción modifica la proporción de éxitos en la población. La probabilidad de éxito (condicional a los resultados de otras extracciones) no permanece igual de una

extracci´on a otra y las pruebas no son independientes (por tantoX no sigue una distribuci´on binomial).

En estos casos, debe aplicarse la distribución hipergeométricapara determinar la probabilidad de un número espec´ıfico de “éxitos” o “fracasos”.

(32)

El espacio de resultados es el conjunto de subconjuntos posibles de tama˜non. Est´a dado por C_nN

Entre los A”éxitos”, hayC_xA formas de extraer x éxitos. Entre los restantes N−A”fracasos“, pueden extraersen−x deC_nN₋−_xA formas posibles. El número de muestras conteniendo exactamentex éxitos yn−x

fracasos es el producto de dichos números. Para contar los éxitos y fracasos sólo importa si un elemento está incluida en la extracción y no el orden en que salió.

Los resultados son equiprobables, ya que cada subconjunto de n elementos tiene la misma probabilidad de ser extra´ıdo que cualquier otro.

(33)

Funci´on de cuant´ıa hipergeom´etrica:

pX(x) =

C_xAC_nN₋−_xA CN

n

- N : tama˜no de la poblaci´on.

- A: cantidad de elementos que poseen la caracter´ıstica “éxito”. - n : cantidad de elementos que se seleccionan sin reposición. Los parámetros de la Hipergeométrica son N,Ayn.

(34)

Ejemplo: En una fábrica trabajan tres hombres y tres mujeres. El capataz desea elegir dos trabajadores para una labor, al azar. X = número de mujeres en la selección. ¿Cuál es la función de cuant´ıa de X?

La selección de dos personas para formar un grupo es del tipo “extracción sin reposición”. La probabilidad de selección de la segunda persona cambia: los ensayos no son independientes.

La cantidad de maneras distintas de seleccionar dos personas entre los seis trabajadores es:

C₂6= 6! 2!4! =

6·5 2·1 = 15

Cada uno de estos grupos tiene la misma probabilidad de constituirse. En estos grupos puede haber 0, 1, o 2 mujeres.

(35)

Si en la selección hay 0 mujeres, de los tres hombres dos son elegidos. ¿Cuántas formas existen de esta particular combinación?:

C₀3·C₂3 = 1· 3! 2!1! = 3

el primer número corresponde a la selección de las mujeres y el segundo a la de los hombres. Los grupos en que hay una mujer (y un hombre) y dos mujeres y ningún hombre se calculan:

C₁3·C₁3= 3·3 = 9; C₂3·C₀3 = 3·1 = 3 La cuant´ıa es por lo tanto:

pX(x) =                    C₀3·C₂3/C₂6 = 3/15 x = 0 C3 1 ·C13/C26 = 9/15 x = 1 C₀3·C₂3/C₂6 = 3/15 x = 2 0 otro caso

(36)

Distribuci´on Poisson

Estamos interesados en contar la ocurrencia de sucesos “raros” (un n´umero entero, no negativo y en general peque˜no), que ocurren en un intervalo en un continuo como el espacio o tiempo. La variable aleatoria X

expresa el número de eventos en un intervalo dado. La intensidad con que aparecen dichos sucesos se representa mediante el parámetro positivo λ. Algunos ejemplos de experimentos aleatorios para los que se utiliza como modelo la distribución de Poisson:

-La cantidad de fallas por intervalo en un flujo continuo de producci´on -El n´umero de conexiones a una red en un per´ıodo de tiempo.

(37)

La notaci´on esX ∼Poisson(λ). La cuant´ıa de una variable que se

distribuye Poisson est´a dada por:

pX(x) =    e−λ_λx x! x= 0,1,2, ... 0 otro caso

λ >0 es el número medio de eventos que ocurren en un intervalo unitario. En este sentido x debe estar referida al mismo largo de intervalo que λ. Es un ejemplo de una distribución con un número infinito, aunque contable, de puntos en el espacio muestral. Las probabilidades tienden a cero a medida que el número de sucesos considerado se incrementa, ya que la suma de todas las probabilidades es igual a 1.

(38)

Poisson es una generalizaci´on de la distribuci´on binomial, en las

condiciones particulares en que n es muy grande mientras quep se hace muy peque˜no.

Consideremos los vuelos de avión, que son centenares de miles en un intervalo de tiempo dado. La probabilidad de un accidente aéreo es muy, muy baja, pero dado el alto número de vuelos se puede esperar un número pequeño de accidentes en dicho intervalo.

El modelo es aplicable a eventos que ocurren en un continuo (tiempo, espacio). En un intervalo finito hay infinidad de puntos, de los cuales sólo muy pocos contienen eventos (de ah´ı ”sucesos raros”). El modelo binomial se vuelve complicado debido a los números extremadamente grandes y pequeños que se manejar´ıan. La distribución Poisson puede verse como el caso l´ımite de la binomial cuandon →+∞ pero np→λ(fijo) con lo cual

(39)

La media o valor esperado de una variable aleatoria con distribuci´on de Poisson coincide con el par´ametro de intensidad, es decir:

E(X) =λ

En esta distribuci´on, la varianza toma el mismo valor que la media:

(40)

2.3. Modelos Continuos Distribuci´on Uniforme

Definición: La distribución uniforme en un intervalo dado [a,b], (con la notaciónX ∼U[a,b]), queda definida por la función de densidad:

pX(x) =    1 (b−a) a≤x≤b 0 otro caso fX(x) x 1/(b a) a b

(41)

Una variable aleatoria que expresa un n´umero elegido al azar entrea yb

sigue una distribuci´on uniforme. Como la probabilidad de que el n´umero k

est´e en cualquier intervalo de una amplitud dada es la misma, la funci´on de densidad tiene la misma altura en todos los puntos.

Media: La media de una variable aleatoria X con distribuci´on uniforme entre a yb es el punto medio entre estos dos valores, o sea:

E(X) = a+b 2 Varianza: V(X) = (b−a) 2 12

(42)

Distribuci´on Normal

La distribuci´on normal (o gaussiana) describe a una variable con

distribución simétrica con respecto a un valor central alrededor del cual se concentra gran parte de la masa de probabilidad y en la que los valores extremos son poco frecuentes. Es usual utilizarla como modelo para variables como peso, altura o calificación obtenida en un examen. Densidad: fX(x) = 1 √ 2πσe −1 2( x−µ σ ) 2

Depende de dos parámetros: mediaE(X) =µX, y desviación estándar

p

V(X) =σx. Cuanto menor la desviación estándar, mayor la concentración alrededor de la media. Cada variable normal queda especificada por sus valores particulares de media y desv´ıo estándar.

(43)

Simetr´ıa: es simétrica con respecto a la media, punto en que la función de densidad alcanza su valor máximo.

f(µ−a) =f(µ+a) Tambi´en las ”probabilidades de las colas”son iguales:

P{x<(µ−a)}=P{x>(µ+a)}

lo que puede ponerse en términos de la función de distribución como:

(44)

´

Areas bajo la curva normal

x f(x) µ µ+ µ _µ_{+ 2} _µ_{+ 3} µ 2 µ 3

El 68.3 % del área bajo la curva normal está comprendida en un intervalo una desviación estándar de amplitud centrado en la media. El 95.5 % del ´

area bajo la curva normal se encuentra a menos de dos desviaciones est´andar y el 99.7 % (casi la totalidad) a menos de tres desviaciones est´andar de la media.

(45)

Transformaciones

Una propiedad de las variables aleatorias normales es que sus transformaciones lineales tambi´en siguen una distribuci´on normal.

Si X ∼N(µx, σx2), entonces la variableY =aX+b tiene una distribución normal con media aµx+b y desviación estándar|a|σx.

Ejemplo:

La variable X ∼N(1,5,0,01) representa el tiempo en horas de cierto

proceso. Si Y expresa el mismo tiempo en minutos (Y = 60X), entonces la distribución deY es normal con media µy = 60(1,5) = 90 y desviación estándarσy = 60(0,1) = 6.

(46)

Normal est´andar

Si a una variable normal X ∼N(µx, σx2) le restamos su media y la

dividimos por su desviaci´on est´andar (.es_{tandarizaci´}_{on”), la variable normal}

est´andarZ resultante se distribuye N(0,1) :

X −µx σx

=Z ∼N(0,1)

Los valores obtenidosz representan la distancia a la media de lasx medida en unidades de la desviación estándar. Las tablas de la Normal(0,1) muestran las probabilidades P{Z ≤b} – áreas correspondiente a valores menores que b bajo la curva de la función de densidad N(0,1).

(47)

Probabilidades de intervalos

Se puede calcular las probabilidades para cualquier variable normal utilizando las tablas disponibles para la distribuci´on normal est´andar.

Si X es una variable normal con mediaµX y desviaci´onσX y queremos hallar P(X <b), recordamos que siZ = (X −µX)/σX, entonces

X =σXZ +µx, y por lo tanto: P(X ≤b) =P(σXZ+µX ≤b) =P Z ≤ b−µx σX

(48)

Tabla Normal:

La fila y columna en conjunto determinan el valorc. En la celda se encuentra las ´areas 1−α para los valores c =z1−α, donde

P(Z ≤c) = 1−α, y dondeZ tiene una distribuci´onN(0,1).

Z .00 .01 .02 .03 .04 .05 .06 .07 ... ... 0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 ... ... 0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 ... ... 0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 ... ... 0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 ... ... 0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 ... ... ... ... ... ... ... ... ... ... ... ... ... 1 1

(49)

Para probabilidades de intervalos abiertos por la derecha se puede usar

P(Z >a) = 1−P(Z ≤a)

La tabla solamente incluye las probabilidades acumuladas hasta valores de

Z mayores que 0. Para obtenerlas para valores menores que 0 se debe usar

P(Z <−c) =P(Z >c) = 1−P(Z ≤c).

La probabilidad P(a<Z ≤b),puede obtenerse a partir de :

(50)

Ejemplo:

El peso medio de los estudiantes varones de la FCS es de 69 kg y la desviación estándar de 10 kg. Suponiendo que los pesos están distribuidos normalmente, hallar la proporción de estudiantes que pesan entre 48 y 72 kg.

Estandarizando los valores se tiene:

P(48<X ≤72) =P(48−69 10 < X−69 10 ≤ 72−69 10 ) = P(−2,1<Z ≤0,3) =P(Z ≤0,3)−P(Z ≤ −2,1) = Φ(0,3)−Φ(−2,1) Usando tablas se obtiene 0,6179−0,0179 = 0,6.

(51)

Propiedad:

La suma de variables aleatorias normales e independientes tambi´en se distribuye normal.

Si X ∼N(µx, σ2x),Y ∼N(µy, σy2) y X e Y son independientes, entonces la suma X +Y se distribuye:

(52)

Distribuciones t-student y chi-cuadrado

Las distribuciones son Chi cuadrado y T de Student son familias de distribuciones asociadas a sucesiones de variables aleatorias normales. Distribuci´on χ2

Se considera Z1,Z2, . . . ,Zn, una sucesi´on de variables aleatorias

independientes que siguen todas ellas una distribuci´onN(0,1). La variable

X construida como X =Pn

i=1Zi2 se dice que sigue una distribuci´onχ2 (n) siendo n los “grados de libertad”, que en este caso indican la cantidad de variables N(0,1) en la suma.

(53)

La funci´on de densidad chi-cuadrado depende de los grados de libertad. La variable siempre toma valores positivos.

70 30 40 20 50 60 10 0 80 0.2 0.05 0.15 0.1 n = 4 n = 8 n = 20 n = 30 n = 50

(54)

Distribuci´on t de Student

Está caracterizada también por el parámetron, ”grados de libertad”, y usamos la notaciónX ∼t(n). Las probabilidades para distintos valores de n se encuentran en tablas. Una variableX con esta distribución tiene

E(X) = 0 yV(X) =n/(n−2).

Sea X1 ∼N(0,1) yX2∼χ2(n) dos variables aleatorias independientes,

entonces la expresi´on

t = pX1 X2/n

∼t(n)

El cociente entre una variable Normal (0,1) y la ra´ız de una chi-cuadrado dividida por sus grados de libertad sigue una distribuci´ont con n grados de libertad.

(55)

La densidad de la distribuci´ont se asemeja a la N(0,1) a medida que aumentan los grados de libertad.

x 0 5 -5 t(4) t(8) t(20) N(0,1)