Propiedad reproductiva de la distribución normal.
Algunas distribuciones tienen la siguiente propiedad: Si dos o más variables aleatorias que tienen distribución de probabilidad del mismo tipo se suman, la variable aleatoria resultante tiene una distribución del mismo tipo de los sumandos. Esta propiedad, se llama propiedad reproductiva.
Teorema 1 Sean X1, X2, …,Xn , n variables aleatorias independientes donde
)
,
(
µ
σ
2N
X
i∼
, parai
=
1
,
2
,...,
n
. SiN
X
X
X
Y
=
1+
2+
...
+
Entonces la variable aleatoria Y se distribuye normal con media,
∑
∑
=
=
=
=
ni i
Y n
i i
Y
y
ianza
1 2 2
1
var
σ
σ
µ
µ
es decir,
)
,
(
1 2 1
∑
∑
= =
∼
ni i n
i i
N
Y
µ
σ
Ejemplo 1. Un brazo mecánico consta de tres partes. Suponga que cada parte es
una variable aleatoria producida por diferentes fabricas y cuya distribución de la longitud de cada una está dada por:
)
04
.
0
,
18
(
)
03
.
0
,
24
(
)
02
.
0
,
12
(
2 31
N
X
N
X
N
X
∼
∼
∼
donde la media estádada en centímetro y la varianza en centímetros cuadrados. Calcular la probabilidad que la longitud del brazo este comprendido entre 53.6 y 54.4.
El resultado anterior se puede generalizar a una combinación lineal de variables
aleatorias normales independientes X1, X2, …,Xn. Es decir,
n n
X
a
X
a
X
a
a
Y
=
0+
1 1+
2 2+
...
+
)
,
(
1 2 1
0
∑
∑
= =
+
∼
ni i i n
i i
i
a
a
a
N
Teorema Central del Límite
El teorema central del límite, es uno de los conceptos más importantes en estadística. Este teorema justifica la importancia de la distribución normal.
Teorema 2 (Teorema central del límite) Sea X1, X2, …,Xn, … una sucesión de
variables aleatorias independientes con E(Xi) = µi y varianza V(Xi) = σ2i (ambos
finitos).
Si Y= X1 + X2 + … + Xn=
∑
=
n
i i
X
1
, entonces bajo ciertas condiciones de generales, la
variable aleatoria Z definida por
∑
∑
∑
= =
−
==
n
i i n
i
n
i i i
X
Z
1 2
1 1
σ
µ
tiene una distribución aproximadamente normal estándar N(0,1), cuando n es suficientemente grande.
Las condiciones de generales mencionadas anteriormente, se pueden resumir
informalmente como sigue: los términos Xi tomados individualmente, contribuyen con
una cantidad despreciable a la variación de la suma, y no es probable que un simple término haga una gran contribución a la suma.
Observación
Observe que la variable Y =
∑
=
n
i i
X
1
puede ser aproximada a la distribución normal,
cualquiera sea la distribución de la Xi.
Teorema 3 Sean X1, X2, …,Xn, n variables aleatorias independientes idénticamente
distribuidas con E(Xi) = µ y varianza V(Xi) = σ2 (con media y varianza común y
ambas finitas).
Si Y= X1 + X2 + … + Xn=
∑
=
n
i i
X
1
, entonces la variable aleatoria:
n
n
X
n
n
X
Z
n
i i
/
/
1
σ
µ
σ
µ
−
=
−
donde
n
X
X
n
i i
∑
==
1(
X
se llama media muestral) tiene una distribuciónaproximadamente normal con media cero y varianza uno (N(0, 1))
Ejemplo 2 Las cajas entregadas por una fábrica tienen un peso medio de 300 libras
y una desviación estándar de 50 libras. ¿Cuál es la probabilidad de que 25 cajas tomadas al azar y cargadas en un camión exceden de la capacidad especificada del camión, que se sabe es de 8,200 libras? ¿Cuál es la probabilidad que el peso promedio de estas 25 cajas sea inferior a 320 libras?
Ejemplo 3 La longitud a que se puede estirar sin ruptura un filamento de Nylon es
Distribuciones muestrales
Definición 1 (muestra aleatoria) Sea X una variable aleatoria con función de
probabilidad f(x), con media µ y varianza σ2. Una muestra aleatoria de tamaño n, de
X es un conjunto de variables aleatorias X1, X2, …,Xn, que cumplen las siguientes
condiciones:
1. Cada Xi (i=1, 2, …, n) tiene la misma distribución de X. Es decir,
FXi(x) = FX(x) , i =1, 2, …, n
o
fXi(x) = fX(x) , i =1, 2, …, n
2. Las variables aleatorias Xi (i=1, 2, …, n) son independientes.
Consecuencias
1) Cada Xi tiene la misma distribución de X. Entonces
2
X
X
V
i
X
V
X
X
X
E
i
X
E
X
i i
σ
σ
µ
µ
====
====
====
====
====
====
)
(
)
(
)
(
)
(
2) La función de probabilidad conjunta de la muestra aleatoria X1, X2, …,Xn, está
dada por:
continua
es
X
si
x
f
x
f
x
f
x
x
f
discreta
es
X
si
x
p
x
p
x
p
x
x
p
n X X
X n
n X X
n X X
X n
n X X
)
(
*
...
*
)
(
*
)
(
)
,...,
(
)
(
*
...
*
)
(
*
)
(
)
,...,
(
,..., ,...,
2 1
1 1
2 1
1 1
====
====
Nota 1. La definición anterior se cumple, cuando proviene de una población infinita
discreta o continua y cuando la muestra se extrae con reemplazamiento de una población finita.
Nota 2. Cuando la muestra se extrae sin reemplazo de una población finita,
evidentemente no se satisface la definición de la muestra aleatoria, pues las
variables aleatorias X1, X2, …,Xn, no son independiente. Sin embargo si el tamaño
Ejemplo 4.- Suponga que X es una variable aleatoria normal estándar y que X1,
X2, …,X4, es una muestra aleatoria de X; se define
4
41
∑
=
i= iX
X
.Determinar
)
2
1
(
X
≥
P
Estadísticos y momentos muestrales.
Definición 2. Un estadístico es una variable aleatoria que depende solamente de la
muestra observada.
Ejemplo 5. Si X1, X2, …,Xn, es una muestra aleatoria de una población X, entonces
n
X
X
n
i i
∑
==
1 y1
)
(
22
−
∑
−
=
n
x
x
s
i
son estadísticos
La distribución de probabilidad de un estadístico se denomina distribución
muestral.
Definición 3. La desviación estándar de la distribución muestral de un estadístico,
se denomina el error estándar del estadístico.
Definición 4. Momentos muestrales Sea X1, X2, …,Xn una muestra aleatoria de
una población con función de densidad f(x). Entonces, el r-ésimo momento muestral
alrededor del origen cero, denotado por
M
r', se define:n
X
M
n
i r i
r
∑
=
=1 'en particular si r =1 se obtiene la media muestral
n
X
X
n
i i
∑
==
1El r-ésimo momento alrededor de la media muestral
X
se define por:n
X
X
M
n
i
r i
r
∑
−
=
=1)
(
Teorema 4. Si . X1, X2, …, Xn es una m.a. de una población X que tiene media µ y
varianza σ2, entonces
X
tiene valor esperado µ y varianza σ2/n.Teorema 5. Si . X1, X2, …, Xn es una muestra aleatoria extraída sin
reemplazamiento de una población finita de N elementos, con media µ y varianza
σ2
, entonces
X
tiene valor esperado µ y varianza σ2/n((N-n)/(N-1)).El factor(N-n)/(N-1) se llama factor de corrección para poblaciones finitas
Ejemplo 6. Determinar la media y la varianza de la media muestral extraída de una
población infinita.
Ejemplo 7. Una población X consta de 5 elementos
X
=
{
1
,
2
,
3
,
4
,
5
}
a) Calcular la media y la varianza de la población. b) Grafique la distribución de probabilidad de X
Se extrae una muestra aleatoria tamaño 2 de esta población con reemplazamiento
c) Escriba todas las muestras posibles de tamaño 2 de X
d) Calcular la media y la desviación estándar para cada una de las muestras. e) Calcular la esperanza de la media muestral y su desviación estándar. f) ¿Qué se verifica?
Ejemplo 8. Sea X una variable aleatoria con función de densidad de probabilidad
dada por:
<
<
=
.
.
.
0
2
0
,
4
)
(
3
c
o
e
x
x
x
f
De la cual se extrae una muestra aleatoria de tamaño 32. Hallar:
a) Probabilidad que la media muestra sea menor a 1,6 b) Probabilidad que la media muestra esté entre 1.5 y 1,6
DISTRIBUCIÓN CHI-CUADRADO
Definición 5: Sean Z1, Z2,…Zr, variables aleatorias independientes distribuídas
normalmente, cada una con media 0 y varianza 1. La variable aleatoria
2 2
2 2 1 2
r
Z
Z
Z
X
====
++++
++++
...
++++
Se dice que es una variable aleatoria chi-cuadrado con r grados de libertad (o que tiene una distribución chi-cuadrado con r grados de libertad) si su función de densidad está dado por
∞
∞
∞
∞
<<<<
<<<<
====
−−−− −−−−
c
o
e
x
e
x
x
f
x r r r X
.
.
)
(
)
(
/ / /
0
0
2
1
2 1 22 2
2
Γ
donde Γ representa la función gamma
Observe que los valores que toma la variable aleatoria chi-cuadrado, son todos los reales positivos, debido a que es una suma de cuadrados.
Grados de libertad r, es el número de variables aleatorias independientes que se suman. También el grado de libertad se puede concebir como un parámetro asociado con la distribución de probabilidad o como al número de variables que pueden variar libremente.
La media y la varianza de la variable aleatoria chi-cuadrado con r grados de libertad son:
r
x
Var
r
x
E
2
2 2
2
====
====
====
====
)
(
)
(
σ
µ
Debido a que distribución chi-cuadrado es importante en las aplicaciones, principalmente es inferencia estadística algunas de las cuales citaremos posteriormente: la función de distribución F(x) están preparados en tablas, para
valores seleccionados de r y x2. Por lo tanto, se puede encontrar en la tabla, la
probabilidad que la variable aleatoria X que tiene una distribución
χ
r2(1≤r≤30) seamenor o igual a un valor constante 2
α
χ , representado por
1 0
, ]
[X <χα2 =α <α < P
Es decir,
∫∫∫∫
====
∫∫∫∫
====
====
<<<<
2 2 −−−− −−−−0 0
2 1 2
2 2 2
2
1
α χα
α
α
χ
x r rr
r
x
e
dx
dx
x
f
X
P
)
(
)
(
]
[
Vea la figura:
α 1-α
x2
2
α
x
Note que P[X >χα2]=1−α
Ejemplo 9. Si X es una variable aleatoria χ172 . Calcular
a)
P
[
X
<<<<
7
.
564
]
:
b
)
P
]
X
>>>>
27
.
59
];
c
)
P
[
6
.
408
<<<<
X
<<<<
27
.
59
]
Teorema 6. Si X es una variable aleatoria que tiene una distribución chi-cuadrado
con r grados de libertad. Entonces para r suficientemente grande, la variable
aleatoria 2X , tiene aproximadamente una distribución N( 2r−1,1). Es decir, si X
es
2
r
χ
, con r grande, entonces)
,
(
2
1
1
2
X
→
→
→
→
N
r
−−−−
Luego, la variable aleatoria, Z =N 2X − 2r−1 tiene aproximadamente una
distribución N(0, 1) Por lo tanto, para r >30.
El teorema siguiente es una generalización del teorema anterior.
Teorema 7.. Sea X1, X2,…,Xn una muestra aleatoria de una variable aleatoria normal
X con media µ y varianza σ2. Entonces, la variable aleatoria
∑
∑
∑
∑
====
−−−−
====
ni i
X
Y
1
2 2
σ
µ
)
/
(
Teorema 8. (propiedad aditiva de la chi-cuadrado) Sea 22 2 2
1
X
X
pX
,
,...,
variablesaleatorias chi-cuadrados independientes con grados de libertad r1, r2,…,rp
respectivamente, entonces la variable aleatoria
2 2
2 2 1 2
p
X
X
X
X
====
++++
++++
...
++++
Sigue una distribución chi-cuadrado con grado de libertad igual a
∑
∑
∑
∑
====
====
pi i
r
r
1
Teorema 9. Sea X1, X2, …,Xn una muestra aleatoria de tamaño n de una población
normal con media µ y varianza σ2. Sea X yS2 la media muestral y varianza muestral
respectivamente, entonces
a) Las variables aleatorias 2
yS
X son independientes.
b) La función de la varianza muestral 2
2
) 1 (
σ
S n−
tiene una distribución 2
1 −
n
χ .
Demostración. Demostraremos sólo la parte b)
1. 1 2
2
2
2 ( )
) 1 (
σ σ
∑
=− =
−
n
i
i X
X S
n
2. La variable aleatoria
2 1
2
) (
σ µ
∑
=−
n
i i
X
tiene una distribución χn2, puesto que cada término (Xi −µ)/σ son variables
aleatorias normales estándar e independientes.
Ejemplo 10. Calcular P[0.618≤S2/σ2 ≤1.60], si S2 está basado en una muestra aleatoria de 11 observaciones de una variable aleatoria distribuida normalmente con
DISTRIBUCION t-STUDENT
DEFINICION: Sea Z una variable aleatoria normal con media 0 y varianza 1. Sea Y una variable que tiene una distribución chi-cuadrado con r grados de libertad, y si Z e Y son independientes, entonces la variable aleatoria
Y
r
Z
r
Y
Z
T
====
====
/
se dice que tiene una distribución t-de student (o simplemente tiene una distribución t), con r grados de libertad, y su función de densidad está dado por
∞
∞
∞
∞
<<<<
<<<<
∞
∞
∞
∞
−−−−
++++
++++
====
++++ −−−−
t
r
t
r
r
t
f
r
r
)
,
(
]
/
)
[(
)
(
/ ) ( 1 2 2
2
1
2
1
Γ
Γ
π
Observe que la distribución de la variable aleatoria T, está completamente determinado sólo por el parámetro r. Entonces hay una distribución t correspondiente a cada grado de libertad. En la figura se presenta un bosquejo de la función de densidad de la variable aleatoria T, para diferentes grados de libertad. En la misma figura se da, la gráfica de la normal estándar. Note, la simetría de la distribución t alrededor de t =0 y varía de menos infinito a más infinito.
La media y la varianza de la distribución t con r grados de libertad están dados por:
2
2
1
0
2
>>>>
−−−−
====
====
>>>>
====
====
r
r
r
T
Var
r
T
E
,
)
(
,
)
(
σ
µ
Tabulación de la distribución t. Debido a la importancia de la distribución t, en inferencia estadística y la dificultad para evaluar la función de distribución de la variable aleatoria T, éstas se dan en una tabla. Puesto que existe una distribución de áreas completas para todas las distribuciones t, que corresponden a los diferentes grados de libertad, se presenta en la tabla sólo un resumen de la información de cada una de estas distribuciones, para r=1, 2, …,30. En el encabezado de la columna de la izquierda, dice grados de libertad y cada fila de esta tabla corresponde a una distribución t, particular. Por lo tanto, la probabilidad que la
variable aleatoria T sea menos o igual a una constante t = tα, es decir
∫∫∫∫
−−−−∞∞∞∞====
====
≤≤≤≤
αα
α
t
T
z
dz
f
t
T
α
0 tα
Sea X1, X2,…,Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con
distribución N(µ, σ2), hemos visto:
1. La variable aleatoria (X −µ) n/σ tiene una distribución N(0, 1)
2. La variable aleatoria (n – 1) S2/σ2 tiene una distribución chi-cuadrado con n – 1
grados de libertad.
3. X y S2 son variables aleatorias independientes
De acuerdo con la definición de la variable aleatoria T, de (1) y (2), la variable aleatoria
S
n
X
n
S
n
n
X
(
)
1
/
)
1
(
)
(
2 2
µ
σ
µ
=
−
−
−
−
tiene una distribución t con n – 1 grados de libertad. Esta variable aleatoria se usa
Distribución de la diferencia de dos medias muestrales con varianzas desconocidas pero iguales.
Otro resultado importante, que frecuentemente se está interesado en examinar, es la
distribución de la variable X −Y , cuando no se conoce la varianza.
Sea X1, X2,…,Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con
distribución N(
µ
X,σ
2);Sea Y1, Y2,…, Yn una muestra aleatoria de tamaño m de unavariable aleatoria Y, con distribución N(
µ
Y,σ
2), sean también las dos muestraindependientes. Entonces se tiene:
1. La distribución de la variable aleatoria
2 1
2
2
2 ( )
) 1 (
σ
σ
∑
=− =
−
n
i i x
X X S
n
es una chi-cuadrado con n-1 grados de libertad y es independiente de X yY .
2. La distribución de la variable aleatoria
2 1
2
2
2 ( )
) 1 (
σ
σ
∑
=− =
−
n
i i Y
Y Y S
m
es chi-cuadrado con m-1 grados de libertad y es independientes de X,Y y 2
X
S
3. La distribución de la variable aleatoria
m n Y X
m n Y X
U X Y X Y
1 1
) (
) (
) (
) (
2 2
+ − − − = +
− − − =
σ
µ
µ
σ
σ
µ
µ
es normal estándar.
4. de (1) y (2) usando la propiedad reproductiva de la distribución chi-cuadrado, la variable aleatoria
2 2 2
2
) 1 ( ) 1 (
σ
σ
X YS m S
n
tiene una distribución chi-cuadrado con n + m –2 de libertad, y además está
distribuida independientemente de X −Y ; por lo tanto U y V son independientes.
Entonces de acuerdo con la definición de una variable aleatoria T de (3) y (4), la variable aleatoria m n m n S m S n Y X m n S m S n m n Y X m n V U Y X Y X Y X Y X 1 1 2 ) 1 ( ) 1 ( ) ( ) ( 2 / ] ) 1 ( ) 1 [( 1 1 ) ( ) ( 2 2 2 2 2 2 + − + − + − − − − = − + − + − + − − − = − +
µ
µ
σ
σ
µ
µ
tiene una distribución t con n + m – 2 grados de libertad, observe que esta variable
aleatoria no contiene σ.
DISTRIBUCION –F
En muchas situaciones interesados en comparar las varianzas de dos variables aleatorias independientes distribuidas normalmente, la que se describe anteriormente. En estos casos recurrimos a la distribución F que se define como sigue:
Sea U y V dos variables aleatoria independientes que tienen distribuciones
chi-cuadrado, r1 y r2 grados de libertad, respectivamente. Entonces, la variable aleatoria
2 1
r
V
r
U
F
/
/
====
tiene una distribución F con r1 y r2 grados de libertad. Su función de densidad está
dada por:
∞
∞
∞
∞
<<<<
<<<<
++++
====
++++ −−−− ++++c
o
e
z
r
r
z
r
z
f
r rr r r r r r F r r
.
.
,
,
)
(
.
)
(
)
(
)
(
)
(
( )/ ) / ( / /0
0
2 2 1 1 2 2 2 2 1 2 2 1 1 2 1 2 2 2 1 2 1Γ
Γ
Γ
La media y la varianza de la variable aleatoria F están dados por
2
2
2 2 2>>>>
−−−−
====
====
r
r
r
F
E
F
(
)
,
4
4
2
2
2
2 2
2 2 1
2 1 2 2 2
>>>>
−−−−
−−−−
−−−−
++++
====
====
r
r
r
r
r
r
r
F
Var
F
),
(
)
(
)
(
)
(
σ
La probabilidad que la variable aleatoria F sea menor o igual que una constante fα
está dada por
∫∫∫∫
====
====
<<<<
αα
α
f
F
z
dz
f
f
F
P
[
]
0(
)
r1, r2
α
0 fα
Entonces,
1 2 2
1
2 1 1
2
1 1
1
1
r r r
r
r r r
r
f
f
f
f
, , ,
,
, , ,
;
α α
α α
−−−− −−−−
Distribución de la razón de dos varianzas muestrales
Sea X1, X2,…,Xn una muestra aleatoria de tamaño n de una variable aleatoria
2
, ( ,N x x
X µ σ ). Sea Y1, Y2,…,Ym una muestra aleatoria de tamaño m de una variable
aleatoria Y con distribución N(
µ
Y,σ
Y2). Además suponga que X e Y sonindependientes. Entonces, la variable aleatoria,
2 4
1
2
2
2 ( )
) 1 (
X i
i
X X
X X S
n
σ
σ
∑
=− =
−
tiene una distribución chi-cuadrado con n-1 grados de libertad. De modo similar, la variable aleatoria
2 1
2
2
2 ( )
) 1 (
Y m
i i
Y Y
Y Y S
m
σ
σ
∑
=− =
−
tiene una distribución chi-cuadrado con m-1 grados de libertad. Además, las dos variables aleatorias chi-cuadrado son independientes por que X e Y son independientes. Entonces, de acuerdo con la definición de la variable aleatoria F, la variable aleatoria
2 2
2 2
2 2 2
2
/ / )
1 /( ) 1 (
) 1 /( ) 1 (
Y Y
X X
Y Y X
X
S S
m S m
n S n
σ
σ
σ
σ
=− −