• No se han encontrado resultados

Teorema 3 Sean X1 ,X2

N/A
N/A
Protected

Academic year: 2019

Share "Teorema 3 Sean X1 ,X2"

Copied!
15
0
0

Texto completo

(1)

Propiedad reproductiva de la distribución normal.

Algunas distribuciones tienen la siguiente propiedad: Si dos o más variables aleatorias que tienen distribución de probabilidad del mismo tipo se suman, la variable aleatoria resultante tiene una distribución del mismo tipo de los sumandos. Esta propiedad, se llama propiedad reproductiva.

Teorema 1 Sean X1, X2, …,Xn , n variables aleatorias independientes donde

)

,

(

µ

σ

2

N

X

i

, para

i

=

1

,

2

,...,

n

. Si

N

X

X

X

Y

=

1

+

2

+

...

+

Entonces la variable aleatoria Y se distribuye normal con media,

=

=

=

=

n

i i

Y n

i i

Y

y

ianza

1 2 2

1

var

σ

σ

µ

µ

es decir,

)

,

(

1 2 1

= =

n

i i n

i i

N

Y

µ

σ

Ejemplo 1. Un brazo mecánico consta de tres partes. Suponga que cada parte es

una variable aleatoria producida por diferentes fabricas y cuya distribución de la longitud de cada una está dada por:

)

04

.

0

,

18

(

)

03

.

0

,

24

(

)

02

.

0

,

12

(

2 3

1

N

X

N

X

N

X

donde la media está

dada en centímetro y la varianza en centímetros cuadrados. Calcular la probabilidad que la longitud del brazo este comprendido entre 53.6 y 54.4.

El resultado anterior se puede generalizar a una combinación lineal de variables

aleatorias normales independientes X1, X2, …,Xn. Es decir,

n n

X

a

X

a

X

a

a

Y

=

0

+

1 1

+

2 2

+

...

+

)

,

(

1 2 1

0

= =

+

n

i i i n

i i

i

a

a

a

N

(2)

Teorema Central del Límite

El teorema central del límite, es uno de los conceptos más importantes en estadística. Este teorema justifica la importancia de la distribución normal.

Teorema 2 (Teorema central del límite) Sea X1, X2, …,Xn, … una sucesión de

variables aleatorias independientes con E(Xi) = µi y varianza V(Xi) = σ2i (ambos

finitos).

Si Y= X1 + X2 + … + Xn=

=

n

i i

X

1

, entonces bajo ciertas condiciones de generales, la

variable aleatoria Z definida por

= =

=

=

n

i i n

i

n

i i i

X

Z

1 2

1 1

σ

µ

tiene una distribución aproximadamente normal estándar N(0,1), cuando n es suficientemente grande.

Las condiciones de generales mencionadas anteriormente, se pueden resumir

informalmente como sigue: los términos Xi tomados individualmente, contribuyen con

una cantidad despreciable a la variación de la suma, y no es probable que un simple término haga una gran contribución a la suma.

Observación

Observe que la variable Y =

=

n

i i

X

1

puede ser aproximada a la distribución normal,

cualquiera sea la distribución de la Xi.

Teorema 3 Sean X1, X2, …,Xn, n variables aleatorias independientes idénticamente

distribuidas con E(Xi) = µ y varianza V(Xi) = σ2 (con media y varianza común y

ambas finitas).

Si Y= X1 + X2 + … + Xn=

=

n

i i

X

1

, entonces la variable aleatoria:

n

n

X

n

n

X

Z

n

i i

/

/

1

σ

µ

σ

µ

=

(3)

donde

n

X

X

n

i i

=

=

1

(

X

se llama media muestral) tiene una distribución

aproximadamente normal con media cero y varianza uno (N(0, 1))

Ejemplo 2 Las cajas entregadas por una fábrica tienen un peso medio de 300 libras

y una desviación estándar de 50 libras. ¿Cuál es la probabilidad de que 25 cajas tomadas al azar y cargadas en un camión exceden de la capacidad especificada del camión, que se sabe es de 8,200 libras? ¿Cuál es la probabilidad que el peso promedio de estas 25 cajas sea inferior a 320 libras?

Ejemplo 3 La longitud a que se puede estirar sin ruptura un filamento de Nylon es

(4)

Distribuciones muestrales

Definición 1 (muestra aleatoria) Sea X una variable aleatoria con función de

probabilidad f(x), con media µ y varianza σ2. Una muestra aleatoria de tamaño n, de

X es un conjunto de variables aleatorias X1, X2, …,Xn, que cumplen las siguientes

condiciones:

1. Cada Xi (i=1, 2, …, n) tiene la misma distribución de X. Es decir,

FXi(x) = FX(x) , i =1, 2, …, n

o

fXi(x) = fX(x) , i =1, 2, …, n

2. Las variables aleatorias Xi (i=1, 2, …, n) son independientes.

Consecuencias

1) Cada Xi tiene la misma distribución de X. Entonces

2

X

X

V

i

X

V

X

X

X

E

i

X

E

X

i i

σ

σ

µ

µ

====

====

====

====

====

====

)

(

)

(

)

(

)

(

2) La función de probabilidad conjunta de la muestra aleatoria X1, X2, …,Xn, está

dada por:

continua

es

X

si

x

f

x

f

x

f

x

x

f

discreta

es

X

si

x

p

x

p

x

p

x

x

p

n X X

X n

n X X

n X X

X n

n X X

)

(

*

...

*

)

(

*

)

(

)

,...,

(

)

(

*

...

*

)

(

*

)

(

)

,...,

(

,..., ,...,

2 1

1 1

2 1

1 1

====

====

Nota 1. La definición anterior se cumple, cuando proviene de una población infinita

discreta o continua y cuando la muestra se extrae con reemplazamiento de una población finita.

Nota 2. Cuando la muestra se extrae sin reemplazo de una población finita,

evidentemente no se satisface la definición de la muestra aleatoria, pues las

variables aleatorias X1, X2, …,Xn, no son independiente. Sin embargo si el tamaño

(5)

Ejemplo 4.- Suponga que X es una variable aleatoria normal estándar y que X1,

X2, …,X4, es una muestra aleatoria de X; se define

4

4

1

=

i= i

X

X

.

Determinar

)

2

1

(

X

P

Estadísticos y momentos muestrales.

Definición 2. Un estadístico es una variable aleatoria que depende solamente de la

muestra observada.

Ejemplo 5. Si X1, X2, …,Xn, es una muestra aleatoria de una población X, entonces

n

X

X

n

i i

=

=

1 y

1

)

(

2

2

=

n

x

x

s

i

son estadísticos

La distribución de probabilidad de un estadístico se denomina distribución

muestral.

Definición 3. La desviación estándar de la distribución muestral de un estadístico,

se denomina el error estándar del estadístico.

Definición 4. Momentos muestrales Sea X1, X2, …,Xn una muestra aleatoria de

una población con función de densidad f(x). Entonces, el r-ésimo momento muestral

alrededor del origen cero, denotado por

M

r', se define:

n

X

M

n

i r i

r

=

=1 '

en particular si r =1 se obtiene la media muestral

n

X

X

n

i i

=

=

1

El r-ésimo momento alrededor de la media muestral

X

se define por:

n

X

X

M

n

i

r i

r

=

=1

)

(

(6)

Teorema 4. Si . X1, X2, …, Xn es una m.a. de una población X que tiene media µ y

varianza σ2, entonces

X

tiene valor esperado µ y varianza σ2/n.

Teorema 5. Si . X1, X2, …, Xn es una muestra aleatoria extraída sin

reemplazamiento de una población finita de N elementos, con media µ y varianza

σ2

, entonces

X

tiene valor esperado µ y varianza σ2/n((N-n)/(N-1)).

El factor(N-n)/(N-1) se llama factor de corrección para poblaciones finitas

Ejemplo 6. Determinar la media y la varianza de la media muestral extraída de una

población infinita.

Ejemplo 7. Una población X consta de 5 elementos

X

=

{

1

,

2

,

3

,

4

,

5

}

a) Calcular la media y la varianza de la población. b) Grafique la distribución de probabilidad de X

Se extrae una muestra aleatoria tamaño 2 de esta población con reemplazamiento

c) Escriba todas las muestras posibles de tamaño 2 de X

d) Calcular la media y la desviación estándar para cada una de las muestras. e) Calcular la esperanza de la media muestral y su desviación estándar. f) ¿Qué se verifica?

Ejemplo 8. Sea X una variable aleatoria con función de densidad de probabilidad

dada por:



<

<

=

.

.

.

0

2

0

,

4

)

(

3

c

o

e

x

x

x

f

De la cual se extrae una muestra aleatoria de tamaño 32. Hallar:

a) Probabilidad que la media muestra sea menor a 1,6 b) Probabilidad que la media muestra esté entre 1.5 y 1,6

(7)

DISTRIBUCIÓN CHI-CUADRADO

Definición 5: Sean Z1, Z2,…Zr, variables aleatorias independientes distribuídas

normalmente, cada una con media 0 y varianza 1. La variable aleatoria

2 2

2 2 1 2

r

Z

Z

Z

X

====

++++

++++

...

++++

Se dice que es una variable aleatoria chi-cuadrado con r grados de libertad (o que tiene una distribución chi-cuadrado con r grados de libertad) si su función de densidad está dado por











<<<<

<<<<

====

−−−− −−−−

c

o

e

x

e

x

x

f

x r r r X

.

.

)

(

)

(

/ / /

0

0

2

1

2 1 2

2 2

2

Γ

donde Γ representa la función gamma

Observe que los valores que toma la variable aleatoria chi-cuadrado, son todos los reales positivos, debido a que es una suma de cuadrados.

Grados de libertad r, es el número de variables aleatorias independientes que se suman. También el grado de libertad se puede concebir como un parámetro asociado con la distribución de probabilidad o como al número de variables que pueden variar libremente.

La media y la varianza de la variable aleatoria chi-cuadrado con r grados de libertad son:

r

x

Var

r

x

E

2

2 2

2

====

====

====

====

)

(

)

(

σ

µ

Debido a que distribución chi-cuadrado es importante en las aplicaciones, principalmente es inferencia estadística algunas de las cuales citaremos posteriormente: la función de distribución F(x) están preparados en tablas, para

valores seleccionados de r y x2. Por lo tanto, se puede encontrar en la tabla, la

probabilidad que la variable aleatoria X que tiene una distribución

χ

r2(1≤r≤30) sea

menor o igual a un valor constante 2

α

χ , representado por

1 0

, ]

[Xα2 =α <α < P

Es decir,

∫∫∫∫

====

∫∫∫∫

====

====

<<<<

2 2 −−−− −−−−

0 0

2 1 2

2 2 2

2

1

α χα

α

α

χ

x r r

r

r

x

e

dx

dx

x

f

X

P

)

(

)

(

]

[

(8)

Vea la figura:

α 1-α

x2

2

α

x

Note que P[Xα2]=1−α

Ejemplo 9. Si X es una variable aleatoria χ172 . Calcular

a)

P

[

X

<<<<

7

.

564

]

:

b

)

P

]

X

>>>>

27

.

59

];

c

)

P

[

6

.

408

<<<<

X

<<<<

27

.

59

]

Teorema 6. Si X es una variable aleatoria que tiene una distribución chi-cuadrado

con r grados de libertad. Entonces para r suficientemente grande, la variable

aleatoria 2X , tiene aproximadamente una distribución N( 2r−1,1). Es decir, si X

es

2

r

χ

, con r grande, entonces

)

,

(

2

1

1

2

X

N

r

−−−−

Luego, la variable aleatoria, Z =N 2X − 2r−1 tiene aproximadamente una

distribución N(0, 1) Por lo tanto, para r >30.

El teorema siguiente es una generalización del teorema anterior.

Teorema 7.. Sea X1, X2,…,Xn una muestra aleatoria de una variable aleatoria normal

X con media µ y varianza σ2. Entonces, la variable aleatoria

====

−−−−

====

n

i i

X

Y

1

2 2

σ

µ

)

/

(

(9)

Teorema 8. (propiedad aditiva de la chi-cuadrado) Sea 22 2 2

1

X

X

p

X

,

,...,

variables

aleatorias chi-cuadrados independientes con grados de libertad r1, r2,…,rp

respectivamente, entonces la variable aleatoria

2 2

2 2 1 2

p

X

X

X

X

====

++++

++++

...

++++

Sigue una distribución chi-cuadrado con grado de libertad igual a

====

====

p

i i

r

r

1

Teorema 9. Sea X1, X2, …,Xn una muestra aleatoria de tamaño n de una población

normal con media µ y varianza σ2. Sea X yS2 la media muestral y varianza muestral

respectivamente, entonces

a) Las variables aleatorias 2

yS

X son independientes.

b) La función de la varianza muestral 2

2

) 1 (

σ

S n

tiene una distribución 2

1 −

n

χ .

Demostración. Demostraremos sólo la parte b)

1. 1 2

2

2

2 ( )

) 1 (

σ σ

=

− =

n

i

i X

X S

n

2. La variable aleatoria

2 1

2

) (

σ µ

=

n

i i

X

tiene una distribución χn2, puesto que cada término (Xi −µ)/σ son variables

aleatorias normales estándar e independientes.

Ejemplo 10. Calcular P[0.618≤S2/σ2 ≤1.60], si S2 está basado en una muestra aleatoria de 11 observaciones de una variable aleatoria distribuida normalmente con

(10)

DISTRIBUCION t-STUDENT

DEFINICION: Sea Z una variable aleatoria normal con media 0 y varianza 1. Sea Y una variable que tiene una distribución chi-cuadrado con r grados de libertad, y si Z e Y son independientes, entonces la variable aleatoria

Y

r

Z

r

Y

Z

T

====

====

/

se dice que tiene una distribución t-de student (o simplemente tiene una distribución t), con r grados de libertad, y su función de densidad está dado por

<<<<

<<<<

−−−−













++++

++++

====

++++ −−−−

t

r

t

r

r

t

f

r

r

)

,

(

]

/

)

[(

)

(

/ ) ( 1 2 2

2

1

2

1

Γ

Γ

π

Observe que la distribución de la variable aleatoria T, está completamente determinado sólo por el parámetro r. Entonces hay una distribución t correspondiente a cada grado de libertad. En la figura se presenta un bosquejo de la función de densidad de la variable aleatoria T, para diferentes grados de libertad. En la misma figura se da, la gráfica de la normal estándar. Note, la simetría de la distribución t alrededor de t =0 y varía de menos infinito a más infinito.

La media y la varianza de la distribución t con r grados de libertad están dados por:

2

2

1

0

2

>>>>

−−−−

====

====

>>>>

====

====

r

r

r

T

Var

r

T

E

,

)

(

,

)

(

σ

µ

Tabulación de la distribución t. Debido a la importancia de la distribución t, en inferencia estadística y la dificultad para evaluar la función de distribución de la variable aleatoria T, éstas se dan en una tabla. Puesto que existe una distribución de áreas completas para todas las distribuciones t, que corresponden a los diferentes grados de libertad, se presenta en la tabla sólo un resumen de la información de cada una de estas distribuciones, para r=1, 2, …,30. En el encabezado de la columna de la izquierda, dice grados de libertad y cada fila de esta tabla corresponde a una distribución t, particular. Por lo tanto, la probabilidad que la

variable aleatoria T sea menos o igual a una constante t = tα, es decir

∫∫∫∫

−−−−

====

====

≤≤≤≤

α

α

α

t

T

z

dz

f

t

T

(11)

α

0 tα

Sea X1, X2,…,Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con

distribución N(µ, σ2), hemos visto:

1. La variable aleatoria (X −µ) n/σ tiene una distribución N(0, 1)

2. La variable aleatoria (n – 1) S2/σ2 tiene una distribución chi-cuadrado con n – 1

grados de libertad.

3. X y S2 son variables aleatorias independientes

De acuerdo con la definición de la variable aleatoria T, de (1) y (2), la variable aleatoria

S

n

X

n

S

n

n

X

(

)

1

/

)

1

(

)

(

2 2

µ

σ

µ

=

tiene una distribución t con n – 1 grados de libertad. Esta variable aleatoria se usa

(12)

Distribución de la diferencia de dos medias muestrales con varianzas desconocidas pero iguales.

Otro resultado importante, que frecuentemente se está interesado en examinar, es la

distribución de la variable XY , cuando no se conoce la varianza.

Sea X1, X2,…,Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con

distribución N(

µ

X,

σ

2);Sea Y1, Y2,…, Yn una muestra aleatoria de tamaño m de una

variable aleatoria Y, con distribución N(

µ

Y,

σ

2), sean también las dos muestra

independientes. Entonces se tiene:

1. La distribución de la variable aleatoria

2 1

2

2

2 ( )

) 1 (

σ

σ

=

− =

n

i i x

X X S

n

es una chi-cuadrado con n-1 grados de libertad y es independiente de X yY .

2. La distribución de la variable aleatoria

2 1

2

2

2 ( )

) 1 (

σ

σ

=

− =

n

i i Y

Y Y S

m

es chi-cuadrado con m-1 grados de libertad y es independientes de X,Y y 2

X

S

3. La distribución de la variable aleatoria

m n Y X

m n Y X

U X Y X Y

1 1

) (

) (

) (

) (

2 2

+ − − − = +

− − − =

σ

µ

µ

σ

σ

µ

µ

es normal estándar.

4. de (1) y (2) usando la propiedad reproductiva de la distribución chi-cuadrado, la variable aleatoria

2 2 2

2

) 1 ( ) 1 (

σ

σ

X Y

S m S

n

(13)

tiene una distribución chi-cuadrado con n + m –2 de libertad, y además está

distribuida independientemente de XY ; por lo tanto U y V son independientes.

Entonces de acuerdo con la definición de una variable aleatoria T de (3) y (4), la variable aleatoria m n m n S m S n Y X m n S m S n m n Y X m n V U Y X Y X Y X Y X 1 1 2 ) 1 ( ) 1 ( ) ( ) ( 2 / ] ) 1 ( ) 1 [( 1 1 ) ( ) ( 2 2 2 2 2 2 + − + − + − − − − = − + − + − + − − − = − +

µ

µ

σ

σ

µ

µ

tiene una distribución t con n + m – 2 grados de libertad, observe que esta variable

aleatoria no contiene σ.

DISTRIBUCION –F

En muchas situaciones interesados en comparar las varianzas de dos variables aleatorias independientes distribuidas normalmente, la que se describe anteriormente. En estos casos recurrimos a la distribución F que se define como sigue:

Sea U y V dos variables aleatoria independientes que tienen distribuciones

chi-cuadrado, r1 y r2 grados de libertad, respectivamente. Entonces, la variable aleatoria

2 1

r

V

r

U

F

/

/

====

tiene una distribución F con r1 y r2 grados de libertad. Su función de densidad está

dada por:











<<<<

<<<<

++++

====

++++ −−−− ++++

c

o

e

z

r

r

z

r

z

f

r r

r r r r r r F r r

.

.

,

,

)

(

.

)

(

)

(

)

(

)

(

( )/ ) / ( / /

0

0

2 2 1 1 2 2 2 2 1 2 2 1 1 2 1 2 2 2 1 2 1

Γ

Γ

Γ

La media y la varianza de la variable aleatoria F están dados por

2

2

2 2 2

>>>>

−−−−

====

====

r

r

r

F

E

F

(

)

,

(14)

4

4

2

2

2

2 2

2 2 1

2 1 2 2 2

>>>>

−−−−

−−−−

−−−−

++++

====

====

r

r

r

r

r

r

r

F

Var

F

),

(

)

(

)

(

)

(

σ

La probabilidad que la variable aleatoria F sea menor o igual que una constante fα

está dada por

∫∫∫∫

====

====

<<<<

α

α

α

f

F

z

dz

f

f

F

P

[

]

0

(

)

r1, r2

α

0 fα

Entonces,

1 2 2

1

2 1 1

2

1 1

1

1

r r r

r

r r r

r

f

f

f

f

, , ,

,

, , ,

;

α α

α α

−−−− −−−−

(15)

Distribución de la razón de dos varianzas muestrales

Sea X1, X2,…,Xn una muestra aleatoria de tamaño n de una variable aleatoria

2

, ( ,N x x

X µ σ ). Sea Y1, Y2,…,Ym una muestra aleatoria de tamaño m de una variable

aleatoria Y con distribución N(

µ

Y,

σ

Y2). Además suponga que X e Y son

independientes. Entonces, la variable aleatoria,

2 4

1

2

2

2 ( )

) 1 (

X i

i

X X

X X S

n

σ

σ

=

− =

tiene una distribución chi-cuadrado con n-1 grados de libertad. De modo similar, la variable aleatoria

2 1

2

2

2 ( )

) 1 (

Y m

i i

Y Y

Y Y S

m

σ

σ

=

− =

tiene una distribución chi-cuadrado con m-1 grados de libertad. Además, las dos variables aleatorias chi-cuadrado son independientes por que X e Y son independientes. Entonces, de acuerdo con la definición de la variable aleatoria F, la variable aleatoria

2 2

2 2

2 2 2

2

/ / )

1 /( ) 1 (

) 1 /( ) 1 (

Y Y

X X

Y Y X

X

S S

m S m

n S n

σ

σ

σ

σ

=

− −

Referencias

Documento similar