y contrastes de hip ´otesis

(1)

Inferencia Estad´ıstica

Estimaci ´on de par ´ametros

mediante intervalos de confianza

y contrastes de hip ´otesis

(2)

´Indice

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

Distribuciones de los estad´ısticos muestrales

Estimaci ´ on mediante intervalos de confianza

Estimaci ´ on mediante contraste de hip ´ otesis

(3)

Distribuciones de los estad´ısticos muestrales de una poblaci´on normal

❖´Indice

muestrales

❖Introducci ´on

❖Para la varianza muestral

❖Para la media muestral

❖Para la proporci ´on muestral

❖Para el cociente de varianzas

❖Para la diferencia de medias

muestrales

❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de

confianza

hip ´otesis

(4)

Distribuciones de los estad´ısticos muestrales

❖´Indice

muestrales

❖Introducci ´on

muestrales

confianza

hip ´otesis

Como se ha visto en el tema anterior, los estad´ısticos muestrales se pueden utilizar para la estimaci ón puntual de los correspondientes par ámetros poblacionales. Pero adem ás de la estimaci ón puntual, existen otros m étodos de estimaci ón de par ámetros poblacionales como son los intervalos de confianza y los contrastes de hip ótesis (que se estudiaran en temas posteriores).

Para el estudio de estos m étodos ser á fundamental tener en cuenta el car ácter aleatorio de los estad´ısticos muestrales y conocer su distribuci ón.

As´ı, se entiende por distribuci ón de muestreo de un estad´ıstico la distribuci ón de probabilidad que puede obtenerse como resultado de un n úmero infinito de muestras aleatorias independientes, cada una de tama ño n, provenientes de la poblaci ón de inter és.

Destacar que este tema se centra en estad´ısticos muestrales cuyas distribuciones de probabilidad son obtenidas a partir de poblaciones con distribuci ón normal. Esta caracter´ıstica marcar á tambi én los siguientes temas de estimaci ón param étrica mediante intervalos de confianza y contraste de hip ótesis.

(5)

Media poblacional conocida y desconocida

❖´Indice

muestrales

❖Introducci ´on

muestrales

confianza

hip ´otesis

Sea X₁, . . . , X_n una muestra aleatoria simple de tama ˜no n procedente de una poblaci ´on N(µ, σ²), donde µ es conocida. Se verifica entonces que

1 σ²

n

X

i=1

(Xi − µ)² ∼ χ²ⁿ.

Sea X₁, . . . , X_n una muestra aleatoria simple de tama ˜no n procedente de una poblaci ´on N(µ, σ²), donde µ es desconocida. Se verifica entonces que

1 σ²

n

X

i=1

X_i − X2

∼ χ²n−1.

(6)

Varianza poblacional conocida y desconocida

❖´Indice

muestrales

❖Introducci ´on

muestrales

confianza

hip ´otesis

Sea X₁, . . . , X_n una muestra aleatoria simple de tama ˜no n procedente de una poblaci ´on N(µ, σ²), donde σ² es conocida. Se verifica entonces que

X ∼ N

µ, σ

√n

.

Sea X₁, . . . , X_n una muestra aleatoria simple de tama ˜no n procedente de una poblaci ´on N(µ, σ²), donde σ² es desconocida. Se verifica entonces que

X − µ√ n

S_n−1 = X − µ√

n − 1

S_n ∼ tn−1.

(7)

Distribuci´on para la proporci´on muestral

❖´Indice

muestrales

❖Introducci ´on

muestrales

confianza

hip ´otesis

Sea X₁, . . . , X_n una muestra aleatoria simple procedente de una variable aleatoria distribuida seg ún una Bernouilli de par ámetro p, entonces la variable aleatoria dada por la proporci ón muestral

P = 1 n

n

X

i=1

Ai,

tiene distribuci ´on aproximadamente Normal N

p, p(1 − p) n

,

si el tama ˜no muestral es suficientemente elevado y donde

Ai =







1 , si el individuo i presenta la caracter´ıstica en estudio con probabilidad p

0 , en otro caso

.

(8)

Distribuci´on para el cociente de varianzas

❖´Indice

muestrales

❖Introducci ´on

muestrales

confianza

hip ´otesis

DadasX1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples independientes procedentes de sendas poblaciones normales N(µ1, σ₁²) y N(µ2, σ₂²), se verifica entonces que

F = S_n−1²

S_m−1² · σ₂² σ₁²,

es una variable aleatoria que se distribuye seg ´un una F de Snedecor con n − 1 y m − 1 grados de libertad para el numerador y el denominador, respectivamente.

(9)

Varianzas poblacionales conocidas

❖´Indice

muestrales

❖Introducci ´on

muestrales

confianza

hip ´otesis

Dadas X1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples independientes procedentes de dos poblaciones normales N(µ1, σ₁²) y N(µ2, σ₂²), siendo σ₁² y σ₂² conocidas. Entonces, la diferencia X−Y se distribuye como sigue

X − Y ∼ N

µ1 − µ², σ₁²

n + σ₂² m

.

(10)

Varianzas poblacionales desconocidas e iguales

❖´Indice

muestrales

❖Introducci ´on

muestrales

confianza

hip ´otesis

Dadas X1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples independientes procedentes de dos poblaciones normales N(µ1, σ₁²) y N(µ2, σ₂²), siendo σ₁² y σ₂² desconocidas e iguales (σ₁² = σ₂² = σ²). Entonces,

(X − Y ) − (µ¹ − µ²) S_p

qm+n mn

∼ tn+m−2,

donde

S_p² = (n − 1) · S_n−1² + (m − 1) · S_m−1²

n + m − 2 .

(11)

Distribuci´on para la diferencia de proporciones

❖´Indice

muestrales

❖Introducci ´on

muestrales

confianza

hip ´otesis

DadasX1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples independientes con tama ˜nos n y m, procedentes de variables aleatorias de Bernouilli, con par ´ametros p₁ y p₂. Se verifica entonces que la variable aleatoria

(P1 − P²) − (p¹ − p²) qp₁(1−p1)

n + ^p²^(1−p_m ²⁾

∼ N(0, 1).

(12)

Estimaci´on mediante intervalos de confianza

❖´Indice

muestrales

confianza

❖M ´etodo del estad´ıstico pivote

❖Para la varianza poblacional

❖Para la media poblacional

❖Para la proporci ´on

poblacionales

❖Para la diferencia de proporciones Estimaci ´on mediante contraste de

hip ´otesis

(13)

Estimaci´on mediante intervalos de confianza

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

La estimaci ón puntual, estudiada en temas anteriores, nos aporta un valor concreto pero no aporta una medida de la precisi ón de la estimaci ón. Una manera de subsanar este hecho ser á obtener de cada muestra, no un es- timador puntual, sino un intervalo que se sospecha que debe contener al par ámetro. En ocasiones ser á m ás interesante saber entre que posibles valores se puede mover el par ámetro m ás que conocer un valor puntual del mismo. Es decir, puede ser m ás interesante proporcionar un intervalo dentro del cual est é contenido el verdadero valor de un par ámetro desconocido, con cierto grado de certeza, que dar una aproximaci ón puntual del mismo. El conocido dicho m ás vale acertar aproximadamente que fallar exactamente resume de manera concisa esta idea.

Evidentemente, esta t écnica no tiene por que dar siempre un resultado correcto y a la probabilidad de que hayamos acertado al decir que el par ámetro estaba contenido en dicho intervalo se le denomina nivel de confianza. Los extremos del intervalo de confianza se calcular án a partir de los datos muestrales y por tanto ser án variables aleatorias que depender án, entre otros elementos, del nivel de confianza.

(14)

M´etodo del estad´ıstico pivote

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Sea X una variable aleatoria (continua o discreta) cuya distribuci ón de probabilidad depende de un par ámetro desconocido, θ. Dada una muestra aleatoria simple, X₁, . . . , X_n, y una funci ón t, t = T (X1, . . . , X_n; θ), tal que:

● Para cada θ, T(·; θ) es un estad´ıstico muestral.

● Para cada realizaci ´on de la muestra, x₁, . . . , x_n, T(x1, . . . , x_n; ·) es es- trictamente mon ´otona.

● Si Λ = Img(t), para cada λ ∈ Λ, la ecuaci ´on λ = T (x1, . . . , xn; θ), tiene soluci ´on en θ.

En tal caso, si para cadaθ, t tiene distribuci ´on independiente de θ, se puede construir un intervalo de confianza para θ.

Entonces, el proceso a seguir en cada ocasi ón para construir un intervalo de confianza, conocido como m étodo del estad´ıstico pivote, ser á siempre el mismo:

● Seleccionar un estad´ıstico, T, que debe contener al par ámetro para el cual se desea estimar el intervalo de confianza, θ, y cuya distribuci ón sea conocida y no dependa del par ámetro desconocido, θ.

(15)

M´etodo del estad´ıstico pivote

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

● La distribuci ón de tal variable aleatoria es independiente del valor del par ámetro y, por tanto, se pueden encontrar los cuantiles ^α₂ y 1 − ^α₂ que definen un intervalo de extremos fijos, entre los que, con probabilidad 1 − α, se encontrar á dicha variable. Esto es:

P h λ^α

2 ≤ t ≤ λ1−^α₂

i = 1 − α,

donde λ^α

2 y λ₁₋^α

2 son los puntos (cuartiles) de la distribuci ´on del estad´ıstico T que dejan a su izquierda una probabilidad ^α₂ y 1 − ^α₂ , respectivamente.

● El siguiente paso ser á despejar el par ámetro en la desigualdad de la probabilidad anterior, obteniendo un nuevo suceso de extremos aleato- rios que contendr á al verdadero valor del par ámetro fijo y desconocido:

P[a ≤ θ ≤ b] = 1 − α, donde a = T⁻¹

λ^α

2

y b = T⁻¹

λ₁₋^α

2

.

El intervalo obtenido, [a, b], ser ´a el intervalo de confianza, al nivel 1 − α, para el par ´ametro desconocido en estudio.

(16)

M´etodo del estad´ıstico pivote

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Por su propia construcci ón este m étodo nos permite afirmar que si se construyen distintos intervalos, cada vez con distintas realizaciones de la muestra, al menos el 100(1 − α)% de ellos contiene el verdadero valor del par ámetro.

Hay que destacar que una vez que se ha calculado el intervalo para una muestra determinada, no es correcto decir la probabilidad de que el par ámetro pertenezca al intervalo es 1 − α, ya que una vez calculado el intervalo, este deja de ser aleatorio y la probabilidad ser á 1 si el intervalo es de los 1 − α que contienen al par ámetro, ó 0 o si el intervalo es uno de los α intervalos que no contienen al par ámetro. Por tanto, no tiene sentido hablar de probabilidad sino de confianza. La confianza est á puesta en que el m étodo de construcci ón de los intervalos nos asegura que (1 − α)100%

de las muestras producir ´an intervalos que contienen al par ´ametro.

Los niveles de confianza habituales son del 90%, 95% y 99%. Advertir que conforme aumenta la confianza, si bien disminuye el porcentaje de intervalos err óneos, la estimaci ón realizada es m ás pobre. Si os dijera que estimo que vuestra nota final estar á comprendida entre 0 y 10, ¿os he proporcionado informaci ón útil? Y eso que en este caso hemos trabajado a un 100% de confianza!!!

(17)

Con media poblacional conocida

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es N(µ, σ²), donde µ es conocida. Entonces, dada una muestra aleatoria simple, X₁, . . . , X_n, se toma como cantidad pivotal:

1 σ²

n

X

i=1

(Xi − µ)²,

que tiene una distribuci ´on χ² con n grados de libertad.

Sea χ₁₋^α

2 el cuantil 1 − ^α₂ de la distribuci ´on χ² con n grados de libertad y χ^α

2 es el cuantil ^α₂ de la misma distribuci ´on, esto es:

P h

Y < χ₁₋^α

2

i = 1 − α

2, P h

Y < χ^α

2

i = α 2, donde Y ∼ χ²ⁿ. En tal caso:

P

"

χ^α

2 < 1 σ²

n

X

i=1

(Xi − µ)² < χ₁₋^α

2

#

= 1 − α,

(18)

Con media poblacional conocida

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

de donde, despejando σ² P

"

1 χ₁₋^α

2

n

X

i=1

(Xi − µ)² < σ² < 1 χ^α

2

n

X

i=1

(Xi − µ)²

#

= 1 − α.

Entonces, el intervalo de confianza para la varianza de la poblaci ´on donde la media es conocida se expresar ´a como:

"

1 χ₁₋^α

2

n

X

i=1

(Xi − µ)², 1 χ^α

2

n

X

i=1

(Xi − µ)²

# .

(19)

Con media poblacional desconocida

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es N(µ, σ²), donde µ es desconocida. Entonces, dada una muestra aleatoria simple, X₁, . . . , X_n, se selecciona como cantidad pivotal:

1 σ²

n

X

i=1

(Xi − X)²,

que tiene una distribuci ´on χ² con n− 1 grados de libertad.

Teniendo en cuenta, al igual que antes, que χ₁₋^α

2 es el cuantil 1 − ^α₂ de la distribuci ´on χ² con n grados de libertad y χ^α

2 es el cuantil ^α₂ de la misma distribuci ´on, entonces:

P

"

χ^α

2 < 1 σ²

n

X

i=1

(Xi − X)² < χ₁₋^α

2

#

= 1 − α,

de donde, despejando σ² P

"

1 χ₁₋^α

2

n

X

i=1

(Xi − X)² < σ² < 1 χ^α

2

n

X

i=1

(Xi − X)²

#

= 1 − α.

(20)

Con media poblacional desconocida

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Entonces, el intervalo de confianza, al nivel 1 − α, para la varianza de una poblaci ´on donde la media es desconocida es

"

1 χ₁₋^α

2

n

X

i=1

(Xi − X)², 1 χ^α

2

n

X

i=1

(Xi − X)²

# .

(21)

Con varianza poblacional conocida

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Para obtener el intervalo de confianza del par ´ametro media poblacional de una variable aleatoria X distribuida como una N(µ, σ²), donde σ² es una cantidad conocida, dada X₁, . . . , X_n una muestra aleatoria simple procedente de X, se selecciona como cantidad pivotal:

X − µ

√σn

,

que se distribuye seg ún una N(0, 1). Dicha distribuci ón se emplear á para calcular el intervalo de confianza de manera que se verifica que:

P

"

Z^α

2 < X − µ√ n

σ < Z₁₋^α

2

#

= 1 − α,

donde Z^α

2 y Z₁₋^α

2 son los puntos de una distribuci ´on N(0, 1) que dejan por debajo suya una probabilidad ^α₂ y 1 − ^α₂, respectivamente. Esto es:

P h

Z < Z^α

2

i = α

2 , P h

Z < Z₁₋^α

2

i = 1 − α 2, donde Z ∼ N(0, 1).

(22)

Con varianza poblacional conocida

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Si en la desigualdad de la probabilidad anterior despejamos µ, se obtiene:

P

X + Z^α

2 · σ

√n < µ < X + Z₁₋^α

2 · σ

√n

= 1 − α.

Por tanto, se ha obtenido un intervalo que contiene en su interior a la media poblacional µ con una probabilidad 1 − α. Esto es, teniendo en cuenta la simetr´ıa¹ de la distribuci ´on normal:

X − Z1−^α₂ · σ

√n, X + Z₁₋^α

2 · σ

√n

,

es el intervalo de confianza, al nivel de confianza 1 − α, para la media de una poblaci ´on normal con varianza conocida.

1Puesto que la distribuci ´on Normal es sim ´etrica con respecto a su media, que en este caso es el cero, se verifica que Z^α

2 = −Z1−^α₂ . Este hecho se

(23)

Con varianza poblacional desconocida

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es Normal N(µ, σ²), donde σ² es desconocida. En- tonces, dada una muestra aleatoria simple, X₁, . . . , X_n, utilizaremos como cantidad pivotal:

X − µ√ n S_n−1 ,

que se distribuye seg ´un una distribuci ´on t-Student con n − 1 grados de libertad, donde

S_n−1 = v u u t

1 n − 1

n

X

i=1

(Xi − X)².

El intervalo de confianza queda determinado por P

"

t^α

2 < X − µ√ n

S_n−1 < t₁₋^α

2

#

= 1 − α,

donde t^α

2 y t₁₋^α

2 son los puntos de una t de Student con n − 1 grados de libertad que dejan por debajo suya una probabilidad ^α₂ y 1 − ^α₂, respectivamente. Esto es:

(24)

Con varianza poblacional desconocida

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

P h

t < t^α

2

i = α

2 , P h

t < t₁₋^α

2

i = 1 − α 2, donde t ∼ tn−1.

Despejando el par ´ametro desconocido, en este caso µ, en la expresi ´on anterior obtenemos la probabilidad equivalente:

P

X + t^α

2 · S_n−1

√n < µ < X + t₁₋^α

2 · S_n−1

√n

= 1 − α.

De forma que usando que la distribuci ón t-Student es sim étrica, la regi ón que determina

X − t1−^α₂ · S_n−1

√n , X + t₁₋^α

2 · S_n−1

√n

,

es el intervalo de confianza, al nivel de confianza 1 − α, para la media de una poblaci ´on normal con varianza desconocida.

(25)

Intervalo de confianza para la proporci´on

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Dada X₁, . . . , X_n una muestra aleatoria de tama ño n procedente de una Bernoulli, estimamos la proporci ón muestral mediante la distribuci ón

P − p qP (1−P )

n

,

que puede considerarse aproximadamente normal de media cero y varianza uno, cuando el tama ˜no de la muestra es suficientemente grande.

Teniendo en cuenta que la distribuci ´on normal es sim ´etrica y sea Z₁₋^α

2 el cuantil 1 − ^α₂ de la distribuci ´on normal de media cero y varianza uno, se verifica entonces que

P



−Z1−^α₂ < P − p qP (1−P )

n

< Z₁₋^α

2



 = 1 − α.

Si en el suceso expresado en la probabilidad anterior despejamos p, queda P

"

P − Z^1−α

2

rP(1 − P )

n < p < P + Z₁₋^α

2

rP(1 − P ) n

#

= 1 − α.

(26)

Intervalo de confianza para la proporci´on

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Por tanto, el intervalo de confianza, al nivel 1 − α, para la proporci ´on se define como:

"

P − Z1−^α₂

rP(1 − P )

n , P + Z₁₋^α

2

rP(1 − P ) n

# .

(27)

Intervalo para el cociente de varianzas

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Dadas X1, . . . , Xn e Y1, . . . , Ym, dos muestras aleatorias simples independientes procedentes de dos poblaciones normales, N(µ1, σ₁²) y N(µ2, σ₂²), con medias y varianzas desconocidas, la variable usada como cantidad pivotal ser ´a

S_n−1²

S_m−1² · σ₂² σ₁²,

que tiene una distribuci ´on F de Snedecor con n− 1 grados de libertad para el numerador y m − 1 grados de libertad para el denominador.

Si F^α

2 es el cuantil ^α₂ y F₁₋^α

2 es el cuantil 1 − ^α₂ de dicha distribuci ´on, entonces

P

F^α

2 < S_n−1²

S_m−1² · σ₂²

σ₁² < F₁₋^α

2

= 1 − α,

donde despejando ^σ²²

σ₁² resultaP

F^α

2 · S_m−1²

S_n−1² < σ²₂

σ²₁ < F₁₋^α

2 · S_m−1² S_n−1²

= 1 − α.

Y entonces, el intervalo de confianza, al nivel 1 − α, para el cociente de varianzas de dos poblaciones normales es

F^α

2 · S_m−1²

S² , F₁₋^α

2 · S_m−1² S²

.

(28)

Con varianzas poblacionales conocidas

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Dadas dos muestras aleatorias simples independientes, X1, . . . , Xn e Y1, . . . , Ym, procedentes de dos poblaciones normales, N(µ1, σ₁²) y N(µ2, σ₂²), con varianzas conocidas, entonces la variable aleatoria usada como cantidad pivotal ser ´a

(X − Y ) − (µ¹ − µ²) qσ₁²

n + ^σ_m²²

,

la cual tiene una distribuci ´on N(0, 1).

SiZ₁₋^α

2 es el cuantil1−^α₂ de dicha distribuci ´on normal, entonces se verifica que

P



−Z1−^α₂ < (X − Y ) − (µ¹ − µ²) qσ₁²

n + ^σ_m²²

< Z₁₋^α

2



 = 1 − α,

donde hemos usado una vez m ás que por ser la distribuci ón Normal sim étrica se verifica que Z^α

2 = −Z1−^α₂ .

(29)

Con varianzas poblacionales conocidas

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Si en el suceso expresado en la probabilidad anterior despejamos µ₁ − µ², queda

P

"

(X − Y ) − Z1−^α₂

rσ₁²

n + σ₂²

m < µ1 − µ² <

(X − Y ) + Z1−^α₂

rσ₁²

n + σ₂² m

#

= 1 − α,

obteni ´endose el intervalo de confianza para la diferencia de medias, al nivel 1 − α, para dos poblaciones normales cuyas varianzas son conocidas

"

(X − Y ) − Z1−^α₂

rσ₁²

n + σ₂²

m ,(X − Y ) + Z1−^α₂

rσ₁²

n + σ₂² m

# .

(30)

Con varianzas poblacionales desconocidas e iguales

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Dadas dos muestras aleatorias simples independientes, X1, . . . , Xn e Y1, . . . , Ym, procedentes de dos poblaciones normales, N(µ1, σ₁²) y N(µ2, σ₂²), con varianzas desconocidas e iguales (σ₁² = σ²₂ = σ²), entonces la variable aleatoria usada como cantidad pivotal ser ´a

(X − Y ) − (µ¹ − µ²) S_p

qm+n nm

,

que tiene una distribuci ´on t-Srudent con m + n − 2 grados de libertad y donde

Sp = s

(n − 1) · S_n−1² + (m − 1) · S_m−1²

n + m − 2 .

Si t₁₋^α

2 es el cuantil 1 − ^α₂ de la distribuci ´on t-Student con m+ n − 2 grados de libertad, entonces se verifica que

P



−t1−^α₂ < (X − Y ) − (µ¹ − µ²) Sp

qm+n nm

< t₁₋^α

2



 = 1 − α,

(31)

Con varianzas poblacionales desconocidas e iguales

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Si en la expresi ´on anterior despejamos µ₁ − µ², obtenemos:

P

"

(X − Y ) − t1−^α₂ S_pr m + n

nm < µ₁ − µ² <

(X − Y ) + t1−^α₂ Spr m + n nm

#

= 1 − α.

Por tanto, el intervalo de confianza para la diferencia de medias, al nivel 1 − α, para dos poblaciones normales cuyas varianzas son desconocidas

"

(X − Y ) − t₁₋^α₂ S_pr m + n

nm ,(X − Y ) + t₁₋^α₂ S_pr m + n nm

# .

(32)

I.C. para la diferencia de proporciones

❖´Indice

muestrales

confianza

poblacionales

hip ´otesis

Dadas dos muestras aleatorias simples de tama ño m y n procedentes de dos variables aleatorias independientes distribuidas seg ún dos Bernouillis de par ámetros p₁ y p₂, respectivamente. Entonces

(P1 − P²) − (p¹ − p²) qP₁(1−P1)

n + ^P²^(1−P_m ²⁾

∼ N(0, 1).

Si Z₁₋^α

2 es el cuantil 1 − ^α₂ de la distribuci ón N(0, 1), entonces, teniendo en cuenta que la distribuci ón normal es sim étrica, se verifica que

P



−Z1−^α₂ < (P1 − P²) − (p¹ − p²) qP₁(1−P1)

n + ^P²^(1−P_m ²⁾

< Z₁₋^α

2



 = 1 − α.

Si en el suceso expresado en la probabilidad anterior despejamos p₁ − p², queda P h

(P1 − P²) − Z1−^α₂ · δ < p¹ − p² < (P1 − P²) + Z₁₋^α

2 · δi

= 1 − α, donde δ =

qP₁(1−P1)

n + ^P²^(1−P_m ²⁾. Por tanto, el intervalo de confianza, al nivel 1 − α, para la diferencia de proporciones muestrales ser ´a h(P − P ) − Z · δ, (P − P ) + Z · δi

.

(33)

Estimaci´on mediante contraste de hip´otesis

❖´Indice

muestrales

confianza

hip ´otesis

❖Introducci ´on al contraste de hip ´otesis

poblacionales

❖Para la diferencia de proporciones

(34)

Introducci´on al contraste de hip´otesis

❖´Indice

muestrales

confianza

hip ´otesis

poblacionales

En el presente tema se aborda el problema de inferencia sobre los par ámetros desconocidos de una distribuci ón desde un nuevo enfoque. En este caso desarrollaremos un procedimiento, conocido como contraste de hip ótesis, que va a permitir discernir si una propuesta sobre los posibles valores que puede tomar un par ámetro puede considerarse o no como cierta.

Dicha decisi ón ser á tomada a partir de una regla, referida como regi ón de rechazo, basada en la informaci ón muestral (destacar que no se estudiar á c ómo se construye dicha regi ón de rechazo, la cual nos ser á dada directa- mente).

El procedimiento de contrastaci ´on, que estudiaremos en los siguientes apartados, tiene los siguientes pasos:

● Planteamiento de hip ótesis nula y alternativa, as´ı como elecci ón del nivel de significaci ón (normalmente 0’05 y 0’01).

● Selecci ón de un estad´ıstico de prueba que conduce a unos l´ımites (valores cr´ıticos) que dividen el espacio muestral en una regi ón donde se rechaza la hip ótesis nula (regi ón cr´ıtica).

● Tomar una decisi ´on.

(35)

Contrastes de hip´otesis e intervalos de confianza

❖´Indice

muestrales

confianza

hip ´otesis

poblacionales

Para aplicar esta metodolog´ıa necesitaremos las mismas distribuciones us- adas en la obtenci ón de intervalos de confianza. Esta situaci ón no es ca- sual, ya que una regla factible para rechazar un determinado valor para el par ámetro o par ámetros desconocidos es que dicho valor se encuentre fuera del correspondiente intervalo de confianza. El contraste y los intervalos de confianza son pues, dos cuestiones estrechamente relacionadas.