Inferencia Estadística Estimación de parámetros mediante intervalos de confianza y contrastes de hipótesis 1 / 56

Texto completo

(1)

Inferencia Estad´ıstica

Estimaci ´on de par ´ametros

mediante intervalos de confianza

y contrastes de hip ´otesis

(2)

´Indice

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

Distribuciones de los estad´ısticos muestrales

Estimaci ´

on mediante intervalos de confianza

Estimaci ´

on mediante contraste de hip ´

otesis

(3)

Distribuciones de los estad´ısticos

muestrales de una poblaci´on normal

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

(4)

Distribuciones de los estad´ısticos muestrales

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

Como se ha visto en el tema anterior, los estad´ısticos muestrales se pueden utilizar para la estimaci ´on puntual de los correspondientes par ´ametros poblacionales. Pero adem ´as de la estimaci ´on puntual, existen otros m ´etodos de estimaci ´on de par ´ametros poblacionales como son los interva-los de confianza y interva-los contrastes de hip ´otesis (que se estudiaran en temas posteriores).

Para el estudio de estos m ´etodos ser ´a fundamental tener en cuenta el car ´acter aleatorio de los estad´ısticos muestrales y conocer su distribuci ´on. As´ı, se entiende por distribuci ´on de muestreo de un estad´ıstico la dis-tribuci ´on de probabilidad que puede obtenerse como resultado de un n ´umero infinito de muestras aleatorias independientes, cada una de tama ˜no

n, provenientes de la poblaci ´on de inter ´es.

Destacar que este tema se centra en estad´ısticos muestrales cuyas tribuciones de probabilidad son obtenidas a partir de poblaciones con dis-tribuci ´on normal. Esta caracter´ıstica marcar ´a tambi ´en los siguientes temas de estimaci ´on param ´etrica mediante intervalos de confianza y contraste de hip ´otesis.

(5)

Media poblacional conocida y desconocida

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

Sea X1, . . . , Xn una muestra aleatoria simple de tama ˜no n procedente de

una poblaci ´on N(µ, σ2), donde µ es conocida. Se verifica entonces que

1 σ2 n X i=1 (Xi − µ)2 ∼ χ2n.

Sea X1, . . . , Xn una muestra aleatoria simple de tama ˜no n procedente de

una poblaci ´on N(µ, σ2), donde µ es desconocida. Se verifica entonces que

1 σ2 n X i=1 Xi − X 2 ∼ χ2n−1.

(6)

Varianza poblacional conocida y desconocida

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

Sea X1, . . . , Xn una muestra aleatoria simple de tama ˜no n procedente de

una poblaci ´on N(µ, σ2), donde σ2 es conocida. Se verifica entonces que

X ∼ N  µ, σ n  .

Sea X1, . . . , Xn una muestra aleatoria simple de tama ˜no n procedente de

una poblaci ´on N(µ, σ2), donde σ2 es desconocida. Se verifica entonces que X − µ√n Sn−1 = X − µ√n − 1 Sn ∼ tn−1 .

(7)

Distribuci´on para la proporci´on muestral

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

Sea X1, . . . , Xn una muestra aleatoria simple procedente de una variable

aleatoria distribuida seg ´un una Bernouilli de par ´ametro p, entonces la vari-able aleatoria dada por la proporci ´on muestral

P = 1 n n X i=1 Ai,

tiene distribuci ´on aproximadamente Normal

N  p, p(1 − p) n  ,

si el tama ˜no muestral es suficientemente elevado y donde

Ai =  

1 , si el individuo i presenta la caracter´ıstica en estudio con probabilidad p

0 , en otro caso

(8)

Distribuci´on para el cociente de varianzas

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

DadasX1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples independi-entes procedindependi-entes de sendas poblaciones normales N(µ1, σ12) y N(µ2, σ22),

se verifica entonces que

F = S 2 n−1 Sm−12 · σ22 σ12,

es una variable aleatoria que se distribuye seg ´un una F de Snedecor con

n − 1 y m − 1 grados de libertad para el numerador y el denominador, respectivamente.

(9)

Varianzas poblacionales conocidas

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

Dadas X1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples indepen-dientes procedentes de dos poblaciones normales N(µ1, σ12) y N(µ2, σ22),

siendo σ12 y σ22 conocidas. Entonces, la diferencia X−Y se distribuye como sigue X − Y ∼ N  µ1 − µ2, σ 2 1 n + σ22 m  .

(10)

Varianzas poblacionales desconocidas e iguales

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

Dadas X1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples indepen-dientes procedentes de dos poblaciones normales N(µ1, σ12) y N(µ2, σ22),

siendo σ12 y σ22 desconocidas e iguales (σ12 = σ22 = σ2). Entonces, (X − Y ) − (µ1 − µ2) Sp q m+n mn ∼ tn+m−2, donde Sp2 = (n − 1) · S 2 n−1 + (m − 1) · Sm−12 n + m − 2 .

(11)

Distribuci´on para la diferencia de proporciones

❖´Indice Distribuciones de los estad´ısticos muestrales ❖Introducci ´on ❖Para la varianza muestral ❖Para la media muestral

❖Para la proporci ´on muestral ❖Para el cociente de varianzas ❖Para la diferencia de medias muestrales ❖Para la diferencia de proporciones

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de

hip ´otesis

DadasX1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples independi-entes con tama ˜nos n y m, procedentes de variables aleatorias de Bernouilli, con par ´ametros p1 y p2. Se verifica entonces que la variable aleatoria

(P1 − P2) − (p1 − p2) q p1(1−p1) n + p2(1−p2) m ∼ N(0, 1).

(12)

Estimaci´on mediante intervalos de

confianza

❖´Indice Distribuciones de los estad´ısticos muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

(13)

Estimaci´on mediante intervalos de confianza

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

La estimaci ´on puntual, estudiada en temas anteriores, nos aporta un valor concreto pero no aporta una medida de la precisi ´on de la estimaci ´on. Una manera de subsanar este hecho ser ´a obtener de cada muestra, no un es-timador puntual, sino un intervalo que se sospecha que debe contener al par ´ametro. En ocasiones ser ´a m ´as interesante saber entre que posibles valores se puede mover el par ´ametro m ´as que conocer un valor puntual del mismo. Es decir, puede ser m ´as interesante proporcionar un intervalo dentro del cual est ´e contenido el verdadero valor de un par ´ametro descono-cido, con cierto grado de certeza, que dar una aproximaci ´on puntual del mismo. El conocido dicho m ´as vale acertar aproximadamente que fallar

exactamente resume de manera concisa esta idea.

Evidentemente, esta t ´ecnica no tiene por que dar siempre un resul-tado correcto y a la probabilidad de que hayamos acerresul-tado al decir que el par ´ametro estaba contenido en dicho intervalo se le denomina nivel de con-fianza. Los extremos del intervalo de confianza se calcular ´an a partir de los datos muestrales y por tanto ser ´an variables aleatorias que depender ´an, entre otros elementos, del nivel de confianza.

(14)

M´etodo del estad´ıstico pivote

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Sea X una variable aleatoria (continua o discreta) cuya distribuci ´on de probabilidad depende de un par ´ametro desconocido, θ. Dada una mues-tra aleatoria simple, X1, . . . , Xn, y una funci ´on t, t = T (X1, . . . , Xn; θ), tal

que:

● Para cada θ, T(·; θ) es un estad´ıstico muestral.

● Para cada realizaci ´on de la muestra, x1, . . . , xn, T(x1, . . . , xn; ·) es

es-trictamente mon ´otona.

● Si Λ = Img(t), para cada λ ∈ Λ, la ecuaci ´on λ = T (x1, . . . , xn; θ),

tiene soluci ´on en θ.

En tal caso, si para cadaθ, t tiene distribuci ´on independiente de θ, se puede construir un intervalo de confianza para θ.

Entonces, el proceso a seguir en cada ocasi ´on para construir un intervalo de confianza, conocido como m ´etodo del estad´ıstico pivote, ser ´a siempre el mismo:

● Seleccionar un estad´ıstico, T, que debe contener al par ´ametro para el cual se desea estimar el intervalo de confianza, θ, y cuya distribuci ´on sea conocida y no dependa del par ´ametro desconocido, θ.

(15)

M´etodo del estad´ıstico pivote

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

● La distribuci ´on de tal variable aleatoria es independiente del valor del par ´ametro y, por tanto, se pueden encontrar los cuantiles α2 y 1 − α2 que definen un intervalo de extremos fijos, entre los que, con probabilidad

1 − α, se encontrar ´a dicha variable. Esto es:

P hλα

2 ≤ t ≤ λ1−α2

i

= 1 − α,

donde λα

2 y λ1−α2 son los puntos (cuartiles) de la distribuci ´on del

es-tad´ıstico T que dejan a su izquierda una probabilidad α2 y 1 − α2 , re-spectivamente.

● El siguiente paso ser ´a despejar el par ´ametro en la desigualdad de la probabilidad anterior, obteniendo un nuevo suceso de extremos aleato-rios que contendr ´a al verdadero valor del par ´ametro fijo y desconocido:

P[a ≤ θ ≤ b] = 1 − α, donde a = T−1 λα 2  y b = T−1 λ1−α 2  .

El intervalo obtenido, [a, b], ser ´a el intervalo de confianza, al nivel 1 − α, para el par ´ametro desconocido en estudio.

(16)

M´etodo del estad´ıstico pivote

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Por su propia construcci ´on este m ´etodo nos permite afirmar que si se construyen distintos intervalos, cada vez con distintas realizaciones de la muestra, al menos el 100(1 − α)% de ellos contiene el verdadero valor del par ´ametro.

Hay que destacar que una vez que se ha calculado el intervalo para una muestra determinada, no es correcto decir la probabilidad de que el

par ´ametro pertenezca al intervalo es 1 − α, ya que una vez calculado el intervalo, este deja de ser aleatorio y la probabilidad ser ´a 1 si el intervalo es de los 1 − α que contienen al par ´ametro, ´o 0 o si el intervalo es uno de los α intervalos que no contienen al par ´ametro. Por tanto, no tiene sentido hablar de probabilidad sino de confianza. La confianza est ´a puesta en que el m ´etodo de construcci ´on de los intervalos nos asegura que (1 − α)100% de las muestras producir ´an intervalos que contienen al par ´ametro.

Los niveles de confianza habituales son del 90%, 95% y 99%. Advertir que conforme aumenta la confianza, si bien disminuye el porcentaje de intervalos err ´oneos, la estimaci ´on realizada es m ´as pobre. Si os dijera que estimo que vuestra nota final estar ´a comprendida entre 0 y 10, ¿os he proporcionado informaci ´on ´util? Y eso que en este caso hemos trabajado a un 100% de confianza!!!

(17)

Con media poblacional conocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es N(µ, σ2), donde µ es conocida. Entonces, dada una muestra aleatoria simple, X1, . . . , Xn, se toma como cantidad pivotal:

1 σ2 n X i=1 (Xi − µ)2,

que tiene una distribuci ´on χ2 con n grados de libertad. Sea χ1−α

2 el cuantil 1 −

α

2 de la distribuci ´on χ

2 con n grados de libertad y χα

2 es el cuantil

α

2 de la misma distribuci ´on, esto es: P hY < χ1−α 2 i = 1 − α2, P hY < χα 2 i = α 2,

donde Y ∼ χ2n. En tal caso:

P " χα 2 < 1 σ2 n X i=1 (Xi − µ)2 < χ1−α 2 # = 1 − α,

(18)

Con media poblacional conocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de hip ´otesis de donde, despejando σ2 P " 1 χ1−α 2 n X i=1 (Xi − µ)2 < σ2 < 1 χα 2 n X i=1 (Xi − µ)2 # = 1 − α.

Entonces, el intervalo de confianza para la varianza de la poblaci ´on donde la media es conocida se expresar ´a como:

" 1 χ1−α 2 n X i=1 (Xi − µ)2, 1 χα 2 n X i=1 (Xi − µ)2 # .

(19)

Con media poblacional desconocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es N(µ, σ2), donde µ es desconocida. Entonces, dada una muestra aleatoria simple, X1, . . . , Xn, se selecciona como

canti-dad pivotal: 1 σ2 n X i=1 (Xi − X)2,

que tiene una distribuci ´on χ2 con n− 1 grados de libertad. Teniendo en cuenta, al igual que antes, que χ1−α

2 es el cuantil 1 −

α

2 de la

distribuci ´on χ2 con n grados de libertad y χα

2 es el cuantil

α

2 de la misma

distribuci ´on, entonces:

P " χα 2 < 1 σ2 n X i=1 (Xi − X)2 < χ1−α 2 # = 1 − α, de donde, despejando σ2 P " 1 χ1−α 2 n X i=1 (Xi − X)2 < σ2 < 1 χα 2 n X i=1 (Xi − X)2 # = 1 − α.

(20)

Con media poblacional desconocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Entonces, el intervalo de confianza, al nivel 1 − α, para la varianza de una poblaci ´on donde la media es desconocida es

" 1 χ1−α 2 n X i=1 (Xi − X)2, 1 χα 2 n X i=1 (Xi − X)2 # .

(21)

Con varianza poblacional conocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Para obtener el intervalo de confianza del par ´ametro media poblacional de una variable aleatoria X distribuida como una N(µ, σ2), donde σ2 es una cantidad conocida, dada X1, . . . , Xn una muestra aleatoria simple

proce-dente de X, se selecciona como cantidad pivotal:

X − µ σ

n ,

que se distribuye seg ´un una N(0, 1). Dicha distribuci ´on se emplear ´a para calcular el intervalo de confianza de manera que se verifica que:

P " Zα 2 < X − µ√n σ < Z1−α2 # = 1 − α, donde Zα

2 y Z1−α2 son los puntos de una distribuci ´on N(0, 1) que dejan por

debajo suya una probabilidad α2 y 1 − α2, respectivamente. Esto es:

P hZ < Zα 2 i = α 2 , P h Z < Z1−α 2 i = 1 − α2, donde Z ∼ N(0, 1).

(22)

Con varianza poblacional conocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Si en la desigualdad de la probabilidad anterior despejamos µ, se obtiene:

P  X + Zα 2 · σ √ n < µ < X + Z1−α2 · σ √ n  = 1 − α.

Por tanto, se ha obtenido un intervalo que contiene en su interior a la media poblacional µ con una probabilidad 1 − α. Esto es, teniendo en cuenta la simetr´ıa1 de la distribuci ´on normal:

 X − Z1−α 2 · σ √ n, X + Z1−α2 · σ √ n  ,

es el intervalo de confianza, al nivel de confianza 1 − α, para la media de una poblaci ´on normal con varianza conocida.

1Puesto que la distribuci ´on Normal es sim ´etrica con respecto a su media,

que en este caso es el cero, se verifica que Zα

(23)

Con varianza poblacional desconocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es Normal N(µ, σ2), donde σ2 es desconocida. En-tonces, dada una muestra aleatoria simple, X1, . . . , Xn, utilizaremos como

cantidad pivotal:

X − µ√n Sn−1 ,

que se distribuye seg ´un una distribuci ´on t-Student con n − 1 grados de libertad, donde Sn−1 = v u u t 1 n − 1 n X i=1 (Xi − X)2.

El intervalo de confianza queda determinado por

P " tα 2 < X − µ√n Sn−1 < t1−α2 # = 1 − α, donde tα

2 y t1−α2 son los puntos de una t de Student con n − 1 grados de

libertad que dejan por debajo suya una probabilidad α2 y 1 − α2, respectiva-mente. Esto es:

(24)

Con varianza poblacional desconocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de hip ´otesis P ht < tα 2 i = α 2 , P h t < t1−α 2 i = 1 − α 2, donde t ∼ tn−1.

Despejando el par ´ametro desconocido, en este caso µ, en la expresi ´on anterior obtenemos la probabilidad equivalente:

P  X + tα 2 · Sn−1 √ n < µ < X + t1−α2 · Sn−1 √ n  = 1 − α.

De forma que usando que la distribuci ´on t-Student es sim ´etrica, la regi ´on que determina  X − t1−α 2 · Sn−1 √ n , X + t1−α2 · Sn−1 √ n  ,

es el intervalo de confianza, al nivel de confianza 1 − α, para la media de una poblaci ´on normal con varianza desconocida.

(25)

Intervalo de confianza para la proporci´on

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Dada X1, . . . , Xn una muestra aleatoria de tama ˜no n procedente de una

Bernoulli, estimamos la proporci ´on muestral mediante la distribuci ´on

P − p q

P (1−P ) n

,

que puede considerarse aproximadamente normal de media cero y vari-anza uno, cuando el tama ˜no de la muestra es suficientemente grande.

Teniendo en cuenta que la distribuci ´on normal es sim ´etrica y sea Z1−α 2 el

cuantil 1 − α2 de la distribuci ´on normal de media cero y varianza uno, se verifica entonces que

P  −Z1−α 2 < P − p q P (1−P ) n < Z1−α 2   = 1 − α.

Si en el suceso expresado en la probabilidad anterior despejamos p, queda

P " P − Z1−α 2 r P(1 − P ) n < p < P + Z1−α2 r P(1 − P ) n # = 1 − α.

(26)

Intervalo de confianza para la proporci´on

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Por tanto, el intervalo de confianza, al nivel 1 − α, para la proporci ´on se define como: " P − Z1−α 2 r P(1 − P ) n , P + Z1−α2 r P(1 − P ) n # .

(27)

Intervalo para el cociente de varianzas

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Dadas X1, . . . , Xn e Y1, . . . , Ym, dos muestras aleatorias simples indepen-dientes procedentes de dos poblaciones normales, N(µ1, σ12) y N(µ2, σ22),

con medias y varianzas desconocidas, la variable usada como cantidad pivotal ser ´a

Sn−12 Sm−12 ·

σ22 σ12,

que tiene una distribuci ´on F de Snedecor con n− 1 grados de libertad para el numerador y m − 1 grados de libertad para el denominador.

Si Fα

2 es el cuantil

α

2 y F1−α2 es el cuantil 1 −

α

2 de dicha distribuci ´on,

entonces P  Fα 2 < Sn−12 Sm−12 · σ22 σ12 < F1−α2  = 1 − α, donde despejando σ22 σ12 resultaP  Fα 2 · Sm−12 Sn−12 < σ22 σ21 < F1−α2 · Sm−12 Sn−12  = 1 − α.

Y entonces, el intervalo de confianza, al nivel 1 − α, para el cociente de varianzas de dos poblaciones normales es

 Fα 2 · Sm−12 S2 , F1−α2 · Sm−12 S2  .

(28)

Con varianzas poblacionales conocidas

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Dadas dos muestras aleatorias simples independientes, X1, . . . , Xn e

Y1, . . . , Ym, procedentes de dos poblaciones normales, N(µ1, σ12) y N(µ2, σ22), con varianzas conocidas, entonces la variable aleatoria usada como cantidad pivotal ser ´a

(X − Y ) − (µ1 − µ2) q σ12 n + σ22 m ,

la cual tiene una distribuci ´on N(0, 1). SiZ1−α

2 es el cuantil1−

α

2 de dicha distribuci ´on normal, entonces se verifica

que P  −Z1−α 2 < (X − Y ) − (µ1 − µ2) q σ12 n + σ22 m < Z1−α 2   = 1 − α,

donde hemos usado una vez m ´as que por ser la distribuci ´on Normal sim ´etrica se verifica que Zα

(29)

Con varianzas poblacionales conocidas

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Si en el suceso expresado en la probabilidad anterior despejamos µ1 − µ2,

queda P " (X − Y ) − Z1−α 2 r σ12 n + σ22 m < µ1 − µ2 < (X − Y ) + Z1−α 2 r σ12 n + σ22 m # = 1 − α,

obteni ´endose el intervalo de confianza para la diferencia de medias, al nivel

1 − α, para dos poblaciones normales cuyas varianzas son conocidas

" (X − Y ) − Z1−α 2 r σ12 n + σ22 m ,(X − Y ) + Z1−α2 r σ12 n + σ22 m # .

(30)

Con varianzas poblacionales desconocidas e

iguales

❖´Indice Distribuciones de los estad´ısticos muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Dadas dos muestras aleatorias simples independientes, X1, . . . , Xn e

Y1, . . . , Ym, procedentes de dos poblaciones normales, N(µ1, σ12) y N(µ2, σ22), con varianzas desconocidas e iguales (σ12 = σ22 = σ2), entonces

la variable aleatoria usada como cantidad pivotal ser ´a

(X − Y ) − (µ1 − µ2) Sp q m+n nm ,

que tiene una distribuci ´on t-Srudent con m + n − 2 grados de libertad y donde Sp = s (n − 1) · Sn−12 + (m − 1) · Sm−12 n + m − 2 . Si t1−α 2 es el cuantil 1 − α

2 de la distribuci ´on t-Student con m+ n − 2 grados

de libertad, entonces se verifica que

P  −t1−α 2 < (X − Y ) − (µ1 − µ2) Sp q m+n nm < t1−α 2   = 1 − α,

(31)

Con varianzas poblacionales desconocidas e

iguales

❖´Indice Distribuciones de los estad´ısticos muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Si en la expresi ´on anterior despejamos µ1 − µ2, obtenemos:

P " (X − Y ) − t1−α 2 Sp r m + n nm < µ1 − µ2 < (X − Y ) + t1−α 2 Sp r m + n nm # = 1 − α.

Por tanto, el intervalo de confianza para la diferencia de medias, al nivel

1 − α, para dos poblaciones normales cuyas varianzas son desconocidas

" (X − Y ) − t1−α2 Spr m + n nm ,(X − Y ) + t1−α2 Sp r m + n nm # .

(32)

I.C. para la diferencia de proporciones

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de confianza ❖M ´etodo del estad´ıstico pivote ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Estimaci ´on mediante contraste de

hip ´otesis

Dadas dos muestras aleatorias simples de tama ˜no m y n procedentes de dos variables aleatorias independientes distribuidas seg ´un dos Bernouillis de par ´ametros p1 y p2, respectivamente. Entonces

(P1 − P2) − (p1 − p2) q P1(1−P1) n + P2(1−P2) m ∼ N(0, 1). Si Z1−α 2 es el cuantil 1 − α

2 de la distribuci ´on N(0, 1), entonces, teniendo

en cuenta que la distribuci ´on normal es sim ´etrica, se verifica que

P  −Z1−α 2 < (P1 − P2) − (p1 − p2) q P1(1−P1) n + P2(1−P2) m < Z1−α 2   = 1 − α.

Si en el suceso expresado en la probabilidad anterior despejamos p1 − p2,

queda P h(P1 − P2) − Z1−α 2 · δ < p1 − p2 < (P1 − P2) + Z1−α2 · δ i = 1 − α, donde δ = q P1(1−P1) n + P2(1−P2)

m . Por tanto, el intervalo de

confi-anza, al nivel 1 − α, para la diferencia de proporciones muestrales ser ´a

h

(33)

Estimaci´on mediante contraste de

hip´otesis

❖´Indice Distribuciones de los estad´ısticos muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

(34)

Introducci´on al contraste de hip´otesis

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

En el presente tema se aborda el problema de inferencia sobre los par ´ametros desconocidos de una distribuci ´on desde un nuevo enfoque. En este caso desarrollaremos un procedimiento, conocido como contraste de hip ´otesis, que va a permitir discernir si una propuesta sobre los posibles val-ores que puede tomar un par ´ametro puede considerarse o no como cierta. Dicha decisi ´on ser ´a tomada a partir de una regla, referida como regi ´on de rechazo, basada en la informaci ´on muestral (destacar que no se estudiar ´a c ´omo se construye dicha regi ´on de rechazo, la cual nos ser ´a dada directa-mente).

El procedimiento de contrastaci ´on, que estudiaremos en los siguientes apartados, tiene los siguientes pasos:

● Planteamiento de hip ´otesis nula y alternativa, as´ı como elecci ´on del nivel de significaci ´on (normalmente 0’05 y 0’01).

● Selecci ´on de un estad´ıstico de prueba que conduce a unos l´ımites (val-ores cr´ıticos) que dividen el espacio muestral en una regi ´on donde se rechaza la hip ´otesis nula (regi ´on cr´ıtica).

(35)

Contrastes de hip´otesis e intervalos de confianza

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Para aplicar esta metodolog´ıa necesitaremos las mismas distribuciones us-adas en la obtenci ´on de intervalos de confianza. Esta situaci ´on no es ca-sual, ya que una regla factible para rechazar un determinado valor para el par ´ametro o par ´ametros desconocidos es que dicho valor se encuentre fuera del correspondiente intervalo de confianza. El contraste y los interva-los de confianza son pues, dos cuestiones estrechamente relacionadas.

(36)

Formulaci´on de un contraste

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Consideraremos una hip ´otesis estad´ıstica como cualquier afirmaci ´on, ver-dadera o falsa, sobre alguna caracter´ıstica desconocida de la poblaci ´on. El proceso de contrastaci ´on de hip ´otesis consiste en aceptarla provisional-mente como verdadera, se denominar ´a hip ´otesis nula y se denotar ´a como

H0. La veracidad de la hip ´otesis nula se somete a comprobaci ´on

experi-mental frente a otra hip ´otesis complementaria, que se denominar ´a hip ´otesis

alternativa y se denota como H1. Como consecuencia de la comprobaci ´on experimental la hip ´otesis nula podr ´a seguir siendo considerada cierta o por el contrario se rechazar ´a.

Para una determinada variable aleatoria cuya distribuci ´on de probabili-dades depende de un par ´ametro desconocido, θ, se pueden establecer las siguientes hip ´otesis:

H0 : θ ∈ ω H1 : θ ∈ Θ − ω

 ,

donde Θ se define como el conjunto de posibles valores que puede tomar

θ y que recibe el nombre de espacio param ´etrico.

En tal caso, la hip ´otesis nula, H0, afirma que el verdadero valor del

par ´ametro pertenece al subconjunto ω ⊂ Θ. Mientras que la hip ´otesis al-ternativa, H1, afirma, por el contrario, que el verdadero valor del par ´ametro

(37)

Tipos de hip´otesis

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Dependiendo del n ´umero de elementos que forman el conjunto ω, se dis-tingue entre:

● Hip ´otesis simples: Si se refiere a un ´unico valor del par ´ametro, es decir a un ´unico punto del espacio param ´etrico.

● Hip ´otesis compuestas: Si se refiere a una regi ´on del espacio param ´etrico.

(38)

Regi´on de rechazo

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Tal y como se ha dicho anteriormente, el procedimiento de contrastaci ´on de hip ´otesis consiste en tomar como cierta la hip ´otesis nula y con la in-formaci ´on proporcionada por la muestra decidir si se acepta o no dicha suposici ´on.

Con tal objetivo se tendr ´a en cuenta la siguiente definici ´on: La regi ´on de rechazo puede considerarse como el conjunto de valores del estad´ıstico

de prueba que no tienen posibilidad de presentarse si la hip ´otesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presen-tarse si la hip ´otesis nula es falsa (el valor cr´ıtico separa la regi ´on de no rechazo de la de rechazo).

Por tanto, la forma de actuar o regla de decisi ´on, siendo la regi ´on de rechazo (o cr´ıtica) el conjunto de todos los valores del estad´ıstico de prueba para los cuales la hip ´otesis nula ser ´a rechazada, ser ´a extraer una muestra y comprobar si pertenece a la regi ´on de rechazo.

¡Problema!: Si la muestra se situa en la regi ´on de rechazo se tendr´ıan indicios para creer que la hip ´otesis nula es falsa. Sin embargo, puede ocur-rir que se haya obtenido una muestra poco frecuente y tenemos el riesgo de rechazar la hip ´otesis nula siendo verdadera.

(39)

Tipos de error

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Cualquiera que sea la decisi ´on tomada, ya sea de rechazo o no de la hip ´otesis nula, puede incurrirse en error:

● Se comete error de tipo I cuando se rechaza la hip ´otesis nula siendo cierta.

● Se comete error de tipo II cuando no rechazamos la hip ´otesis nula siendo falsa.

En la siguiente tabla se muestran las decisiones que se pueden tomar y las consecuencias posibles:

H0 cierta H0 falsa

Se rechaza H0 Error tipo I Decisi ´on correcta

No se rechaza H0 Decisi ´on correcta Error tipo II

Por tanto, de los cuatro escenarios posibles, en dos se toma la decici ´on cor-recta y en los otros dos se comete un error. Ahora bien, ¿puede controlarse dicho error?

(40)

Nivel de significaci´on

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Definiendo el nivel de significaci ´on como la probabilidad de rechazar

la hip ´otesis nula cuando es verdadera y suponiendo que la hip ´otesis planteada es verdadera, entonces, el nivel de significaci ´on indicar ´a la prob-abilidad de rechazarla. Por dicho motivo se suelen tomar valores bajos, del 1% ´o 5%, para el nivel de significaci ´on.

Adem ´as, dicha elecci ´on indica que la probabilidad de cometer error tipo I es baja (por definici ´on). Si bien acabamos de ver que el error tipo I est ´a controlado, por lo general no ocurre lo mismo con el error tipo II (aunque existen situaciones donde se consigue minimizarlo).

Cuando es necesario dise ˜nar un contraste de hip ´otesis, ser´ıa deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan peque ˜nas como fuera posible. Sin embargo, con una muestra de tama ˜no prefijado, disminuir la probabilidad del error de tipo I conduce a incrementar la probabilidad del error de tipo II. El recurso para disminuir el error de tipo II, es aumentar el tama ˜no muestral.

(41)

¿Culpable o inocente?

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Supongamos que somos miembros de un jurado y tenemos que decidir si el imputado es culpable o inocente. Si construyo un test de hip ´otesis donde la hip ´otesis nula es que el imputado es inocente y la alternativa es que es culpable, los distintos escenarios que pueden surgir son:

Es inocente Es culpable Rechazo inocencia Error Decisi ´on correcta No rechazo inocencia Decisi ´on correcta Error

Por como se ha construido el contraste, el error consistente en rechazar la inocencia cuando realmente lo es (error tipo I) es muy peque ˜no, mientras que el error de que sea culpable y declararlo inocente (error tipo II) no estar´ıa controlado.

¿Es correcta la construcci ´on del contraste? Si consideramos m ´as grave declarar culpable a un inocente que dejar en libertad a un culpable, el con-traste ser ´a correcto. Por este motivo, cuando se est ´a interesado en la ve-racidad de alguna afirmaci ´on, por como se comportan los errores, su ne-gaci ´on se debe formular como hip ´otesis nula.

(42)

Con la media poblacional conocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Sea X una variable aleatoria cuya distribuci ´on de probabilidades es normal

N(µ, σ2), donde µ es conocida. Entonces, dada una muestra aleatoria sim-ple X1, . . . , Xn procedente de X, los posibles test, al nivel de significaci ´on α, para la varianza de una poblaci ´on normal con media conocida, junto a su correspondiente regi ´on de rechazo, son los siguientes:

Casos Regi ´on de rechazo

H0 : σ2 = σ20 H1 : σ2 6= σ20  1 σ02 n X i=1 (Xi − µ)2 < χ2n,α/2 ´o 1 σ02 n X i=1 (Xi − µ)2 > χ2n,1−α/2 H0 : σ2 ≤ σ02 H1 : σ2 > σ02  1 σ02 n X i=1 (Xi − µ)2 > χ2n,1−α H0 : σ2 ≥ σ02 H1 : σ2 < σ02  1 σ02 n X i=1 (Xi − µ)2 < χ2n,α

Donde χ2n,a es el punto de una chi cuadrado de n grados de libertad que deja por debajo suya una probabilidad igual a a, es decir, P[χ < χ2n,a] = a,

donde χ ∼ χ2n. Advi ´ertase que tomando como cierta la hip ´otesis nula,

tomaremos como estad´ıstico experimental χ2exp = n P i=1 (xi − µ)2 σ02 ∼ χ 2 n.

(43)

Con la media poblacional desconocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Sea X una variable aleatoria cuya distribuci ´on de probabilidades es normal

N(µ, σ2), donde µ es desconocida. Entonces, dada una muestra aleatoria simple X1, . . . , Xn procedente de X, los posibles test, al nivel de

signifi-caci ´onα, para la varianza de una poblaci ´on normal con media desconocida, junto a su correspondiente regi ´on de rechazo, son los siguientes:

Casos Regi ´on de rechazo

H0 : σ2 = σ02 H1 : σ2 6= σ02  (n − 1)S2 n−1 σ20 < χ 2 n−1,α/2 ´o (n − 1)Sn−12 σ02 > χ 2 n−1,1−α/2 H0 : σ2 ≤ σ02 H1 : σ2 > σ02  (n − 1)S2 n−1 σ02 > χ 2 n−1,1−α H0 : σ2 ≥ σ02 H1 : σ2 < σ02  (n − 1)S2 n−1 σ02 < χ 2 n−1,α

Donde χ2n−1,a es el punto de una chi cuadrado de n − 1 grados de lib-ertad que deja por debajo suya una probabilidad igual a a, es decir,

P[χ < χ2n−1,a] = a, donde χ ∼ χ2n−1. En este caso, tomando como cierta la hip ´otesis nula, tomaremos como estad´ıstico experimental

χ2 = 1 · n X

(44)

Con la media poblacional desconocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

que se distribuye seg ´un una distribuci ´on chi-cuadrado con n − 1 gra-dos de libertad y que recordemos que tambi ´en puede expresarse como

χ2exp = (n − 1)S 2

(45)

Con varianza poblacional conocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Sea X una variable aleatoria cuya distribuci ´on de probabilidades es normal

N(µ, σ2), donde σ2 es una cantidad conocida. Dada una muestra aleatoria simple X1, . . . , Xn procedente de X, los posibles test, al nivel de

signifi-caci ´on α, para la media de una poblaci ´on normal con varianza conocida, junto a su correspondiente regi ´on de rechazo, son los siguientes:

Casos Regi ´on de rechazo

H0 : µ = µ0 H1 : µ 6= µ0  |x − µ0| σ √n > Z1−α/2 H0 : µ ≤ µ0 H1 : µ > µ0  x − µ0 σ √ n > Z1−α H0 : µ ≥ µ0 H1 : µ < µ0  x − µ0 σ √ n < Zα

Donde Za es el punto de una normal de media cero y varianza uno que

deja por debajo suya una probabilidad igual a a, es decir, P[Z < Za] = a, donde Z ∼ N(0, 1).

(46)

Con varianza poblacional conocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Advi ´ertase que tomando como cierta la hip ´otesis nula, el estad´ıstico media muestral, X, seguir ´a una distribuci ´on normal de media µ0 y varianza σ

2

n y,

por tanto, el estad´ıstico experimental usado ser ´a:

Zexp = X − µ0 σ √ n .

(47)

Con varianza poblacional desconocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Sea X una variable aleatoria cuya distribuci ´on de probabilidades es normal

N(µ, σ2), donde σ2 es desconocida. Dada una muestra aleatoria simple

X1, . . . , Xn procedente de X, los posibles test, al nivel de significaci ´on α,

para la media de una poblaci ´on normal con varianza desconocida, junto a su correspondiente regi ´on de rechazo, son los siguientes:

Casos Regi ´on de rechazo

H0 : µ = µ0 H1 : µ 6= µ0  |x − µ0| Sn−1n > tn−1,1−α/2 H0 : µ ≤ µ0 H1 : µ > µ0  x − µ0 Sn−1 √ n > tn−1,1−α H0 : µ ≥ µ0 H1 : µ < µ0  x − µ0 Sn−1 √ n < tn−1,α

Donde tn−1,a es el punto de una t-Student de n − 1 grados de libertad que deja por debajo suya una probabilidad igual a a, es decir, P[t < tn−1,a] = a, donde t ∼ tn−1.

(48)

Con varianza poblacional desconocida

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Advi ´ertase que tomando como cierta la hip ´otesis nula, el estad´ıstico media muestral, X, seguir ´a una distribuci ´on t-Student con n−1 grados de libertad y, por tanto, el estad´ıstico experimental se obtiene como Texp = XS− µ0

n−1

n

(49)

Contraste de hip´otesis para la proporci´on

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

SeaX una variable aleatoria distribuida seg ´un una Bernuilli de par ´ametro p, esto es, X ∼ B(p). Dada una muestra aleatoria simple X1, . . . , Xn

proce-dente de X, los posibles test, al nivel de significaci ´on α, para la proporci ´on muestral, junto a su correspondiente regi ´on de rechazo, son los siguientes:

Casos Regi ´on de rechazo

H0 : p = p0 H1 : p 6= p0  |P − p0| q P (1−P ) n > Z1−α/2 H0 : p ≤ p0 H1 : p > p0  P − p0 q P (1−P ) n > Z1−α H0 : p ≥ p0 H1 : p < p0  P − p0 q P (1−P ) n < Zα

Donde Za es el punto de una normal de media cero y varianza uno que

deja por debajo suya una probabilidad igual a a, es decir, P[Z < Za] = a, donde Z ∼ N(0, 1).

(50)

Contraste de hip´otesis para la proporci´on

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Advi ´ertase que la proporci ´on muestral, P, se distribuye seg ´un una dis-tribuci ´on N(np, npq), por lo que el estad´ıstico experimental (supuesto que la hip ´otesis nula es cierta) quedar ´a definido como Zexp =

P − po q

P (1−P ) n

(51)

Contraste para el cociente de varianzas

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Sean X e Y dos variables aleatorias independientes distribuidas seg ´un una

N(µ1, σ12) y N(µ2, σ22), respectivamente, donde las medias son descono-cidas. Dadas dos muestras aleatorias simples X1, . . . , Xn e Y1, . . . , Ym

procedentes de X e Y , respectivamente, los posibles test, al nivel de signifi-caci ´on α, para la comparaci ´on de varianzas de dos poblaciones normales con medias desconocidas, junto a su correspondiente regi ´on de rechazo, son los siguientes:

Casos Regi ´on de rechazo

H0 : σ12 = σ22 H1 : σ12 6= σ22  S2 n−1 S2m−1 < Fn−1,m−1,α/2 ´o Sn−12 Sm−12 > Fn−1,m−1,1−α/2 H0 : σ21 ≤ σ22 H1 : σ21 > σ22  S2 n−1 Sm−12 > Fn−1,m−1,1−α

Donde Fn−1,m−1,a es el punto de una F-Snedecor de n− 1 y m − 1 grados de libertad que deja por debajo suya una probabilidad igual a a, es decir,

P[F < Fn−1,m−1,a] = a, donde F ∼ Fn−1,m−1.

Tomando como cierta la hip ´otesis nula, tomaremos como estad´ıstico exper-imental:

(52)

Varianzas poblacionales conocidas

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Sean X e Y dos variables aleatorias independientes distribuidas seg ´un una

N(µ1, σ12) y N(µ2, σ22), respectivamente, donde las varianzas son cono-cidas. Dadas dos muestras aleatorias simples X1, . . . , Xn e Y1, . . . , Ym

procedentes de X e Y , respectivamente, los posibles test, al nivel de sig-nificaci ´on α, para la comparaci ´on de medias de dos poblaciones normales con varianzas conocidas, junto a su correspondiente regi ´on de rechazo, son:

Casos Regi ´on de rechazo

H0 : µ1 = µ2 H1 : µ1 6= µ2  |X − Y | r σ21 n + σ21 m > Z1−α/2 H0 : µ1 ≤ µ2 H1 : µ1 > µ2  X − Y r σ21 n + σ21 m > Z1−α

Donde Za es el punto de una normal de media cero y varianza uno que

deja por debajo suya una probabilidad igual a a, es decir, P[Z < Za] = a, donde Z ∼ N(0, 1).

En este caso, advi ´ertase que tomando como cierta la hip ´otesis nula,

(53)

Varianzas poblacionales desconocidas e iguales

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Sean X e Y dos variables aleatorias independientes distribuidas seg ´un una N(µ1, σ12) y N(µ2, σ22), respectivamente, donde las varianzas son de-sconocidas e iguales. Dadas dos muestras aleatorias simples X1, . . . , Xn

e Y1, . . . , Ym procedentes de X e Y , respectivamente, los posibles test, al nivel de significaci ´on α, para la comparaci ´on de medias de dos poblaciones normales con varianzas desconocidas e iguales, junto a su correspondiente regi ´on de rechazo, son los siguientes:

Casos Regi ´on de rechazo

H0 : µ1 = µ2 H1 : µ1 6= µ2  |X − Y | Sp q 1 n + 1 m > tn+m−2,1−α/2 H0 : µ1 ≤ µ2 H1 : µ1 > µ2  X − Y Sp q 1 n + 1 m > tn+m−2,1−α

Donde tn+m−2,a es el punto de una t-Student de n + m − 2 grados de libertad que deja por debajo suya una probabilidad igual a a, es decir, P[t < tn+m−2,a] = a, donde t ∼ tn+m−2.

(54)

Varianzas poblacionales desconocidas e iguales

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Adem ´as, recordemos que

Sp2 = (n − 1)S 2 n−1 + (m − 1)Sm−12 n + m − 2 = n · S 2 n−1 + m · Sm−12 n + m − 2 .

Advi ´ertase que, supuesto que la hip ´otesis nula es cierta, se ha usado el estad´ıstico Texp = X − Y Sp q 1 n + 1 m ,

(55)

Contraste para la diferencia de proporciones

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

Sean X e Y dos variables aleatorias independientes que se distribuyen seg ´un B(p1) y B(p2), respectivamente. Dadas dos muestras aleatorias simples X1, . . . , Xn e Y1, . . . , Ym procedentes de X e Y , respectivamente,

los posibles test, al nivel de significaci ´on α, para la diferencia de propor-ciones muestrales, junto a su correspondiente regi ´on de rechazo, son los siguientes:

Casos Regi ´on de rechazo

H0 : p1 = p2 H1 : p1 6= p2  |P1 − P2| q P1(1−P1) n + P2(1−P2) m > Z1−α/2 H0 : p1 ≤ p2 H1 : p1 > p2  P1 − P2 q P1(1−P1) n + P2(1−P2) m > Z1−α H0 : p1 ≥ p2 H1 : p1 < p2  P1 − P2 q P1(1−P1) n + P2(1−P2) m < Zα

Donde Za es el punto de una normal de media cero y varianza uno que deja por debajo suya una probabilidad igual a a, es decir, P[Z < Za] = a,

(56)

Contraste para la diferencia de proporciones

❖´Indice

Distribuciones de los estad´ısticos

muestrales

Estimaci ´on mediante intervalos de

confianza

Estimaci ´on mediante contraste de hip ´otesis ❖Introducci ´on al contraste de hip ´otesis ❖Para la varianza poblacional ❖Para la media poblacional

❖Para la proporci ´on

❖Para el cociente de varianzas ❖Para la diferencia de medias poblacionales ❖Para la diferencia de proporciones

En este caso, tomaremos como estad´ıstico Zexp = (P1−P2)−(p1−p2)

q

P1(1−P1)

n +P2(1−P2)m

Figure

Actualización...

Referencias

Actualización...