U3.3. Intervalos de confianza

(1)

1-α

z

α/2 z1-α/2

UNIDAD 3. LA INFERENCIA INDUCTIVA

Inferencia estadística: Estimación por Intervalos de confianza

Cuando se obtiene una estimación puntual de un parámetro, es conveniente acompañar dicha estimación por una “medida” de la precisión de la estimación. Un modo de hacerlo es informar el estimador y su error estándar. Otro modo es reemplazar la estimación puntual por un intervalo de valores posibles para el parámetro.

Ejemplo: Supongamos que tenemos una muestra aleatoria X1, X2,…, Xn

proveniente de una población con distribución N (μ, σ2

) con varianza 2_conocida.

Por ser los datos normales, sabemos que:

2

, X (0,1)

X N N

n

 

 _

  _ 

 

 

y, por lo tanto, partiendo de un valor de probabilidad (identificada como 1-α) de que la distancia que separe a Xde μ no supere a un cierto valor “a” puede deducirse que





1

P X a  es equivalente a decir que1 P X a z₁ _/2 1

n n



 _

  

 

 _ 

    

 

 

o sea que Z= X

n



 se encuentra comprendido entre dos límites opuestos, y éstos

pueden obtenerse de la tabla de la función de distribución normal estándar a partir de dicha probabilidad que corresponde al área encerrada en esa zona, que gráficamente puede verse como:

1

Utilizaremos la identificación a z₁ _/2.

n

 



 que se obtiene despejando de la expresión dada. Área

α/2 Área

(2)

En el gráfico puede verse cómo los límites de esa zona pueden determinarse perfectamente conociendo sólo el valor de probabilidad 1-α sin saber el valor de los parámetros de la distribución normal considerada.

De aquí es que surge que P X z₁ _/2 1

n



 _

 

 

 _ 

   

 

 

de los que se obtiene

mediante equivalencias algebraicas las siguientes desigualdades:

0 1 /2. 1

P X z

n 



 _ 

 _ _ _{ }

 

  ó lo que es lo mismo,

0 0

1 /2. 1 /2. 1

P X z X z

n n

 

 _  _

 

 _ _{ } _ _{ }

 

 

Es decir, que la probabilidad de que el intervalo construido a partir de datos muestrales y del valor de la varianza poblacional incluya al parámetro μ “se sabe”

que es 1-α. De estos conceptos surge la noción de intervalo de confianza, en el caso analizado para μ conociendo el valor de σ dada una variable normal.

Def: Sea una muestra aleatoria X1, X2,…, Xn de una distribución que depende de

un parámetro θ. Dadas dos valores obtenidos de la muestra Liy Ls tales que

P(Li< θ<Ls) = 1-α

con α pequeño, el intervalo obtenido se denomina intervalo de confianza de nivel 1 - α para el parámetro θ.

En ocasiones, como el ejemplo que se presentó recién, el intervalo que resulta es simétrico respecto al estimador puntual de referencia, dependiendo esta característica de la distribución del estimador (en distribuciones normales hay simetría)

Como puede verse, el formato que adquiere el intervalo construido puede resumirse como

[X-a; X+a]

donde a se corresponde con el radio del intervalo o con su semi-amplitud.

Obs: 1) Decir “la probabilidad de que μ pertenezca al intervalo (a, b) es 1 - α” no

es conceptualmente acertado porque θ no es una variable aleatoria. El intervalo

es aleatorio ya que sus extremos son funciones de la muestra y por lo tanto, debemos decir “la probabilidad de que el intervalo (a,b) contenga al parámetro μ es 1 - α”

(3)

Interpretación: Supongamos que, en base a diferentes muestras calculamos los correspondientes intervalos de confianza para μ. Entonces el (1 - α) 100% de ellos contendrán al verdadero valor μ.

Error máximo de estimación: corresponde a la máxima distancia que separa al parámetro del estimador (que en el caso mencionado es el centro del intervalo). Coincide, en algunos casos, con la semi-amplitud del intervalo a.

Prop: d X( ; )  X  a→a=Error Máximo de Estimación

Intervalos de confianza para los parámetros de una distribución normal

Intervalo de confianza para μ de la distribución normal con varianza conocida

Sea una muestra aleatoria X1, X2,…, Xn de una distribución de una distribución

N(μ, σ2), entonces vimos que:

1 /2. 1 /2. 1

P X z X z

n n

 

 _  _

 

 _ _{ } _ _{ }

 

 

de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para μ,

1 /2. ; 1 /2.

X z X z

n n

  

 

 

 

 _   _

 

o bien   Xa X; a

con

a z1 /2. n

 



(4)

Intervalo de confianza para σ2

de la distribución normal

N(μ,σ2

), sabemos que:

2 2

1 2

( 1)

n

n S _

 



donde _n2_₁ indica que el estadístico referido sigue una distribución Chi-cuadrado con n-1 grados de libertad.

Para la construcción del intervalo, análogamente al ejemplo visto, se consideran los percentiles de la distribución como se indica en la siguiente figura:

Los elegimos de manera tal que quede un área igual a α/2 en cada extremo, utilizando el mismo criterio que en los intervalos que construimos para la media poblacional. Entonces,

2

2 2

1; /2 2 1; 1- /2

( 1)

1

n n

n s

P    _    

 _  _ _{ }

 

 

Se obtiene así el siguiente intervalo:

2 2

1; 1- /2 1; /2 2

( 1) ( 1) ;

n n

n s n s

 

 _ _

 

 _ _ 

 _ _

 



Este intervalo ya no tiene una configuración simétrica respecto al estimador s2 como el de μ ya que la distribución del estimador s2

no es simétrica como la distribución normal que sigue Xcuando la variable en estudio tiene distribución normal.

Intervalo de confianza para μ de la distribución normal con varianza desconocida

N(μ, σ2), entonces vimos antes que X t_n ₁ s

n





por lo tanto puede obtenerse

análogamente al planteo y desarrollo del intervalo para μ con σ conocido el

2

1; /2 n 

 _

2

(5)

se obtienen de la distribución t con n-1 grados de libertad:

1; 1 /2. 1; 1 /2. 1

n n

s s

P X t X t

n n

   

   

 _ _{ } _ _{ }

 

 

de donde se deduce el intervalo de confianza de nivel 1 - α para μ con σ2 desconocido,

1; 1 /2. ; 1; 1 /2.

n n

s s

X t X t

n n

    

 

 _   _

 

o bien  _ _Xa X; a_ con a = t_n _{1; 1} _/2. s

n



 

Intervalos de confianza de nivel asintótico 1 – α

En muchos problemas no es posible encontrar intervalos de confianza de nivel exacto 1 - α, o bien son de muy difícil construcción. En otros casos disponemos de muy poca información sobre la distribución de las variables aleatorias en estudio. En estos dos tipos de situaciones es posible obtener intervalos de confianza de nivel aproximado cuando el tamaño de la muestra es grande, utilizando los resultados aportados por el Teorema Central del Límite.

Intervalo de confianza (de nivel asintótico 1 – α) para μ en distribuciones desconocidas

En el caso de poblaciones que no son normales, o que simplemente no sabemos si lo son o no, necesitamos que el tamaño de la muestra sea suficientemente grande para poder aplicar el Teorema Central del Límite que garantiza que:

(0,1)

X

N

n



 (aproximadamante)

y así obtener el intervalo de confianza de nivel aproximado 1 – α para la media μ de una población con desviación típica conocida σ, como fue construido para distribuciones normales:

1 /2. ; 1 /2.

X z X z

n n

  

 

 

 

 _   _

 

(6)

1 /2. ; 1 /2.

s s

X z X z

n n

  

 

 _   _

 

Intervalo de confianza (de nivel asintótico 1 – α) para el parámetro π de la distribución Binomial

Dada una muestra aleatoria donde interesa calcular la proporción de “éxitos” p

que se presentan allí, y a partir de ella, dar una estimación de la proporción poblacional π correspondiente. Queremos construir un intervalo de nivel asintótico 1 - α para π. Para esto, recordemos que, por el Teorema Central del Límite,

1 _, (1 )

n

i d i

X k

p N

n n n

  

   

  _{ } _

 



y, por lo tanto

1 /2 1 /2 1

(1 )

p

P z z

n

 

 _

 

 

 

 _ 

    

  

 

 

De esta manera se obtiene un intervalo para π de nivel aproximado 1 – α:

1 /2 1 /2

(1 ) (1 )

. p p ; . p p

p z p z

n n

  

   

 _   _

 

Una observación necesaria es que para dar una estimación del desvío de p como estimador de π se utiliza la expresión del mismo sustituyendo a π que es desconocido, por su estimador p, dado que:

Verdadero desvío de p = (1 )

n

 

→ Valor estimado del desvío de p = p(1p)

n

Técnica para calcular el tamaño muestral a partir de un error máximo de estimación dado

Determinación del tamaño de muestra cuando se va a estimar μ

Consideremos el intervalo de confianza para μ con varianza conocida. La longitud

L del intervalo obtenido puede obtenerse del error máximo de estimación (con σ

conocido) ya que es:



2 2 ₁ _/2.

L a z

n

 

y depende de:

(7)

0 0,5 1 0,25

p f(p)

Un modo de obtener mayor precisión, es decir un intervalo más angosto, es aumentando el tamaño de la muestra. Si se desea una longitud menor o igual que L_o, entonces

2

1 /2 1 /2

0 1 /2 0 0

0 0

0

2 . 2 .

2 . z z

L z n n

L L

n

 



 

 _ _



 

    _{ } _

 

y, en general, si se quiere obtener un error máximo determinado o conocido, basta calcular n en función de su valor, como:



 

 _ _

2 1 /2.

n z

a

 

Determinación del tamaño muestral al estimar π

Como vimos al estimar μ es posible calcular el valor del tamaño de la muestra a partir de conocer el error máximo de estimación a.

Recordemos que la semi-amplitud a del intervalo de confianza para π resulta de calcular:

1 /2

(1 ) . p p

a z

n





 

que depende de la proporción muestral. Por esta razón se hace necesario, antes de tomar la muestra, estudiar los valores posibles de n según las cotas que pueden manejarse para el valor de p.

Como sabemos que 0 ≤ p ≤ 1, puede analizarse el comportamiento de la

expresión f(p) = p(1-p) en ese rango y ver allí los valores máximo ó mínimo que toma (es una función continua bien conocida).

Volviendo a la expresión de la semi-amplitud del intervalo, puede sustituirse el valor de p por 0,5 de forma tal que la búsqueda del valor de n esté orientada al mínimo que resulte de la condición que se le impone al error máximo de estimación a. De esta manera:

2 1 /2

1 /2 1 /2

0,5(1 0,5) 0,25

n=

2

z

a z n z

n a a



  

 

  

    _ _

 

Gráficamente, puede verse que es una función cuadrática, cuyas raíces son p=0 y p=1, por lo tanto su vértice estará ubicado en p=0,5 y por tener concavidad negativa, resulta ser máxima su imagen f(0,5)=0,25.

De ahí que resulta: f(p)=p(1-p) ≤ 0,25 cualquiera

(8)

Así se logra obtener un valor de n que no involucre ningún valor particular de p