Estimaci´ on puntual de par´ ametros

(1)

Tema 3: Estimaci´ on estad´ıstica de modelos probabilistas.

(primera parte)

Estructura de este tema:

1 T´ecnicas de muestreo y estimaci´on puntual.

2 Estimaci´on por intervalos de confianza.

3 Contrastes de hip´otesis.

(2)

Planteamiento del problema

Inconveniente: La distribuci´on de probabilidad de la v.a. X de inter´es suele serdesconocida.

Simplificación del problema: Supondremos que la distribución de probabilidad esconocida, pero que depende de unos parámetros desconocidos. Entonces, especificando el valor de los parámetros, determinamos totalmente la distribución deX.

Los par´ametros que nos van a interesar en este curso son:

• Media y Varianza poblacional(µyσ²) cuando X ∼N(µ, σ).

• Proporci´on p de individuos de una poblaci´on que presentan cierta caracter´ıstica cuandoX ∼Bernoulli(p).

• Media poblacional(λ) cuando X ∼Pois(λ) ó X ∼exp(1/λ) Objetivo: Estimar el valor de los parámetros desconocidosa partir de unamuestra aleatoria simple de la población,X1, . . . ,Xn:

• cadaXi tienela misma distribuci´onde probabilidad queX;

• las v.a. X₁, . . . ,X_n sonindependientesentre s´ı.

(3)

Unestimador/estad´ıstico es una función real de la muestra X1, . . . ,Xn (que, en general, se denota porT(X1, . . . ,Xn)) y que aproxima el valor de un parámetro de interés.

Unaestimación (puntual) es el valor (numérico) concreto que toma un estimador al ser aplicado a una realización muestral y se denota utilizando el s´ımbolo: b(p.e. ˆµ, σ,ˆ p,ˆ λ) .ˆ

Estimadores naturales de la media y varianza poblacional son:

• Media muestral: X¯ = X1+· · ·+Xn

n = 1

n

X

i=1

Xi

• Varianza muestral: VX = 1 n

n

X

i=1

(Xi −X¯)²= 1 n

n

X

i=1

X_i²−X¯²

• Cuasi-varianza muestral: S_X² = 1 n−1

n

X

i=1

(Xi−X¯)²

(4)

Determina en los siguientes ejemplos el parámetro poblacional de interés, su correspondiente estimador y la estimación con los datos obtenidos.

Ejemplo 3.1: Se está estudiando el nô de aver´ıas que se registran en las Centrales Eléctricas. En uno de los estudios se analizaron 35 muestras aleatorias y se observó que 6 de ellas sufrieron algún tipo de incidencia.

Ejemplo 3.2: Se contabiliza el tiempo (en milisegundos) de acceso a un registro de una base de datos. Debido a imprecisiones en los aparatos, las medidas tienen distribuci´on normal. Se toman 10 muestras aleatorias a la base de datos y se analizan. La media observada es 0,88.

(5)

Obs. Un mismo estimador puede tomar diferentes valores num´ericos, e.d. tenemos diferentes estimaciones, ya que su valor dependetotalmente de la muestra concreta que se ha utilizado.

Ejemplo 3.2 (cont.): Los tiempos observados fueron:

0,73 0,8 0,9 1,24 0,82 0,72 0,57 1,18 0,54 1,3

¯

x= v_x = s_x² =

Se vuelve a la misma base y se recogen otras muestras diferentes, obteni´endose los siguientes tiempos:

1,56 1,22 1,32 1,39 1,33 1,54 1,04 2,25 1,49 1,28

¯

x= v_x = s_x² =

(6)

Estimaci´ on puntual de par´ ametros

SeaX1, . . . ,Xn una muestra aleatoria de una población X cuya distribución de probabilidad es conocida pero depende de un parámetro desconocidoθ= (θ1, . . . , θk).

Objetivos:

• Aproximar/estimar el valor de θmediante estimadores ˆθ.

• Estudiar m´etodos parahallar estimadores.

• Decidirqu´e estimadores son razonables.

SiX es una v.a. discreta, lafunci´on de masa de la muestra es:

P(x1, . . . ,xn) =P{X1=x1, . . . ,Xn=xn}=P(x1)· · ·P(xn) SiX escontinuacon densidad f,la funci´on de densidad de la muestraes:

f(x1, . . . ,x_n) =f(x1)· · ·f(xn)

(7)

PRIMER M´ETODO: M´etodo de los Momentos

El estimador por elm´etodo de los momentos, que denotaremos por θˆ= ( ˆθ₁, . . . ,θˆ_k), se obtiene al resolver el siguiente sistema











E_θ[X] = ¹_nPn i=1Xi, E_θ[X²] = ¹_nP_n

i=1X_i²,

· · ·

E_θ[X^k] = ¹_nPn i=1X_i^k

Observación: Presenta el inconvenientede que la solución puede no pertenecer al espacio paramétrico.

(8)

SEGUNDO MÉTODO: Estimación por el método de máxima verosimilitud (EMV)

La funci´on de verosimilitud de la muestra observadax1, . . . ,xn es L(θ) =L(θ;x₁, . . . ,x_n) =

P_θ(x1)· · ·P_θ(xn) si X es discreta f_θ(x1)· · ·f_θ(xn) siX es continua Expresa lo veros´ımil que es el valor de un par´ametroθen base a la muestra observada.

El estimador dem´axima verosimilitud (EMV), ˆθ= ( ˆθ1, . . . ,θˆ_k), es el que maximiza la func. de verosimilitudL(θ).

Observación: En la práctica, la forma más cómoda de encontrar el EMV es considerar ln(L(θ)) en vez deL(θ):

∂ln(L(θ))

∂θ = 0

(9)

Sesgo y Error Cuadr´atico Medio

Una medida del comportamiento del estimador ˆθ es suerror cuadr´atico medio(ECM)

Eh

(ˆθ−θ)²i

=V_θ(ˆθ) + (Sesgo(ˆθ))², siendo Sesgo(ˆθ) =E(ˆθ)−θ.

SiE(ˆθ) =θ se dice que el estimador ˆθ esinsesgado.

Sesgo

Sesgo(ˆθ) = E(ˆθ)−θ.

Un buen estimador debe ser insesgado o tener un sesgo peque˜no.

Estimador insesgado:

13.2. Insesgadez

Insesgadez

θ

θ θ Sesgo positivo:

13.2. Insesgadez

Insesgadez

θ

θ θ

Sesgo negativo:

13.2. Insesgadez

Insesgadez

θ

θ θ

(10)

Ejemplos importantes:

Distribuci´on Estimadores

X ∼Bernoulli(p) pˆ= ¯x X ∼Poisson(λ) λˆ= ¯x

X ∼exp(λ) λˆ= 1/¯x

X ∼N(µ, σ) µˆ= ¯x ˆ

σ² =v_x, s_x²

¿C´omo de buenos son estos estimadores?, es decir ¿son insesgados?

Tenemos que estudiar la distribuci´on de X¯...

(11)

Propiedades de la media muestral X¯:

SeaX₁, . . . ,X_n una muestra aleatoria de una v.a. X, la media muestral ¯X verifica:

• Si X tiene distribución normal, entonces la distribución de los valores que toma ¯X es también normal.

Si X ∼N(µ, σ) =⇒ X¯ ∼N

µ, σ

√n

.

• Teorema central del l´ımite (TCL): Sin es grande, la distribuci´on de ¯X esaproximadamente normal de mediaµy desviaci´on t´ıpica σ/√

n,aunque X no sea normal.

Sin es grande =⇒ X¯ ^aprox∼ N E(X),

pVar(X)

√n

! .

(12)

Distribuci´on de la media muestral

(13)

Conclusiones: Sea X1,· · · ,Xn una muestra aleatoria de una v.a.

X con media y varianza poblacional µyσ² respectivamente

• La media muestral ¯X siempre es unestimador insesgado de la media de la poblaci´on: E( ¯X) =µ.

• La varianza muestralV_X es unestimador no insesgado de la varianza de la poblaci´on: E(VX) = n−1

n σ².

• La cuasivarianza muestral S_X² es un estimador insesgado de la varianza de la poblaci´on: E(S_X²) =σ².

Observaci´on: Se divide por n−1 ya que puede demostrarse que al dividir porn el estimador tiene una tendencia sistem´atica a

infraestimar el verdadero valor de la varianza poblacionalσ². Esta es la raz´on por la que se usa la cuasi-varianza muestral y no la varianza muestral: estimador insesgado de la varianza poblacional.