Por ejemplo, p puede ser el porcentaje de personas que votarán "sí" en un referéndum. Como el lector puede entender en estos ejemplos, el parámetro θ que queremos estimar no necesita ser el parámetro oficial del que depende la distribución de la variable aleatoria. En aX∼exp(λ) nos puede interesar el parámetro oficial θ=λ, o la expectativa θ = 1/λ, o la probabilidad de pasar el nivel 1, que sería θ =e−λ.
Dado que toda la distribución de X depende de λ, cualquier otro parámetro dado por una función de λ es generalmente invertible. Aunque tenemos cierta libertad para elegir el parámetro a estimar, lo más común es estimar el parámetro "oficial" de la distribución o estimar momentos (media, varianza o quizás desviación estándar) como parámetros de la distribución. A veces, la forma funcional de la distribución puede depender de dos parámetros (o incluso más, aunque esto ya es más inusual).
Aquí los parámetros oficiales de distribución son su media E(X) =μy varianzaV(X) =σ2. Los parámetros oficiales son λ y t; mientras que la media y la varianza vienen dadas por combinaciones de estos: E(X) =t/λ y V(X) =t/λ2.
Generalidades sobre estimadores
- Dependencia de la funci´ on de densidad respecto de los
- Sesgo de un estimador. Estimadores insesgados
- Varianza de un estimador
- Error cuadr´ atico medio
Entendemos que la muestra concreta (x1, . . . , xn) de la que obtendremos la estimación de θ es una realización o una materialización de (X1,. Nuestro objeto de estudio es una variable aleatoria X cuya distribución de probabilidad depende de una parámetro θ Tenga en cuenta que el valor de θ corresponde a una función específica de segunda densidad o masa1.
El sopθ será un intervalo o unión de intervalos (finitos o no) de R para variables continuas, o un subconjunto contable de R en el caso de discretas (en los modelos más usuales, un subconjunto de y para variables finitas, un subconjunto finito de R). En ellos detallamos la expresión de la función de masa o densidad y el espacio de parámetros. La expresión de la función de densidad o masa suele implicar soporte2, pero aun así también la escribiremos de forma explícita.
2Otra opción sería incluir funciones indicadoras en la expresión de la función densidad/masa. Dada una variable X con función densidad/masa f(x;θ), nos interesará calcular la media de las variables Y = g(X), donde g es alguna función. Tenga en cuenta que si T es un estimador del parámetro θ, entonces la desigualdad de Markov lo da.
En lo que sigue, como en el ejemplo 5.1.6, calcularemos con el parámetro λ, para traducir al final aμ).
M´ etodos de construcci´ on de estimadores
M´ etodo de momentos
Este método requiere primero una expresión explícita de Eθ(X) en términos de θ y luego resolver la ecuación (5.5) para obtener una estimación. De hecho, generalmente se obtiene una etiqueta de precio diferente para cada momento de la variable. Por ejemplo, si decidiéramos usar un segundo momento, la ecuación apropiada sería
Cuando hay múltiples parámetros, como ocurre con las variables normales o gamma, es fundamental recurrir a múltiples momentos. Veamos ahora algunos ejemplos en los que ya hemos usado la notación de variables aleatorias para ilustrar todas estas posibilidades. El estimador es un estadístico que registra la proporción de unidades en la muestra (X1,.
Considere la función de densidad (de una variable aleatoria triangular, simétrica con moda y media en 0). Como veremos más adelante (ejemplo 5.4.9), este segundo estimador Mσ2 (que proviene del segundo y no del primer momento) tiene mejores propiedades. Como se ilustra en el siguiente ejemplo, a veces no es fácil resolver θ en la ecuación Eθ(X) = x.
No "sabemos" cómo despejar λ de la ecuación anterior, y para cada muestra tendremos que resolverla numéricamente. Así que cuidado, si x la media de una muestra de X fuera <1/2, a veces no habría estimación.
M´ etodo de m´ axima verosimilitud
La función de probabilidad es un producto de varios (quizás muchos) factores, a menudo números menores o iguales a 1. En la definición de la estimación de parámetros θ con m, la máxima verosimilitud se basa en la hipótesis de que la función de verosimilitud (5.6) de la muestra tiene un máximo global único. A veces, porque la función de verosimilitud no es derivable en todos los puntos (ver ejemplo 5.2.11).
En otros casos (ejemplo 5.2.14), la función de probabilidad puede tener varios máximos locales. En el lado derecho, hemos escrito la función de probabilidad en términos de la media de la muestra, que en este caso es simplemente la proporción de unos en la muestra. En este caso, la realización (x1, . . , xn) consta de enteros positivos xj ≥ 1, y la función de probabilidad es .
El único punto crítico, que es la estimación de máxima verosimilitud, ˆp, se obtiene derivando con respecto ap (e igualando a 0) la función. La función de verosimilitud para una muestra observada (x1, . . . , xn) (que necesariamente consta de números positivos) es. A continuación, trazamos la función de verosimilitud y la verosimilitud logarítmica para n= 10 y x= 1/2.
El parámetro de la distribución a estimar es σ2, por lo que establecemos θ = σ2 y escribimos la función de verosimilitud en términos de θ. Este límite (que no depende de σ2) de la función de probabilidad tiende a 0 cuando |μ|. Aquí no derivamos, sino que observamos directamente que el máximo de la función de probabilidad se alcanza precisamente en el valor de ˆa.
En este caso, la función de verosimilitud es, argumentando como en el ejemplo anterior, Busquemos los puntos críticos de la función de verosimilitud, o mejor dicho, los de la función logarítmica de verosimilitud. Finalmente, lo igualamos a 0 para obtener que los puntos críticos de la función de verosimilitud verifiquen la ecuación.
Ese único punto crítico será el máximo global de la función de verosimilitud y, por lo tanto, la estimación de máxima verosimilitud de θ. Tenga en cuenta que el espacio de parámetros es discreto y, por lo tanto, no tiene sentido derivar la función de probabilidad de muestra que toma.
Informaci´ on y cota de Cram´ er–Rao
Informaci´ on y cantidad de informaci´ on de una variable . 42
Comportamiento asint´ otico de estimadores
Comportamiento asint´ otico de los estimadores por momen-
Comportamiento asint´ otico de los estimadores de m´ axima