INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY
PRESENTE.-Por medio de la presente hago constar que soy autor y titular de la obra
denominada
en los sucesivo LA OBRA, en virtud de lo
cual autorizo a el Instituto Tecnológico y de Estudios Superiores de Monterrey (EL
INSTITUTO) para que efectúe la divulgación, publicación, comunicación pública,
distribución, distribución pública y reproducción, así como la digitalización de la
misma, con fines académicos o propios al objeto de EL INSTITUTO, dentro del
círculo de la comunidad del Tecnológico de Monterrey.
El Instituto se compromete a respetar en todo momento mi autoría y a
otorgarme el crédito correspondiente en todas las actividades mencionadas
anteriormente de la obra.
De la misma manera, manifiesto que el contenido académico, literario,
la edición y en general cualquier parte de LA OBRA son de mi entera
responsabilidad, por lo que deslindo a EL INSTITUTO por cualquier violación a los
derechos de autor y/o propiedad intelectual y/o cualquier responsabilidad
relacionada con la OBRA que cometa el suscrito frente a terceros.
Estimación de Parámetros de un Canal Compuesto Utilizando el
Método de Momentos GeneralizadoEdición Única
Title
Estimación de Parámetros de un Canal Compuesto
Utilizando el Método de Momentos GeneralizadoEdición
Única
Authors
Ana Cecilia Puón Díaz
Affiliation
Tecnológico de Monterrey, Campus Monterrey
Issue Date
20081101
Item type
Tesis
Rights
Open Access
Downloaded
19Jan2017 01:34:07
SUPERIORES DE MONTERREY
C A M P U S M O N T E R R E Y
PROGRAMA DE GRADUADOS EN MECATRÓNICA.
Y
TECNOLOGÍAS DE INFORMACIÓN
TECNOLÓGICO
DE MONTERREY
ESTIMACIÓN DE PARÁMETROS DE UN CANAL COMPUESTO UTILIZANDO EL MÉTODO DE MOMENTOS GENERALIZADO
Por
ANA CECILIA PUÓN D Í A Z
TESIS
COMO REQUISITO PARCIAL PARA OBTENER EL GRADO DE
MAESTRO EN CIENCIAS
EN S I S T E M A S E L E C T R Ó N I C O S CON E S P E C I A L I D A D
EN TELECOMUNICACIONES
SUPERIORES DE MONTERREY
CAMPUS M O N T E R R E Y
Programa de Graduados en Mecatrónica y Tecnologías de Información
TECNOLÓGICO
DE MONTERREY
Estimación de parámetros de un canal compuesto
utilizando el Método de Momentos Generalizado
por
Ana Cecilia Puón Díaz
Tesis entregada al Tecnológico de Monterrey como requisito parcial para el grado de Maestro en Ciencias en Sistemas Electrónicos con especialidad en Telecomunicaciones
Noviembre 2008
DE MONTERREY
CAMPUS MONTERREY
Programa de Graduados en Mecatrónica y Tecnologías de Información
Estimación de parámetros de un canal compuesto utilizando el
Método de Momentos Generalizado
escrita por
Ana Cecilia Puón Díaz
Dr.Frantz Bouchereau Lara Asesor
Dr. David Muńoz Rodríguez Coasesor
Dr. Cesar Vargas Rosales Sinodal
Dr. Joaquín Acevedo
Director de Investigación y Postgrado Escuela de Ingeniería
La copia final de esta tesis ha sido examinada por los que firman la misma, y han encontrado que tanto el contenido y la forma cumplen con las normas aceptables de
Puón Díaz, Ana Cecilia (M.S.ET)
Estimación de parámetros de un canal compuesto utilizando el Método de Momentos Generalizado
Tesis dirigida por Dr. Frantz Bouchereau Lara
Agradecimientos
Gracias a Dios por permitirme vivir hasta este día, darme la fuerza y la inteligencia para lograr mis metas y sobretodo rodearme de gente que me aprecia y me quiere.
Agradezco a mis
papás
y mis hermanas por ser cuatro personas de las que estoy orgullosa, las cuales siempre han sido y serán el soporte en mi vida. Debido a nuestra diferencia de personalidades, comunicación y amor hemos logrado progresar individual mente y como familia, ojalá más personas tuvieran una familia como la nuestra.También quiero retribuir al Dr. Frantz Bouchereau por ser un buen maestro y guía en mi trabajo, y por impulsarme a realizar la maestría que ahora termino.
Gracias al Ing. Armando Cespedes por todo el apoyo durante mi maestría en la parte administrativa y en la realización de los proyectos.
Doy gracias a mi coasesor encubierto M.C.Carlos Alejandro Robles por su apoyo, carińo y sobretodo por coincidir conmigo en el lugar y tiempo apropiados.
A mi amiga Karla por sus consejos, apoyo y por influir en mi vida. A mi prima Ametzin por sus enseńanzas, por mover la otra parte de mi personalidad y por encon trarnos de nuevo en esta vida.
A mi tía Laura por compartirme sus conocimientos y brindarme su carińo. A mi familia regia Rosa, Lolis, Rodolfo, Oscar, Patricio y Mauricio, por siempre estar al pendiente de mí y apoyarme.
Índice
Capítulo
1 Introducción 1
1.1 Descripción del Problema 3
1.2 Objetivos 3 1.3 Justificación 3 1.4 Contribución 4 1.5 Organización de la Tesis 4
2 Canales con desvanecimiento 5
2.1 Desvanecimiento a Pequeńa Escala 6 2.2 Desvanecimiento a Gran Escala 7 2.3 Desvanecimiento compuesto 8
3 Método de Momentos Generalizado(GMM) 17
3.1 Método de Momentos(MOM) 17 3.1.1 Teoría de la Distribución de Muestras Grandes 18
3.1.2 Estimación de Parámetros de Distribuciones 20
3.1.3 Propiedades Asimptóticas 22 3.2 Método de Momentos Generalizado(GMM) 24
3.2.1 Matrices de Pesos, WT 25
3.2.2 Propiedades Asimptóticas 29 3.3 Aplicación: Estimación GMM de parámetros que describen canales inalámbricos
con el modelo compuesto GaminaLognormal 33 3.3.1 Implementación del Método de Momentos Generalizado 34
3.3.2 Obtención de varianzas y varianzas cruzadas de momentos mues
trales para la matriz WT 36
4 Simulaciones 45
4.1 Procedimiento 45 4.2 Escenarios 46
4.2.1 Rayleigh 46 4.2.2 Lognormal 46 4.2.3 Suzuki 47 4.3 Estimación con GMM 47
4.3.1 Medidas para el análisis del comportamiento del estimador . . . 48
4.4 Resultados 50
5 Conclusiones 69
5.1 Trabajo Futuro 71
Tabla
Figura
4.1 Curvas de MSE para los estimados de m, s2,
a, y m, las cuales se obtuvieron de
observaciones GL con parámetros que caracterizan a una distribución Rayleigh. 52
4.2 Curvas del porcentaje de veces que la hipótesis nula (que dos distribuciones son
iguales) en una prueba de KolmogorovSmirnov(KS) es aceptada usando obser
vaciones GL con parámetros que caracterizan a una distribución Rayleigh. . . 53
4.3 Curvas de MSE para los estimados de m, s2,
a, y m, las cuales se obtuvieron de
observaciones GL con parámetros que caracterizan a una distribución Rayleigh,
con el proceso de sombreado decorrelacionado usando a = 20 54
4.4 Gráfica del valor absoluto de la varianza cruzada entre el momento potencia 0.2
y el momento log 55
4.5 Gráfica del. valor absoluto de la varianza cruzada entre el momento potencia 0.2
y el momento 0.1 56
4.6 Gráfica del valor absoluto de la varianza cruzada entre el momento potencia 0.1
y el momento entre dos muestras con separación de 2 TIEMpos 56
4.7 Curvas de MSE para los estimados de m, s2,
a, y m, ,las cuales se obtuvieron de
observaciones GL con parámetros que caracterizan a una distribución Lognormal. 58
4.9 Curvas del porcentaje de veces que la hipótesis nula(que dos distribuciones son
iguales) en una prueba de KolmogorovSmirnov(KS) es aceptada usando obser
vaciones GL con. parámetros que. caracterizan a una, distribución Lognormal. . 60
4.10 Curvas de MSE para los estimados de m, s2,
a, y m,, las cuales se obtuvieron de
observaciones GL con parámetros que caracterizan a una distribución Lognor
mal, con el proceso de sombreado decorrelacionado usando a = 20 61
4.11 Curvas de MSE para los estimados de m, s2,a, y m, las cuales se obtuvieron de
observaciones GL con parámetros que caracterizan a una distribución Suzuki. . 63
4.12 Medición de la sensibilidad del parámetro a2
con la distancia de Kullback. • . 64
4.13 Medición de la sensibilidad del parámetro ra con la distancia de Kullback. . . . 65
4.14 Curvas del porcentaje de veces que la hipótesis nula(que dos distribuciones son
iguales) en una prueba de KolmogorovSmirnov(KS) es aceptada usando obser
vaciones GL con, parámetros que caracterizan, a una distribución Suzuki. . . . 66
4.15 Curvas de MSE para los estimados de m, s2,
a, y m,las cuales se obtuvieron de
observaciones GL con parámetros que caracterizan a una distribución Suzuki,
Introducción
El canal inalámbrico es altamente aleatorio y no permite un análisis sencillo de los efectos que ocasiona en las seńales transmitidas. Regularmente los modelos estadísticos que describen la envolvente de la seńal recibida y el canal inalámbrico se obtienen en forma empírica, caracterizando estadísticamente datos obtenidos al transmitir seńales en algún canal determinado, ya que no existen modelos genéricos que se adecúen a cualquier canal. El problema de estos modelos es que sólo son válidos para el canal en donde se realizaron las mediciones y dependen del rango de frecuencias utilizado en el sondeo del canal.
Los modelos simples como Rayleigh,LogNormal, Nakagami,etc, han sido am pliamente usados en la literatura para proporcionar información de los fenómenos que afectan a la propagación en el canal inalámbrico como son el desvanecimiento por múltiple trayectoria o el sombreado. Desafortunadamente dichos modelos no describen totalmente al canal debido a que sólo puntualizan un fenómeno. Por ejemplo, es común que el sombreado se modele con la distribución Lognormal y la múltiple trayectoria con Rayleigh. Pero la experimentación en diversos canales inalámbricos ha dado como resultado la aceptación de otras distribuciones de la envolvente de una seńal recibida a través de una trayectoria. Estas distribuciones, que junto con la Rayleigh y Lognormal llamaremos clásicas, son la Riceana, Nakagamim, Suzuki y mediaGaussiana [2].
caracterizar el canal inalámbrico en áreas cerradas. En la mayoría de los resultados de dicho estudio la distribución que mejor describió las muestras fue la lognormal, pero también concluyó que no había un modelo consistente que presente una distribución, basada en potencia, que abarque diferentes condiciones ambientales.
Los métodos para la selección de modelos estadísticos que no necesitan la com paración de la distribución cumulativa empírica de los datos, ya que esto último necesita postprocesamiento, y que describan lo mejor posible el comportamiento de los datos obtenidos a través del canal se basan en la estimación de parámetros que rigen a una familia de distribuciones lo suficientemente rica como para incluir uno o más modelos de desvanecimiento. Estos modelos, llamados de desvanecimiento compuesto, fueron propuestos inicialmente para explicar la transición entre el desvanecimiento a pequeńa y a gran escala [3].
La distribución GammaLognormal(GL) es una de estas familias de distribuciones que permite el modelado correcto de observaciones de potencia recibida sin la necesidad de que sean i.i.d.. Esta distribución contiene a los modelos Lognormal, Nakagamim, Rayleigh, determinístico, medioGaussiano, Suzuki,etc. La ventaja de utilizar el modelo propuesto es la posibilidad de seleccionar el modelo de desvanecimiento más adecuado de acuerdo a los valores que se obtengan de la estimación de los parámetros de la distribución GL. La selección del modelo se basa en determinar en que región de las delimitadas en la tabla 2.1,que se desplegará en el siguiente capítulo, se encuentran los parámetros.
proceso de sombreado se mantiene constante en una ventana de tiempo cuya duración es determinística y conocida.
1.1 Descripción del Problema
Este trabajo busca estimar los parámetros que describen el modelo estadístico compuesto GammaLognormal(GL). El estimador aquí propuesto usa el Método de Momentos Generalizado que es consistente; es óptimo de acuerdo al criterio de pesos dado por la ecuación (3.18) que es la minimización del error cuadrático medio ponderado con una matriz de pesos; también utiliza muestras que no son i.i.d. y es fácilmente implementable.
1.2 Objetivos
El primer objetivo es estudiar modelos estadísticos simples y compararlos con uno compuesto para el desarrollo de un modelo de canal inalámbrico más general y completo.
Otro de los principales objetivos es implementar el Método de Momentos Gen eralizado aunque el nivel de dificultad sea mayor al Método de Momentos. Una de las implicaciones que tiene este objetivo es la investigación de los tipos de matrices de pesos que se pueden utilizar, ya que es posible elegir una matriz que cumpla con las condiciones de asintoticidad pero no ser la óptima.
1.3 Justificación
1.4 Contribución
Este trabajo expone al estimador del Método de Momentos Generalizado de los parámetros del modelo GammaLognormal, el cual es óptimo con respecto a la elección de la matriz de pesos W t en 3.18, y lo compara con el estimador del Método de Mo mentos presentado en [1]. También utiliza distintas matrices de pesos para implementar GMM de las cuales la inversa de la matriz que usa la diagonal de la covarianza esti mada da mejores resultados debido a que las otras matrices necesitan perfeccionar su estimación.
1
.5
Organización de la Tesis
Canales con desvanecimiento
La propagación de las seńales en un canal inalámbrico es caracterizada por tres fenómenos independientes: la pérdida de potencia por trayectoria, el desvanecimiento por sombreado (desvanecimiento a gran escala) y el desvanecimiento por múltiple trayec toria (desvanecimiento a pequeńa escala) [5],[6].
La pérdida de potencia por trayectoria, la cual representa la atenuación de la seńal con una cantidad positiva medida en dB, es definida como la diferencia entre la potencia efectiva transmitida y la potencia recibida, y puede incluir o no incluir la ganancia de las antenas. La ecuación característica de este fenómeno es
donde P^o e s Ia potencia recibida a una distancia de referencia dO, en este caso lm,
y n es el exponente de pérdida de potencia por trayectoria , el cual varia entre 1 y 5. La ecuación (2.1) puede ser utilizada en canales donde la potencia sólo decae con la distancia, pero en un ambiente real se necesita tomar en cuenta otros factores que deterioran la seńal para hacer un modelado más aproximado.
El fenómeno de desvanecimiento ha sido confundió por algunos autores al utilizar indistintamente los conceptos de desvanecimiento rápido y lento, y los de desvanec imiento a pequeńa y gran escala. Los primeros tienen que ver con la relación entre la razón de cambio en el tiempo del canal y la seńal transmitida, y los últimos describen la pérdida de la potencia en la propagación de la seńal [7].
En este capítulo se tomará en cuenta que el canal inalámbrico tiene una respuesta con ganancia constante y una fase lineal durante su ancho de banda que es más grande que el ancho de banda de la seńal transmitida, entonces la seńal transmitida tendrá un desvanecimiento plano [7]. En este tipo de desvanecimiento las características espec trales de la seńal transmitida serán preservadas en el receptor. Sin embargo, la potencia de la seńal recibida cambiará con el tiempo debido a fluctuaciones en la ganancia del canal causadas por múltiple trayectoria y / o por sombreado. Aquí se presentaran los efectos de la propagación de la seńal relacionados con los desvanecimientos en el canal y su relación con los ambientes físicos.
El sombreado y la múltiple trayectoria tienen una descripción matemática des conocida o muy compleja para el análisis de sistemas de comunicación. Sin embargo, se han utilizado modelos estadísticos que dependen particularmente del ambiente de propagación y el escenario de comunicación [8].
2.1 Desvanecimiento a Pequeña Escala
Este fenómeno es usado para describir las rápidas fluctuaciones de las amplitudes, fases, o retrasos por múltiples trayectorias de una seńal de radio en un periodo corto de tiempo o de distancia recorrida. Este desvanecimiento es causado por interferencias entre dos o más versiones de la seńal transmitida que llegan al receptor en intervalos de tiempo cortos. Las seńales repetidas que llegan al receptor se combinan para dar una seńal resultante la cual varia en amplitud y fase dependiendo de la distribución de la intensidad, el tiempo relativo de propagación de las ondas y del ancho de banda de la seńal transmitida [7].
Los efectos más importantes causados por este desvanecimiento son:
• Modulación aleatoria de frecuencia debida a los desfasamientos Doppler,desfa
samientos en la frecuencia de la seńal recibida ocasionados por el movimiento, sobre seńales con múltiples trayectorias
• Dispersión en tiempo(ecos) causados por retardos en la propagación.
Las múltiples trayectorias son las reflexiones causadas por el terreno y los obstácu los que se encuentran cercanos al receptor. La seńal recibida en cualquier punto del es pacio iluminado por el haz del transmisor consiste en una gran número de ondas planas que tienen amplitud, fase y ángulo de llegada con distribución aleatoria. Estos compo nentes por múltiple trayectoria se combinan vectorialmente en la antena receptora, y pueden causar una distorsión o desvanecimiento en la seńal recibida [7].
Parsons [5] menciona que es un fenómeno espacial, pero las variaciones espaciales son experimentadas como variaciones temporales para los receptores que se mueven a través del canal de múltiple trayectoria. Aún cuando el receptor se encuentra esta cionario, la seńal recibida sufrirá desvanecimiento debido al movimiento de los objetos que lo rodean en el canal inalámbrico.
2.2 Desvanecimiento a Gran Escala
El sombreado manifiesta la variación lenta de la media de la potencia de la seńal en distancias correspondientes a varias longitudes de onda entre el transmisor(Tx) y el receptor(Rx). Este es causado por variaciones en la topología del ambiente físico donde se propaga la seńal.
El comportamiento del sistema de comunicación dependerá del sombreado sólo si el receptor es capaz de promediar la múltiple trayectoria o si es empleado un sistema eficiente de microdiversidad para eliminar los efectos de las reflexiones. Observaciones experimentales hechas en ambientes exteriores e interiores [3, 9, 10, 11, 12, 13] han arrojado que el sombreado puede modelarse con una distribución lognormal.
La ecuación (2.1) es un modelo de pérdida de potencia por trayectoria para cualquier separación entre el Tx y el Rx, que esta en función de la distancia, pero se necesita introducir al modelo el fenómeno de sombreado para considerar el hecho de que el ambiente periférico puede variar en dos diferentes puntos que tienen la misma distancia entre el T x y el Rx, lo que vuelve a la potencia recibida una variable aleatoria.
2.3 Desvanecimiento compuesto
La distribución compuesta se forma del desvanecimiento por múltiple trayectoria impuesto sobre sombreado lognormal. En los sistemas donde el receptor se mueve muy lento o está estacionario, como puede ser el caso de las antenas en una fábrica, es muy difícil que se puedan promediar los efectos de la múltiple trayectoria y una distribución compuesta es necesaria para evaluar el comportamiento de la conexión y otras cantidades [6].
Dos diferentes enfoques se han sugerido en la literatura para obtener una dis tribución compuesta. El primer enfoque expresa la envolvente,zt, (o el cuadrado de la envolvente) como una densidad condicional en Qv = E[z(t)](o Qp = E[z(t)
2
}), y luego
integrar sobre la densidad de ílv(o ílp) para obtener la distribución compuesta
El segundo enfoque, originalmente sugerida por Lee and Yeh [14], define la seńal compuesta recibida como el producto del desvanecimiento a pequeńa escala(múltiple trayectoria) y a gran escala(sombreado). Entonces, en cualquier tiempo t, la envolvente
de la seńal compuesta tiene la forma
¿
c(t)
=
z(t)n
v{t)
(2.3)y el cuadrado de la envolvente de la seńal compuesta tiene la forma
%(t) = ¿
2(t)-Sl
p(t).
(2.4)Bajo el supuesto de que el desvanecimiento a pequeńa escala y a gran escala son procesos aleatorios independientes, se puede desmostrar que las dos aproximaciones llegan al mismo resultado, para mayor referencia véase [[6],Sec. 2.4.2].
2.4 Modelos Estadísticos
Dependiendo de la naturaleza del ambiente físico en el que se propaga la seńal existen diferentes tipos de modelos que describen el comportamiento estadístico de la envolvente compleja de la seńal recibida.
2.4.1 Rayleigh
En los canales de radio, la distribución Rayleigh es comúnmente usada para des cribir la naturaleza estadística en el tiempo de la envolvente recibida de una seńal con desvanecimiento plano [7]. Cuando la seńal recibida está compuesta por múltiples re flexiones, la seńal compleja paso baja recibida r(t) =
r¡(t)
+
j
V
q(í)
puede ser modelada como un proceso Gaussiano complejo. En ausencia de una línea de vista (LOS,por sus siglas en inglés), r¡(t) y rg(í) tienen media cero [6]. La envolvente compleja z(t) =| r(t) j que es la suma de dos seńales en cuadratura de ruido Gaussiano obedece una distribución Rayleigh. La distribución Rayleigh tiene una función de densidad de probabilidad (pdf, por sus siglas en ingles) dada por(0 <
r <
oo)(2.5)
Pz(r)
£exp(-?%£l
v ' (2.6) 0($))) (A>0,r>0)
0 (r < 0).
El parámetro A denota la máxima amplitud de la seńal dominante y To() o s Ia
función de Bessel modificada del primer tipo y de orden cero. La distribución Riceana es frecuentemente descrita en términos del parámetro K que es definido como la razón entre la seńal de potencia deterministica y la varianza debido a la múltiple trayectoria. Esta dada por K = A2
/(2a2
) o , en términos de dB
A
2K{dB) = lOlog^dB
(2.7)
El parámetro K es conocido como el factor Riceano y especifica completamente donde a es el valor rms del voltaje de la seńal recibida antes de la detección de la envolvente, y la <x2 es la potencia promediada en el tiempo de la seńal recibida antes
de detección de la envolvente [7].
2.4.2 Ricean
Esta distribución es usada cuando existe un componente estacionario de línea de vista en la trayectoria de propagación. En este tipo de situaciones los componentes aleatorios de múltiples trayectorias que llegan a diferentes ángulos se superimponen a la seńal estacionaria dominante [7]. Esto quiere decir que, siguiendo con la terminología empleada arriba, r¡{f) y rg(í) tienen una media que no es cero.
El efecto de la llegada de una seńal dominante con muchas seńales de múltiple trayectoria débiles da como resultado una envolvente con distribución Riceana. La distribución Riceana tiende a Rayleigh cuando la componente dominante se desvanece [71
la distribución Riceana. Si A —> O , K oo dB,y así como el elemento dominante decaiga en amplitud, la distribución Riceana se degenera a una distribución Rayleigh.
La fase de seńal recibida está uniformemente distribuida en el rango de ( — 7r, 7r), y su pdf es po{0) = 1/27T si A —> 0. Si K 1, entonces la fase tiende a la del componente dominante.
2.4.3 L o g n o r m a l
Como se mencionó anteriormente la pérdida de potencia por trayectoria PL{d). para una distancia en particular, es aleatoria considerando sombreado y puede ser des crita por la distribución lognormal.
Retomando la ecuación (2.1) y agregando sombreado al modelo se tiene el sigu iente modelo para pérdida de potencia por trayectoria:
donde Xa es una variable aleatoria Gaussiana con media cero (en dB) y con desviación estándar a (también en dB).
La variable lognormal 7 dada por Xa — 10ÍO(7io7,con la siguiente pdf
donde Ł = j ^ -v //7(dB) y cr7(dB) son la media y la desviación estándar de 10/o<?io7
respectivamente [8].
También 7 representa el nivel medio de la envolvente^ = E[z(t)}, donde el valor esperado es tomado sobre la pdf de la envolvente recibida. También 7 es llamada la media local ya que representa el nivel promedio de la envolvente sobre una distanca de pocas longitudes de onda [6].
La distribución lognormal describe los efectos del sombreado aleatorio que ocurren en un gran número de mediciones en distintos lugares que tienen la misma distancia de
(2.8)
separación entre el TxRx, pero con diferentes cantidades de obstáculos en la trayectoria de propagación. El sombreado lognormal implica que las mediciones de los niveles de la seńal a una separación específica TxRx tienen una distribución Gaussiana con una media dada por (2.1), donde los niveles de la seńal tienen valores en unidades dB [7].
2.4.4 Suzuki
Esta distribución ha demostrado ser útil para modelar canales con múltiple trayec toria y sombreado en un medio urbano donde se propagan ondas de radio. La dis tribución Suzuki es una mezcla de las distribuciones Rayleigh y Lognormal, que de scribe las variaciones espaciales locales(áreas con diámetros menores a cien longitudes de onda) y a las globales(las que incluyen áreas más grandes) de la envolvente y / o las fluctuaciones temporales por el desvanecimiento a pequeńa y a gran escala. El canal de radio en un medio urbano es esencialmente un canal de múltiple trayectoria, debido a reflexiones, refracciones y dispersiones por edificios que es modelado comúnmente como un filtro lineal [3].
La seńal principal llega al receptor que se encuentra dentro de un grupo local de edificios. Antes de entrar a la dispersión local del grupo de edificios esta seńal ya atravesó un camino que es influenciado por múltiples reflexiones y / o difracciones por distintos objetos. Debido a esto la envolvente de la seńal, llegando al grupo local de edificios, será una seńal aleatoria. Al llegar al grupo local el trayecto se empieza a descomponer en pequeńos trayectos como resultado de la disperción por los objetos locales. Las seńales generadas por los subtrayectos llegan casi con el mismo retraso, pero con fases diferentes de la portadora. Consecuentemente, la envolvente de la seńal vista por el receptor tiende a ser distribuida de la siguiente manera
donde / ( x ; a) es una pdf dentro de un área local, con un vector de n parámetros,
E
Q(CT) es una distribución de a que depende del trayecto del transmisor al grupo local de edificios, o(a\,G2, ...,<rn), es un vector en el espacio de los parámetros[3]. Para describir la distribución Suzuki se toma en cuenta que la trayectoria que sigue la seńal del transmisor al grupo local tiene una distribución lognormal debido a que conlleva a efectos multiplicativos, mientras que la trayectoria en el grupo local tiene una distribución Rayleigh porque es generada por la adición de un efecto de dispersión. Y está descrita con el siguiente modelo
>M
=r^Ł)^H
JJ
^h
(2u)
2
. 4 . 5
Nakagami-m
Esta distribución fué introducida por Nakagami a principios de 1940 's para carac terizar el desvanecimiento rápido en distancias largas de canales HF [15]. La distribución Nakagami fue seleccionada para clasificar datos empíricos [6].
La pdf de la distribución Nakagamim, que describe la envolvente recibida z(t) = | r(t) |, es en esencia una distribución chicuadrada centrada dada por
, . 2mmx2m1 , m i \
PÁ¿) = ~ ^, s ™p(—;=r), x > 0 2.12)
1 v ' f í ™ r ( m ) 1 v Qp ' ~ y '
donde m es el parámetro Nakagamim de desvanecimiento que varia desde (1/2) hasta
oo y
ü
p=
E[z
[15];
\/m2 — m
K = — m > 1, (2.13) m — v m2 — m,
Como la distribución Riceana contiene la función de Bessel y la distribución Na kagami no, la distribución Nakagami regularmente lleva a una expresión analítica con forma cerrada [6].
2.4.6 Gamma
El cuadrado de la envolvente, z2
, tiene una densidad Gamma dada por [6]
. . mmxm~l . mx.
^ = T ^ ^ " ^
( 2
1 5 )2.4.7 Gamma-Lognormal
El ambiente de propagación para las seńales de radio es conveniente modelarlo como un canal con sombreado y con desvanecimiento Nakagami, porque la distribución Nakagami es matemáticamente conveniente [6]. La distribución compuesta del cuadrado de la envolvente con desvanecimiento Nakagami y sombreado lognormal tiene una función de densidad GammaLognormal.
La distribución compuesta GammaLognormal fue introducida por Ho y Stüber [16]. Esta familia de distribuciones considera la envolvente de la seńal, yt, como la multiplicación de los efectos por múltiple trayectoria (xt) y el sombreado (eZt) expresada
por
Vt = ezt
xt (2.16)
El proceso aleatorio {^t} es Gaussiano con media /x y función de autocovarianza E[ztzt+T] — = cr
m"
T(m) exp[{(m — \)log y — mz — m,ye
z
}}
V2
.exp dz,donde m es el parámetro de desvanecimiento Nakagamiin, la // es el valor medio y la <72 es la varianza de la variable aleatoria lognormal. Si se condiciona sobre z, los
componentes de y son mutualmente independientes.Entonces, dejando que fz denote la función Nmultidimensional de densidad normal con media ¡i y matriz de covarianza A j j = o2R&{U — tj),el likelihood de esta famiia de distribuciones esta dado por 1
/ /2(z) exp \ y~]{m l)logyt mzt myte
Zf > dz[l}.
(2.18) La definición de la distribución Lognormal usa el logaritmo natural en lugar de la definición clásica con dB (WlogíQ()). La familia GL contiene las distribuciones correspondientes a Lognormal, Naka gami, Rayleigh, deterministica, mediaGaussiana, así como también un rico set de pro cesos con desvanecimiento compuesto. Uno de los beneficios de usar este tipo de familias es la selección, a través de los parámetros {żż,<r2, del mejor modelo de desvanec
imiento para cada set de datos sin necesidad de utilizar observaciones i.i.d. y de hacer comparaciones usando postprocesamiento.
1 log d e n o t a el l o g a r i t m o n a t u r a l
L(//,
a
2,
m,a) =
mr(m)
vector de parámetros a tiene un rango A. La distribución del proceso aleatorio {zt} está completamente caracterizado por dim(a) + 2 parámetros reales. En términos físicos, {ez',t = 1 ,N } denotan muestras del proceso de sombreado Lognormal. Las variables
aleatorias Gamma x son i.i.d. e independientes del vector z. El 1enésimo componente del vector x tiene una media unitaria y una varianza 1/m [1].
La densidad de la variable aleatoria yt es
fy= I
a los modelos clásicos de desvanecimiento. Hay que subrayar que los modelos clásicos de desvanecimiento usualmente se refieren a la distribución de la envolvente, no a la potencia instantánea.
Modelo de desvanecimiento m
GL
5R
R+Rayleigh 5? « 0 w 1
Lognormal K+ « 0
Nakagamim
»
w 0 3Í+Suzuki
3?
+ « 1halfGaussian w 0 « 2
[image:32.612.234.445.147.242.2]Método de Momentos Generalizado(GMM)
En este capítulo se presentarán estimadores que se alejarán de suposiciones para métricas para retomar estimadores que son robustos a variaciones del proceso de ge neración de datos. Primero se empezará con la teoría del estimador formalizado más viejo, la clásica teoría del Método de Momentos. La utilización de los momentos muestra como los bloques de construcción de la estimación de ecuaciones es de gran importancia en los análisis económicos y debido a que estos manejan datos estocásticos de series de tiempo se decidió utilizar esta teoría e implementarla en la construcción de estimadores de parámetros para canales inalámbricos.
3.1 Método de Momentos(MOM)
El método de momentos es uno de los estimadores formales más antiguos, se remonta desde Karl Pearson en los 1800s. Tiene la virtud de ser fácil de implementar pero en muchos casos, desafortunadamente, el método entrega estimadores no óptimos. De cualquier manera, es un buen comienzo cuando la implenientación de otros métodos es totalmente intratable.
a la varianza más el cuadrado de la media de la distribución de yż. Esta constante será, en su momento,una función de los parámetros desconocidos de la distribución. Para estimar K parámetros, 0\,#ft,se pueden calcular con K estadísticos, iri\,?7>/^,que sus límites de probabilidad son funciones conocidas de los parámetros. Estos K mo mentos son igualados a las K funciones, y las funciones son invertidas para expre sar los parámetros como funciones de los momentos. Los momentos serán consis tentes por virtud de la ley de grandes números (Teoremas 3.1.23.1.8). Ellos tendrán asimptóticamente una distribución normal por virtud del teorema de límite central de LindbergLevy(3.1.10). Los estimadores de parámetros derivados heredaran la consis tencia por virtud del Teorema de Slutsky (3.1.12) y la normalidad asimptótica por virtud del método delta (3.1.11) [17].
3.1.1 Teoría de la Distribución de Muestras Grandes
En muchas ocasiones, sólo es posible hacer declaraciones aproximadas acerca de los estimadores en lugar de la distribución de la muestra. Por ejemplo, si ellos mejoran cuando el tamańo de la muestra se incrementa y lo que puede ser dicho acerca de la distribución muestral en muestras grandes como aproximación de las muestras finitas actuamente observadas. En esta subsección se enunciarán formalmente los teoremas fundamentales necesarios para dicho análisis, los cuales son usados para describir los estimadores de este capítulo. Los siguientes teoremas fueron extraídos del libro [17].
Teorema 3.1.1.
Convergencia en sentido cuadrático medioSi xn tiene una media \.in y una varianza o\ tal que los límites ordinarios de fin
y o\ son c y 0, respectivamente, entonces xn convergirá en sentido cuadrático medio a
c, y plim xn = c.
Teorema 3.1.2.
Consistencia de la media muestralLa media de una muestra aleatoria de cualquier población con media ˇá y o'2
es un estimador consistente de \i. Demostración: E[xn\ = /i y Var[xn] — o'n/n.
Entonces, xn convergirá en sentido cuadrática medio a ˇi, o plim xn — ˇi.
Corolario 3.1.3.
Corolario del Teorema 3.1.2Consistencia de una media de funciones. En el muestreo aleatorio, para
cualquier función g(x), si E[g(x)} y Var[g(x)} son constantes finitas, entonces
Demostración: Definir' yi = g(xi) y usar el Teorema 3.1.2.
Teorema 3.1.4.
Ley débil de Khinchine de los grandes númerosSi xż, i—l,...,n es una muestra de observaciones de una distribución con media
finita, E[XÍ] = fi, entonces plim xn = ˇi. La demostración de este y del siguiente teorema
es bastante complicada.
Teorema 3.1.5.
Ley débil de Chebychev de los grandes númerosSi Xi, i=l,...,n es una muestra de observaciones tal que E[XJ\ = /x < oo y
Var\x„\ = o~\ < oo tal que afjn = (1/n2
) J\ a\ —> 0 como n—> oo entonces
plim(xn fin) = 0.
Teorema 3.1.6.
Ley fuerte de Kolmogorov de los grandes númerosSi X ż , % = 1 j ... y n es una secuencia de variables independientemente distribuidas tal
que E[xj] = fi < oo y Var[xn] = a
2 < oo tal que Y1T < 0 0 c°wi° 0 0 entonces
plim xn — fin 0.
Teorema 3.1.7.
Ley fuerte de Markov de los grande númerosSi {ZJ}, es una secuencia de variables aleatorias independientes con E[ZJ] = /i,; <
oo
y si para algunos 6 > 0, E[\zi ~Mż|
1+<5]A
1+<5<
entonces zn — ˇ2n convergirá
casi seguramente(a.s) a 0, lo que se denotaría zn — fi.n 0.
Teorema 3.1.8.
Convergencia en potencias pequeńas1 n
Si Xi converge en la renésima media a c entonces xn convergirá en la senésima
media a c para toda s<r. La demostración usa la inecualidad de Jensen, Teorema 3.1.9.
Si se escribe E[\xn — c|
s
] = E[(\xn — c\ r
ylr
] < {E[(\xn — c |
r
) ] }s
/r
y el término del centro
converge a cero entonces la función completa también debe Jiacerlo.
Teorema 3.1.9. Desigualdades para esperanzas
Inecualidad de Jensen. Si g(xn) es una función cóncava de xn, entonces
Inecualidad de CauchySchwartz.Para dos variables aleatorias, E[\xy\] <
Teorema 3.1.10. Teorema de Límite Central LindbergLevy
Si xí, ... ,xn son una muestra aleatoria proveniente de una distribución de pro
babilidad con media /i y a2
t finitas y xn — (1/n) Y17=\
xi> entonces
Teorema 3.1.11. Límite en Distribución Normal de una función
Si \/rˇ.(zn — fi) —> N[0,o
2} y si g(z
n) es una función continua que no involucra a
n, entonces
g{E[xn\) > E\g(xn)}.
s/n(xn n) ^ N[0,a
2}.
Vż\9(zn)9(H)]±N[0,{9'(H)}
2<T2]. (3.2)
Teorema 3.1.12. Teorema de Slutsky
Para una función continua g(xn) que no es una función de n,
plim g(xn) = giplim xn). (3.3)
3.1.2 Estimación de Parámetros de Distribuciones
E[y2K
], el kenésimo momento no centrado es
n
(3.4)
Por el Teorema 3.1.1,
E[m'k\ = ,i'k = E[y?\ (3.5)
y
Var[m'k] = (l/n)Var[y^} = (l/n)(/4 /^). (3.6)
Por convención, ˇ i \ = E[yi\ = /x.Por el Teorema de Khinchine, 3.1.4,
plim m'k = p'k = E[y k
i\. (3.7)
Finalmente, por el Teorema de Límite Central de LindbergLevy, se tiene que
En general, p,'k será una función de los parámetros que interesan. Calculando K mo
mentos no centrados e igualándolos a estas funciones, se obtienen K ecuaciones que pueden(en principio) ser resueltas para brindar estimados de los K parámetros desco nocidos.
Aunque los momentos basados en potencias de y proveen una fuente natural de información acerca de los parámetros, otras funciones de los datos pueden ser también útiles. Si m.k() es una función continua y diferenciable que no involucra el tamańo de
la muestra (n), entonces el momento generado estaría dado por
Esto se deduce del Teorema 3.1.2 y del corolario, 3.1.3, plim mk = E[nik(yi)] =
//fc(#l, ...,8ˇ<) Se asume que /.żfc() involucra algunos o todos los parámetros de la dis tribución. Si se requiere estimar K parámetros entonces se plantean mínimo K cena (3.8)
k = 1 , 2 ,K . (3.9)
ciones de momentos,
mi m(0i,...,0K) = 0 , (3.10)
ma U2{9I,...,0K) = 0,
mK UK(0I, ...,0k) = 0,.
Si las ecuaciones son continuas y funcionalmente independientes, entonces el estimador del Método de Momentos puede ser obtenido resolviendo el sistema de ecuaciones para
En la mayoría de los casos, los estimadores del método de momentos no son eficientes. La excepción se da en las muestras aleatorias provenientes de una familia exponencial de distribuciones.
Si los momentos son calculados como en la equación (3.9), donde yż es una ob servación de un vector de variables, entonces un estimador apropiado de la matriz de covarianza ashnptótica de [mi, ...,m/<] puede ser calculada usando
Este estimador proporciona la matriz de covarianza asimptótica para los momentos usados en el cálculo de los parámetros estimados. Bajo la suposición de que las muestras aleatorias son iid de una distribución que tiene momentos finitos arriba de los 2K, F
convergirá en probabilidad a la matriz de covarianza apropiada del vector de momentos normalizado, í> = Asy.Var\\/ñxa.n(d)\. Finalmente, bajo la suposición de las muestras aleatorias, aunque la distribución exacta es probable desconocida se puede recurrir al Teorema de límite central de LindbergLevy para obtener una aproximación asimptótica
Qk
= ^[mi,....
m
K].
3.1.3
Propiedades Asimptóticas
K. (3.11)
Para formalizar esta derivación, ahora se escribirán las ecuaciones de momentos como
mn,fc(É»i,É'2,,É'A:) = 0, k = l,...,K. (3.12)
El índice n indica la dependencia de un set de datos de n observaciones. En esta forma general de ecuaciones de momentos se combinaran los estadísticos muestra y las
funciones de parámetros, fi(0i, ...,0K) Si Gn(6) es la matriz K x K que su kenésimo
renglón es el vector de derivadas parciales
Gn,k = gQˇk • (3.13)
Ahora, se expande el set resuelto de ecuaciones de momentos alrededor de los valores reales de los parámetros 9q en una serie lineal de Taylor. La aproximación es
O«[m„(0o)] +
G
n(0
o)(l90o).
(3.14)Por consiguiente,
v^(0
90)« [G^eo)]
1
v^[m
n(eo)].(3.15)
Del Teorema de Límite Central se puede decir que y/
ń mn( 0o) tiene una dis
tribución normal con un vector de medias igual a cero y una matriz de covarianza igual a 3>. Suponiendo que las funciones en las ecuaciones de momentos son continuas y fun cionalmente independientes, se puede esperar que G„(#o) convergirá a una matriz no singular de constantes,r(0o) En condiciones generales la distribución límite del laclo derecho de la ecuación (3.15) será la de una función lineal de un vector distribuido nor malmente. Concluyendo, se esperaría que la distribución asimptótica de 0 sea normal con un vector de medias
6q
y una matriz de covarianzas^{[^'(Oo)]
1}*!
IT
(0o)]
_ 1}
Entonces, la matriz de covarianza asimptótica para el estimador del método de momen tos podría estimarse con
Est.Asy.Var[é]
= [G'J^F^G^é)]
1.
m\(yt) ui(9\,...,0K)
m2{yt) - U2{01, •••,8K)
(3.17)
mK(yt) UK(0I,,0K)
para todo tiempo t.
Usando la ecuación anterior y bajo las suposiciones hechas en las secciones ante riores, específicamente que plimfl(yt,6) = E[/3(yt,0)] = 0, los estimadores del Método de Momentos Generalizado son los valores incluidos en 6 que minimizan a
T T
<h(0) = TlY,fllyt,0)'w TT
lY,P{vtJ), (3.18)
í=i t=i
donde es una matriz positivamente semidefinida la cual depende de los datos y converge en probabilidad a una matriz positivamente semidefinida de constantes [19] y T es el mimero de muestras totales. Estos estimadores son llamados de mínima distancia.
3.2 Método de Momentos Generalizado(GMM)
Las restricciones sobre la matriz de pesos son necesarias para asegurar que 4>T(0) sea una medida significativa de distancia. Si WT es positivamente semidefinida asegura que 4>T{9) > 0 para cualquier 0, y también que 4>T{9T) = 0 si T_ 1
YÍt=i PiUt^r) = 0. Sin embargo, la propiedad de ser positivamente semidefinida deja abierta la posibilidad de que <PT{0T) sea cero en un valor de 0T que no satisfaga las condiciones de los momentos muestras. Desafortunadamente en modelos no lineales es casi imposible obtener una solución con forma cerrada del estimador 0. Pero en la actualidad los procesos de optimización son implementados en softwares como Matlab@[19].
3.2.1 Matrices de Pesos,
W
TLa matriz de pesos WT juega un papel importante en el análisis del Método de Momentos Generalizados porque determina la naturaleza exacta del valor mínimo de 4>T(0) Debido a lo anterior es importante hablar de las diferentes WT que se pueden utilizar para este método. El estimador 0 converge en probabilidad a los valores reales si las funciones condición aseguran que hay suficiente información con la cual se puede estimar 0^ y que esta información es correcta. La elección de la matriz determina como esta información es usada y como impacta en la precisión del estimador. La matriz de pesos óptima es definida para producir la varianza asimptótica mínima del estimador GMM[19]. Hansen define a {8 : T > 1} como una secuencia de vectores aleatorios que con vergen en probabilidad a #o para el cual {\/TaTp(0) • N > 1} converge en probabilidad a cero, donde WT = á'TaT y {OT} debe converger a una matriz de constantes óo Este
estimador GMM es asimptóticamente normal y depende de su matriz de covarianza asimptótica para la limitación de la matriz de pesos ¿to- Asumiendo que las condiciones de primer orden para el problema de minimizar (f>T son satisfechas por PT entonces
D
^T
QˇjN
bilidada 0o;{ar : T > 1} converge en probabilidad a ao;entonces {{83 / 30){0T) • T > 1} converge en probabilidad a do y {&T • N > 1} converge en probabilidad a żo = d^a^ao. El Teorema 3.1 en [18] seńala que {\/T(0T ~ 0o) '• T > 1} converge en distribución a un vector aleatorio con distribución normal con media cero y matriz de covarianza (á[)dü)~
1
áüSá'0{áod0)~ 1
'.
La definición de S esta dada por
T
S = lim Var[Tl
'2S
TPt}. (3.19)
í = l
El teorema 3.2 de Hansen supone que {0f • T > 1} 6 A y que la matriz de pesos límite asociada con §T satisface (áofifo)~ 1áoS'«,aó(áodo)~1' =
[doS^do)"1
. Entonces bajo dicha suposición, 0T es óptimo con matriz de covarianza asimptótica (df0S'
ldo) 1.
Además, todos los estimadores óptimos en A tendrán dic:ha matriz de covarianza límite, y ńo = ed'0S~
l, para alguna matriz e no singular (q x q).
Si se escoge la matriz a'0ao = S~
l como la matriz de pesos límite entonces el
estimador será óptimo.
Aunque para obtener ż>Y se necesita 0? s o puedo construir un estimador consis
tente usando un estimador consistente de 0. Para resolver este problema se recurre al procedimiento de Hansen de dos pasos para un estimador GMM óptimo con respecto a la elección de la matriz de pesos.En el primer paso se puede usar una matriz de pesos subóptima como Wf = Iq, donde q es el número de momentos condición, para construir
0l
y este estimador es usado para construir ż>Y En el segundo paso, el modelo es reos timado usando Wi = S^1
. El estimador de S usado en el segundo paso de estimación es basado en un estimador subóptimo 81
3 . 2 . 1 . 1
W
T=l
Para la primera estimación de los parámetros
1 0 ü 0 1 0
0 0 0 . . . ln
(3.20) entrega una estimación consistente haciendo equipotenciales las condiciones,pero como se mencionó anteriormente la varianza más pequeńa de 6 se obtiene de un estimador que utiliza la matriz inversa de S para pesar la diferencia entre los momentos muéstrales y los momentos analíticos, ya que elige la información necesaria acerca de la importancia de los diferentes momentos.
3 . 2 . 1 . 2 WT = S i
La matriz de covarianza de largo plazo S existe y es positivamente definida. T
Var\T~l
'r
T — o c
5 = lim Var[T~l
l2y 0 t]
T—>yc
f = l
( V
V 2 ż
A Ł [ T
- ^ ¿ ^ A
V
í = i t = i / limE
T—>oc
X
\ i = l t = l / donde fit = ftillu 0).Para simplificar la notación
t~
1/2Ef=i
Pt - e[t-w Eli &} = t-
1 1 2E L (A
m)),
entonces
S = Tlim EiiTV^fr E\f3t\)}{T ll2
Y,(& ~ E\Pt])Y] t = i í = i T T
lim ż ^ T "1/2 Ł Ł
(/ 3í _ !?[&])'].
i —>rx> ' ż— ' (3.21)
La estacionariedad implica que E[(3t — E[f3t])(3tj — E[0t_j])') — Fj, para todo
t y de esta manera
S = T
0+
JimíE
( ^ Y
1
)
(
rż +
rí)} =
ro + f > > +
rí) (
3
22)
j = i v ' ż = i
La matriz Fj es conocida como la jenésima matriz de autocovarianza de /ż[19]. El estimador de esta matriz que se utilizará será:
» i
5 = f0 +
2Efj,
(3.23)donde Fj = E\(0t ~ —
E[fitj])'} debido a que J3t se estimará con los
parámetros estimados con MOM.
3.2.1.3
W
T =
Í'T
1,
J diagonal En general, si IVV es positivamente definida y plim^Yl'iii P = 0, entonces el estimador de mínima distancia que minimiza 4>T{0) en (3.18) es consistente [17]. El problema ahora es decidir que matriz de pesos usar, en [17] seńalan que basados en la lógica que motiva mínimos cuadrados generalizados, la matriz de pesos óptima es la que sus elementos son los recíprocos de las varianzas de los momentos individuales,*2.gonal = diag({Asy.Var[f3}}~
1) = diag({^Var[/3]}-1), (3.24)
donde J3 es el vector ^ YlJ=i P- Ya que los momentos son sumas de las observaciones estos son variables aleatorias las cuales tienen varianzas estimables. De esta forma los K elementos de (3(yt, 0) se suponen poco correlacionados, y se puede construir esta matriz que ignora esta correlación [17].
La matriz de covarianza asimptótica del estimador GMM que tiene a WT =
y
GMM =^[G'WG]"
1,
(3.25)donde G es la matriz de derivadas con el jenésimo renglón igual a
GJ=plim!^jP.. (3.26)
Finalmente, por virtud del teorema de límite central para los momentos muestra y el teorema de Slutsky aplicado a esta manipulación, se espera que el estimador sea asimptóticamente normalmente distribuido [17].
3.2.1.4 WT = ^0\n p l e t a
La matriz de pesos que también se puede utilizar es la matriz completa:
Completa = i Asy. ^ \0\) = { ^ a r ^ ] } "1. (3.27)
Esta matriz toma en cuenta todas las correlaciones entre los distintos momentos y realiza dobles dobles sumatorias dentro del valor esperado.
3.2.2 Propiedades Asimptóticas
En los modelos lineales, el análisis asimptótico se basa crucialmente en una ex presión cerrada para 9T Sin embargo, una representación de este tipo no existe en los modelos no lineales y por eso es necesario una demostración diferente. Si se establece la consistencia del estimador entonces es posible invocar el Teorema del Valor Medio para obtener una representación de OT — #o que facilita una derivación de que su dis tribución estadística es asimptótica normal. Hansen [18] estableció estas propiedades en su artículo original.
Antes de desarrollar el análisis asimptótico es necesario hacer restricciones sobre yt En primer lugar el proceso debe ser estrictamente estacionario, y para que se puedan
aplicar las Leyes de los Grandes Números y el Teorema de límite central se hará la siguiente suposición.
Suposición 3.2.1. Ergodicidad El proceso aleatorio {yż; —oo < t < 0 0 } es ergódico.
Para la ergodicidad es suficiente que la dependencia entre yt y ytm decrezca a
es llamado un proceso mezclado.
El estimador GMM esta basado en el set de condiciones ortogonales,
E[Pi(0Q)} = 0
donde 6q es el vector de parámetros verdaderos. El subíndice i es para indicar la dependencia de los datos observados. Promediando estas condiciones sobre las muestras observadas se produce la ecuación de los momentos muestra
E[Pt(Oo)] = o
donde
fr(0
o) =
^Łí=ift(0o)
Este set de L ecuaciones involucran los K parámetros. Se asumirá que este valor esperado existe y que la contraparte muestral converge a él. A continuación se liarán algunas suposiciones acerca del modelo y de los momentos empíricos.
Suposición 3.2.2.
CONVERGENCIA DE LOS MOMENTOS EMPÍRICOS: El proceso de gene ración de datos se siipone que cumple con las condiciones de la Ley de grandes númerospara que pueda aplicar, entonces se asumirá que los momentos empíricos convergen en
probabilidad a sus valores esperados. Lo que se necesita para esta suposición es que
M0o) = ^ E L A ( 0 o
)-O.
Los momentos empíricos se suponen continuos y funciones de los parámetos con tinuamente diferenciables.Cumpliendo con las propiedades anteriores se puede asumir que las derivadas de los momentos,
resultado del caso de datos de series de tiempo. En resumen, si los momentos obedecen una ley de grandes números, entonces es razonable asumir que las derivadas también lo hacen.
Suposición 3.2.3.
IDENTIFICACIÓN: Para cualquier T > K, si 0\ y 0ż son dos diferentes vectores de parámetros, entonces existirán sets de datos tal que J3T{&I) i1 Prifo)
Formalmente, identificación es definida para acentuar que el límite probabilístico de
la función criterio GMM es 'únicamente minimizada con los verdaderos valores de los
parámetros, 0Q.
La condición de identificación tiene tres importantes implicaciones:
Condición de orden. El número de momentos condición es al menos mayor al
número de parámetros: L > K. Esto es necesario pero no suficiente para la identifi cación.
Condición de rango. La matriz L x K de las derivadas Gn( # o ) deben tener el
rango de renglones igual a K.
Singularidad. Con la suposición de continuidad, la suposición de identificación
implica que el vector de parámetros que satisfagan la población de los momentos condición es único. El vector de verdaderos parámetros, plim / 3 t ( # o ) = 0. Si 8\ es cualquier vector de parámetros que satisface esta condición, entonces 0\ debe ser igual a 0Q.
Las suposiciones 3.2.2 y 3.2.3 caracterizarán la parametrización del modelo. Ahora se hará la suposición estadística que permitirá establecer las propiedades del estimador GMM.
Suposición 3.2.4.
DISTRIBUCIÓN ASIMPTÓTICA DE LOS MOMENTOS EMPÍRICOS: Seasumirá que los momentos empíricos obedecen el teorema del límite central. Esto supon
drá que los momentos tienen una matriz de covarianza asimptóticamente finita, ( 1 / T ) # ,
entonces
Los requerimientos de los datos para que esta suposición sea válida, variarán y serán complicados si las observaciones no son independientes. Para muestras de observa ciones independientes, se asumirán las condiciones que subraya el teorema de Lindberg Feller o el de Límite Central de Liapounov como suficientes. Para casos más generales, es necesario hacer algunas suposiciones acerca de los datos. Si se asume que las funciones /3ż(#o) son una serie ergódica, de martingala en diferencias y estacionaria,
ü?[A(0o)|/9ii ((?o),/9i2(0o)...] = 0 ,
entonces se puede invocar el teorema de Límite Central para Series de Martingalas en Diferencias. Generalmente es bastante complicado verificar si esta suposición se cumple para modelos no lineales, por lo tanto es asumido rotundamente.
Teorema 3.2.5.
DISTRIBUCIÓN ASIMPTÓTICA DEL ESTIMADOR GMM Bajo las suposiciones anteriores,OGMM ^ 0 (3.28)
OGMM ~ N[Q,VGMM],
(3.29)
donde WGMM e sla definida, en la, ecuación (3.25).
El estimador GMM es obtenido si se minimiza la función de criterio T T
QT(6)
=T
'
l
Y
J
PÍV
U 0
)'W
TT-[
Y,P(VT> (33°)
Para probar el Teorema 3.2.5 se establecerá primero que Qt ( # ) converge al valor Qo(0). Bajo la suposición de estricta continuidad y la suposición 3.2.2 Qt ( # o ) converge a 0. Ya que WT es positivamente definida, para cualquier T finita, se sabe que
0 < QT0) < QT{0Q). (3.31)
y = [yi,y2,,yN]T
(3.32)
Esta familia considera la potencia recibida yt como la multiplicación del desvanec imiento a pequeńa escala Xf y el sombreado eZt expresada por y
t = e
Zfxt En tiempo
continuo el proceso aleatorio Gaussiano zt es estacionario en sentido amplio , con media /í y una función de autocovarianza E[ztZt+T] —/i
2 = < 72i ?
a( r ) . Se asume que RSL(T) tiene
un máximo unitario y que el vector de parámetros a tiene un rango A. En esta sección de aplicación se asumirá que a será escalar, y que / ?a( r ) es exponencial, Ra(r) = e
'"1
"'. En términos físicos, {eZt, t — 1 ,N } denotan muestras del proceso de sombreado Log
normal. Las variables aleatorias Gamma i.i.d. x, son independientes del vector z. El 1enésimo componente del vector x tiene una media unitaria y una varianza 1 /m.
La densidad de la variable aleatoria yt es1
fy= / exp[{(m l)log y mz mye
z}} —==e.xp \ ż \ dz,
|_i Vm) J \I1Ka1 L <y J
(3.33) donde m es el parámetro de desvanecimiento Nakagamim, la ˇi es el valor medio y
1 log d e n o t a el l o g a r i t m o n a t u r a l
Cuando T —> oo, QT{&GMM) y QT{@) convergirán al mismo límite. Este será el caso en el que ˇ3T(&GMM) 0T(8Q), ya que la función es cuadrática y WT es positivamente definida. La condición de identificación mencionada anteriormente asegura que cuando n —> OQ,8GMM deberá igualar 0o. Esto establece consistencia al estimador[17].