Evaluación del uso de la transformada Wavelet como método de predicción en aplicaciones de VoIP

Texto completo

(1)UNIVERSIDAD CENTRAL “MARTA ABREU” DE LAS VILLAS FACULTAD DE INGENIERIA ELECTRICA DEPARTAMENTO DE ELECTRÓNICA Y TELECOMUNICACIONES. Evaluación del uso de la Transformada Wavelet como método de predicción en aplicaciones de VoIP. Tesis presentada en opción al Título Académico de Máster en Telemática. Maestría en Telemática. Autor: Ing. Daily Alejandro Díaz Tutor: MSc. Carlos A. Rodríguez López. Santa Clara, Cuba, 2015.

(2) UNIVERSIDAD CENTRAL “MARTA ABREU” DE LAS VILLAS FACULTAD DE INGENIERIA ELECTRICA DEPARTAMENTO DE ELECTRÓNICA Y TELECOMUNICACIONES. Evaluación del uso de la Transformada Wavelet como método de predicción en aplicaciones de VoIP. Tesis presentada en opción al Título Académico de Máster en Telemática Maestría en Telemática. Autor: Ing. Daily Alejandro Díaz Correo: [email protected] Centro de procedencia: Universidad Central Marta Abreu de Las Villas. Tutor: MSc. Carlos A. Rodríguez López Correo: [email protected] Centro de procedencia: Universidad Central Marta Abreu de Las Villas. Santa Clara, Cuba, 2015.

(3) RESUMEN VoIP requiere el uso de mecanismos de buffer de reproducción, los que a su vez, precisan de métodos de predicción que se sustentan, generalmente, en métodos de análisis de series de tiempo estacionarias. Estos, para lograr una adecuada estimación requieren de un ajuste de parámetros y el modelo será, en última instancia, bueno para las condiciones de red que dieron origen a esa traza. Debido a esto, y a la sugerida no estacionariedad de la demora de red, en este trabajo se determina el impacto en la calidad percibida por el usuario del uso del método de predicción WTAR. Para la evaluación se emplea el Modelo E definido en la ITU-TG.107. Como paso previo, se caracterizan las trazas de la demora de red en cuanto a estacionariedad. Para todas las trazas analizadas fue constatada la no estacionariedad de las mismas. Se concluyó que WTAR es altamente dinámico y esto lleva a que se produzcan notables pérdidas de paquetes. Con el objetivo de mejorar los niveles de satisfacción del usuario, en el último experimento se ajusta el buffer por encima de un valor umbral. Los mejores resultados se obtienen para los 100ms, dado que logra la mejor relación de compromiso entre la demora adicional y la pérdida de paquetes. Esta cantidad, al ser significativa en cuanto a la demora que introduce, ilustra que en el Modelo E la pérdida de paquetes tiene mayor influencia en la caída del MOS. Palabras Claves: buffer, Transformada Wavelet, estacionariedad.

(4) ÍNDICE RESUMEN .............................................................................................................................................. 3 GLOSARIO ............................................................................................................................................. 6 INTRODUCCIÓN ................................................................................................................................... 1 Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD ..................................................... 5 1.1. Introducción al capítulo ............................................................................................................. 5. 1.2. Voz sobre redes de datos ........................................................................................................ 6. 1.3. Análisis de series de tiempo .................................................................................................... 7. 1.3.1. Serie de tiempo .................................................................................................................. 7. 1.3.2. Proceso estocástico .......................................................................................................... 8. 1.3.3. Componentes de una serie de tiempo ........................................................................... 9. 1.3.4. Procesos estocásticos estacionarios............................................................................ 11. 1.3.5. Función de autocovarianzas y de autocorrelación ..................................................... 13. 1.4. Mecanismos de buffer de reproducción ............................................................................... 14. 1.4.1. Ajuste intra-ráfagas ......................................................................................................... 16. 1.4.2. Ajuste inter-ráfagas ......................................................................................................... 16. 1.4.2.1. Técnicas intolerantes a pérdidas .......................................................................... 17. 1.4.2.2. Técnicas tolerantes a pérdidas ............................................................................. 17. 1.4.2.3. Técnicas basadas en calidad ................................................................................ 17. 1.5. Métodos de predicción............................................................................................................ 17. 1.6. La Transformada Wavelet ...................................................................................................... 20. 1.6.1. Transformada Wavelet Continua .................................................................................. 22. 1.6.2. Transformada Wavelet Discreta .................................................................................... 22. 1.7. Método de predicción basado en la Transformada Wavelet ............................................ 23. 1.8. Métodos para la obtención de trazas ................................................................................... 25. 1.9. Descripción de las Trazas ...................................................................................................... 25.

(5) ÍNDICE. 1.9.1. Trazas obtenidas de acuerdo a la Recomendación G1050 de la UIT-T................. 25. 1.9.2. Trazas propuestas por 3GPP para validar el ajuste del buffer ............................... 27. 1.10. Formas subjetivas de evaluación .......................................................................................... 27. 1.11. Formas objetivas de evaluación ............................................................................................ 28. 1.12.1 Modelo E ............................................................................................................................... 28 1.12. Consideraciones finales del capítulo .................................................................................... 29. Capítulo 2 CARACTERIZACIÓN EN CUANTO A ESTACIONARIEDAD DE LA SERIE DE TIEMPO DE LA DEMORA DE RED ................................................................................................. 30 2.1 Introducción al capítulo ............................................................................................................... 30 2.2 Análisis de estacionariedad las trazas obtenidas a partir de la Recomendación G1050 de la UIT-T ................................................................................................................................................. 31 2.3 Análisis de estacionariedad de las trazas propuestas por 3GPP para validar el ajuste del buffer...................................................................................................................................................... 40 2.4 Consideraciones finales de capítulo .......................................................................................... 46 Capítulo 3 EVALUACIÓN DEL MÉTODO DE PREDICCIÓN SUSTENTADO EN LA TRANSFORMADA WAVELET .......................................................................................................... 47 3.1. Introducción al capítulo ....................................................................................................... 47. 3.2 Evaluación del método de predicción sustentado en la Transformada Wavelet empleando las trazas obtenidas a partir de la Recomendación G1050 de la UIT-T ................ 47 3.3 Evaluación del método de predicción sustentado en la Transformada Wavelet empleando las trazas propuestas por 3GPP para validar el ajuste del buffer .......................... 51 3.4 Evaluación del método de predicción sustentado en la Transformada Wavelet empleando un umbral de demora ..................................................................................................... 56 3.5. Considerasiones finales del capítulo ................................................................................ 58. CONCLUSIONES ................................................................................................................................ 59 RECOMENDACIONES....................................................................................................................... 60 REFERENCIAS BIBLIOGRÁFICAS ................................................................................................. 61 ANEXO 1 .............................................................................................................................................. 63.

(6) GLOSARIO 3GPP: 3rd Generation Partnership Project ACR: Absolute Category Rating AR: Autoregressive ARIMA: Autoregressive Integrated Moving Average ARMA: Autoregressive Moving Average CBR: Constant Bit Rate DCR: Degradation Category Rating DIAR: Diferencial Integrated Moving Average DMOS: Degradation MOS Mean Opinion Score DSL: Digital Subscriber Line FAC: Función de Autocorrelación FACV: Función de Autocovarianzas FoIP: Fax over IP GARCH: Generalised Autoregressive Conditional Heteroskedasticity GPON: Gigabit-capable Passive Optical Network HD: High-Definition video HTTP: HyperText Transport Protocol) IMS: IP Multimedia Subsystem IP: Internet Protocol IPTV: Internet Protocol Television LAN: Local Area Network MA: Moving Average MOS: Mean Opinion Score MTSI: Multimedia Telephony Service for IMS OTT: Over-the-Top-TCP streaming video PSTN: Public Switching Telephone Network QoS: Quality of Service.

(7) GLOSARIO. RTCP: Real Time Control Protocol RTP: Real Time Protocol SD: Standard-Definition video TCP: Transport Control Protocol UDP: User Datagram Protocol VBR: Variable Bit Rate VoIP: Voice over IP WTAR: Wavelet Transform based prediction method.

(8) INTRODUCCIÓN Hoy en día ha cobrado gran auge la tecnología VoIP (Voice over IP) dado que es muy económico y factible para comunicaciones a largas distancias. Como VoIP es transportado por una red de conmutación de paquetes, y en estas no se reserva una conexión de extremo a extremo antes de que comience la comunicación y por todo el tiempo que dure esta, los paquetes de voz son afectados por fenómenos como la demora, la variación de la demora y la pérdida de paquetes; los cuales se manifiestan como degradaciones en la calidad del servicio percibida por los usuarios. Para tráfico de tiempo real como la voz, la retransmisión de tramas perdidas en la capa de transporte no es práctica; por ocasionar retardos adicionales. Como resultado de esto el receptor dejará un intervalo en el flujo de voz y sonará grietoso con silabas o palabras perdidas. Para suavizar el efecto perjudicial de los fenómenos antes mencionados es necesaria la presencia de un buffer en el receptor, cuya tarea consiste en retardar los paquetes; de tal forma que se pueda recuperar la periodicidad con que fueron transmitidos (Figura I.1).. Figura I.1: Problema del instante de reproducción: a) paquetes que arriban tarde, b) solución usando un buffer en el receptor [1].. Existe una relación evidente entre el tamaño del buffer y su capacidad para recuperar el sincronismo entre los paquetes. Un buffer grande permite absorber una gran variación en la demora con una mínima razón de pérdidas de paquetes en el receptor. Al mismo tiempo, introduce una demora adicional en la conexión que puede afectar de forma apreciable la calidad del servicio. Un buffer pequeño no introduce retardos adicionales significativos pero aumenta la razón de pérdida de paquetes debido a que cualquier paquete que arribe con una demora superior a la prevista es descartado. La solución se mueve entonces, en el compromiso de ser capaz de eliminar la variación de la demora con una razón de pérdidas mínima (inteligibilidad de la comunicación) e introducir un mínimo retardo en el receptor (interactividad de la comunicación)..

(9) INTRODUCCIÓN. Para implementar un determinado algoritmo de buffer de reproducción es preciso estimar el retraso adicional del próximo paquete. Partiendo de que la demora y la variación de la demora son series de tiempo, los predictores para realizar sus cálculos se han apoyado tradicionalmente en modelos de análisis de series de tiempo importados casi todos del mundo financiero. Dentro de estos están los siguientes: . AR (p) (Autoregressive): el proceso se representa como una suma ponderada de observaciones pasadas de la variable. El número de rezagos (p) determina el orden del modelo autorregresivo.. . MA (q) (Moving Average): el proceso se representa como una suma ponderada de errores de predicción actuales y anteriores. El número de rezagos del error considerados (q) determina el orden del modelo de media móvil.. . ARMA (p,q) (Autoregressive Moving Average): el proceso se representa en función de observaciones pasadas de la variable y de los valores actuales y rezagados del error. El número de rezagos de la variable de interés (p) y el número de rezagos del error (q) determinan el orden del modelo mixto.. Los modelos presentados anteriormente son modelos cuyo enfoque está en la predicción de procesos estacionarios. De acuerdo a [1] una serie de tiempo es estrictamente estacionaria cuando el comportamiento estadístico de cada conjunto de valores es idéntico, salvo por un desplazamiento en el tiempo. . ARIMA (Autoregressive Integrated Moving Average): el proceso supone que luego de un número (I) de diferencias de la serie ésta sigue un modelo ARMA, debido a que la diferenciación puede convertir una serie no estacionaria en una estacionaria comparativamente homogénea [2]. Box y Jenkins propusieron un procedimiento eficiente para identificar el tipo de modelo en una serie real, estimar sus parámetros y comprobar si el modelo es adecuado [3]. En esta metodología el primer paso es; dada una serie de tiempo, como la serie de la demora introducida por la red en una conversación de VoIP, seleccionar un modelo lineal, como los expuestos anteriormente, para emplearlo en la predicción de los valores futuros de la demora. Luego se encuentran los coeficientes del modelo y se ajusta el mismo hasta conseguir ponerlo a punto. Una vez hecho esto se espera que la predicción sea adecuada. Sin embargo, este modelo será, en última instancia, bueno para las condiciones de red que dieron origen a esta traza en particular; pero una vez que el entorno de red varíe los resultados dejarán de ser los mismos. Debido a los múltiples posibles entornos de red que se pueden encontrar hoy en día es de esperar que la comunidad científica haya comenzado a buscar otras alternativas que logren un ajuste más dinámico y general; en el que a partir de un único modelo se logre una adecuada predicción independientemente de los posibles entornos de red. Todo esto, sin tener en cuenta las características de estacionariedad de las trazas de la demora introducida por la red en una conversación de VoIP, factor este, que debe ser analizado porque la mayoría de los modelos lineales econométricos explorados hasta hoy 2.

(10) INTRODUCCIÓN. como métodos de predicción en mecanismos de buffer de reproducción son modelos diseñados para la predicción estacionaria. En [2] se plantea que en las redes actuales. De acuerdo a esto vale la pena explorar el método propuesto en [2] el cual se sustenta en la Transformada Wavelet; la cual es una herramienta matemática eficiente para el análisis local de señales no estacionarias y de rápida transitoriedad. De ahí que se presente la interrogante científica: ¿Qué impacto tiene en la calidad percibida por el usuario el uso de la Transformada Wavelet como método de predicción en mecanismos de buffer de reproducción? El objetivo principal de esta investigación es determinar el impacto en la calidad percibida por el usuario del uso de la Transformada Wavelet como método de predicción en mecanismos de buffer de reproducción en aplicaciones de VoIP. Para dar cumplimiento a este se proponen los siguientes objetivos específicos: . Describir los métodos de predicción en mecanismos de buffer de reproducción que se emplean en esta investigación y el modelo E como forma objetiva de evaluación de la calidad que percibe el usuario de aplicaciones de voz sobre IP.. . Caracterizar la serie de tiempo de la demora introducida por la red en cuanto a estacionariedad.. . Evaluar el método de predicción sustentado en la Transformada Wavelet.. A partir de los objetivos anteriormente expuestos se formulan las siguientes interrogantes científicas: . ¿Cuáles son las características de los métodos de predicción en mecanismos de buffer de reproducción y del modelo E como forma objetiva de evaluación de la calidad que percibe el usuario de aplicaciones de voz sobre IP?. . ¿Cuáles son las características de estacionariedad la serie de tiempo de la demora introducida por la red?. . ¿Cómo es el comportamiento en cuanto a calidad percibida por el usuario del método de predicción sustentado en la Transformada Wavelet?. En este proyecto es objeto de investigación los mecanismos de buffer de reproducción en aplicaciones de VoIP y el campo de acción es el uso de la Transformada Wavelet como método de predicción. Los métodos y técnicas que se prevén utilizar en el desarrollo de esta investigación son: . Empírico de recolección de información: se aplica en el estudio de documentos, para de esta manera poder obtener la información necesaria referente al objeto de investigación.. Se utilizarán además los métodos teóricos: . Histórico-Lógico: posibilita a través del estudio de la trayectoria del objeto de investigación contextualizar el problema de investigación, sus antecedentes y desarrollo. 3.

(11) INTRODUCCIÓN. . Análisis y Síntesis: permite lograr el tratamiento de cada elemento constituyente del campo de acción de la investigación, o sea, el uso de la Transformada Wavelet como método de predicción.. . Inductivo-Deductivo: partiendo de los resultados obtenidos en cada uno de los experimentos diseñados permite arribar a conclusiones respecto al uso de la Transformada Wavelet como método de predicción en aplicaciones de VoIP.. Con este proyecto se aspira a contribuir al mejoramiento de la calidad percibida por el usuario de las aplicaciones de voz sobre redes IP al ofrecer una evaluación de un método de predicción en mecanismos de buffer de reproducción basado en la Transformada Wavelet; la cual es una herramienta dinámica para el análisis de señales no estacionarias. El informe de investigación se organiza de la siguiente forma: resumen, introducción, capitulario, conclusiones, recomendaciones y referencias bibliográficas. Introducción: Se reseñan la necesidad, actualidad e importancia de la evaluación del uso de la Transformada Wavelet como método de predicción en aplicaciones de VoIP. Capítulo 1: DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. Se exponen las características del transporte de voz sobre redes de datos. Se abordan las cuestiones teóricas fundamentales relacionadas con análisis de series de tiempo, los mecanismos de buffer de reproducción y los métodos de predicción tradicionalmente usados. Se presenta como una herramienta matemática para el análisis de señales la Transformada Wavelet y el método de predicción basado en ella que se evalúa en este trabajo. Finalmente se describen las trazas que se emplean para la experimentación y el modelo E como la forma de evaluación de calidad. Capítulo 2: CARACTERIZACIÓN EN CUANTO A ESTACIONARIEDAD DE LA SERIE DE TIEMPO DE LA DEMORA DE RED. Se caracteriza mediante simulación en MATLAB en cuanto a estacionariedad la serie de tiempo de la demora introducida por la red. El análisis se realiza para dos grupos de trazas; un primer grupo obtenidas a partir de la Recomendación G.1050, y un segundo, conformado por un conjunto de trazas que propone 3GPP para validar el ajuste del buffer en aplicaciones MTSI (Multimedia Telephony Service for Internet Protocol Multimedia Subsystem). Capítulo 3: EVALUACIÓN DEL MÉTODO DE PREDICCIÓN SUSTENTADO EN LA TRANSFORMADA WAVELET. Se evalúa mediante simulación en MATLAB, haciendo uso del Modelo E, la calidad percibida por el usuario cuando se emplea el método de predicción sustentado en la Transformada Wavelet propuesto en [2] y manejando las trazas cuya estacionariedad se analiza en el capítulo anterior. Conclusiones: Se describen los resultados obtenidos a partir de los objetivos trazados inicialmente. Se incluyen las referencias bibliográficas conformando un listado según la norma IEEE.. 4.

(12) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD 1.1 Introducción al capítulo En este capítulo se presentan las cuestiones teóricas fundamentales que permiten la comprensión de la presente investigación y el objetivo que se persigue es describir los métodos de predicción en mecanismos de buffer de reproducción empleados en esta investigación y el modelo E como forma objetiva de evaluación de la calidad que percibe el usuario de aplicaciones de VoIP. VoIP es la tecnología empleada para enviar información de voz en forma digital en paquetes discretos a través de los protocolos de Internet en vez de hacerlo a través de la red de telefonía habitual. Como IP (Internet Protocol) es un protocolo de transporte de datagramas en el que no se asegura la llegada de paquetes VoIP se ve típicamente afectada por fenómenos como la demora, el jitter (variación de la demora) y la pérdida de paquetes. Para dar solución a los problemas antes mencionados se hacen necesarios los mecanismos de buffer de reproducción; los cuales requieren para determinar el instante de reproducción de un método de predicción que estime la demora del siguiente paquete. La búsqueda de un método de predicción adecuado parte del análisis del comportamiento matemático de la demora y variación de la demora en redes IP. Se pueden tratar la demora y la variación de la demora como una serie de tiempo, dado que son una secuencia de datos típicamente medidos en instantes sucesivos de tiempo y espaciados en intervalos de tiempo uniformes. De ahí que clásicamente se hayan empleado métodos de análisis de series de tiempo como métodos de predicción aunque actualmente y dada la no estacionaridad de la serie de tiempo sugerida en [2] han ido ganando favor los predictores basados en la transformada Wavelet [2], [4], [5], [6]. Para la evaluación de cualquier método de predicción en mecanismos de buffer de reproducción es necesario contar con trazas, que reflejen el comportamiento de la demora. Las trazas pueden ser obtenidas por medio de pruebas de campo, por emulación o por simulación, siendo esta última la forma empleada en este trabajo. En este capítulo se describen los dos grupos de trazas empleadas para la evaluación que se realiza. El criterio de evaluación con el cual se mide el desempeño de determinado método de predicción más comúnmente aceptado es el Modelo E definido por la ITU – T G.107, en este un modelo a partir de parámetros de la red se obtiene una variable intermedia, el factor R,. 5.

(13) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. que luego es convertido a un valor MOS (Mean Opinion Score), el cual en una escala de uno a cinco refleja el nivel de satisfacción del usuario con la aplicación de VoIP. 1.2 Voz sobre redes de datos VoIP es la tecnología empleada para enviar información de voz en forma digital en paquetes discretos a través de los protocolos de Internet en vez de hacerlo a través de la Red Telefónica Pública Conmutada, mejor conocida por sus siglas en inglés PSTN (Public Switching Telephone Network). Para poder transmitir las muestras de voz sobre redes de datos, es necesario paquetizarla. Para minimizar la sobrecarga y no introducir demoras inaceptables, se toman “ventanas” de 10 a 30ms. Las muestras de voz de cada una de estas “ventanas” consecutivas se acumulan y con ellas se forman los paquetes de voz. El protocolo RTP (Real Time Protocol), basado en la RFC 3550, establece los principios de un protocolo de transporte sobre redes que no garantizan calidad de servicio para datos de tiempo real, como voz y video. Cada paquete RTP consiste en una cabecera y los datos de voz. La cabecera contiene números de secuencia, marcas de tiempo, y monitoreo de entrega. La RFC 3550 establece, además, un protocolo de control, RTCP (Real Time Control Protocol), encargado de enviar periódicamente paquetes de control entre los participantes de una sesión. Las aplicaciones típicamente utilizan RTP sobre protocolos de red no confiables, como UDP (User Datagram Protocol). Los bytes obtenidos de cada conjunto de muestras de voz o video son encapsulados en paquetes RTP, y cada paquete RTP es, a su vez, encapsulado en segmentos UDP, el que a su vez se monta sobre IP, el que, en la LAN (Local Area Network), viaja típicamente sobre Ethernet Esta suma de protocolos hace que el ancho de banda requerido para el tráfico de voz sobre Ethernet sea bastante mayor al ancho de banda del audio (Figura 1.1) y depende del tamaño de la “ventana” (típicamente 10, 20 o 30 ms) y el códec (G.711, G.723, G.729) utilizado para paquetizar la voz.. Figura 1.1: Ejemplo de un paquete de voz [7].. Como UDP/IP es un protocolo de transporte de datagramas en el que no se asegura la llegada de paquetes, VoIP se ve típicamente afectada por fenómenos como la demora, el jitter (variación de la demora) y la pérdida de paquetes los cuales se describen a continuación: . Pérdida de paquetes: Se producen principalmente por congestión en la redes o por fallos de comunicación. Estas no están referidas solo a la perdida completa del paquete, que no llega a su destino, sino a la llegada de paquetes después de un tiempo determinado, lo que provoca que el paquete 6.

(14) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. sea descartado. La pérdida de preferiblemente por debajo de 2%.. paquetes debe. mantenerse. baja,. . Retardo o Latencia: El retardo es la diferencia que existe entre el momento en que una señal es trasmitida y el momento en que llega a su destino [8]. Demoras superiores a 150ms se vuelven inaceptables en comunicaciones de VoIP.. . Jitter: Es la variación en el retardo. En términos simples, es la diferencia entre el tiempo en que llega un paquete y el tiempo en que se cree que llegará el paquete. Para obtener una buena calidad se recomiendan valores de jitter menores de 100 ms.. 1.3 Análisis de series de tiempo Para dar solución, en una comunicación de VoIP, a los problemas antes mencionados se hacen necesarios los mecanismos de buffer de reproducción; los cuales requieren para determinar el instante de reproducción de un método de predicción que estime la demora del siguiente paquete. La búsqueda de un método de predicción adecuado parte del análisis del comportamiento matemático de la demora y variación de la demora en redes IP. Se puede tratar la demora y la variación de la demora como una serie de tiempo, dado que son una secuencia de datos típicamente medidos en instantes sucesivos de tiempo y espaciados en intervalos de tiempo uniformes. De ahí que en esta sección se expongan las cuestiones teóricas fundamentales que permiten el análisis de la serie de tiempo de la demora de red en aplicaciones de VoIP como una serie de tiempo. 1.3.1. Serie de tiempo. Una serie temporal es el resultado de observar los valores de una variable a lo largo del tiempo. Cuando las observaciones se recogen solo en momentos determinados de tiempo, generalmente a intervalos iguales, se obtiene una serie temporal discreta. Si los datos se generen de forma continua y se observan de forma continua, por ejemplo, la temperatura, que se representa en el tiempo por medio de aparatos físicos se contará con un número infinito de observaciones y se tendrá una serie temporal continua. Sin embargo la mayoría de las series disponibles se observan en tiempo discreto a intervalos iguales, aunque se puedan suponer generadas por algún proceso en tiempo continuo. De acuerdo a [9] una serie temporal es una secuencia ordenada de observaciones cada una de las cuales está asociada a un momento de tiempo. Las series pueden ser univariantes o multivariantes en dependencia de si se monitorean una o más variables en un mismo momento. En este proyecto son de interés solo las series univariantes. Dentro de las formas más habituales de representar una serie de tiempo univariantes están: ; ; , donde es la observación número t (1≤ t ≥ N) de la serie y N es el número de observaciones de que consta la serie completa. Las N observaciones pueden recogerse en un vector columna de orden Nx1. 7.

(15) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. Series temporales se pueden encontrar en cualquier campo de la ciencia. Un ejemplo en la rama de la Economía puede ser la rentabilidad mensual de la bolsa de Madrid en el periodo enero de 1988 hasta Septiembre del 2001 que se muestra en la Figura 1.2. En Meteorología, se tienen series temporales de temperatura, cantidad de lluvia caída en una región, velocidad del viento. En Marketing son de gran interés las series de ventas mensuales o semanales. En Demografía se estudian las series de población total, tasas de natalidad. En Medicina, los electrocardiogramas o electroencefalogramas.. Figura 1.2: Rentabilidad mensual de la bolsa de Madrid en el período de Enero de 1988 hasta Agosto de 2001 [10]. El análisis de los datos recogidos en una serie de tiempo tiene como primer objetivo elaborar un modelo estadístico que describa adecuadamente la procedencia de dicha serie y luego emplear dicho modelo para describir las características de la serie, en términos de sus componentes de interés y para predecir futuros valores de las variables. Cuando los valores futuros pueden ser predichos exactamente a partir de las observaciones pasadas entonces se dice que la serie temporal es una serie determinista. Pero para la mayoría de las series el futuro solo se puede determinar parcialmente por sus valores pasados, por lo que las predicciones exactas son imposibles. Este último caso corresponde a una serie de tiempo que es una realización de un proceso estocástico, el cual será definido más adelante. 1.3.2. Proceso estocástico. En [10] se define un proceso estocástico como un conjunto de variables aleatorias { donde el índice t toma valores en un cierto conjunto E; que es un conjunto ordenado y corresponde a los instantes temporales. Para cada valor t del conjunto E (o lo que es lo mismo, para cada instante temporal) está definida una variable aleatoria, , y los valores que se observan de las variables aleatorias forman una serie temporal. Es decir, una serie de T datos es una muestra de tamaño uno del vector de T variables 8.

(16) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. aleatorias ordenadas en el tiempo correspondientes a los momentos t =1,..., T, y la serie observada se considera una realización o trayectoria del proceso estocástico. Un ejemplo se ilustra en la Figura 1.3 donde se presentan 12 realizaciones de la serie de lluvia en Madrid en los 12 meses del año. Se tienen por tanto 12 variables aleatorias, una para cada mes y la trayectoria de los 12 valores en un año dado representa una realización del proceso estocástico. Si se considera un mes cualquiera, los 12 valores disponibles forman una muestra de tamaño 12 de esa variable aleatoria.. Figura 1.3: Series de la cantidad de lluvia recogida en Madrid en cada mes del año entre los años 1988 y 1999 [10]. Muchos procesos estocásticos solo pueden ser observados una vez dado que no es posible reproducir de manera exacta las condiciones bajo las cuales se realizó el mismo. No obstante si las circunstancias sociales o naturales del período al que se refiere la serie considerada se mantienen relativamente estables, entones se espera que la conclusión obtenida del análisis de dicha serie sea aplicable también a momentos posteriores, al menos a corto plazo. Esta idea justifica el empleo de un modelo elaborado con una muestra dada para describir la evolución temporal de un proceso estocástico después del período muestral considerado. 1.3.3. Componentes de una serie de tiempo. El análisis clásico de las series temporales se basa en la suposición de que los valores que toma la variable de observación es la consecuencia de tres componentes, cuya actuación conjunta da como resultado los valores medidos, estos componentes son: . Tendencia: Se puede definir como un cambio que se produce en relación al nivel medio. La tendencia se identifica con un movimiento suave de la serie a largo plazo. 9.

(17) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. La Figura 1.4 presenta una serie que corresponde a la población mayor de 16 años en España al final de cada trimestre en el periodo 1977 al 2000. Se observa en el gráfico que la serie no es estable, ya que su nivel aumenta con el tiempo. En este caso la serie tiene una clara tendencia positiva y además, aproximadamente lineal. Es muy infrecuente en las series reales descubrir una tendencia constante en periodos largos de observación; en lugar de esto, es común encontrar una tendencia evolutiva o cambiante en el tiempo.. Figura 1.4: Población mayor de 16 años en España desde el primer trimestre de 1977 hasta el cuarto del 2000 [10]. . Estacional: Representa efectos de fenómenos que ocurren o se reproducen periódicamente (semestral, mensual). Esta componente se presenta cuando la serie tiene patrones que se repiten con una frecuencia constante, produciendo en su grafica un efecto periódico.. La serie de la Figura 1.5 muestra las lluvias mensuales en Santiago de Compostela durante diez años y es un ejemplo de serie estacional. Se observa que algunos meses tienen sistemáticamente más lluvias que otros. Por ejemplo, los meses de invierno tienen más precipitaciones que los meses de verano. En esto consiste precisamente la estacionalidad. Nótese además que hay años donde ambas son relativamente altas, años húmedos, frente a otros donde ambas son bajas, años secos.. 10.

(18) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. Figura 1.5: Lluvia en Santiago de Compostela desde Enero de 1988 a Diciembre de 1997 [10]. . Aleatoria: Movimientos impredecibles o aleatorios. Esta componente no responde a ningún patrón de comportamiento, sino que es el resultado de factores fortuitos o aleatorios que inciden de forma aislada en una serie.. En resumen, las series temporales pueden tener o no un nivel estable en el tiempo, y si no lo tienen, pueden presentar tendencias más o menos constantes. Cuando el nivel de la serie no es estable en el tiempo se dice que la serie es no es estacionaria. Un caso particular de no estacionariedad es cuando el nivel varía siguiendo un ciclo, como ocurre con las lluvias mensuales dentro del año. Se dice entonces que la serie es estacional y esta faceta puede combinarse con tendencias. De ahí el gráfico de la serie sea siempre una herramienta muy valiosa para entender su comportamiento. 1.3.4. Procesos estocásticos estacionarios. En el análisis de series temporales el objetivo es utilizar la teoría de procesos estocásticos para determinar qué proceso estocástico ha sido capaz de generar la serie temporal bajo estudio con el fin de caracterizar el comportamiento de la serie y predecir en el futuro. La filosofa que subyace en la teoría de la predicción es siempre la misma: se aprende de las regularidades del comportamiento pasado de la serie y se proyectan hacia el futuro. Por lo tanto, es preciso que los procesos estocásticos generadores de las series temporales tengan algún tipo de estabilidad. A estas condiciones que se les impone a los procesos estocásticos para que sean estables para predecir, se les conoce como estacionariedad. El concepto de estacionariedad se puede establecer en términos de la función de distribución o de los momentos del proceso. En el primer caso, se habla de estacionariedad en sentido estricto y, en el segundo, de estacionariedad en sentido débil o en covarianza.. 11.

(19) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. Estacionariedad en sentido estricto: Un proceso estocástico { } es estacionario en sentido estricto si y solo si: [. ]. [. ]. (1.1). Es decir, si la función de distribución de cualquier subconjunto finito de n variables aleatorias del proceso no se altera si se desplaza k periodos en el tiempo. La estacionaridad estricta es una condición muy fuerte, ya que para constatarla es necesario disponer de las distribuciones conjuntas para cualquier selección de variables del proceso. Una propiedad más débil, pero más fácil de contrastar en la práctica, es la estacionariedad en sentido débil. Estacionariedad en sentido débil o en covarianza: Un proceso estocástico { }, es estacionario en sentido débil o en covarianza si y solo si: a) Es estacionario en media, es decir, todas las variables aleatorias del proceso tienen la misma media y es finita: (1.2) b) Todas las variables aleatorias tienen la misma varianza y es finita, o lo que es lo mismo, la dispersión en torno a la media constante a lo largo del tiempo es la misma para todas las variables del proceso: [ ] (1.3) c) Las autocovarianzas solo dependen del número de periodos de separación entre las variables y no del tiempo. La covarianza lineal entre dos variables aleatorias del proceso que disten k periodos de tiempo es la misma que existe entre cualesquiera otras dos variables que estén separadas también k periodos, independientemente del momento concreto de tiempo al que estén referidas: [ ][ ] (1.4) La obtención de varias realizaciones del proceso es posible en ciertas situaciones, por ejemplo con variables climáticas, donde se puede suponer que cada año se observa una realización del mismo. Sin embargo, en muchas situaciones de interés, como ocurre con variables económicas o sociales, sólo se puede observar una realización del proceso. El proceso estocástico existe conceptualmente, pero no es posible obtener muestras sucesivas o realizaciones independientes del mismo. Para poder estimar las características “transversales” del proceso (medias, varianzas, etc.) a partir de su evolución “longitudinal” es necesario suponer que las propiedades “transversales” son estables a lo largo del tiempo. En estos casos se corrobora la estacionariedad en sentido débil o en covarianza del proceso si: (1.5) [. ] [. (1.6) ][. ]. (1.7). Las dos primeras condiciones indican que la media y la varianza son constantes. La tercera que la covarianza entre la serie temporal que corresponde a la única realización del proceso 12.

(20) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. estocástico con la que se cuenta y ella misma desplazada en una cantidad k depende sólo de su separación. 1.3.5. Función de autocovarianzas y de autocorrelación. En principio, si se considera un proceso estocástico teórico que comienza en algún momento del pasado lejano y acaba en un futuro indeterminado se pueden calcular un número indefinido de autocovarianzas, por lo que conviene definir una función que las agrupe a todas. La función de autocovarianzas (FACV) de un proceso estocástico estacionario es una función de k (número de periodos de separación entre las variables) que recoge el conjunto de las autocovarianzas del proceso y se denota por: La función de autocovarianzas tiene las siguientes características: a) Incluye la varianza del proceso para k = 0: [ ][ ] b) Es una función simétrica: [ ][ – ]. [. ][. (1.8). ]. (1.9). La función de autocovarianzas de un proceso estocástico recoge toda la información sobre la estructura dinámica lineal del mismo. Pero depende de las unidades de medida de la variable, por lo que, en general, se suele utilizar la función de autocorrelación, en la cual los coeficientes de la función de autocovarianzas son normalizados respeto a la varianza del proceso que coincide con ser el coeficiente de la función de autocovarianzas para k = 0. El coeficiente de autocorrelación de orden k de un proceso estocástico estacionario mide el grado de asociación lineal existente entre dos variables aleatorias del proceso separadas k periodos, no depende de unidades, se verifica que | | ≤ 1, k y está dado por: √. √. (1.10). La función de autocorrelación (FAC) de un proceso estocástico estacionario es una función de k que recoge el conjunto de los coeficientes de autocorrelación del proceso y se denota por , k =0, 1, 2, 3,…,. Esta función se suele representar por medio de un gráfico de barras denominado correlograma. La función de autocorrelación tiene las siguientes características: a) El coeficiente de autocorrelación de orden 0 es, por definición, 1, lo cual hace que a menudo no se le incluya explícitamente en la función de autocorrelación. (1.11) b) Es una función simétrica. Debido a esto en el correlograma se representa la función de autocorrelación solamente para los valores positivos del retardo k. (1.12) 13.

(21) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. c) La función de autocorrelación de un proceso estocástico estacionario tiende a cero rápidamente cuando k tiende a ∞. La función de autocorrelación es un instrumento poderoso utilizado para recoger la estructura dinámica lineal del modelo. Los gráficos de la Figura 1.6 muestran 4 correlogramas correspondientes a diferentes series temporales. Los correlogramas a), b) y c) decrecen rápidamente hacia cero conforme aumenta k: exponencialmente en los casos b) y c) y truncándose en el caso a). Son, por lo tanto, correlogramas correspondientes a series estacionarias. Por el contrario, los coeficientes de autocorrelación del correlograma d) decrecen lentamente, de forma lineal, por lo que no corresponden a una serie estacionaria.. Figura 1.6: Ejemplos de funciones de autocorrelación [9]. Aunque para el proceso estocástico teórico se cuenta con un número indefinido de autocovarianzas y coeficientes de autocorrelación, cuando se dispone de una serie temporal finita de tamaño T, como máximo se pueden estimar T − 1 coeficientes de autocorrelación, pero, en la práctica, según [9] se recomienda un máximo de T/3. Esto es debido a que cuanto mayor sea k menos información hay para estimar y la calidad de la estimación es menor. 1.4 Mecanismos de buffer de reproducción Una representación típica en bloques de un sistema de VoIP se muestra en la Figura 1.7. Nótese en ésta la ubicación del buffer de reproducción, el cual aparece implementado en el lado terminal del sistema y cuya función es retardar los paquetes de modo que sea posible recuperar el sincronismo con que fueron transmitidos.. 14.

(22) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. Figura 1.7: Representación en bloques de un sistema de VoIP [11]. Los trabajos [12] y [13] marcan la génesis de los estudios de los mecanismos de buffer de reproducción. En la figura 1.8 se presenta una posible clasificación para las distintas estrategias que han sido investigadas en el transcurso del tiempo.. Figura 1.8: Clasificación de las técnicas de reproducción [14]. El primer paso en la clasificación, define dos grandes grupos, atendiendo a si el buffer es fijo o adaptativo. Para la técnica de buffer fijo, la demora de extremo a extremo se mantiene constante durante toda la comunicación. Esta solución no es consistente con la variabilidad de la demora en las redes de paquetes. Por el contrario, con la técnica de buffer adaptativo, 15.

(23) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. es posible ajustar la demora a las condiciones de la red. Esto evita que se introduzca una demora excesiva cuando las condiciones son favorables y viceversa. Para lograrlo, es necesario monitorear la conversación y adecuar el tamaño del buffer. 1.4.1. Ajuste intra-ráfagas. El segundo paso de la clasificación se aplica a las técnicas adaptativas solamente y tiene que ver con el momento en que se ajusta el buffer de reproducción. La vertiente intra-ráfagas modifica la demora de extremo a extremo durante la conversación, ya sea dentro del período de actividad o durante el de silencio. Aunque acomodar la demora de reproducción durante los periodos de actividad es ventajoso en el caso en que la demora de red varíe atendiendo a una dinámica muy alta, también implica un procesamiento complejo de la señal de audio. Para este caso el instante de reproducción puede obtenerse a partir de (1.13): D ni = r ni + d ni. (1.13). En la expresión anterior D ni es el instante de reproducción para el paquete i de la enésima ráfaga. El paquete será reproducido luego de esperar un tiempo igual a la demora de reproducción estimada d ni después de que haya arribado en el tiempo r ni. La demora de reproducción puede ser ajustada cada vez que un paquete llegue al receptor, después de que un número fijo de paquetes hayan sido recibidos, o cuando haya transcurrido un determinado intervalo de tiempo fijo. 1.4.2. Ajuste inter-ráfagas. Cuando el ajuste se realiza inter-ráfagas, el cambio del tamaño del buffer se produce solo durante los intervalos de silencio. Cualquier variación en la demora de reproducción es introducida por la expansión o compresión artificial de los períodos de silencio al comienzo de la ráfaga El instante de reproducción para el primer paquete de una ráfaga se obtiene al retrasar su reproducción después de que arribe al receptor por una cantidad de tiempo igual a la demora de reproducción como se indica en (1.14). Donde D n1 es el instante de reproducción para el primer paquete de la enésima ráfaga. El paquete será almacenado en el receptor d n1 ms (demora de reproducción estimada) después de su arribo en el tiempo r n1. Los restantes paquetes serán reproducidos a continuación según la expresión (1.15), donde l es la longitud del paquete. D n1 = r n1 + d n1 D ni = D n1 + (i − 1) × l. (1.14) para i ≠ 1. (1.15). Este tipo de ajuste provee efectividad limitada cuando las ráfagas son largas y la variación de la demora de red entre ellas es grande. 16.

(24) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. La variante inter-ráfagas puede materializarse siguiendo un modelo tolerante a pérdidas, intolerante a pérdidas o basado en calidad. 1.4.2.1. Técnicas intolerantes a pérdidas. El término “no tolerante a pérdidas” tiene que ver con el principio de que las pérdidas de paquetes son indeseadas en las comunicaciones de voz y que deben ser evitadas, aun pagando el precio de aumentar la demora. En los modelos intolerantes a pérdidas, no se tiene en cuenta la posibilidad que aparece con las técnicas de ocultamiento de paquetes perdidos, en lugar de esto, se trabaja según el principio de minimizar las pérdidas de paquetes. Evidentemente, tal modelo acarrea una sobrestimación de la demora requerida, lo que puede llegar a afectar la interactividad de la conversación La principal ventaja de los algoritmos no tolerantes a pérdidas está en su implementación directa y simple. Sin embargo, estos no proveen una forma en que el usuario obtenga el deseado compromiso entre pérdidas y demora. Cuando las condiciones de red son tales que el jitter es bajo, esta solución es adecuada. Por el contrario, cuando el jitter es grande, es más apropiado permitir que se pierdan algunos paquetes y reducir la demora que introduce el buffer de reproducción. 1.4.2.2. Técnicas tolerantes a pérdidas. En el caso de los algoritmos tolerantes a perdidas, se trata de alcanzar un adecuado compromiso entre la cantidad de paquetes que se pierden debido al arribo de paquetes después de su tiempo de reproducción y la demora introducida por el buffer. Un elemento importante para el funcionamiento de estos algoritmos es el uso de un histograma de la demora observada en los paquetes pasados. La demora de reproducción se calcula a partir de la distribución de la demora de los paquetes. 1.4.2.3. Técnicas basadas en calidad. Los algoritmos basados en calidad, tratan de maximizar la calidad percibida por el usuario. En las técnicas anteriores, el tamaño del buffer de reproducción se calcula de forma que se minimicen los paquetes perdidos o que los mismos estén por debajo de un umbral. Estos algoritmos pueden introducir demoras grandes que afectan la calidad de la comunicación percibida por el usuario. Para prevenir este contratiempo, una solución bastante efectiva es maximizar la calidad percibida y en función de esto, encontrar el correcto balance entre pérdidas y demora. La mayoría de los algoritmos que trabajan según este principio hacen uso del Modelo-E como herramienta para estimar la calidad percibida. 1.5 Métodos de predicción La mayoría de los algoritmos de buffer de reproducción adaptativo descritos en la literatura dependen de anticipar, con la mayor exactitud posible, la demora en la red para calcular el instante de reproducción. Le es imprescindible reaccionar rápidamente a cambios 17.

(25) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. persistentes en la red (ágil) pero ignorar los trascientes en condiciones de ruido (estable), así que no logran establecer un compromiso entre la demora y la compensación de la variación de la demora. Como trabajo clásico de métodos de predicción en mecanismos de buffer de reproducción se destaca el propuestos por Ramjee en [15]. En este se proponen cuatro predictores diferentes. En el primero de los algoritmos de Ramjee la demora para el paquete i es calculada usando un filtro Autorregresivo descrito en la expresión (1.16). Este algoritmo es básicamente un filtro recursivo lineal que se caracteriza por el factor α, que pondera las observaciones pasadas o las recientes, igualado a 0.998002 en el algoritmo original. di = α di-1 + (1 - α) ni. (1.16). El segundo algoritmo es una pequeña modificación del primero que tiene como objetivo lograr que el mecanismo reaccione más rápidamente cuando la demora en la red se incremente. La idea es usar diferentes valores de α, uno para la tendencia hacia el incremento del retardo, y el otro para la tendencia a la disminución del retardo. El tercer algoritmo tiene un enfoque un poco diferente. Se fundamenta en utilizar el retardo mínimo de todos los paquetes recibidos en la ráfaga de audio anterior como el retardo medio. El cuarto algoritmo incluye detección de picos de retardo. Un pico constituye un aumento repentino y elevado del retraso de red de extremo a extremo y está seguido de una serie de paquetes que llegan casi simultáneamente, conduciendo a la finalización del pico. Los primeros algoritmos no se adaptan lo suficientemente rápido en el caso de los picos, tomando mucho tiempo para aumentar sus estimaciones del retardo y para decrementarlas cuando el pico se acaba. El cuarto método tiene dos modos de operación, dependiendo de si se ha detectado un pico. Para cada paquete que llega al receptor, el algoritmo comprueba el modo actual y en caso necesario, cambia su modo. Si un paquete llega con un retardo mayor que el umbral dado (por ejemplo un cierto múltiplo del actual retardo), el algoritmo cambia al modo de pico. La detección de la terminación del pico hace uso de una variable “var” para ajustar la pendiente del pico. Cuando su valor es bastante pequeño, el algoritmo regresa al modo normal. En la figura 1.9 se muestran los pseudocódigos para los cuatro algoritmos de Ramjee tratados anteriormente. Después de obtener el estimado de la demora empleando uno de los cuatro algoritmos de Ramjee, la variación de la demora para cualquiera de ellos se calcula según la expresión 1.17 en la que ni es la demora de red experimentada por el paquete i, y el factor de peso α es seleccionado de acuerdo al método que se emplee. vi = α vi-1 + (1 - α) │ di – ni │. (1.17). La demora de extremo a extremo se obtiene de (1.18) donde Ω es el factor de seguridad usado para definir la relación de compromiso entre la demora de extremo a extremo y la 18.

(26) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. pérdida de paquetes fijado originalmente a 4. En cada caso el ajuste de parámetros se realiza entre ráfagas de audio. Di = di + Ω vi. (1.18). Figura 1.9: Pseudocódigos para los algoritmos 1, 2, 3 y 4 de Ramjee [16]. Otros trabajos que son básicamente modificaciones a este son, por ejemplo, el citado en [17] en el que se propone el uso de un filtro Flip-Flop, lo cual no es más que dos filtros, uno ágil y otro estable. Un controlador emplea el filtro ágil cuando es posible, pero regresa al estable cuando las observaciones son inusualmente ruidosas. Siguiendo la idea de variar el parámetro α para conseguir que el filtro sea ágil cuando sea posible; pero estable cuando sea necesario, en [18] se propone usar un α que varía de acuerdo a determinada función que hasta donde se conoce no se ha publicado. Otras modificaciones al algoritmo clásico se proponen y evalúan en [19], [20], [1], [16, 21, 22] Actualmente se han comenzado a publicar trabajos [23], [2], [24] que explotan otros métodos de análisis de series de tiempo como base para las estimaciones. Dentro de ellos se pueden mencionar DIAR (Diferencial Integrated Moving Average), ARMA (Autoregressive Moving Average), GARCH (Generalised Autoregressive Conditional Heteroskedasticity). También han ido ganando favor los predictores basados en la transformada Wavelet [2], [4], [5], [6].. 19.

(27) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. 1.6 La Transformada Wavelet La Transformada Wavelet es una herramienta matemática eficiente para el análisis local de señales no estacionarias y de rápida transitoriedad, y en principio es similar al análisis de Fourier, pero en lugar de usar senos y cosenos; que son funciones continuas y predecibles de duración infinita, para la descomposición de la señal original se emplean funciones de duración limitada y valor medio cero que capturen mejor el comportamiento local de una serie de tiempo no estacionaria. La gran ventaja de la Transformada Wavelet es que permite el uso de intervalos grandes de tiempo en aquellos segmentos en los que se requiere mayor precisión en baja frecuencia, y regiones más pequeñas donde se requiere información de alta frecuencia. Las wavelets son generadas a partir de la traslación y cambio de escala de una misma función wavelet llamada “Wavelet madre” donde s es el factor de escala, y es el factor de traslación. √. (. ). (1.19). Las wavelets generadas de la misma función wavelet madre tienen diferente escala s y ubicación , pero tienen todas la misma forma. Las Wavelets son dilatadas cuando la escala s > 1, y son contraídas cuando 0< s < 1. Así, cambiando el valor de s se cubren rangos diferentes de frecuencias. Valores grandes del parámetro s corresponden a frecuencias de menor rango, o una escala grande de . Valores pequeños de s corresponden a frecuencias de menor rango o una escala muy pequeña de (Figura 1.10).. Figura 1.10: Proceso de escalamiento y traslación de las wavelets [25]. 20.

(28) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. Existe un sin número de wavelets de las cuales las más sobresalientes fueron desarrolladas por científicos como: Alfred Haar, Ingrid Daubechies, Jean Morlett, Ronald Coifman, Yves Meyer, entre otros. En la Figura 1.11 se muestran algunas de ellas.. Figura 1.11: Gráficos de varios tipos de Wavelets: a) Wavelet de Daubechies, b) Wavelet de Haar, c) Wavelet de Morlet, d) Wavelet de Coiflet, e) Wavelet de Symmlet [26]. Las Transformadas Wavelet Comprende la Transformada Continua de Wavelet y la Transformada Discreta de Wavelet. Las wavelet continuas presentan la dificultad de tener que evaluar un gran número de integrales y tener en consecuencia una redundancia de información, pero permiten la flexibilidad de poder adaptarse a situaciones en las que las discretas no dan un resultado satisfactorio. El tratamiento con wavelet discretas analiza la señal a diferentes bandas de frecuencia con diferentes resoluciones al descomponer la señal componentes de aproximaciones y de detalles.. 21.

(29) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. 1.6.1. Transformada Wavelet Continua. La Transformada Wavelet Continua se define como: √. (. ∫. ). (1.20). La aplicación de la Transformada Wavelet Continua se puede describir de forma cualitativa en los pasos siguientes: 1. Comenzando con un determinado valor de s, por ejemplo 1, para la señal wavelet se ubica ésta al principio de la señal a analizar (t = 0). Luego, se multiplican entre sí ambas señales y el resultado se integra sobre todo el espacio de tiempo. El resultado de dicha integral se multiplica por el inverso de la raíz cuadrada de s. Este valor es el resultado de la Transformada Wavelet en t = 0 y s = 1. Este resultado indica cuán correlacionada está la wavelet con el segmento de la señal original y dependerá de la elección de la función wavelet. 2. La función (en la misma escala) se traslada en el tiempo en y se vuelve a realizar el procedimiento descrito en el paso 1. Se debe repetir esto hasta llegar al final de la señal a analizar. 3. Se varía el valor de s y se vuelven a realizar los pasos 1 y 2 hasta haber barrido todo el rango de frecuencias que se desea analizar. Note que dado que se trata de una transformada continua tanto el corrimiento como la variación de esta debiesen realizarse en forma continua. 4. Cuando se haya completado el cálculo para todos los valores de s, se habrá obtenido la Transformada Wavelet continua de la señal.. 1.6.2. Transformada Wavelet Discreta. En la mayoría de las señales son las componentes de baja frecuencia las que le otorgan a la señal la mayor parte de su información mientras que las componentes de alta frecuencia se encargan de incorporar características más particulares. Es por ello que la Transformada Wavelet Discreta divide la señal en componente de aproximación (baja frecuencia) y de detalles (alta frecuencia). Las componentes se separan por la aplicación a la señal de filtros paso alto y paso bajo. En la medida en que se apliquen mayor cantidad de niveles de filtrado los detalles de la señal quedarán mejor expresados. En la Figura 1.12 se observa la descomposición Wavelet de una señal f (t) en tres niveles. Para obtener la Transformada Wavelet Discreta a partir de discretizar la Transformada Wavelet Continua lo más común es emplear lo que se conoce como rejilla diática, lo cual implica hacer . De ahí que la Transformada Wavelet Discreta quedará descrita en (1.21). √. ∫. (. ). (1.21). 22.

(30) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. Figura 1.12: Descomposición Wavelet de tres niveles de f (t) [2]. Para las señales continuas se utiliza la Transformada Wavelet continua y desarrollos en series de wavelets. Para señales discretas, como la serie de tiempo de la demora en una comunicación de VoIP, se emplea la Transformada Wavelet Discreta debido a su habilidad para capturar las características de la variación en el tiempo. 1.7 Método de predicción basado en la Transformada Wavelet En [6] se propone un método de predicción que se sustenta en el empleo de la Transformada Wavelet el cual se describe de la siguiente manera. Se descompone la serie de tiempo de la demora en dos niveles con la Transformada Wavelet usando la función Wavelet básica Dauubechies dB3, de modo que la señal original queda dividida en componentes de detalle y de aproximación (1.22). (1.22) Donde es la serie de la demora original, y la de detalle respectivamente del segundo nivel, y nivel.. son la componente de aproximación y es la componente de detalle del primer. Se aplica a cada componente de detalle un filtro Autorregresivo. Usar los métodos de predicción con las componentes individuales permite que la precisión de la predicción sea mayor, debido a que las disímiles componentes capturan diferentes características de los datos originales. Para la componente de detalle del segundo nivel, se emplea el filtro descrito en (1.23). (1.23) Donde es el estimado Autorregresivo de la componente de detalle del segundo nivel para el paquete i, es la componente de detalle del segundo nivel para el paquete i y el factor de peso se toma con valor 0.1; de forma tal que se adapte a los cambios rápidos en la red.. 23.

(31) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. El filtro propuesto para la componente de detalle del primer nivel de descomposición queda definido en (1.24). | |. (1.24). En (1.24) se escoge con valor 0.98; con el fin de otorgarle estabilidad al predictor, es el estimado Autorregresivo de la componente de detalle del primer nivel para el paquete i y es la componente de detalle del primer nivel para el paquete i. Se usa el valor absoluto de para reducir la probabilidad de desbordamiento del buffer. Finalmente se obtiene la demora de reproducción a partir de las componentes de detalle filtradas y la componente de aproximación según (1.25), en la que es la componente de aproximación del segundo nivel de descomposición para el paquete i; es el estimado Autorregresivo de la componente de detalle del segundo nivel para el paquete i; es el estimado Autorregresivo de la componente de detalle del primer nivel para el paquete i y Ω es el factor de seguridad, usado para ajustar la demora de extremo a extremo y la razón de pérdida de paquetes. (1.25) En la figura 1.13 se muestra un ejemplo de descomposición Wavelet. Aparecen tanto la componente de aproximación como las de detalle, además de la señal original.. Figura 1.13: Serie de tiempo de la demora y las componentes resultantes de aplicarle la Transformada Wavelet [2]. 24.

(32) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. 1.8 Métodos para la obtención de trazas Un problema común en cuanto a los algoritmos es la forma en que los mismos se evalúan. Tradicionalmente se han seguido dos alternativas. Usando trazas reales obtenidas en escenarios concretos, o mediante simulación de eventos discretos. Cada uno de los cuales tiene sus puntos a favor y en contra. 1.. Obtención de trazas a través de pruebas de campo: Las pruebas de campo constituyen un método para la obtención de trazas que pueden ser muy útiles en la evaluación de un algoritmo cualquiera, pero para aplicar este método es necesario tener una red con las características del escenario donde se desee realizar la evaluación. Generalmente las trazas representan escenarios puntuales y el resultado dice, en última instancia, como es el desempeño del algoritmo en ese escenario. Otro inconveniente es la poca flexibilidad con respecto a los parámetros, lo que resultaría interesante tener en cuenta en el momento de exponer los resultados.. 2.. Obtención de trazas por emulación: La emulación es un método muy usado en la actualidad por sus potencialidades. Mediante este se pueden diseñar diversos experimentos. El principal inconveniente está en que el acceso a los principales testbed está restringido o es muy costoso. Algunos de los testbed de más renombre en el campo de la investigación son Orbit, MobiNet, APE, MobiEmu.. 3.. Obtención de trazas por simulación: La obtención de trazas por simulación se ha usado por varios investigadores debido a sus palpables potencialidades a la hora de comparar resultados, pues con este método se pueden variar parámetros de manera fácil y sin ningún costo y de ahí se pueden obtener valiosos análisis comparativos.. 1.9 Descripción de las Trazas De los tres métodos de obtención de trazas expuestos anteriormente es empleado en este trabajo la simulación. En esta sección se describen los tres grupos de trazas que se manejan para el desarrollo de los diferentes experimentos. 1.9.1. Trazas obtenidas de acuerdo a la Recomendación G1050 de la UIT-T. La Recomendación G1050 de la UIT-T, publicada en 2011 describe un modelo de red IP que puede ser usado para evaluar la eficiencia de flujos IP. Este modelo se centra en la determinación de parámetros como la demora, la variación de la demora o jitter y la pérdida de paquetes. La red IP modelada en la Recomendación corresponde a las características de las redes existentes hasta el año 2010 en el cual se elaboró la Recomendación. Los datos empleados para el modelo de red IP fueron aportados por proveedores de servicio de Internet y fabricantes de equipos de comunicaciones. De ahí que los resultados de emplear esta Recomendación se expresen en términos de cobertura de la misma. El modelo de red IP está conformado en un simulador de eventos discretos, en un sentido más realista se puede decir que el simulador es el modelo en sí. En la Figura 1.14 se ilustra 25.

(33) Capítulo 1 DESCRIPCIÓN DE LOS MÉTODOS DE PREDICCIÓN EMPLEADOS Y DEL MODELO E COMO FORMA DE EVALUACIÓN DE CALIDAD. la topología de red empleada para simular una conexión LAN-LAN, la cual es representativa de una aplicación cliente-cliente tal como VoIP. En las redes de acceso se permiten las tecnologías DSL (Digital Subscriber Line) o GPON (Gigabit-capable Passive Optical Network). Interfering Streams (pcap files). Access Network. 1 Gbit/s. Core Network. Test Stream. Interfering Streams (pcap files). 1 Gbit/s. Interfering Streams (pcap files). Core Network. 1 Gbit/s. Access Network. Interfering Streams (pcap files) Test Stream. Figura 1.14: Topología de red empleada para simular una conexión LAN-LAN [27]. El modelo trabaja los siguientes tipos de flujos: . IPTV (Internet Protocol Television): SD (Standard-Definition video) y HD (HighDefinition video), CBR (Constant Bit Rate) y VBR (Variable Bit Rate). . VoIP (Voice over Internet Protocol). . FoIP (Fax over IP). . Transferencia de archivos peer-to-peer. . HTTP (HyperText Transport Protocol). . OTT (Over-the-Top-TCP streaming video): SD (Standard-Definition video) y HD (HighDefinition video). En el simulador se definen tres perfiles estándares de prueba los cuales se describen a continuación: . Perfil A-Redes bien administradas (Well-managed network): Este perfil corresponde a una red que proporciona QoS (Quality of Service). Incluye IPTV (Internet Protocol Television): SD (Standard-Definition video) y HD (High-Definition video), VoIP (Voice over Internet Protocol) y FoIP (Fax over IP).. . Perfil B-Redes parcialmente administradas (Partially managed network): Este perfil corresponde a una red que tiene uno o más enlaces que no proporcionan QoS (Quality of Service). En este perfil se mezclan servicios de voz y video bien administrados y servicios construidos sobre la base del mejor esfuerzo. Incluye IPTV (Internet Protocol Television): SD (Standard-Definition video), VoIP (Voice over Internet Protocol), FoIP (Fax over IP), Transferencia de archivos peer-to-peer, HTTP (HyperText Transport Protocol), OTT (Over-the-Top-TCP streaming video).. 26.