1 IMPLEMENTACIÓN DE UN MODELO PREDICTOR PARA LA TOMA DE DECISIONES EN
REDES INALÁMBRICAS DE RADIO COGNITIVA
DANILO ALFONSO LÓPEZ SARMIENTO
UNIVERSIDAD DISTRITAL “FRANCISCO JOSÉ DE CALDAS” FACULTAD DE INGENIERÍAS
2 IMPLEMENTACIÓN DE UN MODELO PREDICTOR PARA LA TOMA DE DECISIONES EN
REDES INALÁMBRICAS DE RADIO COGNITIVA
Tesis de grado para optar por el título de:
DOCTOR EN INGENIERÍA
ENFASIS EN CIENCIAS DE LA INFORMACIÓN Y EL CONOCIMIENTO
DANILO ALFONSO LÓPEZ SARMIENTO
Director:
PhD. EDWIN RIVAS TRUJILLO.
UNIVERSIDAD DISTRITAL “FRANCISCO JOSÉ DE CALDAS” FACULTAD DE INGENIERÍAS
DOCTORADO EN INGENIERÍA AGOSTO 10 2017
3 NOTA DE ACEPTACIÓN
Esta Tesis de investigación ha sido aceptada por el programa de Doctorado en Ingeniería de la Universidad Distrital “Francisco José de Caldas” y aprobada por los Jurados evaluadores como requisito final para optar al título de:
Doctor en Ingeniería con énfasis en Ciencia de la Información y el Conocimiento
___________________________________________ Firma del presidente del Jurado.
___________________________________________ Firma del Segundo Jurado.
___________________________________________ Firma del Tercer Jurado.
___________________________________________ Director de Tesis (PhD. Edwin Rivas Trujillo)
___________________________________________ Candidato (PhD(c). Danilo Alfonso López Sarmiento)
4 © Derechos de autor 2017 de Danilo Alfonso López Sarmiento
5 RESUMEN
La etapa de toma de decisiones espectrales en redes de radio cognitiva (CRNs) con topologías centralizadas depende entre otras variables de la fiabilidad del modelo de caracterización de los usuarios primarios (PUs), del método de procesamiento de las solicitudes en la estación base (BS) y del algoritmo de selección de canales; de acuerdo con (Masonta, Mzyece, & Ntlatlapa, 2013), (López, Trujillo, & Gualdron, 2015) entre otros autores, se hace necesario proponer y/o aplicar metodologías que estimen con mayor acierto la presencia/ausencia de los PUs en los canales licenciados, perfeccionar la forma en que se procesan las solicitudes en la BS y mejorar la sub-etapa de selección y asignación de canales en la CRN.
En este sentido la tesis doctoral propone: 1) el uso de LSTM, ANFIS-GRID-FCM y SVM para predecir el comportamiento de los PUs, 2) plantea la posibilidad de gestionar anticipadamente las solicitudes de los usuarios secundarios en la BS (utilizando MLPNN) buscando reducir el tiempo necesario para la asignación del espectro, 3) generar esquemas de selección de canales eficientes basados en la clasificación del espectro a partir de las técnicas de aprendizaje SVM y ANFIS. La metodología seguida para evaluar/validar los algoritmos que forman el sistema de toma de decisiones incluye como fuente de información la utilización de una base de datos que contiene el comportamiento espectral de PUs en diferentes canales en la banda licenciada GSM y de uso libre WiFi, y la generación mediante simulación de tráfico con criterios de QoS para los SUs; los lenguajes de programación utilizados para la construcción de los algoritmos se basa en el uso de C#, Java Script y Matlab.
Los resultados evidencian: 1) un mayor porcentaje de acierto en la caracterización con LSTM y ANFIS-GRID-FCM, 2) una disminución en el tiempo de selección y asignación de canales mediante la utilización de una estrategía proactiva para la gestión de las solicitudes de los SUs en relación con el existente en el estado del arte, 3) que SVM y ANFIS son técnicas válidas para ser utilizadas en la selección de canales.
Como conclusión, el sistema de toma de decisiones propuesto debe ser considerado como un aporte adicional para el mejoramiento de la etapa de decisión espectral en CRNs basadas en infraestructura, que debe ser mejorado/complementado incluyendo factores tan importantes como la caracterización de los usuarios secundarios, la generación de esquemas que permitan la autoconfiguración de los nodos cognitivos, e integración de otras etapas de la CR como la movilidad espectral con el fin de determinar la viabilidad de su implementación a escala real.
6 ABSTRACT
The stage of spectral decision making in cognitive radio networks (CRNs) with centralized topologies depends, among other variables, on the reliability of the characterization model of primary users (PUs), the base station request processing method (BS ) And the channel selection algorithm; according to (Masonta, Mzyece, & Ntlatlapa, 2013), (López, Trujillo, & Gualdron, 2015), among other authors, it is necessary to propose and/or apply methodologies that better estimate the presence/ absence of the PUs in the licensed channels, perfect the way in which requests are processed in the BS and improve the sub-stage of selection and allocation of channels in the CRN.
In this regard, the doctoral thesis proposes: 1) the use of LSTM, SVM and ANFIS-GRID-FCM to predict the behavior of PUs, 2) poses the possibility of managing requests from secondary users in the BS (using MLPNN) aiming at reducing the time needed for spectrum allocation, 3) generate efficient spectrum selection schemes based on spectrum classification from SVM and ANFIS learning techniques. The methodology used to evaluate/validate the algorithms that make up the decision making system includes as a source of information, the use of a database containing the spectral behavior of PUs in different channels in the licensed GSM band and free WiFi, and generating traffic simulation using QoS criteria for SUs; the programming languages used for building the algorithms are based on the use of C #, Java Script and Matlab.
Results show: 1) a higher percentage of success in the LSTM and ANFIS-GRID-FCM characterization, 2) a decrease in the time needed to select and allocate channels, using a proactive strategy to manage SUs requests In relation to those existing in the state of the art, 3) furthermore it proves that SVM and ANFIS are valid for use in channel selection techniques.
In conclusion, the proposed decision-making system should be considered as an additional contribution to improve the spectral decision stage in infrastructure-based CRNs, which should be improved/complemented, including such important factors as the characterization of secondary users, the generation of schemas that allow auto configuration of cognitive nodes, and integration of other CR stages, such as spectral mobility in order to determine the feasibility of its implementation on a real scale.
Keywords: Cognitive radio, spectral decision making, PUs, SUs, blank spaces, characterization, reactive and proactive strategy in spectral decision making, recurrent neural networks, artificial intelligence, prediction, probability of arrival, LSTM, MLPNN, SVM, ANFIS , TOPSIS, FAHP.
7 DEDICATORÍA
8 AGRADECIMIENTOS
A Dios por darme la sabiduría, paciencia y perseverancia necesarias para no desfallecer en la culminación del Doctorado.
A Mi Familia por el amor, apoyo, comprensión y ánimo para seguir adelante en todo momento.
A Mis excelentes amigos Cesar Augusto Hernández y Luis Fernando Pedraza quienes jugaron un papel determinante en el desarrollo de este trabajo; muchas gracias por las acertadas asesorías, y oportunos aportes.
A Nana por Su enorme colaboración y apoyo cuando más lo necesité.
Al Director de Tesis PhD. Edwin Rivas Trujillo, por las asesorías, aportes y sugerencias.
9 TABLA DE CONTENIDO
CAPÍTULO 1. INTRODUCCIÓN. ... 22
1.1. PREGUNTA DE INVESTIGACIÓN. ... 22
1.2. OBJETIVOS... 22
1.2.1. General. ... 22
1.2.2. Específicos. ... 22
1.2.3. Alcances y limitaciones. ... 22
1.3. UBICACIÓN ESPACIAL DEL TRABAJO DE INVESTIGACIÓN Y ESTRUCTURA DEL LIBRO DE TESIS. ... 22
1.3.1. Consideraciones previas sobre radio cognitiva. ... 23
1.3.1.1. Decisión de espectro. ... 24
1.3.2. Ubicación espacial del trabajo de investigación. ... 24
1.3.3. Estructura de los capítulos que componen el trabajo de investigación. ... 25
CAPÍTULO 2. DESARROLLO DE UN ALGORITMO PARA LA CARACTERIZACIÓN DE LOS USUARIOS PRIMARIOS (PUs) EN FUNCIÓN DE LA FUENTE DE DATOS. ... 26
2. MODELOS DE CARACTERIZACIÓN DE USUARIOS PRIMARIOS... 27
2.1. CONTEXTUALIZACIÓN. ... 27
2.2. REVISIÓN CIENTÍFICA. ... 29
2.3. CARACTERIZACIÓN DE PUs CON LSTM. ... 29
2.3.1. Long Short-Term Memory. ... 30
2.3.2. Modelado de la señal de entrada y capas del sistema LSTM. ... 30
2.3.3. Modelo del funcionamiento del sistema LSTM. ... 31
2.3.3.1. Ecuaciones Forward Pass. ... 32
2.3.3.2. Ecuaciones Backward Pass. ... 33
2.3.3.3 Diagrama de flujo y pseudocodigo del sistema LSTM. ... 36
2.3.4. Evaluación y análisis de resultados. ... 37
2.3.4.1. Captura y procesamiento de la información espectral. ... 37
2.3.4.2 Evaluación y validación del algoritmo LSTM. ... 39
2.3.4.3. Discusión. ... 43
Figura 22. Coeficiente de correlación en la etapa de entrenamiento (modelamiento). ... 44
2.4. CARACTERIZACIÓN DE PUs CON UN MODELO NEURODIFUSO (ANFIS GRID-FCM). ... 44
2.4.1. Modelo del funcionamiento del sistema ANFIS. ... 44
2.4.2. Procesamiento de la información espectral. ... 47
2.4.3. Descripción del funcionamiento del algoritmo. ... 49
2.4.4. Evaluación y análisis de resultados. ... 52
2.4.4.1. Validación del modelo ANFIS. ... 52
2.4.4.2. Evaluación de desempeño del algoritmo ANFIS GRID-FCM. ... 53
2.5. CARACTERIZACIÓN DE PUs CON SVMs. ... 55
2.5.1. Diagrama secuencial del SVM-1. ... 56
2.5.2. Diagrama secuencial del SVM-2. ... 58
2.5.3. Metodología de prueba de las SVMs y procesamiento de los datos de entrada a los algoritmos. ... 60
2.5.4. Estimación de PUs usando SVM. ... 61
10
2.5.5.1. SVM_1. ... 63
2.5.5.2. SVM_2. ... 64
2.5.5.3 Discusión. ... 67
2.6. CONCLUSIONES DEL CAPÍTULO. ... 68
CAPÍTULO 3. DESARROLLO DE UN ALGORITMO PARA ESTIMAR LA PROBABILIDAD DE ARRIBO DE SUs A LA ESTACIÓN CENTRAL DE LA RED COGNITIVA. ... 69
3. MODELOS PARA DETERMINAR EL ARRIBO DE SUs A LA ESTACIÓN BASE en CRNs BASADAS EN INFRAESTRUCTURA. ... 69
3.1. CONTEXTUALIZACIÓN. ... 70
3.2. ESTADO DEL ARTE. ... 70
3.3. ESTIMACIÓN DEL ARRIBO DE SUs PARA LA SELECCIÓN DE CANALES EN RADIO COGNITIVA. ... 71
3.3.1. Modelo del sistema para el caso reactivo. ... 71
3.3.2. Modelo del sistema para el caso proactivo. ... 72
3.3.3. Evaluación de desempeño en el procesamiento de solicitudes de acceso a canales en la BS. ... 73
3.4. MODELO MLPNN PARA LA ESTIMACION DE ARRIBO DE SUs. ... 74
3.4.1. Representación del histórico de un SU. ... 74
3.4.2. Modelo matemático del sistema neuronal. ... 76
3.4.3. Diagrama de flujo del algoritmo de aprendizaje. ... 77
3.5.3.1. Entrenamiento de la red neuronal... 77
3.4.4. Software de predicción de arribo de SUs. ... 78
3.4.5. Evaluación de resultados. ... 80
3.6. CONCLUSIONES DEL CAPÍTULO. ... 82
CAPÍTULO 4. DESARROLLO DE UN ALGORITMO PARA LA TOMA DE DECISIONES O SELECCIÓN DE CANAL/CANALES A PARTIR DE LOS REQUERIMIENTOS DE CALIDAD DE SERVICIO (QoS) DE LOS USUARIOS COGNITIVOS. ... 82
4. MODELOS PARA LA SELECCIÓN DE CANALES ESPECTRALES EN REDES DE RADIO COGNITIVA. ... 82
4.1. CONTEXTUALIZACIÓN. ... 82
4.2. ESTADO DEL ARTE. ... 83
4.3. DISEÑO LÓGICO PARA LOS SISTEMAS DE SELECCIÓN DE CANALES. ... 83
4.3.1. Diagrama para la estrategia reactiva. ... 83
4.3.2. Diagrama para la estrategía proactiva. ... 84
4.4. DISEÑO DE CLASIFICADORES ANFIS Y SVM PARA LA SELECCIÓN DE CANALES. .. 85
4.4.1. Clasificador ANFIS. ... 85
4.4.2. Clasificador SVM. ... 86
4.5. DISEÑO DE CLASIFICADORES FAHP Y TOPSIS PARA LA SELECCIÓN DE CANALES. ... 88
4.5.1. Modelo de ranking para FAHP. ... 88
4.5.2. Modelo de ranking para TOPSIS. ... 93
4.6. SELECCIÓN Y ASIGNACIÓN DE CANALES. ... 95
11 4.8. DESCRIPCIÓN DEL SIMULADOR PARA LA SELECCIÓN DE CANALES EN LA ETAPA
DE DECISIÓN ESPECTRAL UTILIZANDO UNA ESTRATEGÍA PROACTIVA. ... 100
4.9. ANÁLISIS DE RESULTADOS DEL SISTEMA DE SELECCIÓN DE CANALES CON SVM Y ANFIS. ... 101
4.10. ANÁLISIS DE RESULTADOS DEL SISTEMA DE SELECCIÓN DE CANALES CON TOPSIS Y FAHP. ... 107
4.11. COMPARACIÓN ENTRE METODOLOGÍAS DE RANKING EN LA SELECCIÓN DE CANALES. ... 107
4.12. CONCLUSIONES DEL CAPÍTULO. ... 111
CAPÍTULO 5. DISEÑO DE UN ALGORITMO CR-MAC PARA LA ASIGNACIÓN EQUITATIVA DE ESPECTRO EN REDES INALÁMBRICAS DE RADIO COGNITIVA (Anzola & Zapata, 2016). ... 112
5.1. CONTEXTUALIZACIÓN. ... 112
5.2. REVISIÓN CIENTÍFICA. ... 112
5.3. MODELO DEL SISTEMA. ... 114
5.3.1. Secuencia de comunicación entre emisor, estación base (BS) y receptor. ... 115
5.3.2. Control de colisiones. ... 116
5.3.3. Clasificación de SUs con ANFIS. ... 117
5.3.3.1. Modelo de clasificación. ... 118
5.3.3.2. Diagrama de flujo del Algoritmo de clasificación. ... 120
5.3.4. Clasificación de SUs con FAHP. ... 121
5.3.4.1. Modelo de clasificación. ... 121
5.3.4.2. Diagrama de flujo del Algoritmo de clasificación. ... 124
5.4. OPERACIÓN DEL PROTOCOLO CRUD-MAC. ... 124
5.4.1. Características de las bandas espectrales susceptibles a ser asignados a los SUs. ... 124
5.4.2. Asignación de potencia. ... 125
5.4.3. Distribución del tráfico de datos de los SUs en los canales. ... 126
5.4.4. Diagrama de flujo. ... 127
5.4.5. Proceso de comunicación con CRUD-MAC. ... 129
5.5. RESULTADOS. ... 131
5.5.1. Resultados sin clasificación. ... 131
5.5.2. Resultados con el sistema de clasificación ANFIS. ... 132
5.5.3. Resultados con el sistema de clasificación FAHP. ... 133
5.5.4. Comparación de resultados. ... 134
5.6. CONCLUSIONES DEL CAPÍTULO. ... 136
CAPÍTULO 6. CONCLUSIONES GENERALES, APORTES Y TRABAJO FUTURO. ... 136
6.1. CONCLUSIONES GENERALES. ... 136
6.2. RESUMEN DE LOS PRINCIPALES APORTES DEL TRABAJO DOCTORAL... 137
6.3. TRABAJO FUTURO. ... 137
REFERENCIAS BIBLIOGRÁFICAS. ... 137
ANEXO 1. ALGUNOS SEGMENTOS DE CÓDIGO EN MATLAB DEL SELECTOR DE CANALES. ... 150
12 LISTA DE TABLAS
Tabla 1. Notaciones para el desarrollo del modelo matemático. ... 32
Tabla 2. Especificaciones de los equipos de medición y captura espectral (Hernández, Salgado, López, & Rodríguez-Colina, 2015). ... 38
Tabla 3. Especificaciones del clúster (Hernández, Salgado, López, & Rodríguez-Colina, 2015). ... 38
Tabla 4. Casos de prueba para trazas de tráfico del PU generadas mediante simulación. ... 39
Tabla 5. Desempeño de LSTM en la caracterización de PUs. ... 41
Tabla 6. Desempeño de MLPNN en la caracterización de PUs. ... 42
Tabla 7. Rendimiento del algoritmo para flujos GSM. ... 45
Tabla 8. Rendimiento del algoritmo para flujos WiFi. ... 45
Tabla 9. Resultados encontrados con LSTM... 53
Tabla 10. Resultados estadísticos de los sistemas ANFIS y LSTM. ... 55
Tabla 11. Matriz de clasificación para 1000 ejemplos. ... 65
Tabla 12. Matriz de clasificación para 1000 ejemplos usando PCA. ... 65
Tabla 13. Matriz de clasificación para mil ejemplos con estimación 𝑙𝑙+ 1000 y sin usar PCA. ... 66
Tabla 14.Matriz de clasificación para mil ejemplos con estimación 𝑙𝑙+ 1000 usando PCA... 66
Tabla 15. Resultados del entrenamiento para el caso de prueba “distribución exponencial”. ... 80
Tabla 16. Resultados de la predicción para el caso de prueba “distribución exponencial”. ... 80
Tabla 17. Resultados del entrenamiento para el caso de prueba “distribución Poisson”. ... 80
Tabla 18. Resultados de la predicción para el caso de prueba “distribución Poisson”. ... 81
Tabla 19. Resultados del entrenamiento para el caso de prueba “distribución uniforme”. ... 81
Tabla 20. Resultados de la predicción para el caso de prueba “distribución uniforme”. ... 81
Tabla 21. Matriz de juicios para aplicaciones Best Effort... 90
Tabla 22. Matriz de juicios para aplicaciones Real Time. ... 90
Tabla 23. Pesos normalizados de los criterios. ... 91
Tabla 24. Índices de consistencia. ... 92
Tabla 25. Matriz de decisión en TOPSIS. ... 93
Tabla 26. Matriz de decisión con algunas alternativas (canales). ... 93
Tabla 27. Matriz de decisión normalizada con algunas alternativas (canales). ... 94
Tabla 28. Pesos para organizar los SUs tipo RT. ... 97
Tabla 29. Pesos para organizar los SUs tipo BE. ... 98
Tabla 30. Asignación de canales para dos SUs tipo BE. ... 99
Tabla 31. Matriz de juicios para los criterios. ... 122
Tabla 32. Pesos normalizados de los criterios. ... 123
Tabla 33. Características de evaluación del algoritmo. ... 131
13 LISTA DE FIGURAS
Figura 1. Concepto de acceso oportunista al espectro (Lopez, 2011). ... 23
Figura 2. Ocupación del espectro en tiempo y frecuencia (Barnes, 2012). ... 23
Figura 3. Marco de gestión de espectro dinámico en CR (Barnes, 2012)... 24
Figura 4. Marco de decisión del espectro (Masonta, Mzyece, & Ntlatlapa, 2013). ... 24
Figura 5. Ubicación espacial del trabajo de investigación. ... 25
Figura 6. Descripción de las propuestas de caracterización de PUs desarrollados en el Capítulo 2. ... 25
Figura 7. Descripción de las propuestas de cálculo de la probabilidad de arribo/estimación futura de SUs en la BS contenidas en el Capítulo 3. ... 25
Figura 8. Descripción de los algoritmos para la selección de canales contenidas en el Capítulo 4. ... 26
Figura 9. Etapas que componen las redes de radio cognitivas (CRNs). ... 28
Figura 10. Contextualización de la caracterización en la etapa de decisión espectral en CRNs. ... 28
Figura 11. Resumen de algunas de las metodologías utilizadas en la caracterización del PU. ... 29
Figura 12. Representación gráfica de redes neuronales tipo LSTM. ... 31
Figura 13. Arquitectura LSTM utilizada para la caracterización de PUs. Modificado de: (Palangi, Ward, & Deng, 2016). ... 33
Figura 14. Diagrama de flujo para el entrenamiento de LSTM. ... 36
Figura 15. Interconexión de los equipos para la captura de datos de ocupación espectral (Hernández, Salgado, López, & Rodríguez-Colina, 2015). ... 38
Figura 16. Diagrama de flujo para discretización de datos espectrales. ... 40
Figura 17.Representación del comportamiento histórico para 77 muestras. ... 40
Figura 18. Topología de la red neuronal. ... 40
Figura 19. Resultados de la etapa de entrenamiento (fase de aprendizaje de la red). ... 41
Figura 20. Resultados de la predicción. ... 41
Figura 21. Porcentaje de acierto en la predicción para LSTM y ANFIS. ... 43
Figura 22. Coeficiente de correlación en la etapa de entrenamiento (modelamiento). ... 44
Figura 23. Estructura ANFIS para la caracterización de PUs. ... 46
Figura 24. Obtención del nivel de potencia final que representa la presencia o ausencia de un PU. ... 48
Figura 25. Muestra de niveles de potencia del PU normalizados... 48
Figura 26. Comparación entre la señal normalizada (imagen superior) y la filtrada (imagen inferior). ... 49
Figura 27. Sistema ANFIS basado en el modelo Sugeno. ... 49
Figura 28. Diagrama a bloques del algoritmo de predicción de PUs utilizando GRID y ANFIS-FCM. ... 51
Figura 29. Entrenamiento del PU en un canal GSM (modelado) con ANFIS GRID-FCM. ... 52
Figura 30. Validación del modelo ANFIS GRID-FCM estimando una predicción futura de comportamiento del PU para 500 datos. ... 53
Figura 31. Entrenamiento del comportamiento del PU en un canal GSM (modelado) con LSTM. ... 54
Figura 32. Validación del sistema LSTM estimando una predicción de comportamiento del PU para 500 datos. ... 54
Figura 33. Diagrama a bloques del sistema de caracterización con SVMs. ... 56
Figura 34. Diagrama de flujo del primer algoritmo SVM-1 (Mathworks_SVMC, 2015). ... 57
Figura 35. Diagrama secuencial del segundo SVM propuesto para PUs (Chang & Lin, 2015). ... 59
Figura 36. Metodología seguida para estimar la ausencia o presencia de PUs. ... 60
Figura 37. Diagrama encargado de extraer los datos del archivo capturado en Acrylic. ... 61
Figura 38. Procesamiento de las secuencias a series temporales. ... 61
Figura 39. Secuencia de pasos para modelar y predecir PUs con SVMs. ... 62
Figura 40. Compresión del volumen de datos a procesar por la etapa de entrenamiento y estimación del canal. ... 62
Figura 41. Forma de crear los ejemplos para modelar y estimar el uso del canal de un usuario primario. .. 63
14 Figura 43. Comparación del comportamiento real y la predicción para el PU en el canal evaluado sin la
utilización de PCA. ... 65
Figura 44. Comparación entre la actividad real del PU y la estimada por la SVM-2 (haciendo uso de PCA). ... 67
Figura 45. Comparación entre la actividad real del PU y la estimada por la SVM-2 basado en porcentajes de probabilidad. ... 67
Figura 46. CRN basada en infraestructura. ... 70
Figura 47. Estrategias de ejecución de las solicitudes de SUs (López, Trujillo, & Gualdron, 2015). ... 71
Figura 48. Sistema de arribo reactivo de SUs a la BS. ... 71
Figura 49. Modelo del sistema de arribo proactivo de SUs a la BS. ... 73
Figura 50. Evaluación del nivel de estimación del arribo de SUs a la BS con el modelo proactivo. ... 74
Figura 51. Representación de la MLPNN para el conjunto de datos de la ecuación 82... 76
Figura 52. Diagrama de entrenamiento del sistema MLPNN. ... 78
Figura 53. Software de predicción de arribo de SUs (generación del histórico). ... 79
Figura 54. Etapa de creación de las MLPNN especializadas. ... 79
Figura 55. Fase de entrenamiento de la red neuronal. ... 79
Figura 56. Fase de predicción (cálculo de probabilidad de una solicitud QoS) de la red neuronal. ... 80
Figura 57. Distribución exponencial predicha para la variable BW. ... 81
Figura 58. Clasificación de metodologías para selección de espectro. ... 83
Figura 59. Diagrama a bloques para el sistema reactivo. ... 84
Figura 60. Diagrama a bloques para el sistema proactivo. ... 85
Figura 61. Arquitectura de la red ANFIS. ... 86
Figura 62. Funciones de pertenencia definidas. ... 86
Figura 63. Diagrama de flujo para el algoritmo de ranking con ANFIS. ... 87
Figura 64. Diagrama de flujo para el algoritmo de ranking con SVM. ... 88
Figura 65. Hiperplano de decisión obtenido para las variables 𝑡𝑡𝑡𝑡, 𝑡𝑡𝑝𝑝, 𝑟𝑟. ... 89
Figura 66. Jerarquía del algoritmo FAHP propuesto. ... 89
Figura 67. Diagrama de flujo para el ranking de canales en FAHP. ... 92
Figura 68. Diagrama de flujo para el ranking TOPSIS. ... 95
Figura 69. Diagrama de flujo para la selección y asignación de canales en el sistema proactivo. ... 96
Figura 70. Asignación y reserva de canales según QoS. ... 97
Figura 71. Diagrama a bloques del software implementado para el sistema reactivo... 98
Figura 72. Trama de presentación para BE. ... 98
Figura 73. Trama de presentación para RT. ... 98
Figura 74. Comportamiento en el tiempo de la cantidad de canales disponibles para los dos SUs del ejemplo. ... 99
Figura 75. Redistribución de carga para un SU tipo BE. ... 100
Figura 76. Diagrama a bloques del software implementado para el sistema proactivo. ... 100
Figura 77. Probabilidad de éxito en las transmisiones RT y BE. ... 102
Figura 78. Probabilidad de éxito en las transmisiones RT. ... 102
Figura 79. Probabilidad de éxito en las transmisiones BE. ... 103
Figura 80. Error de retardo. ... 103
Figura 81. Error de asignación. ... 104
Figura 82. Transmisiones exitosas. ... 104
Figura 83. Throughput. ... 105
Figura 84. Índice de Jain. ... 105
Figura 85. Colisiones entre PUs y SUs. ... 106
Figura 86. Tiempo de entrenamiento necesario para los algoritmos de clasificación. ... 106
Figura 87. Tiempo de procesamiento de las solicitudes de los SUs después de entrenados los algoritmos de aprendizaje. ... 107
15 Figura 89. Comparación entre sistemas de ranking reactivo para uso alto de GSM y arribo exponencial.
... 108
Figura 90. Comparación de cantidad de colisiones con PUs entre sistemas proactivo, reactivo y sin ranking con TOPSIS. ... 109
Figura 91. Comparación de cantidad de colisiones con PUs entre sistemas proactivo, reactivo y sin ranking con ANFIS. ... 109
Figura 92. Comparación de cantidad de colisiones con PUs entre sistemas proactivo, reactivo y sin ranking con FAHP. ... 109
Figura 93. Comparación de cantidad de colisiones con PUs entre sistemas proactivo, reactivo y sin ranking con SVM. ... 110
Figura 94. Tiempo de entrenamiento necesario para los algoritmos de clasificación en WiFi. ... 110
Figura 95. Tiempo de entrenamiento necesario para los algoritmos de clasificación en GSM. ... 111
Figura 96. Componentes generales del protocolo CRUD-MAC. ... 114
Figura 97. Establecimiento de una sesión entre nodos cognitivos. ... 115
Figura 98. Estructura de la trama de presentación (TP). ... 115
Figura 99. Estructura de la trama LAC. ... 116
Figura 100. Rangos de alcance para la BS y el SU en la frontera. ... 116
Figura 101. Diagrama de bloques general del sistema con ANFIS. ... 117
Figura 102. Arquitectura del clasificador ANFIS. ... 119
Figura 103. Diagrama de flujo para la implementación y entrenamiento del sistema ANFIS. ... 120
Figura 104. Diagrama general del sistema con FAHP. ... 121
Figura 105. Jerarquía del algoritmo FAHP. ... 121
Figura 106. Diagrama de flujo del algoritmo FAHP. ... 125
Figura 107. Metodología para la asignación de canales. ... 127
Figura 108. Proceso de transmisión de datos de los SUs. ... 128
Figura 109. Proceso de transmisión de datos de los SUs. ... 130
Figura 110. Diagrama de tiempos del protocolo CRUD-MAC para el SU3. ... 130
Figura 111. Histograma de ηt para el CRUD-MAC sin clasificación. ... 131
Figura 112. Comportamiento de SUs aceptados y rechazados para el CRUD-MAC sin asignación equitativa de recursos. ... 132
Figura 113. Histograma de ηt para el CRUD-MAC con clasificación ANFIS. ... 132
Figura 114. Comportamiento de SUs aceptados y rechazados para el CRUD-MAC con asignación equitativa de recursos usando ANFIS. ... 133
Figura 115. Histograma de ηt para el CRUD-MAC con clasificación FAHP... 133
Figura 116. SUs aceptados y rechazados con clasificación FAHP. ... 134
Figura 117. Resultados comparativos de SUs aceptados y rechazados por época para los tres métodos. . 134
Figura 118. Resultados comparativos de SUs sin intentos exitosos de asignación por época. ... 135
16 LISTA DE ECUACIONES
Ecuación 1 ... 30
Ecuación 2 ... 30
Ecuación 3 ... 31
Ecuación 4 ... 31
Ecuación 5 ... 31
Ecuación 6 ... 32
Ecuación 7 ... 32
Ecuación 8 ... 32
Ecuación 9 ... 32
Ecuación 10 ... 32
Ecuación 11 ... 32
Ecuación 12 ... 33
Ecuación 13 ... 33
Ecuación 14 ... 33
Ecuación 15 ... 34
Ecuación 16 ... 34
Ecuación 17 ... 34
Ecuación 18 ... 34
Ecuación 19 ... 34
Ecuación 20 ... 34
Ecuación 21 ... 34
Ecuación 22 ... 34
Ecuación 23 ... 34
Ecuación 24 ... 35
Ecuación 25 ... 35
Ecuación 26 ... 35
Ecuación 27 ... 35
Ecuación 28 ... 35
Ecuación 29 ... 35
Ecuación 30 ... 35
Ecuación 31 ... 36
Ecuación 32 ... 38
Ecuación 33 ... 42
Ecuación 34 ... 44
Ecuación 35 ... 46
Ecuación 36 ... 46
Ecuación 37 ... 46
Ecuación 38 ... 46
Ecuación 39 ... 47
Ecuación 40 ... 47
Ecuación 41 ... 47
Ecuación 42 ... 47
Ecuación 43 ... 47
Ecuación 44 ... 47
Ecuación 45 ... 49
Ecuación 46 ... 50
Ecuación 47 ... 50
Ecuación 48 ... 50
Ecuación 49 ... 50
Ecuación 50 ... 50
17
Ecuación 52 ... 52
Ecuación 53 ... 52
Ecuación 54 ... 52
Ecuación 55 ... 57
Ecuación 56 ... 58
Ecuación 57 ... 58
Ecuación 58 ... 59
Ecuación 59 ... 59
Ecuación 60 ... 64
Ecuación 61 ... 64
Ecuación 62 ... 71
Ecuación 63 ... 71
Ecuación 64 ... 71
Ecuación 65 ... 71
Ecuación 66 ... 71
Ecuación 67 ... 72
Ecuación 68 ... 72
Ecuación 69 ... 72
Ecuación 70 ... 72
Ecuación 71 ... 72
Ecuación 72 ... 73
Ecuación 73 ... 73
Ecuación 74 ... 73
Ecuación 75 ... 73
Ecuación 76 ... 74
Ecuación 77 ... 74
Ecuación 78 ... 74
Ecuación 79 ... 74
Ecuación 80 ... 74
Ecuación 81 ... 75
Ecuación 82 ... 75
Ecuación 83 ... 75
Ecuación 84 ... 76
Ecuación 85 ... 76
Ecuación 86 ... 76
Ecuación 87 ... 76
Ecuación 88 ... 77
Ecuación 89 ... 77
Ecuación 90 ... 77
Ecuación 91 ... 78
Ecuación 92 ... 78
Ecuación 93 ... 87
Ecuación 94 ... 87
Ecuación 95 ... 89
Ecuación 96 ... 89
Ecuación 97 ... 90
Ecuación 98 ... 90
Ecuación 99 ... 90
Ecuación 100 ... 91
Ecuación 101 ... 91
Ecuación 102 ... 91
Ecuación 103 ... 91
18
Ecuación 105 ... 91
Ecuación 106 ... 92
Ecuación 107 ... 92
Ecuación 108 ... 93
Ecuación 109 ... 93
Ecuación 110 ... 94
Ecuación 111 ... 94
Ecuación 112 ... 94
Ecuación 113 ... 94
Ecuación 114 ... 95
Ecuación 115 ... 95
Ecuación 116 ... 95
Ecuación 117 ... 101
Ecuación 118 ... 101
Ecuación 119 ... 101
Ecuación 120 ... 101
Ecuación 121 ... 101
Ecuación 122 ... 117
Ecuación 123 ... 117
Ecuación 124 ... 117
Ecuación 125 ... 117
Ecuación 126 ... 118
Ecuación 127 ... 118
Ecuación 128 ... 118
Ecuación 129 ... 118
Ecuación 130 ... 118
Ecuación 131 ... 119
Ecuación 132 ... 119
Ecuación 133 ... 119
Ecuación 134 ... 119
Ecuación 135 ... 119
Ecuación 136 ... 120
Ecuación 137 ... 120
Ecuación 138 ... 122
Ecuación 139 ... 122
Ecuación 140 ... 122
Ecuación 141 ... 123
Ecuación 142 ... 123
Ecuación 143 ... 123
Ecuación 144 ... 123
Ecuación 145 ... 123
Ecuación 146 ... 123
Ecuación 147 ... 123
Ecuación 148 ... 124
Ecuación 149 ... 125
Ecuación 150 ... 126
Ecuación 151 ... 126
Ecuación 152 ... 126
Ecuación 153 ... 126
Ecuación 154 ... 126
Ecuación 155 ... 126
Ecuación 156 ... 126
20 LISTA DE SÍMBOLOS
ACK Confirmación De Recibido AHP Analytical Hierarchical Process AI Inteligencia Artificial
ANFIS Adaptative Neuro-Fuzzy Inference System ANFIS-FCM ANFIS-Fuzzy C-Means
BE Best Effort
BPTT Backpropagation Through Time BS Base Station
BW Ancho De Banda CR Radio Cognitiva
CRNs Redes De Radio Cognitiva
CRUD-MAC Control de Acceso al Medio en Redes Cognitivas para la Universidad Distrital CSMA/MAC Carrier Sensing Multiple Access With Collision Avoidance
CSV Comma-Separated Values DSA Acceso Dinámico al Espectro
DSMF Marco de Gestión del Espectro Dinámico FAHP Fuzzy Analytical Hierarchical Process FCC Comisión Federal de Comunicaciones FIS Fuzzy Inference System
FPGA Field Programmable Gate Array FSL Free Space losses
GSM Sistema Global para Comunicaciones Móviles KKT Karush-Kuhn-Tucker
LAC Lista de Asignación de Canales LSTM Long Short-Term Memory MF Función de membresía
MLPNN Multilayer Perceptron Neural Network PCA Principal Component Analysis
PUs Usuarios Primarios QoS Calidad de Servicio QP Quadratic Programming RF Radio Frecuencia
21 RNN Redes Neuronales Recurrentes
RT Real Time
RTS Petición para enviar SIFS Short Interframe Space
SMO Sequential Minimal Optimization SUs Usuarios Secundarios
SVM Support Vector Machine, TC Tiempo de Clasificación TG Tiempo de Guarda
TOPSIS Technique for Order of Preference by Similarity to Ideal Solution TP Trama de Presentación
22
CAPÍTULO 1. INTRODUCCIÓN.
1.1. PREGUNTA DE INVESTIGACIÓN.
¿Cómo se podría reducir el tiempo de selección de bandas espectrales a los SUs sin degradar la comunicación del PU?. El elemento diferenciador de la tesis en relación a otras propuestas, se relaciona con el diseño de un modelo de selección espectral para usuarios cognitivos a partir de la caracterización de los usuarios primarios, y de la probabilidad de llegada de los SUs a la entidad central dentro de una topología de red centralizada. Para ello se hará uso de técnicas de Inteligencia Artificial como Support Vector Machine (SVM) o Adaptive Neural Fuzzy Inference System (ANFIS) o Redes bayesianas, u otras metodologías como Fuzzy Analytical Hierarchical Process (FAHP).
1.2. OBJETIVOS.
1.2.1. General.
Desarrollar un modelo predictivo para la selección de bandas espectrales a partir de la caracterización de los usuarios heterogéneos en la toma de decisiones de espectro de radio cognitiva.
1.2.2. Específicos.
• Desarrollo un algoritmo para la caracterización de los usuarios primarios (PUs) en función de la fuente de datos.
• Desarrollo de un algoritmo para estimar la probabilidad de arribo de usuarios secundarios (SUs) a la estación central de la red cognitiva.
• Desarrollo de un algoritmo para la toma de decisiones o selección del canal a partir de los requerimientos de calidad de servicio (QoS) de los usuarios cognitivos.
1.2.3. Alcances y limitaciones.
• Caracterización de PUs a partir de una técnica existente.
• Diseño del algoritmo de estimación.
• Diseño del algoritmo selector.
• Pruebas de simulación con otra técnica existente para validar la propuesta.
El proyecto asume que:
• Existe un monitoreo de espectro conocido y óptimo; es decir que el módulo de sensado no se construirá.
• Para la generación de las fuentes de tráfico que alimentarán cada algoritmo, se usarán distribuciones de poisson, uniforme, datos reales (siendo esta última una alternativa casi descartada por la consecución de la información).
• Se evaluará la posibilidad de uso de fuentes de tráfico reales o simuladas mediante distribuciones.
• La secuencia de frecuency hopping y módulo de movilidad espectral se deja como trabajo futuro.
• Las características de QoS exigidas por los usuarios secundarios dependen del tráfico a trasmitir y son de tipo: best effort y real time.
• El proceso de encaminamiento corresponde a un estudio futuro en razón que está asociado con el concepto de movilidad espectral; por tal razón, la red cognitiva estará formada por el nodo central y nodos cognitivos coexistiendo dentro de la estructura de red primaria.
23 1.3.1. Consideraciones previas sobre radio cognitiva.
Tradicionalmente, el espectro de RF es administrado por las agencias reguladoras mediante la asignación de partes fijas del espectro para usuarios individuales en forma de licencias renovables. Aunque este enfoque regulador asegura comunicaciones libres de interferencia entre terminales de radio, sufre por la utilización ineficiente del espectro. En años recientes, la CR ha recibido considerable atención por parte de la comunidad científica como una tecnología que permite la gestión eficiente del espectro de radiofrecuencia y su éxito depende de que tan eficiente y ágil sea el proceso de acceso dinámico al espectro (Zhao, Tong, & Swami, 2005) como se muestra en la figura 1, donde se observa que el objetivo fundamental de la CR es encontrar oportunidades espectrales para poder acceder a ellos, sin interferir con el usuario dueño de la banda (es decir el PU). Cabe destacar que un agujero de espectro u oportunidad espectral, es definido como un rango de frecuencia concedida a un PU, pero que en un momento determinado y ubicación geográfica específica no está siendo utilizado (Haykin, 2005) y puede ser aprovechado oportunistamente por los SUs.
Figura 1. Concepto de acceso oportunista al espectro (Lopez, 2011).
Un posible patrón de ocupación de un PU que abarca cuatro canales de frecuencia adyacentes se ilustra en la figura 2. Los segmentos horizontales representan canales de frecuencia durante un periodo de tiempo, donde los bloques verdes oscuros representan los agujeros sin utilización y los verdes claros identifican la actividad del PU. Cuando el PU arriba al canal ocupado actualmente por una SU, este último debe saltar al siguiente mejor canal disponible, según lo indicado por la flecha. Esto implica que para mantener la comunicación ininterrumpida, el SU debería operar continuamente dentro de los bloques libres.
Figura 2. Ocupación del espectro en tiempo y frecuencia (Barnes, 2012).
24 El sensado de espectro hace un barrido de las frecuencias en el área de interés para identificar los espacios en blanco con mayor probabilidad de ser utilizados en un determinado espacio de tiempo, frecuencia y potencia dentro de una región geográfica específica. La decisión de espectro se identifica con la selección del canal o grupo de canales de acuerdo a dos factores: 1) las características disponibles en el entorno; 2) las necesidades solicitadas por el SU para el transporte de los datos (Akyildiz, Lee, Vuran, & Mohanty, 2008). La compartición del espectro, consiste en administrar de manera adecuada las bandas de frecuencia maximizando su uso sin generar molestias en los PU y otros usuarios CR (Mitola & Maguire, 1999), (Akyildiz, Lee, Vuran, & Mohanty, 2008). La movilidad del espectro es la capacidad del CR para dejar una porción del espectro de frecuencia ocupado cuando un PU lo comienza a utilizar nuevamente, y además se encarga de buscar otro espacio “vacío” adecuado para la comunicación (Mitola & Maguire, 1999).
Figura 3. Marco de gestión de espectro dinámico en CR (Barnes, 2012).
1.3.1.1. Decisión de espectro.
Las funciones requeridas para la toma de decisiones se resumen en la figura 4; llevar a cabo estas funciones, implica responder los siguientes interrogantes: ¿cómo se puede caracterizar el espectro disponible?, ¿cómo se puede seleccionar la mejor banda del espectro para satisfacer la QoS de los SU?, ¿cuál es la técnica óptima para reconfigurar el CR para la banda de espectro seleccionado? ¿y cómo? (Masonta, Mzyece, & Ntlatlapa, 2013). Las preguntas anteriores forman la base de la caracterización, selección del espectro y reconfiguración de CR, respectivamente (Masonta, Mzyece, & Ntlatlapa, 2013).
Figura 4. Marco de decisión del espectro (Masonta, Mzyece, & Ntlatlapa, 2013).
1.3.2. Ubicación espacial del trabajo de investigación.
25
• Caracterización (es decir, estimación futura de la ocupación/no ocupación del canal o canales) del usuario licenciado aplicando las metodologías LSTM, ANFIS, SVM, MLPNN, Redes Bayesianas, correlación y regresión lineal, autocorrelación. Cabe destacar que en este documento solo se socializan los resultados encontrados con las tres primeras técnicas, las demás se encuentran relacionados en las publicaciones descritas en el Capítulo 2.
Figura 5. Ubicación espacial del trabajo de investigación.
• Predicción del arribo de los SUs a la estación base (BS) de una red de radio cognitiva con topología basada en infraestructura utilizando MLPNN, para gestionar la reserva de recursos antes del arribo del siguiente usuario cognitivo; pretendiendo con ello reducir el tiempo requerido para gestionar la selección de canales en la BS.
• Selección del canal/canales más adecuados para los SUs de acuerdo a los criterios de calidad de servicio (BE o RT) solicitados por los SUs y disponibles en la CRN, mediante la utilización de las metodologías ANFIS, SVM, FAHP, TOPSIS.
1.3.3. Estructura de los capítulos que componen el trabajo de investigación.
El trabajo doctoral se compone principalmente de tres grandes secciones que corresponden a los Capítulos 2, 3 y 4, directamente relacionados con los “objetivos específicos” planteados en el anteproyecto. Cada uno de los capítulos lo conforma la integración de artículos en proceso de publicación o publicados en revistas indexadas u homologadas por Colciencias y distribuidos cronológicamente como se muestra en las figuras 6, 7 y 8.
Figura 6. Descripción de las propuestas de caracterización de PUs desarrollados en el Capítulo 2.
26 Figura 8. Descripción de los algoritmos para la selección de canales contenidas en el Capítulo 4.
Adicionalmente se incluye un Capítulo 5, donde se diseña un algoritmo basado en un protocolo CR-MAC soportado en ANFIS para la etapa de “compartición espectral” incluyendo criterios fairness.
CAPÍTULO 2. DESARROLLO DE UN ALGORITMO PARA LA
CARACTERIZACIÓN DE LOS USUARIOS PRIMARIOS (PUs) EN
FUNCIÓN DE LA FUENTE DE DATOS.
Principales aportes:
• Desarrollo de una propuesta de caracterización de PUs en CR utilizando la metodología de red neuronal de aprendizaje profundo Long Short-Term Memory.
• Desarrollo de un modelo Neuro-Difuso basado en ANFIS-GRID y ANFIS-FCM para la caracterización de usuarios licenciados en CR: (en proceso de publicación).
• Evaluación del desempeño de la técnica Maquina de Soporte Vectorial para determinar la presencia/ausencia de un PU en CR.
• Desarrollo de un software de caracterización de PUs.
Publicaciones en Revistas indexadas / homologadas por Colciencias:
• Primary user characterization for cognitive radio wireless networks using a neural system based on deep learning: (en segunda revisión de pares para publicación).
• Estimation of future occupation of spectral channels by licensed users in cognitive radio networks applying neuro-fuzzy models: (en evaluación de pares para posible publicación).
• Characterization of primary users in cognitive radio wireless networks using Support Vector Machine: (aprobado para publicación).
• Analysis of multilayer neuronal networks modeling and long short-term memory: (aprobado para publicación en el mes de Junio: http://www.enggjournals.com/ijet/ijet-archives.html).
• User characterization through dynamic Bayesian networks in cognitive radio wireless networks: (http://www.enggjournals.com/ijet/docs/IJET16-08-04-043.pdf).
• Elementos fundamentales que componen la radio cognitiva y asignación de bandas espectrales: (http://www.scielo.cl/pdf/infotec/v26n1/art04.pdf).
• Proposed methodology for assignment of spectral bands in wireless cognitive radio networks: (http://www.scielo.org.co/pdf/tecn/v18nspe/v18nspe06.pdf).
• Predicción espectral en redes inalámbricas de Radio Cognitiva: (http://revistas.udistrital.edu.co/ojs/index.php/REDES/article/view/8047/9731).
• Evaluación del desempeño de filtro adaptado para Radio Cognitiva: (http://revistas.udistrital.edu.co/ojs/index.php/REDES/article/view/5921/7422).
• Evaluation of efficiency techniques for spectrum decision making in Cognitive Radio Wireless Networks: (http://medwelljournals.com/abstract/?doi=jeasci.2016.2729.2739).
27
• Implementing a simulator of wireless cognitive radio network primary users: (http://www.ripublication.com/ijaer10/ijaerv10n24_254.pdf).
Participación en Congresos Internacionales:
• Algorithm and software based on MLPNN for estimating channel use in the spectral decision stage in cognitive radio networks: (http://waset.org/publications/10006009/algorithm-and- software-based-on-multilayer-perceptron-neural-networks-for-estimating-channel-use-in-the-spectral-decision-stage-in-cognitive-radio-networks).
• Analysis of multilayer neuronal networks modeling and Long Short-Term Memory: (https://waset.org/Publication/analysis-of-multilayer-neural-network-modeling-and-long-short-term-memory/10006216).
• Use of artificial intelligence based models to estimate the use of a spectral band in cognitive radio: (https://waset.org/abstracts/63037).
• Analysis of Primary User Modeling Activity on Cognitive Radio Wireless Networks: (http://www.worldresearchlibrary.org/up_proc/pdf/576-14866231488-13.pdf)
2. MODELOS DE CARACTERIZACIÓN DE USUARIOS PRIMARIOS.
2.1. CONTEXTUALIZACIÓN.
Avances recientes en el área de las comunicaciones inalámbricas como el DSA, promete la generación de nuevas metodologías que permitirán resolver algunos de los principales problemas a los que se enfrentan hoy en día las tecnologías de acceso inalámbricos. Uno de ellos tiene que ver con la asignación de la porción del espectro radioeléctrico útil (licenciado y no licenciado) que facilita la conexión de dispositivos con baja probabilidad de errores. En la actualidad, la distribución de ese rango de frecuencias es controlada por las entidades Gubernamentales de cada País, donde a cada operador de telecomunicaciones se le asigna de manera individual y fija un rango de frecuencias en forma de licencias renovables. Esta asignación estática, sumada a la exigencia de nuevas tecnologías y más robustas aplicaciones, ha desencadenado en la demanda de más espectro para soportar el volumen de tráfico que circula en las redes, generando una aparente escasez del recurso. Múltiples estudios validan la teoría de que el problema real radica en la forma en que se distribuye el espectro, en donde existen grandes porciones que son sub-utilizados, llegándose a encontrar segmentos de uso que varían entre el 15% y el 85% (Shared Spectrum Company, 2015), (Federal Communications Commission, 2003), (IEEE Standard 1900.1, 2008), (Sahai, Hoven , & Tandra, 2015). Una administración más eficiente de este recurso, sería un paso importante para soportar la demanda de ancho de banda; en este sentido el acceso oportunista al espectro a través de la Radio Cognitiva (Fortuna & Mohorcic, 2009), (Popescu, Yao, Fiedler, & Popescu, 2014), (Masonta, Mzyece, & Ntlatlapa, 2013) es la técnica disponible que puede gestionar el espectro de forma dinámica optimizando su aprovechamiento.
La asignación dinámica de espectro en Radio Cognitiva (CR), esta soportada en las cuatro etapas (Khalid & Anpalagan, 2010), (Akyildiz & Chowdhury, 2009), (Akyildiz, Lee, & Chowdhury, 2009) descritas en la parte superior de la figura 9, donde de acuerdo a (López, Trujillo, & Gualdron, 2015), la fase de decisión espectral es una de las menos investigadas, y es la encargada de seleccionar y asignar los canales o bandas de frecuencia disponibles (no utilizados por los PUs) para que sean aprovechados por los SUs en el transporte de información. Como no existe ninguna garantía de que un canal estará disponible durante todo el tiempo que lo requiera el SU, es importante determinar cuál es el patrón de aparición futuro del PU en dicho espectro. Utilizando la habilidad de aprendizaje del CR, la historia de la información de uso del recurso puede ser utilizada para predecir el perfil futuro del mismo (Masonta, Mzyece, & Ntlatlapa, 2013). Este proceso se logra mediante la caracterización del PU (modelamiento y predicción) como se muestra en la parte inferior de la figura 9.
28 sistema será óptimo ya que la probabilidad de asignar espectro erróneamente será muy bajo, evitando colisiones entre el PU y los SUs; por el contrario, si la estimación no es acertada, el sistema no funcionara adecuadamente y la cantidad de interferencias producidas volverán inaceptable la implementación de redes inalámbricas cognitivas.
Figura 9. Etapas que componen las redes de radio cognitivas (CRNs).
Dar una solución adecuada al problema de caracterización implica la posibilidad de aprovechar las habilidades de aprendizaje autónomo de la inteligencia artificial (AI); en tal sentido la pregunta que se plantea es: ¿La implementación del modelo de aprendizaje LSTM como predictor, permite mejorar el porcentaje de acierto para detectar la presencia o ausencia de PUs en bandas espectrales?.
Figura 10. Contextualización de la caracterización en la etapa de decisión espectral en CRNs.
29 de error en la predicción de PUs, lo que redundará a su vez en la optimización de la fase de toma de decisiones espectrales en CR; allí se centra el presente capítulo de investigación de la tesis doctoral.
2.2. REVISIÓN CIENTÍFICA.
Algunas de las propuestas de investigación en el modelaje y/o estimación de la actividad de usuarios primarios se encuentran descritas o desarrolladas en (López, Trujillo, & Gualdron, 2015), (Mishra, Tong, Chan, & Kumar, 2012), (Uyanik, Canberk, & Oktug, 2012), (Tumuluru, Wang, & Niyato, 2010), (Pattanayak, Venkateswaran, & Nandi, 2013), (Bkassiny, Li, & Jayaweera, 2011), (Gutiérrez, et al., 2013), (Wang, Ghosh, & Challapali, 2011), (Xing, Jing, Huo, & Cheng, 2013), (Bütün, Çağatay, Altilar, Khalid, & Sankar, 2010), (Yarkan & Arslan, 2013). Un resumen de las técnicas aplicadas se muestra en la figura 11.
Figura 11. Resumen de algunas de las metodologías utilizadas en la caracterización del PU.
Tomando como referencia los resultados encontrados en los trabajos referenciados en esta sección se encuentra que los algoritmos “basados en teoría de colas” y “metodologías adicionales” en la mayoría de los casos no logran encontrar variaciones temporales de corto plazo en la señal que representa el PU generando colisiones o interferencias entre los nodos cognitivos y licenciados; los basados en series temporales requieren de un hardware robusto para su implementación (ya que su complejidad computacional es alta) dificultando su utilización en áreas geográficas de difícil acceso debido al importante consumo de energía de la red cognitiva. Si bien es cierto, se han desarrollado algunas propuestas basadas en aprendizaje autónomo, es importante considerar el desarrollo y/o aplicación de metodologías similares como el basado en ANFIS o LSTM (Graves, Mohamed, & Hinton, 2013), con el objetivo de determinar si es posible disminuir el porcentaje de error en la generación de predicciones para el comportamiento caótico de los PUs, logrando con ello que los modelos sean más confiables.
2.3. CARACTERIZACIÓN DE PUs CON LSTM.
30 La estimación futura del estado del canal en la banda GSM y WiFi (desde la perspectiva del PU) se abordó para este caso específico como un problema de predicción de series binarias, a partir de la conversión de los niveles de potencia (dBm) capturados y entregados por el analizador espectral, a valores discretos (ver sección 2.3.3.3), y utilizando un sistema neuronal recurrente basado en deep learning. Inicialmente se define el concepto teórico de LSTM, se describe la forma en que se modela la señal PU de entrada al sistema y se analiza la estructura en capas de la red LSTM; posteriormente se construye el modelo matemático que explica el sistema LSTM describiendo la interacción existente entre las neuronas de entrada, las celdas de memoria y neuronas de salida, durante el proceso de entrenamiento o aprendizaje.
2.3.1. Long Short-Term Memory.
Las redes neuronales artificiales tradicionales no poseen la capacidad de almacenar información, para ello es necesario modificar su topología creando estructuras recurrentes las cuales retroalimentan la neurona y permiten el almacenamiento de información; a estas estructuras se las conoce como neuronas recurrentes. La unión de un conjunto de estas neuronas se les llama Redes Neuronales Recurrentes (RNN), permiten preservar estados subsecuentes entre diferentes intervalos de tiempo donde sus parámetros son compartidos entre las múltiples partes del modelo, lo que permite una mejor generalización (Veeriah, Zhuang, & Qi, 2015). Uno de los problemas de las redes RNN consiste en el long-term depency, este problema plantea la necesidad de no siempre estudiar todo un histórico para desempeñar una tarea actual, lo que implica que estas redes neuronales solo almacenan la información aprendida en el pasado y no están en la capacidad de almacenar a corto plazo nueva información. Las LSTM pueden ser explícitamente diseñadas para evitar el problema long-term dependency, recordando la información por largos periodos de tiempo y aprendiendo nueva información en el presente. Los bloques LSTM contienen celdas de memoria que permiten recordar un valor para una arbitraria longitud de tiempo y usarla cuando sea necesaria; además tiene una capa de olvido que puede borrar el contenido de la memoria cuando no es útil. Todos los componentes son construidos para funciones diferenciables y entrenadas durante el proceso backpropagation (Yao, Hu, Yu, & Grzymala-Busse, 2015). La estructura de una LSTM puede ser representada como se muestra en la figura 12, donde la celda de memoria es simbolizada por la letra C, la capa de olvido por la letra O, la capa de entrada por la letra E y la capa de salida por la letra S.
2.3.2. Modelado de la señal de entrada y capas del sistema LSTM.
La señal de entrada discreta representa la presencia (1) o ausencia (0) de un PU dentro de la banda espectral para una duración de tiempo 𝑇𝑇 de acuerdo con la ecuación 1, y en el que a partir de dicha secuencia binaria el predictor está entrenado para pronosticar el estado del canal no solo en la siguiente ranura de tiempo sino posteriores instantes de tiempo basado en el historial del comportamiento del PU en el canal.
Ecuación 1 Determinar el número exacto de neuronas para la solución del problema es particularmente difícil. Una red neuronal muy pequeña no puede aprender a solucionar el problema de forma correcta, pero una red muy grande generará un sobreajuste (es decir el problema se particulariza, más no se generaliza) (Kwok & Yeung, 1997), además se debe considerar que a mayor número de capas y neuronas el tiempo de entrenamiento se hace mayor y se utiliza una mayor cantidad de recursos. En este caso particular se utilizó la técnica de optimización numérica basada en la regla de la pirámide geométrica útil cuando el número de las neuronas de la capa de entrada es mayor que el de las neuronas de la capa de salida (Masters, 1993) y que se ajusta al problema en cuestión. Debido a que se debe dividir el número de neuronas de la capa de entrada 𝑛𝑛 veces una potencia de 2 hasta que se obtenga uno, se llega a la ecuación 2, donde 𝐶𝐶𝐶𝐶 corresponde al número de neuronas de la capa de entrada, y 𝑛𝑛 al número de capas existentes.
31 aplicación de software dinámica (donde la creación de la red neuronal LSTM sea variable y dependiente de la secuencia de entrada), el número total de neuronas que componen una topología de red se obtiene de la ecuación 3.
Figura 12. Representación gráfica de redes neuronales tipo LSTM.
Ecuación 3 Aproximando la serie anterior se llega a la ecuación 4,
Ecuación 4 Tomando 𝐶𝐶𝐶𝐶 (de la ecuación 4) como un número muy grande, se puede suponer que el número total de neuronas tiende a:
Ecuación 5 La ecuación 5 indica que a medida que aumenta el número de neuronas en la capa de entrada, el número total de neuronas corresponde aproximadamente al doble de las neuronas de la capa de entrada.
2.3.3. Modelo del funcionamiento del sistema LSTM.
32 descrita en los ítems 2.3.3.1 y 2.3.3.2 hace uso de las notaciones establecidas en la tabla 1 y que son congruentes con (Graves, 2012).
Tabla 1. Notaciones para el desarrollo del modelo matemático. bloque de
memoria Input gate Forget gate Output gate Celda de memoria
Subíndice 𝑖𝑖 𝑙𝑙 ∅ 𝑤𝑤 𝑐𝑐
Entrada 𝑥𝑥𝑖𝑖 𝑎𝑎𝑙𝑙𝑡𝑡 𝑎𝑎∅𝑡𝑡 𝑎𝑎𝑤𝑤𝑡𝑡 𝑎𝑎𝑐𝑐𝑡𝑡, 𝑠𝑠𝑐𝑐𝑡𝑡
Salida 𝑦𝑦𝑖𝑖 𝑏𝑏𝑙𝑙𝑡𝑡 𝑏𝑏∅𝑡𝑡 𝑏𝑏𝑤𝑤𝑡𝑡 𝑏𝑏𝑐𝑐𝑡𝑡 = 𝑏𝑏𝑤𝑤𝑡𝑡 (𝑠𝑠𝑐𝑐𝑡𝑡)
Número de unidades I N/A N/A N/A 𝐶𝐶
Función de activación N/A 𝑓𝑓 sigmoide 𝑓𝑓 sigmoide 𝑓𝑓 sigmoide 𝑓𝑓 (in-cell) ℎ (sal-cell)
2.3.3.1. Ecuaciones Forward Pass.
Para las tres compuertas de la celda (entrada, salida y de olvido), las funciones de propagación 𝑎𝑎𝑙𝑙𝑡𝑡, 𝑎𝑎 ∅𝑡𝑡 y 𝑎𝑎𝑤𝑤𝑡𝑡 (Graves, 2012) no solo consideran la suma ponderada de las entradas actuales, sino también las salidas en el tiempo inmediatamente anterior de los bloques en la capa oculta, y de los estados de las otras celdas del mismo bloque (salvo en la compuerta de salida porque ahí se requiere del estado actual de las celdas). En este sentido las ecuaciones 6 a 11 (Graves, 2012) resultan del análisis del bloque LSTM (figura 13) para cada una de las compuertas y la celda de memoria que conforman el modelo.
Para la input gate:
Ecuación 6
Ecuación 7 Para la forget gate:
Ecuación 8
Ecuación 9 Para la output gate:
Ecuación 10
33 Para describir el comportamiento de la celda, se debe tener en cuenta dos elementos; el primero es la función de propagación 𝑎𝑎𝑐𝑐𝑡𝑡, el cual depende no sólo de las entradas actuales sino de las salidas en el tiempo inmediatamente anterior de los demás bloques en la capa oculta. El segundo es el estado de la neurona 𝑠𝑠𝑐𝑐𝑡𝑡, que indica si la misma está conservando la información o la va a olvidar y depende de la salida de la forget gate y de la input gate.
Figura 13. Arquitectura LSTM utilizada para la caracterización de PUs. Modificado de: (Palangi, Ward, & Deng, 2016).
La salida de la neurona 𝑏𝑏𝑐𝑐𝑡𝑡 indicará si se generó nuevo aprendizaje o se conserva la información almacenada. Teniendo claro lo anterior y partiendo de lo mostrado en la figura 13, se concluye que el estado y salida de la celda están dadas por las ecuaciones 12 a 14 (Graves, 2012).
Estado de la neurona:
Ecuación 12
Ecuación 13
Salida de la neurona:
Ecuación 14
2.3.3.2. Ecuaciones Backward Pass.
34 Ecuación 15 Además, definiendo la salida de la celda (𝜖𝜖𝑐𝑐𝑡𝑡) y el estado de la celda (𝑠𝑠𝑐𝑐𝑡𝑡) se tiene:
Ecuación 16
Ecuación 17 Definiendo 𝐸𝐸 (en las ecuaciones 16 y 17), como la función de pérdida (error), y partiendo del hecho de que se desea establecer como varía el error al hacer modificaciones en los pesos, se tiene a partir de la regla de la cadena:
Ecuación 18 De la ecuación 18 es claro que el objetivo es calcular 𝜕𝜕𝑎𝑎𝜕𝜕𝜕𝜕
𝑗𝑗, pero teniendo en cuenta que para el caso de LSTM existen 4 tipos de 𝑎𝑎 que son la output gate (𝜕𝜕𝑎𝑎𝜕𝜕𝜕𝜕
𝑤𝑤
𝑡𝑡), cells (𝜕𝜕𝑎𝑎𝜕𝜕𝜕𝜕 𝑐𝑐
𝑡𝑡), forget gate (𝜕𝜕𝑎𝑎𝜕𝜕𝜕𝜕
∅𝑡𝑡), and input gate (
𝜕𝜕𝜕𝜕 𝜕𝜕𝑎𝑎𝑙𝑙𝑡𝑡) las cuales se pueden definir como se muestra en las ecuaciones 19 a 22 (Graves, 2012).
Ecuación 19
Ecuación 20
Ecuación 21
Ecuación 22
Teniendo en cuenta que la sumatoria se hace sobre 𝑐𝑐, porque el modelo se desarrolla en un único bloque (que posee 𝐶𝐶 celdas en su interior), al calcular las derivadas respectivas se encuentran las descripciones matemáticas mostradas en la ecuación 23 (Graves, 2012).
35 A partir del análisis matemático aplicado anteriormente se llega a las siguientes ecuaciones Backward Pass (Graves, 2012):
Output gate:
Ecuación 24 Cell:
Ecuación 25
Forget gate:
Ecuación 26
Input gate:
Ecuación 27 Nótese que las ecuaciones 24 a 27 dependen de los términos 𝜖𝜖𝑠𝑠𝑡𝑡 y 𝜖𝜖
𝑐𝑐𝑡𝑡, por lo tanto es necesario determinar como el error se afecta al hacer cambios tanto en las salidas de las celdas como en sus estados.
En este caso, es necesario tener presente que el error es una función cuyas variables son las 𝐾𝐾 salidas generadas por los 𝐻𝐻 bloques de la capa oculta; es más, para un bloque fijo, la salida resultante en un tiempo 𝑡𝑡, afectará a las 𝐾𝐾 unidades de la capa de salida (en el instante 𝑡𝑡) y a la próxima entrada de cada uno de los 𝐻𝐻 bloques en la capa oculta. Por lo anterior, 𝜖𝜖𝑐𝑐𝑡𝑡 puede ser definida como (ecuación 28):
Ecuación 28
Quedando la salida de la celda, como se describe en la ecuación 29:
Ecuación 29 Finalmente, se debe analizar que sucede con el error, sí se generan cambios en los estados de la celda. El estado de la celda 𝑐𝑐 en el tiempo 𝑡𝑡, 𝑠𝑠𝑐𝑐𝑡𝑡 indica si se modificó o no la información almacenada en ese momento; por lo tanto 𝑠𝑠𝑐𝑐𝑡𝑡 es un valor que afecta la entrada de todas las gates, al próximo estado de la celda y claramente a la salida de la propia celda; matemáticamente esto es (ecuación 30):
36
Quedando el estado de la celda como se muestra en la ecuación 31, valores concordantes con lo mostrado por (Graves, 2012).
Ecuación 31 2.3.3.3 Diagrama de flujo y pseudocodigo del sistema LSTM.
El diagrama de flujo para el entrenamiento (figura 14) comienza su proceso inicializando de forma aleatoria cada neurona con valores que oscilan entre -1 y 1; seguidamente se toma cada ejemplo de entrenamiento y se evalúa la salida con la esperada, si la respuesta entregada no corresponde a la deseada, el algoritmo calcula el error entre la salida obtenida por el sistema y la esperada, corrigiendo cada peso de las compuertas (input, output, forget) y de la celda a través de la aplicación de ponderaciones y haciendo uso de funciones tangenciales y sigmoideas hasta culminar con todos los ejemplos de entrenamiento, y de esta forma aproximando la salida del modelo al esperado (mediante la disminución del error, como se mostró en el ítem 2.3.3).
Figura 14. Diagrama de flujo para el entrenamiento de LSTM.
Parte del pseudocódigo del algoritmo implementado es el que se muestra seguidamente:
Algoritmo LSTM.
Data: La existencia de un arreglo Wo, Wf, Wi y Wc que representa la red neuronal.
Result: Red neuronal entrenada con los datos de los ejemplos de entrenamiento.
forgetLayer = Wf.size() //Se obtiene el tamaño del arreglo que representa la red neuronal. ;
for i = 0; i < neurons; i++ do
Wf[i] = random(-1,1); //Se inicializa cada capa de la red neuronal. Wi[i] = random(-1,1);
Wc[i] = random(-1,1); Wo[i] = random(-1,1);
end
37 bi = 0.5 ;
bo = 0.5 ;
inputs = readInputs() //Se leen los ejemplos de entrada. ; outputs = readOutputs() //Se leen los ejemplos de salida. ; size = inputs.size() //Se obtiene el tamaño de los ejemplos. ;
for i = 0; i < size; i++ do sumf = 0;
sumi = 0; sumc = 0; sumo = 0;
for j = 0; j < neurons; j++ do
sumf = sumf + Wf[j]*inputs[i][j] //Se calcula la salida para cada ejemplo en cada capa.; sumi = sumi + Wi[j]*inputs[i][j];
sumc = sumc + Wc[j]*inputs[i][j]; sumo = sumo + Wo[j]*inputs[i][j];
end
ft = sigmoide(sumf + bf) //Se realizan las aproximaciones para cada salida de la red. ;
it = sigmoide(sumi + bi); dct = tanh(sumc + bc) ; ct = ft + it*dct ;
ot = sigmoide(sumo + bo) ;
output = ot*tanh(ct) //Se calcula la salida de la red neuronal. ;
if output != outputs[i] then
error = outputs[i] - output; for j = 0; j <neurons; j++ do
Wo[j] = Wo[j] + inputs[i][j]*e //Se recorre cada neurona y se corrige su ponderación respecto al error calculado.;
end
bo = 0.5 + error //Se corrige el desplazamiento;
end
2.3.4. Evaluación y análisis de resultados.
Para evaluar el desempeño del algoritmo la red LSTM se sometió a dos casos de prueba; en el primer de ellos, se analizó el desempeño del sistema de modelamiento y predicción cuando la señal de entrada al sistema LSTM se genera computacionalmente para diferentes patrones de comportamiento (sección 2.3.4.2) los cuales son difíciles de encontrar en las redes inalámbricas convencionales; en el segundo caso, se estudió el pronóstico entregado por el algoritmo para secuencias de datos reales capturadas en las bandas GSM-850 y WiFi (también encontrado en la sección 2.3.4.2), partiendo de la premisa que del 100% de los datos utilizados, el 70% se usa en la etapa de entrenamiento de la red LSTM y el 30% restante para validación (estimación de la predicción).
2.3.4.1. Captura y procesamiento de la información espectral.
38 Figura 15. Interconexión de los equipos para la captura de datos de ocupación espectral (Hernández,
Salgado, López, & Rodríguez-Colina, 2015).
La base de datos de las intensidades de potencia del espectro radioeléctrico para GSM y WiFi utilizadas para la evaluación del algoritmo ANFIS como método para la caracterización (modelamiento y predicción) de PUs, fueron suministradas por (Pedraza, Hernández, & Marquez, 2013).
Tabla 2. Especificaciones de los equipos de medición y captura espectral (Hernández, Salgado, López, & Rodríguez-Colina, 2015).
Equipo Rango de frecuencia Especificaciones Referencia del modelo Analizador e espectro 9 KHz - 7.1 GHz MS2721B Anritsu Antena discona 25 MHz - 6 GHz Super-M Ultra Base Amplificador de bajo ruido 20 MHz - 8 GHz ZX60 - 8008 -S+ Cable de banda ancha DC – 18 GHz CBL-6FT SMNM+
Tabla 3. Especificaciones del clúster (Hernández, Salgado, López, & Rodríguez-Colina, 2015).
Característica Descripción
Equipo y marca Máquina virtual KVM - BIOS Openstack Foundation 2015.1 Marca
Cantidad de procesadores Memoria RAM
Sistema de almacenamiento Sistema operativo
Servidor DELL R900
Intel(R) Xeon(R) CPU E7450 @ 2.40GHz, 24 Cores 64GB DDR2
1000GB ext4
Ubuntu server 14.04.04 con entorno de escritorio XFCE4
Para el procesamiento de la información espectral, se parte del hecho de que las medidas fueron tomadas cada 290 milisegundos en la banda WiFi (2.4 a 2.48 GHz), y GSM (Uplink- 824-849 MHz) en términos de potencia de transmisión (dBm); con el fin de facilitar el reconocimiento de patrones se representaron los niveles de potencia en sistema binario a partir de la definición establecida en la ecuación 32.
39 donde a, toma los valores de -89 dBm para el caso GSM y -88 dBm para WiFi.
En la figura 16, se aprecia el procedimiento para convertir las trazas de datos espectrales en señales discretas; cabe destacar que para el desarrollo de las pruebas se contó con una base de datos de 6.79 GB de información sobre trazas de tráfico GSM y 9.63 GB para trazas WiFi.
2.3.4.2 Evaluación y validación del algoritmo LSTM.
El rendimiento del algoritmo propuesto es puesto a prueba para un comportamiento del PU con secuencias de datos simulados y reales (trazas GSM y WiFi),
Primer grupo de casos de prueba.Se crearon de manera simulada patrones de comportamiento (múltiples
tamaños) a partir de lo sugerido en (Saleem & Rehmani, 2014), y de acuerdo a lo descrito en la tabla 4.
Tabla 4. Casos de prueba para trazas de tráfico del PU generadas mediante simulación. Identificador Caso de prueba Descripción
CP1 i % 2 === 0 Corresponde a un histórico en donde todas las unidades de tiempo pares presentan ocupación del canal.
CP2 i % 5! === 0 Corresponde a un histórico en donde todas unidades de tiempo que no sean múltiplos de 5, presentan una ocupación de canal.
CP3 i % 3 === 0 Corresponde a un histórico en donde todas las unidades de tiempo que sean múltiplos de 3, presentan una ocupación de canal.
CP4 i % 3 === 0 and i % 2 === 0 Corresponde a un histórico en donde todas las unidades de tiempo que sean múltiplos de 3 y 2, presentan una ocupación de canal.
CP5 Aleatorio Corresponde a un histórico donde aleatoriamente se genera la ocupación del canal