• No se han encontrado resultados

Descubrimiento de conocimiento en el problema de resistencia a fármacos del VIH utilizando Mapas Cognitivos Difusos

N/A
N/A
Protected

Academic year: 2020

Share "Descubrimiento de conocimiento en el problema de resistencia a fármacos del VIH utilizando Mapas Cognitivos Difusos"

Copied!
85
0
0

Texto completo

(1)Universidad Central “Marta Abreu” de Las Villas Facultad de Matemática, Física y Computación. Trabajo para optar por el Título de Máster en Ciencia de la Computación. Descubrimiento de Conocimiento en el Problema de Resistencia a Fármacos del VIH utilizando Mapas Cognitivos Difusos Autora Lic. Isel del Carmen Grau García Tutora Dra. María Matilde García Lorenzo 2014.

(2) Dictamen DICTAMEN La que subscribe, Isel del Carmen Grau García, hace constar que el trabajo titulado “Descubrimiento de Conocimiento en el Problema de Resistencia a Fármacos del VIH utilizando Mapas Cognitivos Difusos” fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de los estudios de la Maestría en Ciencia de la Computación, autorizando a que el mismo sea utilizado por la institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos ni publicado sin la autorización de la universidad.. __________________ Firma del Autor. Los abajo firmantes, certificamos que el presente trabajo ha sido realizado según acuerdos de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada.. _____________________________. _______________________. Firma del Tutor Dra. María Matilde García Lorenzo. Firma del Jefe de Seminario Dra. Gladys Casas Cardoso. _____________ Fecha. II.

(3) Dedicatoria. A mi pequeña familia A Gonzalo. III.

(4) Agradecimientos AGRADECIMIENTOS Agradezco al Prof. Dr. Rafael Bello y la Prof. Dra. María Matilde García, quien es además la tutora de esta tesis, por la guía, colaboración y confianza que han depositado en nosotros y nuestro trabajo desde que comenzamos a trabajar en el Centro de Estudios de Informática. Quiero agradecer también en otro plano a mi pequeña pero fuerte familia: -. A mi mamá por su esfuerzo infinito en lograr mi bienestar, a mi papá por ayudarme a madurar.. -. A mis abuelos Yuyi y Magaly y mi tío Eddy por ser el respaldo permanente, por cuidar de mí cuando debería ser al revés.. -. A mi tía Lidia y a los dos Ale que me siguen considerando su Tata a pesar de que ya estamos creciditos.. -. A mis hermanos que están lejos pero cerca: Ricar, Ary y Nitsy, por hacer crecer la familia de forma adorable con Deneb, Dante, Alicia y Mila.. -. A mi tía Margara (EPD), que se nos fue de pronto, pero siempre tenía una sonrisa y estaba pendiente de todos. A mis padrinos y mis demás primos por su cariño.. -. A quienes también considero mi familia: Juana y Miriam, por tenerme como una hija.. Aprovecho esta oportunidad para agradecer a todas mis amigas, sobre todo a las que más extraño. Finalmente agradezco a Gonzalo, mi pareja en la vida personal y mi equipo perfecto en la profesional, mi soporte incondicional y constante, mi orgullo en el pasado y el presente, y mi inspiración para el futuro.. IV.

(5) Resumen RESUMEN El Virus de Inmunodeficiencia Humano (VIH) es un complejo retrovirus que deteriora progresivamente el sistema inmunológico de los pacientes infectados. Aunque los fármacos antivirales existentes no son capaces de erradicar el VIH, se diseñan para inhibir la función de proteínas esenciales en el proceso de replicación del virus, de esta forma reducen la concentración de virus en el paciente. Sin embargo, debido a su alta tasa de mutación, este virus es capaz de desarrollar resistencia a los fármacos aprobados causando el fracaso del tratamiento. En la última década se han propuesto varias técnicas de aprendizaje automatizado para modelar el problema de predicción de resistencia antiviral en mutaciones del VIH como un problema de clasificación o predicción de secuencias. Estos enfoques ofrecen buenos resultados desde el punto de vista de la exactitud, pero la mayoría no permiten la interpretación de los resultados obtenidos. En este trabajo se propone un modelo basado en Mapas Cognitivos Difusos (MCD) para analizar el comportamiento de la resistencia antiviral en el VIH como un sistema dinámico e interpretable. Además, se utiliza un algoritmo de aprendizaje supervisado basado en Inteligencia Colectiva para optimizar la causalidad del modelo. Los mapas ajustados resultantes son agregados con el objetivo de obtener un prototipo de mapa para cada fármaco estudiado. Los prototipos obtenidos permiten la predicción de la resistencia antiviral de nuevas mutaciones. La evaluación estadística del modelo muestra que la exactitud de la clasificación es significativamente superior a la de otros enfoques de la literatura. Además, tomando ventaja de la capacidad de interpretación, el análisis de la causalidad en el MCD permite el descubrimiento de conocimiento asociado a las mutaciones en posiciones de la secuencia que se relacionan directamente con la resistencia. Todos estos resultados fueron implementados y probados en una herramienta de simulación computacional utilizando bases de conocimiento asociadas con la resistencia de las proteínas proteasa y transcriptasa reversa del VIH.. V.

(6) Abstract ABSTRACT The Human Immunodeficiency Virus (HIV) is a complex retrovirus which progressively deteriorates the immunological system of infected patients. Although the existing antiretroviral drugs are not able to eradicate the HIV, they are designed for inhibiting the function of essential proteins for the virus replication process, reducing the virus loading in the patient. However, due to its high mutation rate, this virus is capable to develop resistance to the approved drugs, eventually causing the treatment failure. In the last decade, there have been proposed several machine learning techniques for modeling the prediction of antiviral resistance in HIV mutations, as a classification or sequence prediction problem. These approaches offer relatively good results in terms of accuracy, but the most of them are not interpretable. In this work we propose a model based on Fuzzy Cognitive Maps (FCM) for analyzing the behavior of the antiviral resistance in HIV as a dynamic and interpretable system. In addition, we use a supervised learning algorithm based on Swarm Intelligence for optimizing the system causality. The resulting adjusted maps are aggregated in order to obtain a prototype map for each studied antiviral drug. The obtained prototypes allow us to predict antiviral resistance from new mutations. The statistical evaluation of the model shows that the classification accuracy is significantly superior to other approaches in literature. In addition, using its interpretation capability, the causality analysis in the FCM allows the knowledge discovery related to mutations in sequence positions directly associated with resistance. All these results were implemented and tested in a computational tool for simulation of FCM, using knowledge bases regarding to antiviral drug resistance of HIV protease and reverse transcriptase.. VI.

(7) Tabla de Contenidos TABLA DE CONTENIDOS INTRODUCCIÓN .......................................................................................................................... 1 Objetivo General ......................................................................................................................... 3 Objetivos Específicos.................................................................................................................. 3 Tareas de Investigación............................................................................................................... 3 Hipótesis de Investigación .......................................................................................................... 4 Diseño de la Tesis ....................................................................................................................... 4 CAPÍTULO 1. MARCO TEÓRICO DE LA INVESTIGACIÓN ............................................. 6 1.1 VIH y Terapias Antirretrovirales ..................................................................................... 6 1.1.1 VIH y sus proteínas fundamentales .......................................................................... 7 1.1.2 Fármacos antirretrovirales y resistencia antiviral ..................................................... 9 1.1.3 Pruebas de resistencia antiviral ............................................................................... 12 1.2 Enfoques de aprendizaje automatizado para el análisis de la resistencia antiviral ........ 15 1.3 Balance entre exactitud y capacidad de interpretación en la modelación de sistemas ... 18 1.4 Mapas Cognitivos Difusos ............................................................................................. 20 1.4.1 Estructura y causalidad en los Mapas Cognitivos Difusos ..................................... 21 1.4.2 Inferencia en los Mapas Cognitivos Difusos .......................................................... 22 1.4.3 Proceso de construcción de los Mapas Cognitivos Difusos.................................... 24 1.4.4 Aprendizaje y ajuste de Mapas Cognitivos Difusos ............................................... 25 1.5 Consideraciones finales del capítulo .............................................................................. 29 CAPÍTULO 2. MODELACIÓN Y AJUSTE DE UN MCD PARA EL ANÁLISIS DE LA RESISTENCIA ANTIVIRAL EN PROTEÍNAS DEL VIH ........................................................ 30 2.1 Modelación de una proteína utilizando Mapas Cognitivos Difusos .............................. 30 2.2 Aprendizaje de la causalidad del modelo ....................................................................... 33 2.2.1 Esquema general de la optimización para el aprendizaje del modelo .................... 33 2.2.2 Optimización de Bandadas de Partículas ................................................................ 35 2.2.3 Detección de estados de no progreso ...................................................................... 38 2.2.4 Operador para preservar la diversidad .................................................................... 40 2.3 Agregación de MCD y obtención de prototipos............................................................. 42 2.4 Conclusiones parciales del capítulo ............................................................................... 45 CAPÍTULO 3. EVALUACIÓN DEL MODELO PROPUESTO ............................................ 46 3.1 Implementación del modelo propuesto .......................................................................... 46 3.2 Evaluación de la capacidad de predicción...................................................................... 47 3.2.1 Estudio del desempeño para el problema de clasificación utilizando dos clases ... 47 3.2.2 Estudio del desempeño para el problema de clasificación utilizando tres clases ... 51 3.3 Capacidad de interpretación de prototipos obtenidos .................................................... 55 3.4 Otras aplicaciones del modelo: simulación y generación de mutaciones ...................... 58 3.4.1 Generación de mutaciones utilizando el modelo propuesto y un enfoque combinatorio ......................................................................................................................... 59 3.5 Conclusiones parciales del capítulo ............................................................................... 63 CONCLUSIONES ........................................................................................................................ 65 RECOMENDACIONES ............................................................................................................... 66 ANEXOS ...................................................................................................................................... 67 Anexo A: Conversión de codones de nucleótidos en aminoácidos. ......................................... 67 VII.

(8) Tabla de Contenidos Anexo B: Energías de contacto de los aminoácidos. ................................................................ 68 Anexo C: Selección de posiciones previamente asociadas con la resistencia. ......................... 69 Anexo D: Implementación del modelo en una herramienta computacional. ............................ 70 REFERENCIAS BIBLIOGRÁFICAS.......................................................................................... 72. VIII.

(9) Introducción INTRODUCCIÓN El Virus de Inmunodeficiencia Humana (VIH) es un complejo y dinámico retrovirus que azota a la humanidad causando millones de muertes anuales. Aunque las terapias antirretrovirales no son capaces de erradicar el virus, se diseñan para inhibir las funciones de proteínas que son esenciales en el ciclo de reproducción del virus: la proteasa, la transcriptasa reversa, la integrasa, etc. Por ejemplo, los fármacos inhibidores de la proteasa evitan la maduración de las partículas virales liberadas. Sin embargo, debido a su alta tasa de mutación y replicación este virus es capaz de desarrollar resistencia a los fármacos, causando eventualmente el fracaso del tratamiento. Los pacientes que adquieren o son infectados desde un inicio con mutaciones del virus que son resistentes a algún fármaco tienen menos opciones de tratamiento y por tanto mayor riesgo de mortalidad, particularmente en países en vías de desarrollo donde las opciones de tratamiento son limitadas. Por tanto, la modelación de los mecanismos de resistencia es útil para el estudio del comportamiento del virus, con el objetivo de diseñar terapias personalizadas más efectivas utilizando los fármacos existentes en la actualidad (Tang and Shafer 2012). Existen dos tipos fundamentales de estudios de resistencia de una mutación del virus a la aplicación de un fármaco. Estas pruebas se pueden realizar, o bien midiendo la actividad viral en presencia y ausencia de un fármaco (prueba fenotípica) o bien secuenciando el genoma de la mutación y haciendo un estudio de las mutaciones en posiciones previamente asociadas con la resistencia (prueba genotípica). Los ensayos genotípicos son mucho más rápidos y menos costosos, pero los resultados solamente denotan evidencia indirecta de la resistencia (Beerenwinkel 2005), dado el limitado conocimiento del comportamiento del VIH. Por tanto, con el objetivo de descubrir información más relevante y consistente, son necesarios otros enfoques biológicos, matemáticos o computacionales (Beerenwinkel 2005). Se han propuesto varias técnicas de aprendizaje automatizado para modelar el comportamiento de la resistencia fenotípica a partir de información histórica del genotipo de mutaciones, recopilada de ambas pruebas. Estas técnicas incluyen Redes Neuronales Artificiales, algunas técnicas de Regresión, Maquinas de Soporte Vectorial, Arboles de Decisión, entre otras (Grau,. 1.

(10) Introducción Nápoles et al. 2013). Estos modelos alcanzan buen desempeño en términos de exactitud de la predicción, pero muy pocos son interpretables (Beerenwinkel 2005) o permiten explorar los diferentes efectos de los patrones mutacionales en la resistencia antiviral, es decir, las relaciones entre las posiciones de la secuencia y su influencia en la resistencia. Históricamente, en la modelación computacional de sistemas reales ha existido la contradicción entre obtener modelos con alto desempeño desde el punto de vista de la exactitud o alta capacidad de interpretación. La exactitud de un modelo se define como la destreza para reproducir fielmente el conocimiento sobre el sistema, mientras la capacidad de interpretación se puede definir como la habilidad del modelo para explicar el comportamiento del sistema en una forma comprensible para los seres humanos. Algunos modelos computacionales por sus características de diseño se concentran únicamente en la exactitud, como es el caso de las Redes Neuronales Artificiales en general, pues recrean el sistema modelado en forma de caja negra. Otros modelos hacen más énfasis en la capacidad de interpretación, como es el caso de aquellos que involucran la Lógica Difusa en su diseño. Los Mapas Cognitivos Difusos (MCD) (Kosko 1986) como herramienta de Soft Computing son una alternativa adecuada para modelar sistemas con comportamiento dinámico y que requieran análisis e interpretación de sus resultados. En cierto sentido, este enfoque mezcla las bondades de la Lógica Difusa para la modelación e interpretación de reglas causales y la precisión de las reglas de inferencia de las Redes Neuronales Artificiales desde el punto de vista conexionista. Existen varios algoritmos para el aprendizaje y ajuste de la estructura de los MCD en función de los datos históricos disponibles, entre los que se destacan los enfoques basados en Inteligencia Colectiva. Esta técnica ha sido utilizada ampliamente en la literatura para la simulación de sistemas dinámicos complejos de disímiles campos de aplicación (Papageorgiou 2011). A pesar de que su concepción original no estaba enfocada hacia una herramienta para la predicción o clasificación, se han obtenido resultados prometedores en este campo (Papakostas, Boutalis et al. 2008; Papakostas and Koulouriotis 2010; Papakostas, Koulouriotis et al. 2012). En este trabajo se pretende explorar la capacidad de predicción de los MCD a través de un modelo creado para el problema de clasificación de secuencias enunciado anteriormente. 2.

(11) Introducción Además, una de las posibilidades más atractivas que ofrecen los MCD es interpretar el grado de influencia causal entre las variables que describen el problema modelado, facilitando el descubrimiento de conocimiento en los datos.. Objetivo General Diseñar e implementar un modelo basado en Mapas Cognitivos Difusos para la predicción y extracción de conocimiento en el problema de resistencia antiviral del VIH, ajustando sus parámetros utilizando un enfoque de Inteligencia Colectiva con vistas a mejorar las posibilidades de tratamiento del virus ante nuevas mutaciones.. Objetivos Específicos 1. Diseñar e implementar un modelo para simular el comportamiento de la resistencia antiviral en secuencias de proteínas del VIH utilizando Mapas Cognitivos Difusos. 2. Ajustar los parámetros del modelo, en particular la matriz de causalidad, utilizando un enfoque de Inteligencia Colectiva. 3. Evaluar y comparar el desempeño del modelo con otros enfoques de la literatura en términos de exactitud de la predicción. 4. Extraer conocimiento a partir del modelo obtenido, haciendo uso de las facilidades de inferencia e interpretación de los Mapas Cognitivos Difusos.. Tareas de Investigación 1. Estudio de los conceptos fundamentales referentes al VIH, sus proteínas, los fármacos antivirales existentes así como las principales terapias y las mutaciones previamente asociadas con la resistencia reportadas hasta el momento. 2. Estudio de los principales enfoques computacionales publicados en literatura para tratar el problema de resistencia antiviral del VIH como un problema de clasificación de secuencias. 3. Estudio de la teoría sobre Mapas Cognitivos Difusos, sus características y algoritmos para el ajuste.. 3.

(12) Introducción 4. Desarrollo de un modelo de Mapa Cognitivo Difuso para la simulación del comportamiento de las secuencias de proteínas del VIH con respecto a la resistencia antiviral. 5. Ajuste de la matriz de pesos causales de los mapas obtenidos utilizando una técnica basada en Inteligencia Colectiva que sea capaz de manejar los estados de convergencia prematura y estancamiento. 6. Agregación de los diferentes mapas obtenidos para cada fármaco en un único mapa que represente todos los criterios expertos sobre un fármaco en particular. 7. Validación estadística del desempeño del modelo propuesto comparándolo con otros enfoques de la literatura. 8. Descubrimiento de conocimiento a partir de los mapas obtenidos en las relaciones causales entre las diferentes posiciones de la proteína y la resistencia antiviral.. Hipótesis de Investigación El diseño, implementación y ajuste de un modelo para la simulación del comportamiento de la resistencia antiviral de proteínas del VIH utilizando Mapas Cognitivos Difusos e Inteligencia Colectiva, facilita la predicción y ayuda a descubrir conocimiento en las relaciones causales entre las posiciones de la secuencia y la resistencia a los fármacos estudiados.. Diseño de la Tesis Luego de la Introducción, la tesis está compuesta de tres capítulos. En el primer capítulo se describen algunos conceptos básicos sobre el VIH, sus proteínas y terapias antirretrovirales. Además enuncia el problema de resistencia antiviral como problema de clasificación y se realiza una revisión crítica de las principales técnicas computacionales utilizadas para este problema. En este capítulo también se exponen algunos aspectos fundamentales de la teoría de MCD. En el segundo capítulo se introduce la modelación del problema de resistencia antiviral utilizando MCD y se detalla el ajuste de parámetros utilizando un algoritmo de Inteligencia Colectiva. Además se obtienen los prototipos de mapas ajustados para cada uno de los fármacos a través de un proceso de agregación. En el tercer capítulo, se evalúa y compara estadísticamente el desempeño del modelo propuesto frente a otras técnicas de la literatura. También se realiza un 4.

(13) Introducción proceso de extracción del conocimiento para determinar relaciones causales entre las posiciones de la secuencia y la resistencia. Se explican otras aplicaciones del modelo propuesto en el campo del estudio de los mecanismos de resistencia. Finalmente se formulan las Conclusiones y Recomendaciones de este trabajo y se incorporan las Referencias Bibliográficas y los Anexos.. 5.

(14) Capítulo 1 CAPÍTULO 1.. MARCO TEÓRICO DE LA INVESTIGACIÓN. En este capítulo se presenta un conjunto de conceptos básicos relacionados con el VIH, los principales fármacos antirretrovirales autorizados para su tratamiento, las diferentes pruebas de resistencia antiviral que se utilizan clínicamente y como sus resultados, dan lugar a formular el problema de resistencia antiviral como un problema de clasificación de secuencias. Se realiza una revisión crítica de las principales técnicas computacionales reportadas en la literatura para solucionar este problema. Se describen algunos conceptos de modelación computacional y aspectos teóricos sobre el balance entre exactitud y capacidad de interpretación de estos modelos. Finalmente, se explora la teoría sobre Mapas Cognitivos Difusos como herramienta apropiada para la modelación de sistemas reales, todo lo cual constituye el marco teórico para el desarrollo de esta investigación.. 1.1. VIH y Terapias Antirretrovirales. Los virus son un complejo macromolecular formado por proteínas y ácidos nucleicos, en el cual las proteínas se agrupan formando una cápside que protege al material genético, donde la complejidad de la estructura depende del virus en cuestión. Existe una enorme variedad de estructuras genómicas entre las especies de virus, que como grupo biológico contienen una diversidad genómica superior a la de los reinos de plantas, animales o bacterias. En general, el genoma de los virus puede clasificarse en monocatenario o bicatenario, de ARN o ADN, y que pueden utilizar o no la transcriptasa reversa para el proceso de replicación. En particular los retrovirus, nombre que reciben los virus que pertenecen a la familia Retroviridae, tienen una forma de replicación característica en el interior de las células huéspedes. Como otros grupos virales, los retrovirus contienen un núcleo constituido por ácido nucleico ARN, en lugar de contener ADN. Pero a diferencia de otros virus con ARN, cuando los retrovirus se replican en el interior de las células, lo hacen como genomas de ADN y esto es posible debido a la función de la enzima transcriptasa reversa (NIAID 2009). Este es el caso del Virus de Inmunodeficiencia Humano.. 6.

(15) Capítulo 1 1.1.1 VIH y sus proteínas fundamentales En la actualidad, el Virus de Inmunodeficiencia Humano (VIH) es uno de los virus que afecta seriamente a la humanidad causando más de tres millones de muertes anuales. El VIH es un lentivirus de la familia Retroviridae mencionada anteriormente. Fue descubierto y considerado como el agente de la naciente epidemia de Síndrome de Inmunodeficiencia Adquirido (SIDA) por el equipo de Luc Montagnier en Francia en 1983 (Smith and Daniel 2006). Existen dos tipos del VIH, denominados VIH-1 y VIH-2. El VIH-1 es más virulento e infeccioso que el VIH-2 y es el causante de la mayoría de infecciones por VIH en el mundo. El VIH-2 es menos contagioso y por ello se encuentra confinado casi exclusivamente a los países de África Occidental (Gilbert, McKeague et al. 2003). El presente trabajo se enfoca solamente en el VIH-1 debido principalmente a la disponibilidad de datos referentes a esta variante. Un virión (organismo) del VIH tiene forma esférica y su diámetro mide aproximadamente 100 nanómetros. Está dotado de una envoltura (una membrana que originalmente pertenecía a la célula de donde el virus emergió) donde se encuentran 72 prolongaciones formadas por las glicoproteínas gp120 y gp41 que actúan en el momento de la unión del virus a la célula hospedera. La capa intermedia es una cápside proteica que protege al material genético localizado en la capa interior (Figura 1.1). La estructura genética del VIH está constituida por un ARN de cadena simple compuesto por dos filamentos idénticos. El ARN contiene varios genes, cada uno de los cuales codifica las diversas proteínas que el VIH necesita para reproducirse. Las proteínas son largas cadenas de aminoácidos (unos mil como promedio), siendo estas cadenas tridimensionales en plantas y animales, pero casi lineales en bacterias. Hay veinte aminoácidos distintos que se combinan en cadenas para formar las proteínas, lo cual explica la gran cantidad, variedad y clases de proteínas existentes (ver Anexo A). Normalmente los virus son organismos que contienen varias proteínas con funciones distintas y los tratamientos antivirales se dirigen a algunas de ellas, cuya inhibición pueden evitar su función y por consiguiente interrumpir el ciclo de reproducción del virus.. 7.

(16) Capítulo 1. Figura 1.1 Estructura de un virión del VIH. Tomado de (NIAID 2009).. En particular la transcriptasa reversa es una enzima de tipo ADN-polimerasa, que tiene como función sintetizar ADN de doble cadena utilizando como molde ARN, es decir, transcribe una sola cadena de ARN en una sola cadena de ADN. Cuando el VIH infecta una célula, hace una copia de su propio código genético dentro del ADN de la célula (Figura 1.2). De esta manera la célula queda "programada" para crear nuevas copias del VIH. El virus infecta a los seres humanos debido entre otras a la función de esta enzima; sin la transcriptasa reversa, el genoma viral no sería capaz de incorporarse en la célula huésped, a causa de la incapacidad para replicarse (NIAID 2009). Por otra parte, la proteasa es un enzima que el VIH necesita para completar el proceso de autocopia (replicación de sí mismo) que da lugar a nuevas mutaciones del virus capaces de infectar otras células (Figura 1.2). En el proceso de replicación, el VIH produce largas cadenas de proteínas que la proteasa fragmenta (corta) en trozos más pequeños para formar las proteínas y enzimas que ayudan a construir las nuevas copias del virus. Por tanto, es lógico que la mayoría de los fármacos antirretrovirales aprobados hasta el momento estén dirigidos a inhibir las funciones de estas dos proteínas. 8.

(17) Capítulo 1. Figura 1.2 Ciclo de vida del VIH. Tomado de (NIAID, 2009).. 1.1.2 Fármacos antirretrovirales y resistencia antiviral Los fármacos antirretrovirales son medicamentos para el tratamiento de la infección por retrovirus (en particular el VIH) que actúan en diferentes etapas de su ciclo vital. Debido a que la vida media del virus es corta y las copias de ADN son muy variadas por la gran cantidad de errores de transcripción de RNA a DNA, existe una alta tasa de mutación. Las combinaciones de antirretrovirales actúan incrementando el número de obstáculos para la mutación, manteniendo bajo el número de copias virales. Los agentes antirretrovirales individualmente no suprimen la infección por VIH a largo plazo por lo cual deben usarse en combinaciones. Las combinaciones de tres o cuatro fármacos antirretrovirales se conoce como Terapia Antirretroviral de Gran Actividad (HAART, por sus siglas en inglés) o popularmente, como cocteles antivirales.. 9.

(18) Capítulo 1 La idea general detrás del diseño de los antivirales modernos es identificar las proteínas virales que pueden ser debilitadas. Existen 24 fármacos antivirales principales, autorizados para el tratamiento del VIH-1, organizados en seis clases (Figura 1.3).. Figura 1.3 Lista de los principales fármacos antirretrovirales aprobados para el tratamiento del VIH. Tomado de (Tang and Shafer 2012).. Por ejemplo, para la transcriptasa reversa existen dos tipos fundamentales de fármacos: los inhibidores nucleótidos o nucleósidos (Nucleoside analog reverse-transcriptase inhibitors, NRTIs) y. los inhibidores no nucleósidos (Non-nucleoside reverse-transcriptase inhibitors,. NNRTIs). Los NRTIs fueron los primeros fármacos aprobados para el tratamiento de la infección por VIH. Estos causan la terminación prematura de la cadena de ADN inhibiendo la transcriptasa reversa,. 10.

(19) Capítulo 1 lo que constituye un paso temprano en el ciclo de replicación viral cuando el ADN del virus se produce a partir del ARN viral en una célula recién infectada. La clase de los NRTIs incluye medicamentos como la zidovudina (AZT), didanosina (DDI), zalcitabina (DDC), estavudina (D4T), lamivudina (3TC), abacavir (ABC), emtricibina (FTC) y tenofovir (TDF). Con un mecanismo ligeramente diferente, los NNRTIs también tienen como objetivo bloquear este paso en el proceso de replicación del virus. Este grupo de fármacos no tiene actividad contra el VIH-2. En la clase de los NNRTI se pueden encontrar fármacos como nevirapina (NPV), delavirdina (DLV) y efavirenz (EFV) (Tang and Shafer 2012). Por otra parte, los fármacos inhibidores de la proteasa (PIs) actúan evitando la fragmentación de las cadenas más largas, por lo que las proteínas que se forman dan lugar a copias defectuosas del VIH que si bien pueden destruir la célula que infectó, ya no pueden infectar más células (Barrett A.J. 2003). Entre los principales PIs se encuentran: amprenavir (APV), atazanavir (ATV), indinavir (IDV), lopinavir (LPV), nelfinavir (NFV), ritonavir (RTV) y saquinavir (SQV) (Figura 1.4).. Figura 1.4 Estructura de la proteasa del VIH con el antiretroviral Saquinavir adherido (en azul).. 11.

(20) Capítulo 1 Como fue explicado anteriormente, el VIH-1 tiene una alta tasa de mutación, acumulando cerca de una mutación de nucleótido por cada ciclo de reproducción. Aunque los individuos son usualmente afectados por uno o pocos clones originales del virus, se produce un estimado de 1010 viriones en pacientes no tratados, resultando en una cantidad innumerable de variantes del virus a menudo llamado quasiespecies. La complejidad de la quasiespecies del VIH-1 además se incrementa debido a la alta tasa de recombinación (esto ocurre cada vez que más de una variante del virus infecta una misma célula) y a las variantes latentes del virus archivadas en los cromosomas de las células infectadas, que periódicamente se pueden reactivar complicando el espectro de variantes de virus en el paciente infectado (Tang and Shafer 2012). De esta manera, la habilidad de generar nuevas variantes le permite al VIH-1 evadir el sistema inmunológico y desarrollar resistencia a los fármacos antirretrovirales. La resistencia a los fármacos puede ser adquirida a través de la exposición continuada al fármaco o transmitida de persona a persona. Naturalmente la resistencia a fármacos no utilizados previamente es realmente rara. Por tanto, la mayoría de las mutaciones resistentes son no-polimórficas, es decir, que raramente son observadas en pacientes no tratados. Para estudiar las mutaciones desde el punto de vista de resistencia antiviral existen dos ensayos fundamentales aplicables en la práctica clínica: las pruebas de genotipo y fenotipo. 1.1.3 Pruebas de resistencia antiviral Idealmente, antes de suministrar un fármaco a un paciente es necesario saber qué variantes del virus posee en su organismo y en base a esto investigar cuál sería el medicamento, o combinación de ellos, más recomendada para su tratamiento. La Sociedad Internacional para el SIDA y otras organizaciones mundiales para el VIH recomiendan hacer estas pruebas de resistencia en pacientes que son diagnosticados por primera vez o en los que el tratamiento ha fallado. En estos momentos existen las dos formas mencionadas para probar la susceptibilidad de una cepa aislada del VIH ante fármacos antirretrovirales: las pruebas de genotipo y las pruebas de fenotipo. Los ensayos genotípicos se concentran en detectar mutaciones relacionadas con resistencia en las proteínas y la terapia antiviral: proteasa, transcriptasa reversa, y en casos excepcionales, 12.

(21) Capítulo 1 integrasa y glicoproteína (gp41). Estas pruebas obtienen secuencias de nucleótidos que usualmente incluyen los 297 nucleótidos (o 99 aminoácidos) de la proteasa y los aminoácidos de las posiciones 40 a la 240 de la transcriptasa reversa, donde se encuentra la mayoría de las mutaciones resistentes a los NRTIs y NNRTIs. Para los análisis de resistencia la cadena de nucleótidos que compone la proteína se traduce a la cadena de aminoácidos equivalentes (ver Anexo A). Luego la cadena obtenida es comparada con la secuencia consenso del virus generando la lista de mutaciones (diferencias entre ambas cadenas). El sistema de notación para reportar las mutaciones de una proteína es un código alfanumérico que se compone de 3 partes: una primera letra que indica el aminoácido presente en la secuencia original, un número que indica la posición de la secuencia donde ocurre la mutación, y una o más letras separadas por el carácter ‘/’ que indican los aminoácidos a los que muta esa posición de la secuencia. Así por ejemplo, M184V en la transcriptasa reversa significa que en la posición 184 donde originalmente debería estar el aminoácido Metionina (M; ATG) se encuentra el aminoácido Valina (V; GTG). Antes de reportar la lista de mutaciones a un especialista clínico, esta debe examinarse para determinar aquellas mutaciones asociadas con la resistencia a antiretrovirales. En este proceso, normalmente se utiliza un sistema de interpretación de resistencia genotípica que se utiliza por el laboratorio que prueba la secuencia. Las pruebas de genotipo son mucho más usadas porque son menos costosas y tienen menor tiempo de espera para conocer los resultados. Estas pruebas también son ventajosas para detectar la resistencia evolutiva. Este tipo de resistencia se observa cuando varias mutaciones no causan resistencia por si solas pero influyen indirectamente en la resistencia e indican que la población de virus dentro de un paciente está evolucionando hacia la resistencia (Tang and Shafer 2012). Por otra parte las pruebas de susceptibilidad fenotípicas miden la replicación viral en una célula en presencia de varias disoluciones de un antiretroviral. Graficando la inhibición de la replicación viral con respecto al aumento de las concentraciones del antiretroviral se crea una curva sigmoidal que representa la relación entre dosis y respuesta. Esta curva es resumida en el factor de concentración que inhibe la replicación viral al 50% (𝐼𝐶50 ). Luego los niveles de. 13.

(22) Capítulo 1 susceptibilidad son reportados como valores de resistencia dividiendo el 𝐼𝐶50 obtenido entre el 𝐼𝐶50 de la secuencia de control (secuencia consenso) (Tang and Shafer 2012). Para determinar el valor cualitativo a partir de los valores de resistencia obtenidos en los ensayos se especifican uno o dos cortes (cut-offs) que se determinan técnica, biológica o clínicamente por los responsables del ensayo en función de sus características. Estos cortes permiten determinar dos o tres categorías de resistencia respectivamente, en otras palabras permiten discretizar los intervalos de valores obtenidos. Por ejemplo, para algunos antiretrovirales los cortes clínicos establecen dos valores: hasta donde existe cierta reducción de la respuesta viral, lo que implica que los valores obtenidos desde el mínimo hasta este valor indican susceptibilidad, y luego donde el antiretroviral parece tener un minino de actividad residual, lo que se traduce como resistencia intermedia. El resto de los valores mayores que el segundo corte indican resistencia y por lo general constituyen la mayoría de los casos (Tang and Shafer 2012). Existen dos tipos de ensayos disponibles Phenosense de Monogran Biosciences y Antivirogram de Virco. El ensayo Phenosense es más sensible detectando resistencia a antiretrovirales y es más reproducible que el Antivirogram (Zhang, Rhee et al. 2005). Por estas razones para el presente trabajo se utilizarán las bases de conocimiento obtenidas del ensayo Phenosense. Las pruebas fenotípicas proveen una cuantificación directa de la resistencia al fármaco, pero. requieren un gasto económico muy alto. Estas pruebas son especialmente útiles para determinar la susceptibilidad en antirretrovirales recientemente aprobados de los cuales no se han explorado lo suficiente las mutaciones asociadas con la resistencia. En la práctica clínica, son útiles en presencia de patrones mutacionales complejos que son difíciles de interpretar. La unión de estas pruebas de resistencia han arrojado un gran cúmulo de información histórica sobre las proteínas proteasa o transcriptasa reversa de este virus, y una buena parte se encuentran disponible públicamente en bases de datos internacionales como Stanford HIV Resistance Database (Tang, Liu et al. 2012). Las bases de conocimiento disponibles relacionan en forma de casos la secuencia de aminoácidos de las mutaciones de una proteína obtenidos a través de un ensayo de genotipo como rasgos predictores con el resultado de la resistencia fenotípica que le. 14.

(23) Capítulo 1 corresponde como un rasgo objetivo. De esta manera se facilita el estudio de la resistencia antiviral por otros métodos no necesariamente clínicos o biológicos. En la actualidad, predecir el valor fenotípico a partir del genotipo de una mutación constituye uno de los tantos problemas de clasificación de secuencias dentro de la rama de la Bioinformática. En los últimos diez años han sido utilizados diversos métodos estadísticos y herramientas de Inteligencia Artificial para la resolución de este problema, ya sea enfocado como un problema de clasificación o de predicción del valor de la resistencia.. 1.2. Enfoques de aprendizaje automatizado para el análisis de la resistencia. antiviral Debido al incremento del número de fármacos antirretrovirales aprobados, pero también a la acelerada aparición de las mutaciones resistentes a estos medicamentos, el uso de sistemas inteligentes se ha convertido progresivamente en una vía importante para comprender el fenómeno de la resistencia antiviral. De hecho, en los últimos años se aprecia un crecimiento significativo en el uso de herramientas computacionales para la predicción o clasificación de la resistencia antiviral. Es necesario aclarar que este problema de clasificación de secuencias tiene la dificultad adicional de que las bases de conocimiento con que se cuenta son desbalanceadas, ya que la mayoría de las mutaciones secuenciadas son resistentes. A pesar de ello, los modelos computacionales constituyen una herramienta muy útil para guiar al personal médico en el diseño de terapias complejas individuales, así como a los expertos en diseño de fármacos para el desarrollo de nuevos antirretrovirales (Tang and Shafer 2012). En los primeros estudios publicados sobre el tema, se introdujeron varios sistemas basados en reglas que utilizaban el conocimiento de expertos y datos sobre mutaciones previamente asociadas con la resistencia obtenidos en ensayos clínicos. Este es el caso de los sistemas Rega (Rega Institute, Katholieke Universiteit Leuven) (Laethem 2002), VGI (Reid 2002) y ANRS (Agence Nationale de Recherches sur le Sida) (Rousseau 2001). Estos sistemas reportan su salida en tres niveles de resistencia: susceptible, intermedio y resistente. Cada regla consiste de una expresión Booleana, por ejemplo, una regla de ANRS para el fármaco ABC enuncia “Si existen. 15.

(24) Capítulo 1 cinco o más de las siguientes mutaciones: M41L, D67N, L74V, M184V/I, L210W, T215Y/F; reportar resistencia a abacavir” (Tang and Shafer 2012). Al mismo tiempo el proyecto que sustenta la Stanford HIV Drug Resistance Database habilitó el acceso a un algoritmo conocido como HIVdb (Tang, Liu et al. 2012). Este enfoque utiliza, además de reglas determinadas por expertos, una escala de penalización para el fármaco e infiere cinco niveles diferentes de resistencia: susceptible, resistencia potencial baja, resistencia baja, resistencia intermedia, y alta resistencia. Además este proyecto consta de una plataforma llamada HIValg que permite comparar la salida de varios algoritmos e interpretación de resistencia. Esta plataforma fue utilizada en un estudio publicado en (Ravela 2003) para determinar aquellas mutaciones que causaban discordancia en la predicción de resistencia antiviral entre los enfoques basados en reglas desarrollados hasta ese momento. Este estudio concluyó que de 2045 muestras de individuos, solo el 4.4% de las predicciones resultaron discordantes, y además analizó las causas clínicas de estas discordancias con el objetivo de mejorar la exactitud de la predicción en estos sistemas basados en reglas. Seguidamente se comenzaron a emplear técnicas computacionales más elaboradas, por ejemplo la regresión con máquinas de soporte vectorial y los arboles de decisión implementados en el proyecto Geno2Pheno (Beerenwinkel 2003), el cual está soportado en un servicio web para la predicción de resistencia. Los modelos del proyecto Geno2Pheno fueron entrenados con bases de conocimiento de genotipo y fenotipo creadas en el Institute of Clinical and Molecular Virology of the German National Reference Center for Retroviruses. La exactitud del modelo se estimó utilizando validación cruzada con 10 folds y el coeficiente de correlación 𝑟 2 entre la predicción del modelo y el valor de la resistencia observada varió entre 0.3 y 0.79 para los 17 fármacos utilizados. Han sido exploradas también diferentes tipos de redes neuronales (Draghici and Potter 2003; Woods and Carpenter 2007; Pasomsub 2010) y las redes neuronales recurrentes bidireccionales (Bonet, Rodriguez et al. 2013; Grau, Nápoles et al. 2013) han reportado resultados competitivos en términos de exactitud de la clasificación. Estos modelos recurrentes se apoyan en las relaciones no necesariamente secuenciales que existen en la estructura tridimensional de la. 16.

(25) Capítulo 1 proteína para la definición de la topología con conexiones recurrentes, que enlazan la información en las partes iniciales, medias y finales de la misma. Los modelos de regresión también han sido estudiados, por ejemplo, en un trabajo publicado en (Wang 2004) un modelo de regresión estándar lineal superó el desempeño de otros algoritmos de interpretación genotípica publicados en aquel momento, incluyendo los arboles de decisión, máquinas de soporte vectorial del proyecto Geno2Pheno y los cuatro sistemas basados en reglas bien conocidos (HIVdb, VGI, ANRS y Rega). Más tarde, en (Rabinowitz 2005) los autores introdujeron dos técnicas de regresión más complejas utilizando optimización convexa y obtuvieron resultados competitivos con el desempeño de las técnicas más relevantes hasta el momento. Por otra parte, en el mismo año (Rhee, Taylor et al. 2006) publicaron los resultados de cinco predictores propuestos anteriormente incluyendo arboles de decisión, regresión lineal, análisis discriminante lineal, redes neuronales y regresión con máquinas de soporte vectorial, utilizando bases de conocimiento filtradas y depuradas para lograr mayor calidad en la clasificación. Estos datos históricos están disponibles públicamente también en (Tang, Liu et al. 2012) y son frecuentemente utilizados para la comparación de nuevos algoritmos. Más recientemente, en la referencia (Saigo, Uno et al. 2007) fue descrito un tipo de regresión lineal llamada itemset boosting que trabaja particularmente bien para predecir resistencia en inhibidores de la clase NRTIs. Así también, en (Rhee 2010) una regresión least-angle fue utilizada para identificar las mutaciones de la proteasa asociadas con la susceptibilidad reducida como mínimo a un fármaco; y la regresión least-squares se empleó para cuantificar la contribución de las mutaciones de la proteasa a la reducción de la susceptibilidad. Además, en (Masso 2010) los autores implementan un procedimiento basado en n-grams para generar secuencias de atributos, donde los resultados son complementarios a otros enfoques basados en secuencias. Finalmente, los trabajos más recientes publicados en este tema se enfocan en la utilización de metaclasificadores basados en instancias duras (Bonet, Arencibia et al. 2013) y una nueva forma de representación de la secuencia o estructura de la proteína basada en grafos que utilizan la triangulación de Delaunay (Yu, Weber et al. 2014) para mejorar los porcientos de. 17.

(26) Capítulo 1 correcta clasificación y los coeficientes de correlación utilizando redes neuronales artificiales y máquinas de soporte vectorial respectivamente. A pesar que de forma general estos algoritmos han mejorado sus resultados en términos de exactitud de la clasificación o predicción a través del tiempo, todavía es necesario superarlos sobre todo en los antivirales diseñados para inhibir la transcriptasa reversa. Además, los algoritmos basados en reglas que ofrecen facilidades de interpretación son los de más pobre desempeño, mientras los de mayor exactitud constituyen enfoques que no brindan facilidades de interpretación de la salida obtenida, limitando la usabilidad del resultado para especialistas clínicos y expertos en diseño de fármacos. La contradicción entre obtener muy buena exactitud o alta capacidad de interpretación en la modelación de problemas aun es un campo abierto en la investigación. Los modelos difusos como herramientas de Soft Computing, constituyen una alternativa viable para explorar ambas medidas.. 1.3. Balance entre exactitud y capacidad de interpretación en la modelación. de sistemas La modelación de sistemas es la acción y efecto de aproximarse a un modelo, es decir, al esquema teórico que simplifica un sistema real o realidad compleja con el objetivo de facilitar su entendimiento (Casillas, Cordon et al. 2003). Gracias a estos modelos, los sistemas reales pueden ser explicados, controlados, simulados, predichos o incluso mejorados. El desarrollo de modelos confiables y comprensibles debe ser el objetivo principal en la modelación de sistemas, si esto no ocurre ello pierde utilidad. Existen al menos tres paradigmas en la modelación de sistemas. El enfoque más tradicional es el “modelado de caja blanca” que asume la existencia de suficiente conocimiento de la naturaleza del sistema y de un modelo matemático adecuado para representarlo. En oposición, se encuentra el “modelado de caja negra” que solamente utiliza los datos disponibles, sin conocimiento a priori del sistema, sobre una estructura lo más general posible. Mientras el enfoque de caja blanca tiene serias dificultades ante modelos complejos o poco explorados, el enfoque de caja negra a menudo considera variables que no tienen un significado físico real para el problema. 18.

(27) Capítulo 1 (Casillas, Cordon et al. 2003). Por tanto, por lo general el primer enfoque no obtiene modelos confiables mientras el segundo no obtiene modelos comprensibles. Un híbrido entre estos dos enfoques lo constituye el “modelado de caja gris”, donde algunas partes del sistema se modelan teniendo en cuenta el conocimiento previo, y otras partes menos conocidas se modelan como procedimientos de caja negra. Desde este punto de vista las desventajas de los dos enfoques originales se disminuyen y se gana en el balance entre confiabilidad y comprensibilidad del modelo. Desde hace varios años, una de las herramientas más exitosas para construir modelos de caja gris es el modelado difuso. Este tipo de modelación hace uso de un lenguaje descriptivo basado en Lógica Difusa con predicados lógicos. La clave de su éxito está en la facilidad para incorporar conocimiento experto humano, la cual es la mayoría de la información provista en sistemas de problemas del mundo real y esta descrita por expresiones vagas e imprecisas, y su facilidad para expresar el comportamiento del sistema con un lenguaje fácilmente interpretable por los humanos. Los modelos difusos están caracterizados por dos aspectos que describen su calidad (Gacto, Alcalá et al. 2011): Exactitud: Se refiere a la capacidad del modelo difuso de representar fielmente el sistema modelado. Mientras mayor es la exactitud, más cerca se encuentra el modelo al sistema real. Como cercanía nos referimos a la proximidad entre la respuesta del modelo difuso y la respuesta del sistema real. Existen varias medidas bien definidas para determinar qué tan exacto es un modelo. Algunos ejemplos bien conocidos para clasificación o regresión son el porciento de patrones correctamente clasificados de un conjunto de datos de ejemplos o el error cuadrático medio para problemas de regresión, como una forma de medir la cercanía del modelo con respecto al conocimiento en el intrínseco en el conjunto de datos. Capacidad de interpretación: Se refiere a la capacidad del modelo difuso de expresar el comportamiento del sistema de una manera entendible. Esta es una propiedad subjetiva que depende de varios factores, principalmente relacionados con la estructura del modelo: número de variables de entrada, numero de reglas difusas, el número de términos lingüísticos, la forma de 19.

(28) Capítulo 1 los conjuntos difusos, etc. No obstante, a diferencia de la exactitud, todavía no existe una medida estándar para determinar cuan buena es la capacidad de interpretación del sistema. La comunidad científica usualmente se ha enfocado en mejorar la exactitud de los modelos obtenidos, sin prestar especial atención a la capacidad de interpretación. En la actualidad, a pesar de que el interés en la capacidad de interpretación ha crecido significativamente, todavía existen cuestiones que son campos abiertos en investigación (Gacto, Alcalá et al. 2011): -. La exactitud y la capacidad de interpretación representan objetivos opuestos. Lo ideal sería satisfacer ambos criterios en un alto grado, pero ya que constituyen propiedades contradictorias por lo general esto no es posible. Debido a ello, los investigadores usualmente se enfocan en buscar el mejor balance entre capacidad de interpretación y exactitud.. -. Debido a su naturaleza subjetiva y la gran cantidad de factores, la búsqueda de una medida de capacidad de interpretación apropiada es todavía un problema abierto de investigación. La mayoría de los investigadores coincide en que el número de reglas debe ser el menor posible, las premisas de las reglas deben ser fáciles de entender en términos de estructura y contener la menor cantidad de antecedentes posibles, los términos lingüísticos deben ser comprensibles, etc. Sin embargo, mientras la definición de exactitud en un modelo está bien definida, la capacidad de interpretación es aún difícil de determinar.. Una alternativa para modelar sistemas dinámicos reales que facilita la capacidad de interpretación de los resultados en sistemas con conocimiento difuso y relaciones no necesariamente lineales entre las variables son los Mapas Cognitivos Difusos. Esta técnica de Soft Computing ha sido muy aceptada en los últimos años para la modelación y simulación de sistemas dinámicos en varios campos de aplicación como medicina, procesos industriales, economía, sistemas de supervisión y control, análisis de riesgo y problemas de toma de decisiones en general (Papageorgiou 2011).. 1.4. Mapas Cognitivos Difusos. Los Mapas Cognitivos Difusos (MCD) son una efectiva técnica de Soft Computing para el modelado y simulación de sistemas dinámicos. Fueron introducidos originalmente por Kosko en 20.

(29) Capítulo 1 1986 (Kosko 1986), quien amplio la teoría de los Mapas Cognitivos de Axelrod (Axelrod 1976) agregando el razonamiento difuso. De esta forma, los MCD combinan algunos aspectos de la Lógica Difusa y las Redes Neuronales Artificiales en su esquema de representación: la interpretación causal de las reglas difusas con la topología conexionista y el poder de inferencia de las Redes Neuronales Artificiales. 1.4.1 Estructura y causalidad en los Mapas Cognitivos Difusos Desde el punto de vista estructural, los MCD son grafos dirigidos con retroalimentación. Los vértices del grafo son llamados conceptos y son equivalentes a las neuronas en los modelos conexionistas. Los conceptos representan las variables, estados, o entidades que describen el comportamiento del sistema modelado en un dominio determinado. Las aristas del grafo son enlaces llamados relaciones que expresan el grado de causalidad que existe entre dos conceptos como resultado de la cuantificación de una variable lingüística difusa definida por un experto en la etapa de modelación (Figura 1.5).. Figura 1.5 Ejemplo de Mapa Cognitivo Difuso con seis conceptos.. Desde el punto de vista de la Lógica Difusa, cada concepto 𝐶𝑖 está caracterizado por un valor difuso 𝐴𝑖 en el rango [0,1], que denota el grado de activación de la variable representada por 𝐶𝑖 en el sistema. Los enlaces causales son arcos pesados 𝑤𝑖𝑗 que representan las relaciones causaefecto entre dos conceptos, y pueden ser descritos por un valor de naturaleza difusa en el rango [-1,+1]. El signo de las relaciones causales entre un par de conceptos 𝐶𝑖 y 𝐶𝑗 especifica la dirección del cambio de la manera siguiente: -. Si 𝑤𝑖𝑗 > 0, existe una causalidad positiva entre dos conceptos, por tanto luego de un incremento en el valor de activación 𝐴𝑖 del concepto de origen, ocurre un incremento en el 21.

(30) Capítulo 1 valor del concepto destino 𝐴𝑗 . De la misma manera, luego de un decremento en el valor de activación 𝐴𝑖 ocurre un decremento en el valor de activación 𝐴𝑗 con proporción |𝑤𝑖𝑗 |. -. Si 𝑤𝑖𝑗 < 0, existe una causalidad negativa entre los dos conceptos 𝐶𝑖 y 𝐶𝑗 , entonces un aumento en el concepto de origen 𝐴𝑖 causa una reducción en el valor de activación 𝐴𝑗 del concepto final y viceversa, con proporción |𝑤𝑖𝑗 |.. -. Si 𝑤𝑖𝑗 = 0, entonces no existe ninguna relación causal entre el par de conceptos en cuestión.. Estos pesos causales son a menudo definidos lingüísticamente por expertos en el dominio de aplicación o pueden ser aprendidos automáticamente utilizando datos históricos del problema modelado. 1.4.2 Inferencia en los Mapas Cognitivos Difusos Por otra parte, desde el punto de vista conexionista, los MCD son un tipo de red recurrente artificial debido a que involucra retroalimentación en sus conexiones. Este aspecto permite expresar la dinámica del sistema describiendo los efectos de los cambios de una variable en las otras variables del problema, lo que paulatinamente puede afectar el concepto que inició el cambio, agregando un carácter temporal al sistema modelado. De esta manera, una variación en un concepto puede afectar directa o indirectamente a todo el mapa (Kosko 1988). Todo ello constituye un factor clave para modelar problemas de clasificación de secuencias del campo de la Bioinformática. Estas estructuras además cuentan con una eficiente máquina de inferencia, donde el proceso de inferencia es similar al de las Redes Neuronales Artificiales. Una vez que los pesos causales se definen y los valores a los conceptos de entrada han sido establecidos, los valores de los conceptos 𝐴𝑖 son calculados a través del tiempo de acuerdo a la expresión 1.1: 𝑛 (𝑡+1) 𝐴𝑖. (𝑡). = 𝑓 (∑ 𝑤𝑗𝑖 𝐴𝑗 ) , 𝑖 ≠ 𝑗. (1.1). 𝑗=1. donde 𝑡 es el tiempo actual de la inferencia, 𝑛 es el número de conceptos conectados con el concepto 𝐶𝑖 , 𝑤𝑗𝑖 son los pesos de las conexiones que terminan en 𝐶𝑖 y 𝑓 representa la función de 22.

(31) Capítulo 1 normalización del valor de activación. Las funciones de normalización de los pesos más utilizadas comúnmente son la binaria, la ternaria o la sigmoidal. Debido a las características de recurrencia del mapa, el proceso de inferencia será repetido de modo que el grado de activación de cada neurona dependa de la activación de sus antecedentes en la iteración anterior, logrando que el sistema evolucione a través del tiempo. Por tanto, el proceso de inferencia es repetido un número fijo de veces o hasta que el mapa alcance un estado de equilibrio. Los sistemas que no alcanzan dicho estado de equilibrio pueden ser cíclicos o totalmente caóticos, sobre todo en modelos continuos complejos. De hecho, en un estudio publicado en (Tsadiras 2008) se concluye que la convergencia del mapa está altamente ligada al tipo de función que se utilice para la normalización de los pesos, de ahí que si se utiliza una función binaria o ternaria, es decir, si el MCD es discreto nunca caerá en estados caóticos; pero si se trata de un modelo continuo que utilice, por ejemplo, la función sigmoidal no se puede asegurar lo mismo. Opcionalmente, el mapa puede incluir capacidad memorística, adicionando al cálculo del peso el valor de activación del propio concepto en el tiempo 𝑡 (ver ecuación 1.2). Esto puede ser útil en ciertos problemas de toma de decisiones o clasificación pero tiene como dificultad que tiende a sobresaturar el valor de activación de las neuronas en menor tiempo de simulación. 𝑁 (𝑡+1) 𝐴𝑖. =. (𝑡) 𝑓 (∑ 𝑤𝑗𝑖 𝐴𝑗 𝑗=1. +. (𝑡) 𝐴𝑖 ) , 𝑖. (1.2) ≠𝑗. De manera general, la estructura, causalidad y el mecanismo de inferencia de los MCD permiten recrear procesos dinámicos que evolucionan a través del tiempo de manera comprensible. A pesar de que su concepción original no estaba enfocada hacia una herramienta para la predicción o clasificación se han obtenido resultados prometedores en este campo (Papakostas, Koulouriotis et al. 2012). Por tanto, esta herramienta constituye una opción viable para modelar el problema de clasificación de secuencias enunciado al comienzo del capítulo, ya que mediante los MCD es posible describir el sistema biológico de forma similar a las representaciones mentales de los expertos.. 23.

(32) Capítulo 1 1.4.3 Proceso de construcción de los Mapas Cognitivos Difusos Los MCD no utilizan el poder de la Lógica Difusa como motor de inferencia, pero si pueden utilizarse en el proceso de establecer los pesos iniciales del mapa si este está guiado por expertos. De acuerdo a la teoría del proceso de construcción de un MCD, el número y tipo de conceptos es determinado por un grupo de expertos en el dominio de aplicación. Luego cada interconexión entre dos conceptos es descrita por un experto en el dominio con una regla de la forma SIENTONCES que infiere una variable lingüística difusa, determinándose el grado de causalidad entre los dos conceptos. Más específicamente, las reglas tienen usualmente la siguiente forma: SI {ningún, poco, medio, mucho, o gran} cambio ocurre en el valor del concepto 𝐶𝑖 , ENTONCES {ningún, poco, medio, mucho, o gran} cambio es causado en el valor del concepto 𝐶𝑗 . Luego la variable lingüística 𝑖𝑛𝑓𝑙𝑢𝑒𝑛𝑐𝑖𝑎 describe la causalidad del concepto 𝐶𝑖 sobre el concepto 𝐶𝑗 y toma valores en el intervalo [-1,1]. Esta variable lingüística está descrita por el conjunto de términos lingüísticos 𝑇{𝑖𝑛𝑓𝑙𝑢𝑒𝑛𝑐𝑖𝑎}, por tanto el peso 𝑤𝑖𝑗 expresa un término lingüístico del conjunto 𝑇. Para el conjunto de términos 𝑇{𝑖𝑛𝑓𝑙𝑢𝑒𝑛𝑐𝑖𝑎} en (Papageorgiou 2012) se sugieren 12 términos lingüísticos en el rango desde “negativamente muy fuerte” hasta “positivamente muy muy fuerte”. Esta cantidad de términos permiten al experto describir detalladamente la causalidad y discernir claramente entre varios grados de influencia. Las funciones de membresía correspondientes a los 12 términos se muestran en la Figura 1.6. Una vez obtenidas las 𝑛 reglas sugeridas por los expertos, estas se agregan utilizando el método SUM y se determina el centroide del área para obtener finalmente un valor defuzificado que representa el peso 𝑤𝑖𝑗 . De esta manera es posible determinar las relaciones causa-efecto en un modelo de MCD. La actualización o enriquecimiento de la información en estos modelos se logra con la intervención de expertos en el dominio de aplicación o bien el aprendizaje de datos históricos sobre el comportamiento del sistema modelado. Ahora bien, la construcción de un MCD necesita establecer una gran cantidad de conceptos y relaciones entre ellos, lo cual añade una dificultad sustancial cuando se trata de un proceso manual. Por tanto, esto genera la siguiente pregunta: ¿Cómo se puede construir un mapa cuando no existe un experto en el dominio para determinar. 24.

(33) Capítulo 1 los conceptos y relaciones causales entre ellos? Con el objetivo de solventar esta dificultad, ha sido estudiado el desempeño de varios algoritmos de aprendizaje para ajustar MCD (Papageorgiou 2012).. Figura 1.6 Funciones de membresía para 12 términos lingüísticos. Tomado de (Papageorgiou 2012).. 1.4.4 Aprendizaje y ajuste de Mapas Cognitivos Difusos El objetivo en el aprendizaje de los MCD se ha relacionado con la optimización de la causalidad, es decir, obtener la matriz de pesos causales entre los conceptos del mapa que mejor se ajuste en función del conocimiento sobre un problema de toma de decisiones o clasificación. Normalmente, el conjunto de conceptos 𝐶 se determina por un experto y solamente la matriz de pesos 𝑊 se ajusta a partir de datos históricos (Papageorgiou 2012). De esta manera, los algoritmos de aprendizaje pueden entrenar los MCD de forma similar a la sinapsis en Redes Neuronales Artificiales. De hecho, la mayoría de los algoritmos propuestos en la literatura se basan en ideas procedentes del entrenamiento de Redes Neuronales Artificiales (Papageorgiou 2012). Los enfoques para el entrenamiento de MCD pueden utilizar la intervención de expertos humanos, o bien partir solamente de datos históricos, o utilizar ambas cosas. Atendiendo a esto, los algoritmos de aprendizaje para MCD pueden clasificarse en tres grupos de acuerdo al tipo de. 25.

(34) Capítulo 1 conocimiento que utilizan: los basados en el aprendizaje Hebbiano, los basados en algoritmos poblacionales, y los enfoques híbridos que combinan ambos paradigmas. En el caso de los algoritmos no supervisados, los métodos basados en el aprendizaje Hebbiano utilizan los datos históricos y una fórmula de aprendizaje basada en varias modificaciones de la regla de Hebb, para ajustar iterativamente los pesos del mapa. La primera propuesta basada en este paradigma fue publicada en (Dickerson and Kosko 1993) con el nombre de Differential Hebbian Learning (DHL). El algoritmo DHL asume que si el concepto inicial 𝐶𝑖 y el final 𝐶𝑗 de una relación cambian simultáneamente, el peso 𝑤𝑖𝑗 de esa relación debe ajustarse utilizando la siguiente expresión: 𝑤𝑖𝑗 (𝑡 + 1) = 𝑤𝑖𝑗 (𝑡) + 𝛾(𝑡)(∆𝐴𝑖 ∆𝐴𝑗 − 𝑤𝑖𝑗 (𝑡)). (1.3). donde 𝑡 es el tiempo actual de la inferencia del mapa, ∆𝐴𝑖 y ∆𝐴𝑗 son las variaciones en los valores de activación de los conceptos 𝐶𝑖 y 𝐶𝑗 respectivamente, y 𝛾(𝑡) es un coeficiente que se 𝑡. calcula dinámicamente con la expresión 𝛾(𝑡) = 0.1(1 − 1.1𝑞) donde 𝑞 ∈ ℕ y garantiza que el peso 𝑤𝑖𝑗 se mantenga en el intervalo [-1,1]. El parámetro 𝑞 puede establecerse como el número de iteraciones del aprendizaje. El aprendizaje continúa hasta que se alcanza un número máximo de iteraciones o se encuentra una matriz estable. Una de las principales desventajas de este primer enfoque es que la fórmula solo actualiza los pesos entre un par de conceptos, ignorando la influencia de otros conceptos. Otras modificaciones a este algoritmo han sido propuestas al algoritmo DHL considerándose esta desventaja. Por ejemplo el algoritmo Balanced Differential Algorithm (BDA) (Huerga 2002) elimina una de las deficiencias de DHL teniendo en cuenta todos los conceptos que cambian su valor cuando se van a actualizar los pesos, pero ha sido solo aplicado en MCD binarios. Otro enfoque llamado Active Hebbian Learning (AHL) (Papageorgiou, Stylios et al. 2004), utiliza la intervención inicial de los expertos en determinar la estructura inicial del mapa y una secuencia de activación de los conceptos. Asimismo, otra mejora al DHL fue propuesta en (Papageorgiou, Stylios et al. 2003) llamada Nonlinear Hebbian Learning (NHL) que además de la intervención inicial de los expertos en determinar la estructura, necesita establecer los signos de las conexiones antes de comenzar el proceso de ajuste. 26.

(35) Capítulo 1 En general estos modelos de aprendizaje no tienen como objetivo encontrar un matriz de pesos que se ajuste completamente a los datos históricos disponibles, sino que más bien se enfocan en obtener matrices que converjan a un punto estable (Papageorgiou 2012). Un enfoque ligeramente diferente fue propuesto en (Stach, Kurgan et al. 2008) donde el algoritmo Data Driven NHL (DDNHL) utiliza los datos históricos para mejorar la calidad del aprendizaje, pero en un estudio reciente en (Papakostas, Koulouriotis et al. 2012) no mostró resultados prometedores en problemas de clasificación. En general, la ventaja principal de estos algoritmos es su fácil implementación y ejecución muy rápida, pues no son complejos computacionalmente. Por otra parte, los algoritmos poblacionales si utilizan los datos históricos con el objetivo de obtener modelos que se ajusten al conocimiento disponible lo más fielmente posible. Estos esquemas supervisados son algoritmos de optimización que por lo general son mucho más exigentes desde el punto de vista de complejidad computacional. La representación del individuo es una característica en común de los numerosos enfoques propuestos, y puede describirse como la construcción de un vector de pesos que contiene todas las filas de la matriz de causalidad una a continuación de la otra (Figura 1.7).. Figura 1.7 Representación del individuo en un enfoque poblacional para ajustar la causalidad de un MCD.. Otro aspecto a definir es la función objetivo a utilizar. Una de las más comunes para problemas de clasificación supervisada es la del error de ajuste, ecuación 1.4: 𝐾. 𝑛. 𝐹𝑖𝑡𝑛𝑒𝑠𝑠𝐸𝑟𝑟𝑜𝑟 = ∑ ∑|𝐼𝑛𝑓𝑖 (𝑘) − 𝑅𝑒𝑎𝑙𝑖 (𝑘)| 𝑘=1 𝑖=1. 27. (1.4).

(36) Capítulo 1 donde 𝑘 representa las instancias de entrenamiento, 𝑛 es la cantidad de conceptos del mapa, e 𝐼𝑛𝑓𝑖 (𝑘) y 𝑅𝑒𝑎𝑙𝑖 (𝑘) son la inferencia del concepto 𝑖 del mapa y el valor real esperado respectivamente, para la instancia de entrenamiento 𝑘. Existen varios enfoques para el ajuste de MCD que utilizan algoritmos basados en poblaciones. En el artículo de (Papageorgiou 2012) se hace una revisión exhaustiva y crítica de los enfoques publicados hasta el año 2012, que incluye Algoritmos Genéticos, Algoritmos Genéticos de Código Real, Optimización de Bandadas de Partículas, Recocido Simulado, Búsqueda Tabú, entre otros. Particularmente la Optimización de Bandadas de Partículas ha mostrado resultados relevantes en el ajuste de la matriz de causalidad del mapa. Finalmente, los enfoques híbridos pueden implementarse con una combinación de los dos tipos de aprendizaje mencionados anteriormente: algoritmos Hebbianos y algoritmos poblacionales. Los pocos algoritmos propuestos bajo esta categoría están compuesto por procesos de aprendizaje en dos pasos. Estas propuestas también han mostrado resultados prometedores (Papageorgiou 2012), llevando el sistema al estado de estabilidad deseado y determinándose una matriz apropiada para cada problema específico. De forma general, los algoritmos de aprendizaje computacional para MCD han ganado atención en los últimos 10 años. La efectividad de estas técnicas de aprendizaje en el modelado y la predicción utilizando MCD han sido evidenciadas por varias aplicaciones exitosas en diversos dominios. Para la selección del algoritmo adecuado son necesarios diferentes factores, por ejemplo el tipo de datos de entrenamiento. Los métodos basados en la regla de Hebb son apropiados para determinados tipos de datos y son mucho más rápidos cuando está disponible el conocimiento experto. Mientras los algoritmos poblacionales a pesar de ser más consumidores, proveen de una mejor calidad en el aprendizaje, desde el punto de vista de la similaridad al comportamiento del sistema dinámico real.. 28.

(37) Capítulo 1 1.5. Consideraciones finales del capítulo. Los tratamientos antirretrovirales constituyen una alternativa para aumentar la calidad de vida de los pacientes infectados con el Virus de Inmunodeficiencia Humano, sin embargo, este retrovirus tiende a desarrollar resistencia a los fármacos existentes provocando la falla del tratamiento. Desde el punto de vista de la Inteligencia Artificial el problema de la resistencia a los fármacos conduce a un complejo problema de clasificación, donde los rasgos predictores están constituidos por la mutación secuenciada y el rasgo objetivo es la resistencia a determinado fármaco antiretroviral. Se han adoptado varias técnicas de aprendizaje automatizado para resolver este problema, entre las cuales se encuentran Sistemas basados en Reglas, Arboles de Decisión, diferentes tipos de Regresión y enfoques de Redes Neuronales Artificiales; sin embargo, pocas de ellas pueden ser interpretadas. Por su parte, los Mapas Cognitivos Difusos son clasificadores prometedores, y adicionalmente permiten la interpretación del sistema a partir de relaciones causales expresadas en su estructura.. 29.

Figure

Figura 1.1 Estructura de un virión del VIH. Tomado de (NIAID 2009).
Figura 1.2 Ciclo de vida del VIH. Tomado de (NIAID, 2009).
Figura 1.3 Lista de los principales fármacos antirretrovirales aprobados para el tratamiento del VIH
Figura 1.4 Estructura de la proteasa del VIH con el antiretroviral Saquinavir adherido (en azul)
+7

Referencias

Documento similar

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y

En estos últimos años, he tenido el privilegio, durante varias prolongadas visitas al extranjero, de hacer investigaciones sobre el teatro, y muchas veces he tenido la ocasión

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

En junio de 1980, el Departamento de Literatura Española de la Universi- dad de Sevilla, tras consultar con diversos estudiosos del poeta, decidió propo- ner al Claustro de la

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

[r]

SVP, EXECUTIVE CREATIVE DIRECTOR JACK MORTON

Social Media, Email Marketing, Workflows, Smart CTA’s, Video Marketing. Blog, Social Media, SEO, SEM, Mobile Marketing,