CAPÍTULO 3. EVALUACIÓN DEL MODELO PROPUESTO
3.4 Otras aplicaciones del modelo: simulación y generación de mutaciones
3.4.1 Generación de mutaciones utilizando el modelo propuesto y un enfoque
combinatorio
Una de las características que dificulta el aprendizaje de las bases de conocimiento disponibles sobre la resistencia a fármacos del VIH, es que presentan desbalance entre las clases. Aun cuando el modelo de MCD propuesto es bastante robusto ante esta dificultad, el número de secuencias reportadas con susceptibilidad a los fármacos existentes es bastante menor que las que reportan resistencia, limitando la comprensión del comportamiento de las proteínas del VIH en general. Luego, ¿es posible generar mutaciones artificiales factibles que sean susceptibles a
60
un fármaco determinado? Seguidamente describimos un esquema propuesto por la autora en (Grau and Nápoles 2014) que utiliza el modelo ya entrenado propuesto en el presente trabajo y un método basado en la meta-heurística Optimización de Colonia de Hormigas (ACO, por sus siglas en inglés) (Dorigo, Maniezzo et al. 1996) como generador de nuevas mutaciones. La idea central de este esquema es generar mutaciones factibles sobre la secuencia consenso como un típico problema combinatorio. Para lograr esto, se utiliza la meta-heurística ACO donde la información que guía los movimientos de las hormigas es computada a partir de conocimiento biológico extraído de los datos históricos.
Más específicamente, en la proteína proteasa por ejemplo, la mayoría de las mutaciones que se reportan en la literatura son del tipo mutación genética missense (Grau and Nápoles 2014), este tipo de mutaciones ocurre cuando se reemplaza un nucleótido y cambia la interpretación del codón, es decir, el aminoácido en la secuencia. Por esta razón en (Grau and Nápoles 2014) la autora se concentra en generar este tipo de mutaciones sobre la proteasa, obteniendo secuencias de la proteasa que cumplan con la propiedad de ser susceptibles a un fármaco determinado. El primer paso para utilizar la meta-heurística ACO con este objetivo, es representar las soluciones posibles. Cada hormiga debe construir un vector de solución que contenga las posibles mutaciones sobre la secuencia consenso. De esta manera, el vector de soluciones está constituido por las posiciones de la secuencia que están asociadas con la resistencia. Las mutaciones que pueden ocurrir en estas posiciones son insertadas en la secuencia completa obteniendo la secuencia mutada final. Por ejemplo la secuencia consenso de la proteasa expresada en aminoácidos tiene la forma “P Q I T L W Q R P L V T I K I G G Q L K E A L L D T G A D D T V L E E M N L P G R W K P K M I G G I G G F I K V R Q Y D Q I L I E I C G H K A I G T V L V G P T P V N I I G R N L L T Q I G C T L N”, si se escogen las posiciones asociadas con la resistencia AA10, AA24, AA46, AA71 y AA90, el vector de solución tendrá 5 componentes y supongamos una posible solución encontrada por el algoritmo igual a “P Q G T L”; luego la secuencia final tiene la forma: “P Q I T L W Q R P P V T I K I G G Q L K E A L Q
D T G A D D T V L E E M N L P G R W K P K G I G G I G G F I K V R Q Y D Q I L I E I C G H K T I G T V L V G P T P V N I I G R N L L T Q I G C T L N F”.
61
Como ACO es un modelo completamente constructivo donde cada hormiga construye una solución del problema explorando el grafo de soluciones durante la búsqueda, es necesario definir la preferencia por moverse de un estado a otro. Esta preferencia depende de dos factores:
i. La información artificial 𝜂𝑖𝑗 que se basa en el rastro de la feromona depositado y actualizado por la hormiga durante el proceso de búsqueda.
ii. La información heurística 𝜏𝑖𝑗 que está relacionada con el problema de aplicación. Esta información se establece previamente y no es actualizada durante el proceso de búsqueda. En este esquema se utiliza una variante para determinar la información heurística que parte de los datos históricos, cuantificando las veces que una posición muta a un aminoácido especifico. Por ejemplo, analizando 150 mutaciones para el fármaco LPV notamos que la posición AA30 muta al aminoácido D en 104 secuencias, por tanto la preferencia heurística para aceptar este aminoácido en la posición AA30 será 𝜏𝑖𝑗 = 104/150 ≈ 0.7. La siguiente tabla muestra un
ejemplo de la información heurística extraída de los datos históricos del fármaco LPV:
Tabla 3.14 Ejemplo de frecuencias de mutaciones en cada posición de la secuencia, extraído de los datos históricos de LPV.
AA A C D E F G H I K L M N P Q R S T V W Z 10 0 0 0 0 24 0 0 61 0 11 0 0 0 0 0 0 0 10 0 0 20 0 0 0 0 0 0 0 6 65 0 1 0 0 0 28 0 5 1 0 0 24 0 0 0 0 1 0 0 13 0 92 0 0 0 0 0 0 0 0 0 0 30 0 0 104 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 32 0 0 0 0 0 0 0 12 0 0 0 0 0 0 0 0 0 94 0 0 33 0 0 0 0 30 0 0 2 0 73 0 0 0 0 0 0 0 1 0 0 36 0 0 0 0 0 0 0 43 0 6 56 0 0 0 0 0 0 1 0 0 46 0 0 0 0 0 0 0 51 0 14 41 0 0 0 0 0 0 0 0 0 47 0 0 0 0 0 0 0 96 0 0 0 0 0 0 0 0 0 10 0 0 48 0 0 0 0 0 96 0 0 0 0 1 0 0 0 0 1 0 8 0 0 54 1 0 0 0 0 0 0 32 0 6 4 0 0 0 0 3 0 60 0 0 63 4 2 0 0 0 0 2 0 0 10 0 0 85 0 1 0 2 0 0 0 64 0 0 0 0 0 0 0 87 0 0 3 0 0 0 0 0 0 16 0 0 70 0 0 0 4 0 0 0 0 101 0 0 0 0 0 1 0 0 0 0 0
62 71 31 0 0 0 0 0 0 8 0 1 0 0 0 0 0 0 9 57 0 0 72 0 0 0 1 0 0 0 84 1 1 6 0 0 0 3 0 2 8 0 0 73 2 0 0 0 0 86 0 0 0 0 0 0 0 0 0 15 3 0 0 0 77 0 0 0 0 0 0 0 32 0 0 0 0 0 0 0 0 0 74 0 0 82 59 1 0 0 4 0 0 1 0 0 0 0 0 0 0 1 9 31 0 0 84 1 1 0 0 0 0 0 72 0 0 0 0 0 0 0 0 1 31 0 0 88 0 0 4 0 0 1 0 0 0 0 0 100 0 0 0 0 1 0 0 0 90 0 0 0 0 0 0 0 0 0 46 60 0 0 0 0 0 0 0 0 0 93 0 0 0 0 0 0 0 63 0 42 1 0 0 0 0 0 0 0 0 0
En el proceso de búsqueda, la probabilidad de moverse de un estado a otro se calcula utilizando una expresión que depende de los valores de 𝜂𝑖𝑗 y 𝜏𝑖𝑗 y la actualización de la feromona ocurre según el esquema de la variante MAX-MIN Ant System (Stützle and Hoos 2000), como se explica detalladamente en (Grau and Nápoles 2014). Los detalles de la configuración de parámetros utilizada para el algoritmo también son expuestos en (Grau and Nápoles 2014). Quizás el aspecto más interesante de este esquema es que el valor de la función objetivo es calculado a través del modelo de MCD entrenado para describir el comportamiento de un fármaco determinado. En otras palabras, el valor de la secuencia candidata a solución es medido en términos de susceptibilidad a un fármaco utilizando el proceso de inferencia del MCD. Como es lógico, el MCD utilizado debe estar previamente entrenado para ese fármaco como se describe en el epígrafe 2.2. Como resultado, se obtienen varias mutaciones susceptibles para cada mapa entrenado que representa un fármaco antiviral.
Con el objetivo de validar la susceptibilidad de las secuencias generadas, comparamos la salida de tres de los algoritmos basados en reglas descritos en el epígrafe 1.2, disponibles a través del proyecto HIValg: ANRS, HIVdb y REGA (Tang, Liu et al. 2012). Estos sistemas basados en reglas determinan la susceptibilidad a varios fármacos de una secuencia de entrada provista por el usuario. Tomando las secuencias supuestamente susceptibles generadas artificialmente y utilizándolas como entradas para los sistemas expertos, se obtiene como salida el criterio de susceptibilidad de estos algoritmos. La siguiente tabla muestra el porciento de coincidencia entre las secuencias generadas artificialmente y la salida de estos sistemas expertos con respecto a la
63
susceptibilidad, utilizando 100 posibles secuencias susceptibles para 5 inhibidores de la proteasa disponibles en los sistemas expertos. Por ejemplo, las secuencias generadas como susceptibles para el fármaco ATV son declaradas susceptibles en un 100% por los sistemas ANRS y REGA, y en un 98% por HIVdb, ilustrando la exactitud del esquema de generación.
Tabla 3.15 Porciento de coincidencia entre las secuencias generadas y las salidas de tres sistemas expertos disponibles públicamente.
Fármaco ANRS HIVdb REGA
ATV 1.0 0.98 1.0
IDV 1.0 0.96 0.99
LPV 0.98 0.90 0.94
NFV 0.98 0.93 0.95
SQV 0.99 0.92 0.99
Como resultado, las secuencias susceptibles generadas a través del modelo pueden ser utilizadas para enriquecer las bases de conocimiento desbalanceadas sobre resistencia antiviral, una vez comprobadas su factibilidad biológica. De forma más general, estas secuencias artificiales también pueden constituir información útil para la comprensión del comportamiento de la resistencia antiviral en proteínas del VIH.
3.5 Conclusiones parciales del capítulo
El modelo basado en Mapas Cognitivos Difusos tiene una exactitud de la clasificación notablemente superior, respecto a los clasificadores tradicionales, para el problema de clasificación de dos clases, superando incluso a las Redes Neuronales Recurrentes Bidireccionales. Si se consideran dos niveles de resistencia y la susceptibilidad, el modelo es competitivo.
El modelo propuesto se distingue por su interpretabilidad, al permitir a un experto (ej. diseñador de fármacos, clínico, bioquímico) formular conclusiones sobre la relaciones existentes entre las posiciones de la secuencia y la resistencia a los inhibidores. Además, el modelo permite clasificar nuevas secuencias del virus y estudiar el efecto de una mutación puntual sobre las respuestas del sistema modelado.
64
El esquema propuesto para generar nuevas mutaciones artificiales permite obtener secuencias con determinadas características. Los experimentos mostraron que la exactitud de este esquema es superior al 98%, si se considera el sistema experto ANRS (uno de los más populares dentro de la comunidad científica). Lo cual es una forma adicional de validar la calidad del conocimiento biológico estimado.
65
CONCLUSIONES
En este trabajo se presentó un modelo basado en la teoría de Mapas Cognitivos Difusos que permite clasificar las secuencias con gran exactitud, y adicionalmente permite la extracción de conocimiento biológico relevante que puede ayudar a los expertos a comprender el mecanismo de resistencia del virus.
El diseño del modelo propuesto concibe que cada posición de la secuencia es representada como un concepto, y además se define otro concepto que denota la resistencia al inhibidor estudiado. Luego, cada secuencia se codifica según un descriptor biológico (energía de contacto normalizada), que permite modelar el grado de estímulo del concepto. La herramienta FCMTool 3.0 empleada en la implementación del modelo permite la creación y edición de MCD, facilitando la modelación, ajuste y validación de la propuesta.
Los pesos causales que definen la semántica del sistema se estiman automáticamente, utilizando un esquema de aprendizaje supervisado con un método de optimización poblacional. Por otra parte, durante el proceso de búsqueda el método detecta estados potenciales de convergencia prematura frecuentemente causados por soluciones locales, lo cual contribuye a incrementar la capacidad de generalización de las mutaciones aprendidas.
Las simulaciones mostraron que la propuesta es significativamente superior a los clasificadores tradicionales, si se consideran dos clases. Si se consideran dos niveles de resistencia además de la susceptibilidad, entonces el mapa muestra un desempeño inferior, pero todavía competitivo. Se demuestra la interpretabilidad de los prototipos construidos, lo cual representa una ventaja sobre los clasificadores tradicionales, resultando preferibles los MCD a clasificadores no interpretables o inclusive a los Sistemas Expertos basados en Reglas, pues en estos sistemas la exactitud de la clasificación depende de miles de reglas, dificultando la interpretabilidad del sistema.
66
RECOMENDACIONES
1. Usar otros descriptores numéricos para la codificación de aminoácidos, que correspondan en mayor medida con la interacción entre las posiciones de la secuencia.
2. Mejorar la capacidad de predicción del modelo descrito para el problema de clasificación que considera dos niveles de resistencia. Algunas ideas en este sentido incluyen:
a. Seleccionar un conjunto mínimo de rasgos que sea consistente.
b. Modificar el método de aprendizaje, de forma tal que se favorezcan las soluciones que logren distinguir las mutaciones con nivel de resistencia intermedio.
67
ANEXOS
Anexo A: Conversión de codones de nucleótidos en aminoácidos.
Debido a que existen 4 bases nitrogenadas en el código genético, se forman 64 tripletas o codones posibles (43 = 64), la figura muestra las posibles combinaciones. La mayoría de los aminoácidos puede estar codificado por más de un codón. Por ejemplo los codones TTA, TTG, CTT, CTC, CTA y CTG codifican para el aminoácido Leucina, en cambio solo TGG codifica para el aminoácido Triptófano. La decodificación de aminoácidos se torna sencilla al utilizar la siguiente figura, donde solo es necesario moverse por los anillos de adentro hacia afuera para formar los codones que codifican en un aminoácido.
68
Anexo B: Energías de contacto de los aminoácidos.
La energía de contacto de un aminoácido es un descriptor numérico que corresponde con la estructura tridimensional de la proteína, el cual se calcula estadísticamente a partir de una gran y diversa cantidad de secuencias.
Tabla A.1 Energías de contacto para los aminoácidos.
Aminoácido eir 1996 qi, 1996 Energías de Contacto 1996 -0,6*qi*eir/2kcal/mol
A -2.57 6.334 4.883514 C -3.57 6.646 7.117866 D -1.84 6.487 3.580824 E -1.79 6.235 3.348195 F -4.76 5.87 8.38236 G -2.19 6.284 4.128588 H -2.56 6.241 4.793088 I -4.42 6.042 8.011692 K -1.52 6.569 2.995464 L -4.81 6.087 8.783541 M -3.92 6.137 7.217112 N -1.92 6.574 3.786624 P -2.09 5.858 3.672966 Q -2 6.469 3.8814 R -2.11 6.318 3.999294 S -1.98 6.582 3.909708 T -2.29 6.486 4.455882 V -3.89 6.155 7.182885 W -3.81 5.793 6.621399 Y -3.41 6.037 6.175851
69
Anexo C: Selección de posiciones previamente asociadas con la resistencia.
Para la familia de inhibidores de la proteasa (PIs) se utilizaron las posiciones: AA30, AA32, AA46, AA47, AA48, AA50, AA54, AA76, AA82, AA84, AA88, AA90.
Para la familia de inhibidores de la transcriptasa reversa del tipo NRTIs se utilizaron las posiciones: AA341, AA65, AA67, AA69, AA70, AA74, AA115, AA151, AA184, AA210, AA215, AA219.
Para la familia de inhibidores de la transcriptasa reversa del tipo NNRTIs se utilizaron las posiciones: AA100, AA101, AA103, AA106, AA138, AA181, AA188, AA190, AA230.
70
Anexo D: Implementación del modelo en una herramienta computacional.
Algoritmo principal implementado en Java que utiliza el código fuente de la herramienta
FCMTool 3.0 para la experimentación en forma de script de consola:
71
Construcción de un MCD para el fármaco NPV utilizando FCMTool 3.0.
Figura A.3 Topología construida para el fármaco NPV.
72
REFERENCIAS BIBLIOGRÁFICAS
Axelrod, R. M. (1976). Structure of decision: The cognitive maps of political elites, Princeton university press Princeton.
Barrett A.J., R. N., Woessner JF. (2003). The Handbook of Proteolytic Enzymes, Academic Press.
Beerenwinkel, N., et al. (2003). "Geno2pheno: estimating phenotypic drug resistance from HIV- 1 genotypes." Nucleic Acids Research 31: 38500-38505.
Beerenwinkel, N., Sing, T., Lengauer, T., Roomp, K., Savenkov, I., Fischer, R., Hoffmann, D., Selbig, J., Korn, K., Walter, H., Berg, T., Braun, P., Fa, G.,Oette, M., Kupfer, B., Kaiser, R., & Da, M (2005). "Computational methods for the design of effective therapies against drug resistant HIV strains." Bioinformatics 21: 3943-3950.
Bonet, I., J. Arencibia, et al. (2013). "Multi-Classifier Based on Hard Instances- New Method for Prediction of Human Immunodeficiency Virus Drug Resistance." Current Topics in Medicinal Chemistry 13: 685-695.
Bonet, I., A. Rodriguez, et al. (2013). "Bidirectional Recurrent Neural Networks for Biological Sequences Prediction." Lecture Notes in Artificial Intelligence 8266(Part II): 139–149.
Bratton, D. and J. Kennedy (2007). Defining a Standard for Particle Swarm Optimization. IEEE Swarm Intelligence Symposium.
Casillas, J., O. Cordon, et al. (2003). "Accuracy improvements to find the balance interpretability-accuracy in linguistic fuzzy modeling: an overview." Studies in fuzziness and soft computing.
Clerc, M. and J. Kennedy (2002). "The Particle Swarm—Explosion, Stability, and Convergence in a Multidimensional Complex Space." IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION 6(1).
Dickerson, J. A. and B. Kosko (1993). Virtual worlds as fuzzy cognitive maps Virtual Reality Annual International Symposium, 1993., 1993 IEEE, IEEE.
Dorigo, M., V. Maniezzo, et al. (1996). "The Ant System: Optimization by a colony of cooperating agents." IEEE Transactions on Systems, Man, and Cybernetics -Part B 26: 1: 29-41. Draghici, S. and R. B. Potter (2003). "Predicting HIV drug resistance with neural networks." Bioinformatics and Biology Insights 19: 98-107
73
Friedman, M. (1937). "The use of ranks to avoid the assumption of normality implicit in the analysis of variance." Journal of the American Statistical Association 32: 674-701.
Gacto, M. J., R. Alcalá, et al. (2011). "Interpretability of linguistic fuzzy rule-based systems: An overview
of interpretability measures." Information Sceinces 181: 4340–4360.
Gilbert, P. B., I. W. McKeague, et al. (2003). "Comparison of HIV-1 and HIV-2 infectivity from a prospective cohort study in Senegal." Statistics in Medicine 22 4: pp. 573–593.
Grau, I. and G. Nápoles (2014). "Mutating HIV protease protein using Ant Colony Optimiza-tion and Fuzzy Cognitive Maps: drug susceptibility analysis." Computación y Sistemas 18(1): 51-64. Grau, I., G. Nápoles, et al. (2013). "Backpropagation Through Time Algorithm for Training Recurrent Neural Networks Using Variable Length Instances." Computación y Sistemas 17(1). Grau, I., G. Nápoles, et al. (2013). Predicting HIV-1 Protease and Reverse Transcriptase Drug Resistance Using Fuzzy Cognitive Maps. CIARP.
Grau, I., G. Nápoles, et al. (2012). Fuzzy Cognitive maps for modelling, predicting and interpreting HIV drug resistance. IBERAMIA 2012. J. Pavón, Springer. LNAI 7637: 31-40. Huerga, A. V. (2002). A balanced differential learning algorithm in fuzzy cognitive maps. Proceedings of the 16th International Workshop on Qualitative Reasoning.
Johnson, V., Brun-Vézinet, F., Bonaventura, C., Conway, B., DAquila, R., Demeter, L., Kuritzkes, R., Pillay, D., Schapiro, J., Telenti, A., & Richman, D (2003). "Drug resistance mutation in HIV-1." Topics in HIV Medicine 11: 215-221.
Kennedy, J. and R. Eberhart (1995). Particle Swarm Optimization. Proceedings of the 1995 IEEE International Conference on Neural Networks.
Kosko, B. (1986). "Fuzzy cognitive maps." International journal of man-machine studies 24(1): 65-75.
Kosko, B. (1988). "Hidden patterns in combined and adaptive knowledge networks." International Journal of Approximate Reasoning 2(4): 377-393.
Kosko, B. (1992). Neural networks and fuzzy systems: a dynamical systems approach to machine intelligence, Prentice-Hall, Inc.
Laethem, K., et al. (2002). "A genotypic drug resistance interpretation algorithm that significantly predicts therapy response in HIV-1-infected patients." Antiviral Therapy 7: 123-129 León, M., G. Nápoles, et al. (2013). "Tackling Travel Behaviour: An approach based on Fuzzy Cognitive Maps." International Journal of Computational Intelligence Systems 6(6): 1012-1039.
74
León, M., G. Nápoles, et al. (2011). Two Steps Individuals Travel Behavior Modeling through Fuzzy Cognitive Maps Pre-definition and Learning. MICAI 2011, Springer.
León, M., C. Rodriguez, et al. (2010). Fuzzy cognitive maps for modeling complex systems. Advances in Artificial Intelligence, Springer: 166-174.
Masso, M. (2010). "HIV-1 Prediction of Human Immunodeciency Virus Type 1 Drug Resistance: Representation of Target Sequence Mutational Patterns via an n-Grams Approach." IEEE International Conference on Bioinformatics and Biomedicine: 1--6
Masso, M. (2012). "Prediction of Human Immunodeciency Virus Type 1 Drug Resistance: Representation of Target Sequence Mutational Patterns via an n- Grams Approach." 2012 IEEE International Conference on Bioinformatics and Biomedicine (BIBM) 1-6.
Miyazawa, S., Jernigan, R.L (1999). "Contacts energies Self-Consistent Estimation of Inter- Residue Protein Contact Energies Based on an Equilibrium Mixture Approximation of Residues. PROTEINS: Structure, Function, and Genetics." 34: 49-68.
Nápoles, G. (2014). "Algoritmo para mejorar la convergencia de Mapas Cognitivos Difusos Sigmoidales." Tesis de Maestría en Ciencia de la Computación Universidad Central Marta Abreu de Las Villas.
Nápoles, G., I. Grau, et al. (2014). "Towards swarm diversity: Random Sampling in Variable Neighborhoods procedure using a Lévy distribution " Computación y Sistemas 18(1): 79-95. Nápoles, G., I. Grau, et al. (2012). "Constricted Particle Swarm Optimization based Algorithm for Global Optimization." Polibits 46: 5-11.
Nápoles, G., I. Grau, et al. (2012). Particle Swarm Optimization with Random Sampling in Variable Neighbourhoods for solving Global Minimization Problems. ANTS 2012.
Nápoles, G., I. Grau, et al. (2014). "Two-steps learning of Fuzzy Cognitive Maps for prediction and knowledge discovery on the HIV-1 drug resistance." Expert Systems with Applications 41: 821–830.
Nápoles, G., I. Grau, et al. (2013). Modelling, aggregation and simulation of a dynamic biological system through Fuzzy Cognitive Maps. MICAI 2012, Springer.
NIAID (2009). "Biology of HIV." Department of Health and Human Services. 2011.
Papageorgiou, E. (2011). Review study on Fuzzy Cognitive Maps and their applications during the last decade. International Conference on Fuzzy Systems, IEEE.
75
Papageorgiou, E. (2012). "Learning algorithms for fuzzy cognitive maps—A review study." Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on 42(2): 150-163.
Papageorgiou, E., C. Stylios, et al. (2003). Fuzzy cognitive map learning based on nonlinear Hebbian rule. AI 2003: Advances in Artificial Intelligence, Springer: 256-268.
Papageorgiou, E., C. D. Stylios, et al. (2004). "Active Hebbian learning algorithm to train fuzzy cognitive maps." International Journal of Approximate Reasoning 37(3): 219-249.
Papakostas, G. and D. Koulouriotis (2010). Classifying patterns using fuzzy cognitive maps. Fuzzy Cognitive Maps, Springer: 291-306.
Papakostas, G. A., Y. S. Boutalis, et al. (2008). "Fuzzy Cognitive Maps for pattern recognition applications." International Journal of Pattern Recognition 22.
Papakostas, G. A., D. E. Koulouriotis, et al. (2012). "Towards Hebbian learning of Fuzzy Cognitive Maps in pattern classification problems." Expert Systems with Applications 39: 10620–10629.
Pasomsub, E., et al. (2010). "The Application of Articial Neural Networks for Phenotypic Drug Resistance Prediction: Evaluation and Comparison with Other Interpretation Systems." Jpn. Journal of Infectious Diseases 63: 87--94
Poli, R., J. Kennedy, et al. (2007). "Particle swarm optimization - An overview." Swarm Intelligence 1: 37-57.
Rabinowitz, M., et al. (2005). "Accurate prediction of HIV-1 drug response from the reverse transcriptase and protease amino acid sequences using sparse models created by convex optimization." Bioinformatics 22: 541--549
Ravela, J., et al. (2003). "HIV-1 Protease and Reverse Transcriptase Mutation Patterns Responsible for Discordances Between Genotypic Drug Resistance Interpretation Algorithms." Journal of Acquired Immune Deficiency Syndromes 33: 8-14
Reid, C., et al. (2002). "A dynamic rules-based interpretation system derived by an expert panel is predictive of virological failure." Antiviral Therapy 7(S91).
Rhee, S. Y., et al. (2010). "HIV-1 Protease Mutations and Protease Inhibitor Cross-Resistance." Antimicrobial agents and chemotherapy 54: 4253--4261
Rhee, S. Y., J. Taylor, et al. (2006). "Genotypic predictors of human immunodeciency virus type 1 drug resistance." PNAS 103: 17355-17360.
76
Rousseau, M. N., et al. (2001). "Patterns of resistance mutations to antiretroviral drugs in extensively treated HIV-1-infected patients with failure of highly active antiretroviral therapy." Journal of Acquired Immune Deficiency Syndromes 26: 36-43.
Saigo, H., T. Uno, et al. (2007). "Mining complex genotypic features for predicting HIV-1 drug resistance." Bioinformatics 23: 2455--2462
Shafer, R. (2002). "Genotypic testing for Human Immunodeciency Virus type1 drug resistance." Clinical Microbiology Reviews 15: 247-277.
Shi, Y. and R. Eberhart (1998). A Modified Particle Swarm Optimizer. IEEE Congress on Evolutionary Computation.
Sing, T., Svicher, V., Beerenwinkel, N Ceccherini-Silberstein, F., Däumer,
M.,Kaiser,R.,Walter,H.,Korn,K.,Hoffmann,D.,Oette,M.,Rockstroh,J.,Faetkenheuer, G., Perno, C., & Lengauer, T (2005). Characterization of novel HIV drug resistance mutations using clustering, multidimensional scaling and SVM-based feature ranking. Knowledge Discovery in Databases
Smith, J. A. and R. Daniel (2006). "Following the path of the virus: the exploitation of host DNA repair mechanisms by retroviruses." ACS Chem Biol 1 (4) Division of Infectious Diseases, Center for Human Virology, Thomas Jefferson University, Philadelphia: pp. 217–226.
Song, H. J., C. Y. Miao, et al. (2011). "An extension to fuzzy cognitive maps for classification and prediction." Fuzzy Systems, IEEE Transactions on 19(1): 116-135.
Stach, W., L. Kurgan, et al. (2008). Data driven nonlinear Hebbian learning method for fuzzy cognitive maps. IEEE World Congress Computation Intelligence., Hong Kong, IEEE.
Stützle, T. and H. H. Hoos (2000). "MAX–MIN ant system." Future generation computer systems 16(8): 889-914.
Tang, M. W., T. F. Liu, et al. (2012). "The HIVdb System for HIV-1 Genotypic Resistance