• No se han encontrado resultados

Modelación respecto a otros enfoques reportados en la literatura

4.3 Modelación de la relación cuantitativa estructura-actividad

4.3.2 Modelación respecto a otros enfoques reportados en la literatura

de la verdadera contribución y relevancia de nuevos parámetros moleculares o generalización de estos. Se evalúa el rendimiento aplicando estudios de correlación con determinada propiedad molecular con respecto a los métodos existentes, siguiendo el supuesto de que la novedad de un método puede ser medida en términos de correlaciones con propiedades estructurales de las moléculas, o al menos proveer mejoras cuando son combinadas con las técnicas reportadas.

Este estudio consta de dos partes: 1) se ajustan modelos utilizando las 31 estructuras de la base de datos de Esteroides como conjunto de entrenamiento, y 2) se ajustan modelos dividiendo la base de datos en un conjunto de entrenamiento y un conjunto de prueba. En el primer experimento se obtuvieron los mejores modelos para 4, 5 y 6 variables, mientras que en el segundo se obtuvieron los mejores modelos para 3, 4 y 5 variables. La selección de los modelos fue realizada acorde a la calidad de los parámetros estadísticos considerados en el estudio.

Los modelos del primer estudio realizado, usando los descriptores 2D QuBiLS-MAS propuestos en este trabajo, son comparados con los resultados obtenidos por otros modelos reportados en la literatura en la Tabla 4.8, donde se encuentran resumidos los resultados alcanzados, ordenados de forma decreciente acorde al valor del parámetro

. Los modelos presentados, son superiores a los reportados, incluso cuando muchos

de ellos utilizan técnicas más complejas. Los modelos de dimensión cuarto y cinco, tienen únicamente, menor poder predictivo, pero comparable, que el modelo de Descriptores Moleculares basado en Matrices de Similitud (Similarity matrices-based molecular descriptors), pero están definidos con una técnica más sencilla y con menor número de variables.

Un factor importante en la validación del ajuste para los modelos entrenados, y más aún en la metodología QSAR, es la predicción adecuada de un conjunto de compuestos que son desconocidos al momento de entrenar y/o construir el modelo. Denominado comúnmente en la literatura como conjunto de prueba (test set), presenta un conjunto de instancias (en nuestros caso estructuras moleculares), que serán similares a las del conjunto de entrenamiento (training set). Este enfoque en la familia de Esteroides es

usualmente realizado dividiendo la base de datos en dos clases: el conjunto de entrenamiento con los primeros 21 compuestos y el conjunto de prueba con los 10 restantes, por tanto, son incluidos solamente los 21 esteroides del conjunto de entrenamiento para construir el modelo que después será aplicado al conjunto de prueba. En la Tabla 4.9 son recogidos los valores de para las diferentes metodologías QSAR existentes y que utilizan como conjunto de entrenamiento y prueba la configuración explicada anteriormente. También son listados en esta tabla los valores del mismo parámetro estadístico pero de los modelos generados en este estudio. En sentido general, el rendimiento de los modelos QuBiLS-MAS obtenidos es comparable y presentan mejor poder predictivo que los reportados en la literatura.

Tabla 4.8 Comparación de la predicción de los modelos propuestos y otros enfoques de la literatura

Método QSAR N n Método estadístico Ref.

QuBiLS-MAS Indices 31 6 GA + RLM 0.952 -

Similarity matrices-based molecular descriptors 31 6 Genetic NN 0.940 [187]

QuBiLS-MAS Indices 31 5 GA + RLM 0.935 - QuBiLS-MAS Indices 31 4 GA + RLM 0.926 - TQSAR 31 6 RLM + ACP 0.842 [188] MEDV 31 5 GA + RLM 0.777 [189] TQSI 31 3 RLM 0.775 [190] CoMSA 31 1 Kohonen-NN + PLS 0.76 [191]

Índices de Similitud (Similarity índices) 31 1 PLS 0.734 [192]

CoSASA 30 3a - 0.73 [193]

MQSM 31 4 RLM + PLS 0.727 [194]

E-State and kappa shape index 31 4 RLM 0.720 [195]

MQMS 31 3 RLM + ACP 0.705 [190]

SAMFA-RF 31 - RF 0.689 [196]

SAMFA-PLS 31 4-5 PLS 0.69 [196]

Wagener‟s 31 - Kohonen-NN + BPNN 0.630 [197]

SAMFA-SVM 31 - SVM 0.60 [196]

N: número total de instancias (esteroides) en el conjunto de entrenamiento n: número de componentes en el modelo

Tabla 4.9 Comparación de los modelos QuBiLS-MAS respecto a otros enfoques, considerando las 21 primeras estructuras como conjunto de entrenamiento y las últimas 10 como conjunto de prueba

Modelo QSAR n Ref. Modelo QSAR n Ref.

QuBiLS-MAS Indices 5 0.981 - PARM - 0.806 [198]

QuBiLS-MAS Indices 4 0.963 - Similarity indices 1 0.780 [192]

QuBiLS-MAS Indices 3 0.957 - TDQ 2 0.680 [187]

COMPASS - 0.890 [199] CoMSIA 4 0.665 [200] TARIS 5 0.840 [201] CoMFA 2 0.662 [185] TQSAR 6 0.832 [188] SHAPE matrix 5 0.633 [202] EVA 2 0.830 [203] MS-WHIM 2 0.631 [204] CoMMA 3 0.828 [205] ALPHA 2 0.630 [206] CoMASA 2 0.822 [207] SHESP matrix - 0.628 [202] Tominaga‟s 3 0.807 [208] ESP matrix 1 0.501 [202]

4.4

Conclusiones parciales

En este capítulo se presentaron los resultados del análisis de variabilidad basado en entropía de Shannon, del análisis de independencia lineal mediante la técnica estadística de componentes principales, y de la modelación QSAR ante una actividad específica en un conjunto de datos de 31 instancias. Como conclusión de esta experimentación, se tiene que los descriptores QuBiLS-MAS que se proponen en el presente trabajo 1) tienen un comportamiento de variabilidad superior acorde a varios índices calculados por importantes programas informáticos, como el software DRAGON, por lo que catalogan las moléculas estructuralmente diferentes de forma más relevante; 2) codifican información no redundante respecto a otros descriptores bidimensionales (2D) y geométricos (3D) definidos hasta la fecha; y 3) contribuyen a obtener modelos con poder predictivo comparable respecto a otras metodologías reportadas en la literatura, presentando también un desempeño aceptable en la predicción de propiedades de compuestos no utilizados como serie de entrenamiento.

Conclusiones

1. Los índices moleculares basados en las formas algebraicas lineal, bilineal y cuadrática, extienden satisfactoriamente el procedimiento de cálculo propuesto para las distancias entre átomos y/o enlaces, utilizando por vez primera, operadores matemáticos de agregación distintos a la suma, la identificación por fragmentos locales de átomos, las estrategias de normalización de matrices con enfoques doble estocástico y de probabilidad mutua, así como las restricciones de conectividad aplicadas sobre la matriz operadora para codificar información estructural diferente en las moléculas.

2. Se establece una plataforma común de desarrollo, libre y de código abierto, donde se rediseñaron y recodificaron eficientemente todos los procedimientos de cálculo establecidos hasta la fecha, adicionando nuevas características que contribuyen a la definición de una metodología de cálculo más robusta.

3. La implementación de los algoritmos correspondientes para el cálculo de los índices propuestos, se integró en un software multiplataforma, denominado ToMoCoMD-CARDD QuBiLS-MAS, que permite la configuración, mediante una interfaz gráfica amigable, de todos los parámetros involucrados en la definición de los descriptores e introduce novedosas funcionalidades que facilitan el uso diario de los investigadores.

4. Los diversos experimentos de la química computacional aplicados a los índices propuestos en esta investigación, evidencian que los índices QuBiLS-MAS poseen variabilidad superior a la de otros índices reportados en la literatura, que codifican información química ortogonal respecto a los índices del software DRAGON, y que tienen un desempeño en la modelación de la relación cuantitativa estructura-actividad de comparable a mejor respecto a las metodologías reportadas en la literatura.

Recomendaciones

 Extender los índices moleculares con información geométrica, a partir de relaciones entre dos átomos que consideren métricas diferentes a la Euclidiana como medidas invariantes a la rotación y traslación de la estructura molecular.

 Definir nuevos índices moleculares geométricos que consideren relaciones n- dimensionales entre los núcleos atómicos de una molécula.

 Proponer la implementación en paralelo de los procedimientos necesarios para el cálculo de los descriptores, garantizando la compatibilidad con clústeres y centros de cómputo.

Referencias bibliográficas

[1] Ivan Gutman y Polansky, O.E., Mathematical Concepts in Organic Chemistry. SIAM Review, 1988. 30(2): p. 348-350.

[2] Helm, G.F., The Principles of Mathematical Chemistry: The Energetics of Chemical

Phenomena1897, New York: John Wiley & Sons.

[3] Rogers, D., Computational Chemistry Using the PC, 2003, John Wiley & Sons. [4] Dronskowski, R., Computational Chemistry of Solid State Materials2005: Wiley-VCH.

[5] Todeschini, R. y Consonni, V., Molecular Descriptors for Chemoinformatics. 1st ed, ed. R. Mannhold, H. Kubinyi, y G. Folkers. Vol. 1. 2009, Weinheim: WILEY-VCH. 667.

[6] Marrero Ponce, Y., Total and local (atom and atom type) molecular quadratic indices: significance interpretation, comparison to other molecular descriptors, and QSPR/QSAR applications.

Bioorganic & Medicinal Chemistry, 2004. 12(24): p. 6351-6369.

[7] Marrero-Ponce, Y., Torrens, F., García-Domenech, R., y colaboradores., Novel 2D TOMOCOMD- CARDD molecular descriptors: atom-based stochastic and non-stochastic bilinear indices and their QSPR

applications. J Math Chem, 2008. 44: p. 650-673.

[8] Marrero-Ponce, Y., Martínez-Albelo, E., Casañola-Martín, G., y colaboradores., Bond-based linear indices of the non-stochastic and stochastic edge-adjacency matrix. 1. Theory and modeling of

<i>ChemPhys</i> properties of organic molecules. Molecular Diversity, 2010. 14(4): p. 731-

753.

[9] Kier, L.B. y Hall, L.H., An electrotopological-state index for atoms in molecules. Pharm Res, 1990. 7(8): p. 801-7.

[10] Katritzky, A., Kuanar, M., Slavov, S., y colaboradores., Quantitative Correlation of Physical and

Chemical Properties with Chemical Structure: Utility for Prediction. Chem. Rev., 2010. 110: p.

5714−5789.

[11] Hansch, C., Maloney, P.P., y Fujita, T., Correlation of Biological Activity of Phenoxyacetic Acids

with Hammett Substituent Constants and Partition Coefficients. Nature, 1962. 194: p. 178-180.

[12] Kubinyi, H., QSAR and 3D QSAR in Drug Design: 1. Methodology. Drug Disc. Today, 1997. 2: p. 457-467.

[13] Sutherland, J.J., O'brien, L.A., y Weaver, D.F., A Comparison of Methods for Modeling

Quantitative Structure−Activity Relationships. Journal of Medicinal Chemistry, 2004. 47(22): p. 5541-

5554.

[14] Marrero-Ponce, Y., Torrens, F., Alvarado, Y.J., y colaboradores., Bond-Based Global and Local (Bond and Bond-Type) Quadratic Indices and Their Applications to Computer-Aided Molecular Design. 1.

QSPR Studies of Octane Isomers. J. Comput. Aided Mol. Des., 2006. 20: p. 685-701.

[15] Marrero-Ponce, Y., Total and Local Quadratic Indices of the Molecular Pseudograph´s Atom Adjacency Matrix: Applications to the Prediction of Physical Properties of Organic Compounds.

Molecules, 2003. 8: p. 687-726.

[16] Marrero-Ponce, Y., Huesca-Guillén, A., y Ibarra-Velarde, F., Quadratic indices of the molecular pseudograph's atom adjacency matrix' and their stochastic forms: a novel approach for virtual screening

and in silico discovery of new lead paramphistomicide drugs-like compounds. Journal of Molecular

Structure: THEOCHEM, 2005. 717(1-3): p. 67-79.

[17] Castillo-Garit, J.A., Marrero-Ponce, Y., y Torrens, F., Atom-based 3D-chiral quadratic indices. Part 2: Prediction of the corticosteroid-binding globulinbinding affinity of the 31 benchmark steroids data set. Bioorganic & Medicinal Chemistry, 2006. 14(7): p. 2398-2408.

[18] Castillo-Garit, J.A., Martinez-Santiago, O., Marrero-Ponce, Y., y colaboradores., Atom-based non- stochastic and stochastic bilinear indices: Application to QSPR/QSAR studies of organic compounds.

Chem. Phys. Lett., 2008. 464(1-3): p. 107-112.

[19] Marrero-Ponce, Y., Castillo-Garit, J.A., Castro, E.A., y colaboradores., 3D-chiral (2.5) atom- based TOMOCOMD-CARDD descriptors: theory and QSAR applications to central chirality codification

[21] Cvetkovic, D.M., Doob, M., y Sachs, H., Spectra of Graphs. Theory and Applications. 3rd edition ed1995, Heidelberg: Johann Ambrosius Barth.

[22] Balaban, A., T. (Ed.), Chemical Applications of Graph Theory1976, London: Academic Press. [23] Gutman, I. y Polansky, O.E., Mathematical Concepts in Organic Chemistry1986, Berlin: Springer-Verlag.

[24] Rouvray, D.H., Computational Chemical Graph Theory, ed. D.H.E. Rouvray1990, New York: Nova Science.

[25] Bonchev, D. y Rouvray, D.H., Chemical Graph Theory. Introduction and Fundamentals, ed. D. Bonchev y D.H. Rouvray1991, New York: Abacus Press/ Gordon and Breach Science Publishers.

[26] Mihalic, Z. y Trinajstic, N., J. Chem. Educ., 1992. 69: p. 701.

[27] Devillers, J. y Balaban, A., T., Topological Indices and Related Descriptors in QSAR and QSPR, ed. J.B. Devillers, A. T.,1999, Amsterdam, the Netherlands,: Gordon and Breach.

[28] Kier, L.B. y Hall, L.H., Molecular Connectivity in Chemistry and Drug Research1976, New York: Academic Press.

[29] Kier, L.B. y Hall, L.H., Molecular Connectivity in Structure–Activity Analysis1986, Letchworth, U. K: Research Studies Press.

[30] Kier, L.B. y Hall, L.H., Molecular Structure Description. The Electrotopological State1999, San Diego: Academic Press.

[31] Balaban, A.T., Chiriac, A., Motoc, I., y colaboradores., Steric Fit in Quantitative Structure–

Activity Relations. Lect. Notes Chem. Vol. 15. 1980, Berlin: Springer.

[32] Bonchev, D., Information Theoretic Indices for Characterization of Chemical Structure1983, Chichester, UK: Research Studies Press – Wiley.

[33] Voiculetz, N., Balaban, A.T., Niculescu-Duvaz, I., y colaboradores., Modeling of Cancer Genesis

and Prevention1990, Boca Raton: CRC Press.

[34] Diudea, M.V., QSPR/QSAR Studies by Molecular Descriptors, ed. M.V. Diudea2001, Huntington, N.Y.: Nova Science.

[35] Graovac, A., Gutman, I., y Trinajstic, N., Topological Approach to the Chemistry of Conjugated

Molecules1977, Berlin: Springer.

[36] Dias, J.R., Molecular Orbital Calculations Using Chemical Graph Theory1993, Berlin: Springer. [37] Pólya, G. y Read, R.C., Combinatorial Enumeration of Groups, Graphs, and Chemical

Compounds1987, Berlin: Springer.

[38] Fujita, S., Symmetry and Combinatorial Enumeration in Chemistry1991, Berlin: Springer.

[39] Ivanciuc, O., Canonical Numbering and Constitutional Symmetry., in The Encyclopedia of

Computational Chemistry, P.V.R. Schleyer, y colaboradores., Editors. 1998, John Wiley and Sons:

Chichester. p. 167.

[40] Temkin, O.N., Zeigarnik, A.V., y Bonchev, D., Chemical Reaction Networks. A Graph-

Theoretical Approach1996, Boca Raton: CRC Press.

[41] Koča, J.K., M.; Kvasnička, V.; Matyska, L.; Pospýchal, J. 1989., Synthon Model of Organic

Chemistry and Synthesis Design, . Lect. Notes Chem. . Vol. 51. 1989, Berlin: Springer.

[42] Brown, D., Topology and Chemistry. Structural Chemistry. 13(3–4): p. 339–355. [43] Francl, M., Stretching topology. Nature Chemistry, 2009. 1: p. 334–335.

[44] Gálvez, J. y García, R., Diseño de fármacos por conectividad molecular. (Monografía)1994, Madrid: Farmaindustria. 355.

[45] Grover, M., Singh, B., Bakshi, M., y colaboradores., Pharm. Sci. Technol. Today, 2000. 3: p. 28. [46] González-Díaz, H. y Uriarte, E., Proteins QSAR with Markov average electrostatic potentials.

Bioorganic & Medicinal Chemistry Letters, 2005. 15(22): p. 5088-5094.

[47] Ramos De Armas, R., González Díaz, H., Molina, R., y colaboradores., Markovian Backbone Negentropies: Molecular Descriptors for Protein Research. I. Predicting Protein Stability in Arc Repressor

Mutants. PROTEINS: Structure, Function, and Bioinformatics, 2004. 56: p. 715–723.

[48] Marrero-Ponce, Y., Total and Local Quadratic Indices of the Molecular Pseudograph's Atom Adjacency Matrix: Applications to the Prediction of Physical Properties of Organic Compounds.

Molecules, 2003. 8(9): p. 687-726.

[49] Zefirov, N., Kirpichenok, M., Izmailov, F., y colaboradores., Scheme for the Calculation of the

Electronegativities of Atoms in a Molecule in the Framework of Sanderson Principle. Dokl. Akad. Nauk

[50] Carbo-Dorca, R., Stochastic Transformation of Quantum Similarity Matrixes and Their Use in

Quantum QSAR (QQSAR) Models. Int. J. Quantum Chem., 2000. 79(3): p. 163-177.

[51] Edwards, C.H. y Penney, D.E., Elementary linear algebra1988, Englewoods Cliffs: Prentice Hall. [52] Randic, M., J. Math. Chem., 1990. 4: p. 157.

[53] Balaban, A., T. (Ed.), From Chemical Topology to Three-Dimensional Geometry1997, New York: Plenum.

[54] Rouvray, D.H., in Mathematical and Computational Concepts in Chemistry, N. Trinajstic, Editor 1986, Ellis Horwood: Chichester. p. 295-306.

[55] Hansen, P.J. y Jurs, P.C., J. Chem. Educ., 1988. 65: p. 574.

[56] Randic, M., Encyclopedia of Computational Chemistry, ed. P.V.R. Schleyer. Vol. 5. 1998, New York: John Wiley & Sons. 3018-3032.

[57] Kier, L.B. y Hall, L., The electrotopological state: structure modeling for QSAR and data base

analysis, in Topological Indices and Related Descriptors in QSAR and QSPR, J. Devillers y A.T. Balaban,

Editors. 1999, Gordon and Breach Sci. Pub.: Amsterdam. p. 491-562.

[58] Mokrosz, J.L., Duszynska, B., y Strekowski, L., Pharmazie, 1992. 47: p. 538.

[59] A.R. Katritzky y Gordeevat, E.V., Traditional Topological Indices vs Electronic, Geometrical,

and Combined Molecular Descriptors in QSAR/QSPR Research. J. Chem. Inf. Comput. Sci., 1993. 33: p.

835-857

[60] Balaban, A., T., SAR QSAR Environ. Res., 1998. 8: p. 1. [61] Balaban, A.T., J. Chem. Inf. Comput. Sci., 1992. 32: p. 23.

[62] Todeschini, R. y Consonni, V., Handbook of molecular descriptors2000, Weinheim: Germany: Wiley VCH.

[63] Wiener, H., J. Am. Chem. Soc., 1947. 69: p. 17. [64] Hosoya, H., Bull. Chem. Soc. Japan, 1971. 44: p. 2332. [65] Balaban, A.T., Theor. Chim. Acta, 1979. 5: p. 239.

[66] Mohar, B., Babic, D., y Trinajstic, N., J. Chem. Inf. Comput. Sci., 1993. 33: p. 153. [67] Gutman, I. y Mohar, B., J. Chem. Inf. Comput. Sci., 1996. 36: p. 982.

[68] Ivanciuc, O., Balaban, T.S., y Balaban, A.T., J. Math. Chem., 1993. 12: p. 309. [69] Diudea, M.V., J. Chem. Inf. Comput. Sci., 1996. 36: p. 535.

[70] Diudea, M.V., J. Chem. Inf. Comput. Sci., 1996. 36: p. 833. [71] Platt, J.R., J. Chem. Phys., 1947. 15: p. 419.

[72] Gutman, I., Ruscic, B., Trinajstic, N., y colaboradores., J. Chem. Phys., 1975. 62: p. 3399. [73] Kier, L.B. y Hall, L.H., J. Chem. Inf. Comput. Sci., 2000. 40: p. 792.

[74] Randic, M., J. Am. Chem. Soc., 1975. 97: p. 6609.

[75] Hall, L.H. y Kier, L.B., J. Chem. Inf. Comput. Sci., 1991. 31: p. 76. [76] Hall, L.H. y Kier, L.B., Quant. Struc.-Act. Relat. , 1991. 10: p. 43.

[77] Carrasco, R., Padrón, J.A., y Gálvez, J., Definition of a novel atomic index for QSAR: the

refractotopological state. J. Pharm. Pharmaceut. Sci., 2004. 7(1): p. 19-26.

[78] Marrero Ponce, Y., Cabrera Perez, M.A., Romero Zaldivar, V., y colaboradores., A new topological descriptors based model for predicting intestinal epithelial transport of drugs in Caco-2 cell

culture. J. Pharm. Pharm. Sci., 2004. 7(2): p. 186-99.

[79] Marrero-Ponce, Y., Linear indices of the "molecular pseudograph's atom adjacency matrix": definition, significance-interpretation, and application to QSAR analysis of flavone derivatives as HIV-1

integrase inhibitors. J. Chem. Inf. Comput. Sci., 2004. 44(6): p. 2010-2026.

[80] Marrero-Ponce, Y., Total and local (atom and atom type) molecular quadratic indices: significance interpretation, comparison to other molecular descriptors, and QSPR/QSAR applications.

Bioorg. Med. Chem., 2004. 12: p. 6351-6369.

[81] Marrero-Ponce, Y., Cabrera, M., A., Romero, V., y colaboradores., Total and Local Quadratic Indices of the “Molecular Pseudograph‟s Atom Adjacency Matrix”. Application to Prediction of Caco-2

Permeability of Drugs. Int. J. Mol. Sci., 2003. 4: p. 512-536.

[82] Marrero-Ponce, Y., Castillo-Garit, J.A., Olazabal, E., y colaboradores., TOMOCOMD-CARDD, a novel approach for computer-aided 'rational' drug design: I. Theoretical and experimental assessment of a

[83] Marrero-Ponce, Y., Castillo-Garit, J.A., Olazabal, E., y colaboradores., Atom, atom-type and total molecular linear indices as a promising approach for bioorganic and medicinal chemistry: theoretical and experimental assessment of a novel method for virtual screening and rational design of new lead

anthelmintic. Bioorg. Med. Chem., 2005. 13(4): p. 1005-1020.

[84] Marrero-Ponce, Y., Castillo-Garit, J.A., Torrens, F., y colaboradores., Atom, Atom-Type, and Total Linear Indices of the ¨Molecular Pseudograph´s Atom Adjacency Matrix¨: Application to QSPR/QSAR

Studies of Organic Compounds. Molecules, 2004. 9: p. 1100-1123.

[85] Balaban, A.T. y Balaban, T.S., J. Chem. Phys., 1992. 89: p. 1735. [86] Balaban, A., T., Croat. Chem. Acta, 1993. 66: p. 447.

[87] Balaban, A., T., Local versus Global (i.e. Atomic versus Molecular) Numerical Modeling of

Molecular Graphs. J. Chem. Inf. Comput. Sci., 1994. 34: p. 398.

[88] Balaban, A.T. y Balaban, T.S., J. Math. Chem., 1991. 8: p. 383.

[89] Balaban, A.T. y Diudea, M., J. Chem. Inf. Comput. Sci., 1999. 42: p. 3308. [90] Diudea, M., Minailiuc, O., y Balaban, A.T., J. Comput. Chem., 1991. 12: p. 527. [91] Randic, M., J. Math. Chem., 1991. 7: p. 155.

[92] Basak, S.C., Magnuson, V.R., Niemi, G.J., y colaboradores., Discrete Appl. Math., 1988. 19: p. 17.

[93] Lajiness, M.S., in Computational Chemical Graph Theory, D.H. Rouvray, Editor 1990, Nova Sci.: New York. p. 299.

[94] Basak, S.C. y Grunwald, G.D., J. Chem. Inf. Comput. Sci., 1995. 35: p. 366. [95] Basak, S.C. y Grunwald, G.D., SAR QSAR Environ. Res., 1994. 2: p. 289. [96] Basak, S.C. y Grunwald, G.D., SAR QSAR Environ. Res., 1995. 3: p. 265. [97] Basak, S.C. y Gute, B.D., SAR QSAR Environ. Res., 1997. 7: p. 1.

[98] Grassy, G., Calas, B., Yasri, A., y colaboradores., Nature Biotech., 1998. 16: p. 748.

[99] Devillers, J. y Karcher, W., Applied Multivariate Analysis in SAR and Environmental Studies1991, Dordrecht ,The Netherlands: Kluwer Academic Publishers for the European Communities.

[100] Frank, I.E. y Todeschini, R., The Data Analysis Handbook1994, Amsterdam, The Netherlands: Elsevier.

[101] Massart, D.L., Vandeginste, B.G.M., Buydens, L., y colaboradores., Handbook of Chemometrics

and Qualimetrics. Part A1997, Amsterdam, The Netherlands: Elsevier.

[102] Massart, D.L., Vandeginste, B.G.M., Buydens, L., y colaboradores., Handbook of Chemometrics

and Qualimetrics. Part B1998, Amsterdam, The Netherlands: Elsevier.

[103] Rumelhart, D.E., Hinton, G.E., y Williams, R.J., Learning Representation by Back-Propagating

Errors. Nature, 1986. 323: p. 533-536.

[104] Vapnik, V., The Nature of Statistical Learning Theory1995, New York, USA: Springer.

[105] J W Godden, F L Stahura, y Bajorath, J., Variability of Molecular Descriptors in Compound

Databases Revealed by Shannon Entropy Calculations. J. Chem. Inf. Comput. Sci., 2000. 40( ): p. 796-800.

[106] J W Godden y Bajorath, J., Chemical Descriptors with Distinct Levels of Information Content and Varying Sensitivity to Differences between Selected Compound Databases Identified by SE-DSE Analysis.

J. Chem. Inf. Comput. Sci., 2002. 42: p. 87-93.

[107] Shannon., C.E., A Mathematical Theory of Communication. The Bell System Technical Journal, 1948. 27: p. 379-423, 623-656.

[108] Barigye, S.J., Marrero-Ponce, Y., Martínez López, Y., y colaboradores., Relations Frequency

Hypermatrices in Mutual, Conditional and Joint Entropy-Based Information Indices. J. Comput. Chem.,

2013. 34: p. 259-274.

[109] Massey, W.F., Principal components regression in exploratory statistical research. Journal of the American Statistical Association, 1965. 60: p. 234–256.

[110] Mardia, K.V., Kent, J.T., y Bibby, J.M., Multivariate Analysis1979, London: Academic Press. [111] Seber, G., A. F., Linear Regression Analysis 1977, New York: John Wiley & Sons.

[112] Alzina, R.B., Introduccion conceptual al análisis multivariable. Un enfoque informatico con los

paquetes SPSS-X, BMDP, LISREL Y SPAD. Vol. 1. 1989, Barcelona: PPU, SA. 202-264.

[113] Altman, D.A., Practical statistics for medical research. 1th ed1997, London: Chapman & Hall. [114] Frank, I.E. y Friedman, J.H., A Statistical View of Some Chemometrics Regression Tools.

[115] Kubinyi, H., Evolutionary variable selection in regression and PLS analyses. J. Chemom., 1996.

10: p. 119–133.

[116] Norusis, M.J., Advanced Statistics Guide. SPSS-X1985, New York: McGraw-Hill. 45-48. [117] Belsey, D.A., Kuh, E., y Welsch, R.E., Regression Diagnostics1980, New York: Wiley. [118] Statistica Version. 6.0 Statsoft, I.: Tulsa.

[119] Basak, S.C., Balaban, A.T., Grunwald, G.D., y colaboradores., J. Chem. Inf. Comput. Sci., 2000.

40: p. 891.

[120] Patel, H. y Cronin, M.T.D., J. Chem. Inf. Comput. Sci., 2001. 41: p. 1228.

[121] Cronin, M.T. y Schultz, T.W., Pitfalls in QSAR. J. Mol. Struct. (Theochem). 2003. 622: p. 39-51. [122] Taylor, J.R., An Introduction to Error Analysis, 1997, University Science Books: Sausolito, California. p. 166-8.

[123] Ross, S., in J. Engr. Technology2003, University of New Haven: New Haven.

[124] Egan, W.J. y Morgan, S.L., Outlier detection in multivariate analytical chemical data. Anal. Chem., 1998. 70: p. 2372-2379.

[125] Koji Kadota, Tomokazu Konishi, y Shimizu, K., Evaluation of Two Outlier-Detection-Based

Methods for Detecting Tissue-Selective Genes from Microarray Data. Gene Regul Syst Bio, 2007. 1: p. 9–

15.

[126] Gang Wu, Iwona Pawlikowska, Tanja Gruber, y colaboradores., Subgroup and outlier detection

analysis. BMC Bioinformatics, 2013. 14((Suppl 17): A2).

[127] Kier, L.B., J. Pharm. Sci., 1980. 69: p. 416.

[128] Cativiela, C., Garcia, J.I., Fernandez-Alvarez, E., y colaboradores., Acta Cim. Hung., 1992. 130: p. 129.

[129] Ogino, A., Matsumura, S., y Fujita, T., J. Med. Chem., 1980. 23: p. 437.

[130] Wold, S. y Erikson, L., Statistical Validation of QSAR Results. Validation Tools, in Chemometric

Methods in Molecular Design, H. van de Waterbeemd, Editor 1995, VCH Publishers: Weinheim. p. 309-

318.

[131] Wold, S., Technometrics, 1978. 20: p. 397. [132] Stone, M., J. Roy. Stat. Soc., 1974. 36: p. 111. [133] Shao, J., J. Amer. Stat. Assoc., 1993. 88: p. 486.

[134] Rose, K., Hall, L.H., y Kier, L.B., Modeling blood-brain barrier partitioning using the

electrotopological state. J Chem Inf Comput Sci, 2002. 42(3): p. 651-66.

[135] Leger, C., Politis, D.N., y Romano, J.P., Bootstrap Technology and Applications. Technometrics, 1992. 34: p. 378-397.

[136] Shao, J., Bootstrap Model Selection. J. Amer. Statist. Assoc., 1996. 91: p. 655-665.

[137] Tropsha, A., Gramatica, P., y Gombar, V.K., The importance of being earnest: Validation is the

absolute essential for successful application and interpretation of QSPR models. QSAR Comb. Sci., 2003.

22: p. 69–77.

[138] Van De Waterbeemd, H., Chemometric Methods in Molecular Design (Methods and Principles in

Medicinal Chemistry), ed. H. van de Waterbeemd1995, New York: John Wiley & Sons.

[139] Cruciani G, Baroni M, Clementi S, y colaboradores., Predictive ability of regression models. Part

I: Standard deviation of prediction errors (SDEP). Journal of Chemometrics, 1992. 6(6): p. 335–346.

[140] J. Devillers y Balaban, A.T., Topological Indices and Related Descriptors in QSAR and QSPR

1999, Amsterdam, The Netherlands: Gordon and Breach.

[141] Trinajstic, N., Chemical Graph Theory1983, Florida, USA: CRC Press. 184. [142] Ivanciuc, O., Rev. Roum. Chim., 2000. 45: p. 289.

[143] M. Nic, J. Jirat, y Kosata, B., IUPAC. Compendium of Chemical Terminology, 2nd ed. (the "Gold

Book", ed. A.D.M.a.A. Wilkinson1997, Oxford: Blackwell Scientific Publications.

[144] Marrero-Ponce, Y., Huesca-Guillén, A., y Ibarra-Velarde, F., Quadratic indices of the molecular pseudograph's atom adjacency matrix and their stochastic forms: a novel approach for virtual screening

and in silico discovery of new lead paramphistomicide drugs-like compounds. J. Mol.

Struct.(THEOCHEM), 2005. 717(1-3): p. 67-79.

[147] Broto, P. y Devillers, J., eds. Practical Applications of Quantitative Structure-Activity

Relationships (QSAR) in Environmental Chemistry and Toxicology. . ed. W. Karcher y J. Devillers1990,

Kluwer Dordrecht. 105-127.

[148] Todeschini, R. y Gramatica, P., Perspect Drug Dis Des, 1998. 355: p. 9 –11.

[149] Bondi, A., van der Waals Volumes and Radii. The Journal of Physical Chemistry, 1964. 68(3): p. 441-451.

[150] Nagle, J.K., Atomic polarizability and electronegativity. Journal of the American Chemical Society, 1990. 112(12): p. 4741-4747.

[151] Pauling, L., The Nature of Chemical Bond, 1939, Cornell University: New York.

[152] Ghose, A.K. y Crippen, G.M., Atomic physicochemical parameters for three-dimensional structure-directed quantitative structure-activity relationships. I. Partition coefficients as a measure of

hydrophobicity. J. Comput. Chem., 1986. 7: p. 565-577.

[153] Gasteiger, G. y Marsili, M., Iterative partial equalization of orbital electronegativity - a rapid

access to atomic charges. Tetrahedron, 1980. 36(22): p. 3219-3228.

[154] Ertl, P., Rohde, B., y Selzer, P., Fast Calculation of Molecular Polar Surface Area as a Sum of

Documento similar