• No se han encontrado resultados

3. ENFOQUE BASADO EN CASOS EN LA TOMA DE DECISIONES CLÍNICAS

3.5 Conclusiones finales del capítulo

Se propone un enfoque basado en casos para la toma de decisiones diagnóstica en la admisión de un nuevo paciente el cual se evaluó utilizando criterio de expertos.

En la implementación del enfoque basado en casos se concibe una organización de la base de casos a partir de los agrupamientos de UE predictoras de las HCE lo cual facilita la recuperación y el acceso a los casos, al reducir el espacio de búsqueda explorado para obtener los casos más semejantes a un problema nuevo con una complejidad 𝑂(𝑘𝑛), en la práctica 𝑘 ≪ 𝑛.

El conocimiento del dominio de aplicación utilizado permite inferir como solución diagnósticos posibles ordenados, como una guía de posibilidades que deben descartarse en ese orden. El enfoque presentado obtiene hipótesis diagnósticas en tiempo real, ya que sólo utiliza la información obtenida por el experto a la llegada del paciente.

La fase de revisión permite retroalimentar la inferencia realizada y utilizar información adicional sólo en los casos que detecta una posible inconsistencia en la solución obtenida por el módulo adaptador.

74

CONCLUSIONES

Como resultado del presente trabajo se desarrolló un modelo para el descubrimiento de conocimiento en HCE basadas en el estándar CDA-HL7, que define la estructura y la semántica de un documento clínico. El modelo integra el agrupamiento de HCE combinando estructura- contenido y el razonamiento basado en casos, fue implementado en su primera versión y validado usando criterios de expertos a partir de casos de estudios propuestos por especialistas del Hospital Provincial “Celestino Hernández Robau”; el cual contribuye a la toma de decisiones de forma eficaz que realiza el especialista y constituye un entrenador para estudiantes de Medicina en la Propedéutica Clínica.

- Para facilitar el agrupamiento soportando estructura y contenido que parte de la metodología para el agrupamiento de documentos semi-estructurados XML, efectiva para documentos en los que estructuralmente se distinguen secciones con significado semántico, como la HCE; se utiliza OverallSimSUX que posibilita capturar el grado de similitud existente entre las Unidades Estructurales definidas en las HCE.

- El cálculo automático de los pesos de cada UE, permite alcanzar valores de precisión que no difieren de los alcanzados con la ponderación realizada por los expertos, lográndose la granularidad requerida que satisface los requerimientos de los especialistas.

- El enfoque basado en casos concibe una organización de la base de casos a partir de los agrupamientos de UE predictoras de las HCE; de esa forma se facilita el acceso y recuperación de los casos más similares al nuevo problema, reduciendo el espacio de búsqueda explorado para obtener los casos más semejantes a un problema nuevo.

- El conocimiento del dominio de aplicación utilizado permite inferir como solución diagnósticos posibles ordenados, como una guía de posibilidades que deben descartarse en ese orden. El enfoque basado en casos desarrollado obtiene hipótesis diagnósticas tempranas, ya que sólo utiliza la información obtenida por el experto a la llegada del paciente; los módulos de revisión y reuso permiten retroalimentar la inferencia realizada, al detectar posibles inconsistencias e incorporar el nuevo caso una vez que se tenga el diagnóstico definitivo.

75

RECOMENDACIONES

 Evaluar el efecto de la aplicación del modelo a otras áreas de asistencia, en las que puedan identificarse UE específicas al contexto de aplicación.

 Estudiar el efecto de utilizar otros enfoques de agrupamiento; en particular el incremental y sus potencialidades en la fase de adición.

76

REFERENCIAS BIBLIOGRÁFICAS

AAMODT, A. 1991. A knowledge-intensive, integrated approach to problem solving and sustained learning. Knowledge Engineering and Image Processing Group. University of Trondheim, 27-85.

AGGARWAL, C. C. & REDDY, C. K. 2013. Data clustering: algorithms and applications, CRC Press.

ALONSO, O. E. 2014. Implementación del modelo RIM de HL7 v3 en orientación a objetos y su uso en procesos de interoperabilidad semántica.

ANDERBERG, M. R. 1973. Clustering Analysis for Applications, New York: Academic. ARCO, L. 2009. Agrupamiento basado en la intermediación diferencial y su valoración

utilizando la teoría de los conjuntos aproximados. Doctorado en Ciencias Técnicas, Universidad Central "Marta Abreu" de Las Villas.

ARUQUIPA, C. M. G. 2014. Modelo para la Recuperación de Datos de Expedientes Clínicos mediante HL7. Revista del Postgrado en Informática, 148.

ÁVILA, A. M., VIÑAS, G. A. M., MERCADO, P. E., BLANCO, N. A. U. & RUEDA, A. E. 2012. Inteligencia antificial: sistema experto para ayuda en el diagnóstico de anemias (SEADA). Revista Científica Salud Uninorte.

AZÁN-BASALLO, Y., BRAVO-GARCÍA, L., ROSALES-ROMERO, W., TRUJILLO- MÁRQUEZ, D., GARCÍA-ROMERO, E. A. & PIMENTEL-RIVERO, A. 2014. Solución basada en el Razonamiento Basado en Casos para el apoyo a las auditorías informáticas a bases de datos Solution based on Case-Based Reasoning for supporting a computer auditing database. Revista Cubana de Ciencias Informáticas, 8.

BALDIZZONI, E. 2013. Un proceso de transformación de datos para proyectos de explotación de información Licenciado en sistemas Universidad Nacional de Lanus.

BAREISS JR, E. R. 1988. Protos: a unified approach to concept representation, classification, and learning.

BARRETO , P. J. 2015. La historia clínica: documento científico del médico.

BATCHELOR, B. 1978. Pattern Recognition: Ideas in Practice, New York, Plenum Press. BATEMAN, J. A. 1990. Upper modeling: Organizing knowledge for natural language

processing. DTIC Document.

BERRY, M. W. 2004. Survey of Text mining: Clustering, Classification, and Retrieval, New York, USA, Springer Verlag.

BLUMENTHAL, D. & TAVENNER, M. 2010. The “meaningful use” regulation for electronic health records. New England Journal of Medicine, 363, 501-504.

BONILLO, M. L. 2003. Razonamiento Basado en Casos aplicado a Problemas de Clasificación. Ph. D. thesis, Universidad de Granada.

C.D., M., RAGHAN, P. & SCHÜTZE, H. Introduction to Information Retrieval. 2008 Cambridge University Press.

77 CABARCAS, A., PUELLO, P. & MARTELO, R. J. 2015. Sistema de Información Soportado en Recuperación XML para Pequeñas y Medianas Empresas (PYME) de Cartagena de Indias, Colombia. Información tecnológica, 26, 135-144.

CAMPS, J., GARRELL, J. M., GOLOBARDES, E. & VERNET, D. 2009. Diseño de Funciones de Similitud para el Razonamiento Basado en Casos usando Programación Genética: estudio con problemas sintéticos.

CASTRILLÓN, H., GONZÁLEZ SERRANO, C. & LÓPEZ-GUTIERREZ, D. M. 2014. Modelo arquitectónico para interoperabilidad entre instituciones prestadoras de salud en Colombia.

CIRERA, S. L., RODRÍGUEZ, B. M., MADRIGAL, D. T. E., CARRILLO, P. J., HASIAK, S. A., AUGUSTO, B. R., TOBÍAS, G. A. & NAVARRO, S. C. 2006. Correspondencia entre CIE-10 y CIE-9 para las listas de causas de muerte del Instituto Nacional de Estadística y de la Región de Murcia. Revista española de salud pública, 80, 157-175. CORDERO, M. D., RUIZ , C. Y. & TORRES , R. Y. 2013. Sistema de Razonamiento Basado

en Casos para la identificación de riesgos de software. Revista Cubana de Ciencias Informáticas, 7, 222-239.

CORONA, M. L., IGLESIAS, L. & ESPINOSA, B. A. 2010. Sistema de tareas docentes para la formación de la habilidad toma de decisiones médicas mediante el método clínico. Medisur, 8, 426-436.

CORVETTO, M., BRAVO, M. P., MONTAÑA, R., UTILI, F., ESCUDERO, E., BOZA, C., VARAS, J. & DAGNINO, J. 2013. Simulación en educación médica: una sinopsis. Revista médica de Chile, 141, 70-79.

CRISTIANINI, N., SHAWE-TAYLOR, J. & LODHI, H. 2002. Latent semantic kernels. JJIS’2002, 18.

CRUAÑES VILAS, J., ROMÁ FERRI, M. T. & LLORET, E. 2012. Análisis del uso de métodos de similitud léxica con conocimiento semántico superficial para mapear la información de enfermería en español.

CRUZ HERNÁNDEZ, J., HERNÁNDEZ GARCÍA, P., ABRAHAM MARCEL, E., DUEÑAS GOBEL, N. & SALVATO DUEÑAS, A. 2012. Importancia del método clínico. Revista Cubana de Salud Pública, 38, 422-437.

CHAHAL, M. & SINGH, J. 2013. Importance of Similarity Measures in Query Optimization: A Review. International Journal of Science, Engineering and Computer Technology, 3, 103.

CHEN, K. & LIU, L. ClusterMap: labeling clusters in large datasets via visualization. Proceedings of the ACM IEEE 13th Conference on Information and Knowledge Management (CIKM 2004), 2004 Washington, D.C., 285-293.

CHENG, D., VEMPALA, S., KANNAN, R. & WANG, G. A divide-and-merge methodology for clustering. Proceedings of the 24th ACM SIGMOD SIGACT SIGART Symposium on Principles of Database Systems (PODS 2005), 2005 Baltimore, Maryland. ACM Press, 196-205.

DALAMAGAS, T., CHENG, T., WINKEL, K.-J. & SELLIS, T. 2006. A Methodology for Clustering XML Documents by Structure. Information Systems.

78 DE LA ROSA, T. T. 2009. Razonamiento Basado en Casos Aplicado a la Planificación

Heurística. Php DOCTORAL, Universidad Carlos III de Madrid.

DEL RÍO CRESPO, É. A., CARVAJAL, P. A. G. & GARCÉS, S. A. C. 2015. con la implementación del uso de soluciones estandarizadas.

DENNY, J. C., SPICKARD, A., JOHNSON, K. B., PETERSON, N. B., PETERSON, J. F. & MILLER, R. A. 2009. Evaluation of a method to identify and categorize section headers in clinical documents. Journal of the American Medical Informatics Association, 16, 806-815.

DÍAZ , A. M. B. 2004. Una aproximación ontológica al desarrollo de sistemas de razonamiento basado en casos.

DÍAZ NOVÁS, J. 2008. El tratamiento médico: experiencia, base teórica y método. Revista Habanera de Ciencias Médicas, 7, 0-0.

DIXON, M. 1997. An overview of document mining technology. http://www.geocities.com/ResearchTriangle/Thinktank/1997/mark/writings/dixm97_d m.ps.

DOLIN, R. H., ALSCHULER, L., BEEBE, C., BIRON, P. V., BOYER, S. L., ESSIN, D., KIMBER, E., LINCOLN, T. & MATTISON, J. E. 2001. The HL7 clinical document architecture. Journal of the American Medical Informatics Association, 8, 552-569. DOLIN, R. H., ALSCHULER, L., BOYER, S., BEEBE, C., BEHLEN, F. M., BIRON, P. V. &

SHABO, A. 2006. HL7 clinical document architecture, release 2. Journal of the American Medical Informatics Association, 13, 30-39.

DOUCET, A. & AHONENMYKA, H. 2002. Naive clustering of a large XML document collection. INEX, 84-89.

DUCH, W. 2002. Similarity-based methods: a general framework for classification. Control and Cybernetics, 29, 937-968.

DUEÑAS, L. F. G. 2007. XML, la base de la interoperabilidad en los sistemas de información documental. Revista Códice Vol, 3, 105-127.

DUNN, J. 1974. A fuzzy relative isodata process and its use in detecting compact well-separated clusters. Journal of Cybernetics, 3, 32-57.

EL-SAYED, M. A. 2013. NEW SIMILARITY MEASURE BASED ON MINKOWSKI DISTANCE AND ITS APPLICATIONS IN FACE RECOGNITION. Advances in Computer Science and Engineering, 11, 1.

EYSENBACH, G. 2008. Medicine 2.0: social networking, collaboration, participation, apomediation, and openness. Journal of medical Internet research, 10.

FRAKES, W. B. & BAEZA-YATES, R. 1992. Information Retrieval. Data Structure & Algorithms, New York, Prentice Hall.

FUENTES, I. E., MAGDALENO, D. & GARCÍA, M. M. 2015. Metodología para asistir la toma de decisiones diagnóstica a partir del descubrimiento del conocimiento implícito en Historias Clínicas. 29.

FUKUHARA, T., TAKEDA, H. & NISHIDA, T. Multiple-text summarization for collective knowledge formation. Proceedings of the IEEE International Conference om Systems, Man and Cybernetics, 1999 Tokyo. IEEE Press.

79 GARCIA, E. 2006. Cosine similarity and term weight tutorial. Information retrieval

intelligence, 5.

GIANNOPOULOS, P. & VELTKAMP., R. C. A Pseudo-Metric for Weighted Point Sets. In Proceedings of the 7th European Conference on Computer Vision (ECCV), 2002. 715– 730.

GROSSMAN, D. A. & FRIEDER, O. 2012. Information retrieval: Algorithms and heuristics, Springer Science & Business Media.

GUERRA, G. A., VEGA, P. S. & RUIZ, S. J. 2012. Algoritmos de Agrupamiento Conceptuales: Un estado del arte. Reconocimiento de Patrones. Reporte Técnico.

GUERRINI, G., MESITI, M. & SANZ, I. 2006. An Overview of Similarity Measures for Clustering XML Documents.

GUZMÁN, F. & ARIAS, C. A. 2012. La historia clínica: elemento fundamental del acto médico. Rev Colomb Cir, 27, 15-24.

HAND, D. J. 1981. Discrimination and classification, John Wiley and Sons.

HANNEY, K., KEANE, M., SMYTH, B. & CUNNINGHAM, P. 1995. Systems, tasks and adaptation knowledge: Revealing some revealing dependencies. Case-Based Reasoning Research and Development. Springer.

HATCHER, E., GOSPODNETIC, O. & MCCANDLESS, M. 2009. Lucene in Action.

HERNANDEZ, V. S. 2009. Tecnologias de la informacion y el conocimiento [Online]. GestioPolis.

HÖPPNER, F. 1999. Fuzzy cluster analysis: methods for classification, data analysis and image recognition, John Wiley & Sons.

HÖPPNER, F., KLAWONN, F., KRUSE, R. & RUNKLER, T. 1999. Fuzzy cluster analysis: methods for classification, data analysis and image recognition., West Sussex, England, John Wiley & Sons Ltd.

HUANG, A. Similarity measures for text document clustering. Proceedings of the sixth new zealand computer science research student conference (NZCSRSC2008), Christchurch, New Zealand, 2008. 49-56.

HUNTER, L. & COHEN, K. B. 2006. Biomedical language processing: what's beyond PubMed? Molecular cell, 21, 589-594.

ILIZÁSTIGUI , D. F. 2000. El método clínico: muerte y resurrección. Educación Médica Superior, 14, 109-127.

KARMARKAR, N. 1984. A new polynomial-time algorithm for linear programming. Proceedings of the 16th Annual ACM Symposium on the Theory of Computing.

KAUFMAN, L. & ROUSSEEUW, P. J. 1990. Finding groups in data: an introduction to cluster analysis, John Wiley and Sons.

KOLODNER, J. 1993. Case-Based Reasoning. Morgan Kaufmann Publishers

KOLODNER, J. & LEAKE, D. 1996. A tutorial introduction to case-based reasoning.

KRUSE, R., DÖRING, C. & LESOR, M.-J. 2007. Fundamentals of Fuzzy Clustering. In: OLIVEIRA, J. V. D. & PEDRYCZ, W. (eds.) Advances in Fuzzy Clustering and its Applications. Est Sussex, England: John Wiley and Sons.

80 KUNA, H., MARTIN, R., MARTINI, E. & SOLONEZEN, L. 2014. Desarrollo de un Sistema de Recuperación de Información para Publicaciones Científicas del Área de Ciencias de la Computación. Revista Latinoamericana de Ingenieria de Software, 2, 107-114. KURGAN, L., SWIERCZ, W. & CIOS, K. J. Semantic mapping of xml tags using inductive

machine learning. 11th International Conference on Information and Knowledge Management., 2002 Virginia, USA.

KUTTY, S., TRAN, T., NAYAK, R. & LI, Y. Combining the structure and content of XML documents for clustering using frequent subtrees. Workshop of the INitiative for the Evaluation of XML Retrieval, 2008.

LANQUILLON, C. 2001. Enhancing Text Classification to Improve Information Filtering. PhD. thesis, University of Magdeburg "Otto von Guericke".

LAPUENTE, M. J. L. 2013. Hipertexto, el nuevo concepto de documento en la cultura de la imagen. Universidad Complutense de Madrid.

LEMON, M. J., CASTELLANOS, M. & STINGER, J. R. 2005. Method for content mining of semi-structured documents. Google Patents.

LEWIS, D. D. & RINGUETTE, M. A comparison of two learning algorithms for text categorization. Third annual symposium on document analysis and information retrieval, 1994. 81-93.

LOPEZ, D. M. R. & PLAZA, E. 1997. Case ‐Based Reasoning: an overview. AI communications, 10, 21-29.

LORENZO, M. M. G. & BELLO, R. E. P. 1996. A model and its different applications to case- based reasoning. Knowledge-based systems, 9, 465-473.

LOZANO, L. & FERNÁNDEZ, J. 2008. Razonamiento basado en casos: Una vision general. Recuperado el.

MAGDALENO, D., FUENTES, I. E. & GARCÍA, M. M. 2015a. Clustering XML Documents Using Structure and Content based on a New Similarity Function OverallSimSUX. Computación y Sistemas, 19, 151-161.

MAGDALENO, D., I.E. FUENTES, AND M.M. GARCÍA 2013. Sistema para el Agrupamiento de Artículos Científicos en formato XML usando Lucene (LucXML). N.R. 3267-2013, Editor.

MAGDALENO, D. G., MIRANDA, Y., FUENTES, I. E. & GARCÍA, M. M. 2015b. Comparative Study of Clustering Algorithms using OverallSimSUX Similarity Function for XML Documents. Inteligencia artificial: Revista Iberoamericana de Inteligencia Artificial, 18, 69-80.

MARTÍNEZ-COSTA, C., MENÁRGUEZ-TORTOSA, M. & FERNÁNDEZ-BREIS, J. T. 2010. An approach for the semantic interoperability of ISO EN 13606 and OpenEHR archetypes. Journal of biomedical informatics, 43, 736-746.

MENÁRGUEZ, T. M. 2013. Modelos de representación de arquetipos en sistemas de información sanitarios. Proyecto de investigación:.

MESA, R. Y. 2006. De la gestión de información a la gestión del conocimiento. Acimed, 14, 0- 0.

81 MICHALSKI, R. S., STEPP, R. E. & DIDAY, E. 1981. A recent advance in data analysis: clustering objects into classes characterized by conjuntive concepts. Progress in Pattern Recognition, 1, 33-56.

MLADENIC, D. & GROBELNIK, M. Feature selection for classification based on text hierarchy. Working Notes of Learning from Text and the Web: Conference on Automatic Learning and Discovery (CONALD-98), 1998 Carnegie Mellon University, Pittsburgh, PA.

MORENO, R. M. 2001. El arte y la ciencia del diagnóstico médico, La Habana.

NAYAK, R. & XU, S. 2006. XCLS: a fast and effective clustering algorithm for heterogenous XML documents. Advances in Knowledge Discovery and Data Mining. Springer. NAYAK, R. & XU., S. XCLS: A Fast and Effective Clustering Algorithm for Heterogenous

XML Documents. 10th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD). , 2006 Singapore. LNCS, p 292-302.

NIU, Z.-Y., JI, D.-H. & TAN, C.-L. Document clustering based on cluster validation. In: EVANS, D. A., ed. Proceedings of the Thirteenth ACM International Conference on Information and Knowledge Management (CIKM 2004), 2004 Washington, D.C., USA. ACM Press, 501-506.

NÜRNBERGER, A., KLOSE, A. & KRUSE, R. Clustering of document collection to support interactive text exploration. Proceedings of the 25th Annuals Conference of the Gesellschaft für Klassification. Studies in Classification, Data Analysis and Knowledge Organization. Exploratory Data Analysis in Empirical Research, 2001 Germany. 291- 299.

PATHAK, J., BAILEY, K. R., BEEBE, C. E., BETHARD, S., CARRELL, D. S., CHEN, P. J., DLIGACH, D., ENDLE, C. M., HART, L. A. & HAUG, P. J. 2013. Normalization and standardization of electronic health records for high-throughput phenotyping: the SHARPn consortium. Journal of the American Medical Informatics Association, 20, e341-e348.

PATIDAR, A. K., AGRAWAL, J. & MISHRA, N. 2012. Analysis of different similarity measure functions and their impacts on shared nearest neighbor clustering approach. International Journal of Computer Applications (0975–8887) Vol, 40.

PIANYKH, O. S. 2009. Digital imaging and communications in medicine (DICOM): a practical introduction and survival guide, Springer Science & Business Media.

PINTO, D., TOVAR, M. & VILARIÑO, D. BUAP: Performance of K-Star at the INEX’09 Clustering Task. In: GEVA, S., KAMPS, J. & TROTMAN, A., eds. INEX 2009 Workshop Pre-proceedings, 2009 Woodlands of Marburg, Ipswich, Queensland,Australia. 391-398.

PORRATA, A. P., LLAVORI, R. B. & SHULCLOPER, J. R. 2004. Desarrollo de Algoritmos para la Estructuración Dinámica de Información y su Aplicación a la Detección de Sucesos. Castellón, España.

PORTER, M. F. 1980. An algorithm for suffix stripping. Program, 14, 130-137.

POWERS, D. M. 2011. Evaluation: from precision, recall and F-measure to ROC, informedness, markedness and correlation.

82 RIJSBERGUEN, C. J. 1979. Information Retrieval, London: Butterworths.

RIPOLL GARRIDO, F. 2011. Tecnologia de la informacion al servicio de una gestion y salud de calidad. Informatica Medica.

RODRÍGUEZ, S. H. 2006. La relación médico-paciente. Revista Cubana de Salud Pública, 32, 0-0.

ROSELL, M., KANN, V. & LITTON, J.-E. Comparing comparisons: document clustering evaluation using two manual classifications. In: SANGAL, R. & BENDRE, S. M., eds. Proceedings of the International Conference on Natural Language Processing (ICON 2004), 2004a Hyderabad, India. Allied Publishers, 207-216.

ROSELL, M., KANN, V. & LITTON, J. E. Comparing comparisons: document clustering evaluation using two manual classifications. Proceedings of International Conference on Natural Language processings ICON, 2004b Hyderabad, India.

RUIZ-SHULCLOPER, J. 1995. Introducción al reconocimiento de patrones. Enfoque lógico combinatorio, México, CINVESTAV IPN.

SABORÍO, M. J. C. 2012. Diseño y desarrollo de algoritmos paralelos para recuperación en una memoria de casos distribuida: un modelo computacional paralelo y distribuido de la memoria.

SÁEZ, L. E. M. 2013. Propuesta metodológica para la enseñanza del método clínico. Edumecentro, 2, 32-38.

SAHAMI, M. 1998. Using machine learning to improve informatio access. PhD. Thesis, Stanford University.

SALTON, G. & BUCKLEY, C. 1988. Term weighting approaches in automatic text retrieval. Information Processing and Management, 24, 513-523.

SALTON, G. & MCGILL, M. 1983. Introduction to Modern Information Retrieval, New York, USA, McGraw-Hill.

SALTON, G., WONG, A. & YANG, C.-S. 1975. A vector space model for automatic indexing. Communications of the ACM, 18, 613-620.

SÁNCHEZ, N. M., LORENZO, M. M. G. & VALDIVIA, Z. Z. G. 2009. Modelo para diseñar sistemas de enseñanza-aprendizaje inteligentes utilizando el razonamiento basado en casos. Avances en Sistemas e Informática, 6, 67-78.

SEBASTIÁN, M.-Á. A., SANTASUSAGNA, L. B., MARÍN, A. P. & GARCÍA, A. T. 2006. Gestión diaria del hospital, Masson.

SHANKAR, R. 2012. Evolutionary Document Clustering and Summarization of Scientific Articles using Frequent Itemsets. International Institute of Information Technology Hyderabad.

SHEN, Y. & WANG, B. Clustering schemaless xml document. 11th international conference on Cooperative Information System., 2003.

SHIN, K. & HAN, S. Y. 2003. Fast clustering algorithm for information organization. In:Proc. of the CICLing Conference. Lecture Notes in Computer Science.Springer-Verlag (2003). SILBERSCHATZ, A. & TUZHILIN, A. 1996. What makes patterns interesting in knowledge discovery systems. IEEE Transactions on Knowledge and Data Engineering, 8, 940- 974.

83 SLAVOV, V., RAO, P., PATURI, S., SWAMI, T. K., BARNES, M., RAO, D. & PALVAI, R. 2013. A new tool for sharing and querying of clinical documents modeled using HL7 Version 3 standard. Computer methods and programs in biomedicine, 112, 529-552. STEINBACH, M., KARYPIS, G. & KUMAR, V. A comparison of document clustering

techniques. Proceedings of 6th ACM SIGKDD World Text Mining Conference, 2000a Boston. ACM Press.

STEINBACH, M., KARYPIS, G. & KUMAR, V. A comparison of document clustering techniques. Proceedings of 6th ACM SIGKDD World Text Mining Conference, 2000b Boston. ACM Press, 1-20.

STREHL, A., GHOSH, J. & MOONEY, R. Impact of similarity measures on Web-page clustering. Proceedings of the 17th National Conference on Artificial Intelligence (AAAI 2000): Workshop of Artificial Intelligence for Web Search, 2000 Austin, Texas. 58-64.

TAGHVA, K. & VENI, R. Effects of similarity metrics on document clustering. Information Technology: New Generations (ITNG), 2010 Seventh International Conference on, 2010. IEEE, 222-226.

TAN, A. Text Mining: The state of the art and the challenges. Proceedings of the Conference Knowledge Discovery and Data Mining (PAKDD'99): Workshop Knowledge Discovery from Advanced Databases, 1999 Pacific Asia. 65-70.

TIEN T., R. N. 2007. Evaluating the Performance of XML Document Clustering by Structure only. 5th International Workshop of the Initiative for the Evaluation of XML Retrieval. TOLOSA, G. H. & FEUERSTEIN, E. Mejoras algorítmicas y estructuras de datos para

búsquedas altamente eficientes. XIV Workshop de Investigadores en Ciencias de la Computación, 2012.

TRAN, T., KUTTY, S. & NAYAK, R. 2008a. Utilizing the Structure and Data Information for XML Document Clustering. INEX, 402-410.

TRAN, T., NAYAK, R. & BRUZA, P. Combining Structure and Content Similarities for XML Document Clustering. Seventh Australasian Data Mining Conference, 2008b Glenelg, Australia.

VISVAL, A. & SARA, M. 2009. La gestión documental, de información y el conocimiento en la empresa. El caso de Cuba. Acimed, 19.

VRIES, C. M. D., NAYAK, R., KUTTY, S., GEVA, S. & TAGARELLI, A. 2011. Overview of the INEX 2010 XML mining track : clustering and classification of XML documents. In Lecture Notes in Computer Science, Springer. Amsterdam.

WAN, X. & YANG, J. 2006. Using Proportional Transportation Similarity with Learned Element Semantics for XML Document Clustering. International World Wide Web Conference Committee.

WATSON, I. 1998. Applying case-based reasoning: techniques for enterprise systems, Morgan Kaufmann Publishers Inc.

WILSON, D. R. & MARTÍNEZ, T. R. 1997. Improved heterogeneous distance functions. Journal of Artificial Intelligence Research, 6, 1-34.

84 XIONG, H., WU, J. & CHEN, J. K-means clustering versus validation measures: a data distribution perspective. Proceedings of the 12th ACM SIGKDD international

Documento similar