Evaluación de artículos

(1)

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTÁ

MAESTRIA EN INGENIERIA DE SISTEMAS Y COMPUTACIÓN EVALUACIÓN DE ARTÍCULOS

I. DATA MINIG: CONCEPTS AND TECHNIQUES (GOOGLE EBOOK)

AUTORES: Han Jiawei, Kambe Micheline y Pei Jian

Año publicación: 2012

Este libro contiene los conceptos básicos sobre minería de datos. Tiene un sesgo académico y va dirigido a los estudiantes que se encuentran estudiando este tema. Además es de reciente publicación (2012).

“Nosotros viviendo en la era de la información”, sin embargo, nosotros actualmente estamos viviendo en la era de los datos. Terabytes, pentabytes contienen nuestros computadores, nuestras redes, las bases de datos de las empresas, con datos correspondiente a ingenierías, medicinas, negocios y de casis todos los aspectos de la vida diaria.

(2)

El libro presenta un contenido muy pertinente con el tema. Si observamos la literatura en sus capítulos podemos observar que todos giran alrededor de la minería de datos. El libro presenta entre otros los siguientes capítulos:

Capítulo I: Introducción.

Capítulo II: Para conocer sus datos. Capítulo III: Preprocesamiento de datos.

Capítulo IV: Datos de la generalización por inducción atributo orientado. Capítulo VII: Patrón de la minería en el espacio multinivel y multidimensional. Capítulo VIII: Clasificación: Conceptos básicos

Capítulo IX: Las tendencias de la minería de datos en las fronteras de la investigación.

Los gráficos y tablas presentes en el libro, son muy sencillas, pertinentes y se presentan en blanco y negro.

En la introducción se trata lo concerniente a los conceptos básicos de minería de datos. Los demás capítulos son más especializados.

Considero un libro de consulta para cualquier persona que quiera comenzar a investigar en este campo. El libro presenta una lógica ordenada que va llevando al estudiante al conocimiento en esta materia.

(3)

II. DATA MINING: PAST, PRESENT AND FUTURE

AUTHOR(S): COENEN FRANS

SOURCE: KNOWLEDGE ENGINEERING REVIEW Volume: 26 Issue: 1 Special Issue: SI Pages: 25-29 DOI: 10.1017/S0269888910000378 Published: MAR 2011

Times Cited: 1 (from Web of Science)

AÑO PUBLICACIÓN: MARZO 2011.

Seleccioné este artículo para su análisis por los siguientes tres (3) motivos: 1. Artículo escrito recientemente, marzo del 2011.

2. Su título, Data Mining: pasado, presente y futuro. Título muy llamado.

3. El background del autor. Coenen Frans, profesor de la Universidad de Cambridge, Liverpool, Inglaterra. Encontré trece (13) artículo de su autoría sobre diversos temas de minería de datos en la Web of Science. Los artículos son los siguientes:

• Data mining: past, present and future, marzo 2011.

• EMADS: An extendible multi-agent data miner, octubre 2009.

• Improved methods for extracting frequent itemsets from interim-support trees, abril 2009.

• The effect of threshold values on association rule based classification accuracy, febrero 2007.

• Tree-based partitioning of data for association rule mining, octubre 2006. • The Knowledge Bazaar, septiembre 2006.

(4)

• Data structure for Association Rule Mining: T-trees and P-trees, junio 2004. • Tree structures for mining association rules, enero 2004.

• A tree partitioning method for memory management in association rule mining, año 2004.

• Formalising optimal feature weight setting in case based diagnosis as linear programming problems, septiembre 2002.

• An experimental study of increasing diversity for case-based diagnosis, año 2002.

Esto nos permite opinar que el profesor Coenen Frans, es una autoridad en esta materia.

Analizando el contenido del artículo, el autor sostiene que minería de datos es una solicitud en lugar de una tecnología, muy importante en la actualidad y con un futuro previsible.

El artículo presenta una breve reseña histórica de la minería de datos, hasta el día de hoy y da ideas acerca de su futuro. También sostiene que la inteligencia artificial y la ingeniería del conocimiento son pilares esenciales en este campo y tiene sus raíces en el aprendizaje de las máquinas, las estadísticas, abarcando otras áreas de la informática.

Reconoce el gran avance que minería de datos a tenido en los últimos años, su utilización en todos los campos y el uso de ella por parte de las empresas donde les permite tomar decisiones pertinentes con el objetivo de ganar mercados en un mundo totalmente globalizado.

(5)

III. FROM DATA MINING TO KNOWLEDGE DISCOVERY IN DATABASES.

AUTORES: Usama Fayya , is a senior researcher at Microsoft Research. He received his Ph.D. in 1991 from the University of Michigan at Ann Arbor. Prior to joining Microsoft in 1996, he headed the Machine Learning Systems Group at the Jet Propulsion Laboratory (JPL), California Institute of Technology, where he developed data-mining systems for automated science data analysis.

Gregory Piatetsky, is a principal member of the technical staff at GTE Laboratories and the principal investigator of the Knowledge Discovery in Databases (KDD) Project, which focuses on developing and deploying advanced KDD systems for business applications.

Padhraic Smyth, received a firstclass- honors Bachelor of Engineering from the National University of Ireland in 1984 and an MSEE and a Ph.D. from the Electrical Engineering Department at the California Institute of Technology (Caltech) in 1985 and 1988, respectively

AÑO PUBLICACIÓN: 1997.

Este artículo comienza hablando de la historia y contexto de la minería y la knowledge discovery de datos (KDD) y su intersección con otros campos relacionados. Un breve resumen de los últimos KDD aplicaciones del mundo real son proporcionadas. Las definiciones de los datos y KDD se proporcionan en varios pasos en donde el proceso de KDD se perfila. El proceso tiene la aplicación de algoritmos de minería de datos como un paso en particular en el proceso. El paso de minería de datos se analizan con más detalle en el contexto de determinados algoritmos de minería de datos y su aplicación. Del mundo real aspectos prácticos de la aplicación también se indica. Por último, el artículo enumera los desafíos para la investigación y desarrollo futuros y, en particular se examinan las oportunidades potenciales para la inteligencia artificial (IA) y la tecnología en los sistemas de KDD.

(6)

y la transformación de datos operaciones, la aplicación de rutinas de pre-procesamiento y en algunos casos, prestando atención a los recursos y las limitaciones de acceso a datos. Típicamente los pasos de procesamiento de datos se expresan en términos de postcondiciones deseados y las condiciones previas para la aplicación de ciertas rutinas, que se presta fácilmente a la representación como una planificación problema. Además, la planificación de capacidad puede jugar un papel importante en automatizado agentes (ver siguiente punto) para

recoger muestras de datos

o llevar a cabo una búsqueda para obtener los conjuntos de datos necesarios. Los agentes inteligentes pueden ser despedidos fuera a recoger la información necesaria de una variedad de fuentes. Además, los agentes de información pueden ser activado remotamente a través de la red o puede desencadenar en la aparición de un cierto caso e iniciar una operación de análisis. Por último, los agentes pueden ayudar a navegar y modelar el World-Wide Web (Etzioni, 1996), otra área creciendo en importancia. La incertidumbre en la IA incluye temas de gestión la incertidumbre, los mecanismos de inferencia propios en presencia de incertidumbre, y el razonamiento acerca de la causalidad, todos ellos fundamentales para KDD teoría y la práctica. De hecho, la KDD-96 conferencia tuvo una sesión conjunta con la UAI-96 conferencia de ese año (Horvitz y Jensen, 1996). La representación del conocimiento incluye ontologías, nuevos conceptos para la representación, almacenamiento, y el acceso al conocimiento. También se incluyen esquemas para representar el conocimiento y permitiendo el uso del conocimiento humano antes sobre el proceso subyacente de la KDD sistema.