En este trabajo se ha llevado a cabo el desarrollo de un sistema de búsqueda de reglas de asociación basadas en el algoritmo Apriori y se ha aplicado a dos bases de datos: Una perteneciente a la Unidad de Análisis de Conducta Criminal de la USAL, conteniendo datos sobre perfiles psicológicos de asesinos en serie; y otra disponible en Kaggle, conteniendo datos sobre todos los asesinatos y homicidios cometidos en Estados Unidos entre los años 1980 y 2014. Con las reglas obtenidas, se ha efectuado una serie de filtrados para optimizar la cantidad de información obtenible de las reglas proporcionadas. Se ha utilizado además un sistema basado en expresiones regulares para poder realizar búsquedas de forma sencilla, y en base a esto se ha creado un sistema de búsqueda interactivo para cualquier conjunto de reglas de asociación. Las reglas obtenidas del primer conjunto de datos aportan información de interés, pero hasta que no se pueda ampliar dicho conjunto, no deberán tomarse como nada más que una prueba de concepto sobre la que continuar trabajando en el futuro.
Para el segundo conjunto de datos se han implementado tres redes neuro- nales entrenadas sobre tres características distintas: Relación víctima-criminal, arma homicida y grupo racial del criminal. Se obtienen para estas dos últimas unos ratios de acierto suficientemente elevados como para plantearse el aplicar- lo a casos reales (88 % en caso del grupo racial y un 100 % de aciertos para el arma homicida), pero en el caso de la predicción de la relación entre víctima y criminal se obtienen resultados cercanos al 56 %, por lo cual queda patente que es necesario llevar a cabo mayor investigación en esta aplicación. Sobre estas redes neuronales se ha llevado a cabo un estudio de estructuras internas para determinar cuál proporciona mejores resultados en cada caso, y se han obtenido métricas de rendimiento así como sus matrices de confusión para poder interpre- tar mejor los resultados obtenidos. Mediante estos métodos de optimización se ha conseguido aumentar en un 10 % el rendimiento de la red que predice relación entre víctima y criminal. Además, se le ha aplicado a este conjunto de datos el sistema de obtención de reglas desarrollado para el primer caso, obteniendo en la mayoría de los casos reglas con un valor de lift mayor de 2, lo que las convierte en reglas de interés para su análisis.
Como futuras líneas de trabajo, los objetivos prioritarios son:
Continuar proyecto de la UACC-USAL, desarrollando una interfaz intuitiva para el programa y facilitando el acceso a la base de forma remota.
Desarrollar un sistema de introducción interactivo de casos para la base de datos de la UACC-USAL, facilitando así su crecimiento.
Aplicar un sistema de redes neuronales, clasificando para los distintas tipifi- caciones del perfil.
Mejorar los sistemas de filtrado de reglas, estudiando la introducción de nuevas métricas como el factor de potencia de regla (RPF).
Ampliar el estudio de estructuras de las redes neuronales para mejorar el rendimiento de la red que clasifica para relación entre víctima y criminal.
8. Agradecimientos
En primer lugar, agradecer mis tutoras, la profesora Dra. Angélica Gonzá- lez Arrieta, a la Dra. Ana Gil González y a la Dra. Ana de Luis Reboredo por brindarme esta oportunidad de indagar en la investigación y aplicación de apren- dizaje automático en una herramienta que, en un futuro, pueda ser de utilidad para las investigaciones policiales. Agradecer también a la Unidad de Análisis de Conducta Criminal de la USAL por todo su apoyo y colaboración al proporcionar la base de datos utilizada en el primer caso, y por su ayuda continuada con todas las cuestiones de índole criminalístico que surgieron a lo largo del desarrollo de este trabajo.
26
Referencias
[1] Rakesh Agrawal, Tomasz Imieliński y Arun Swami. “Mining association rules between sets of items in large databases”. En: Proceedings of the 1993 ACM SIGMOD international conference on Management of data. 1993, págs. 207-216.
[2] Jaber Alwidian, Bassam H Hammo y Nadim Obeid. “WCBA: Weighted classification based on association rules algorithm for breast cancer disea- se”. En: Applied Soft Computing 62 (2018), págs. 536-549.
[3] Scott Bonn. Criminal Profiling: The Original Mind Hunter. Dic. de 2017. url: https : / / www . psychologytoday . com / gb / blog / wicked - deeds / 201712 / criminal - profiling - the - original - mind - hunter.
[4] Adolfo Crespo Márquez, Antonio de la Fuente Carmona y Sara Antomario- ni. “A Process to Implement an Artificial Neural Network and Association Rules Techniques to Improve Asset Performance and Energy Efficiency”. En: Energies 12.18 (2019), pág. 3454.
[5] Jeremy Elson y col. “Asirra: A CAPTCHA that Exploits Interest-Aligned Manual Image Categorization”. En: Proceedings of 14th ACM Conference on Computer and Communications Security (CCS). Association for Com- puting Machinery, Inc., oct. de 2007. url: https://www.microsoft. com/en-us/research/publication/asirra-a-captcha-that- exploits-interest-aligned-manual-image-categorization/. [6] Richard HR Hahnloser y col. “Digital selection and analogue amplification
coexist in a cortex-inspired silicon circuit”. En: Nature 405.6789 (2000), págs. 947-951.
[7] Petr Hájek, Ivan Havel y Michal Chytil. “The GUHA method of automatic hypotheses determination”. En: Computing 1.4 (1966), págs. 293-308. [8] Javier Herrero y Luis Sánchez-Gil. Proyecto de investigación de asesinos
en serie. Ene. de 2016. isbn: 978-84-8196-371-7.
[9] Ronald M Holmes, James De Burger y Stephen T Holmes. “Inside the mind of the serial murder”. En: American Journal of Criminal Justice 13.1 (1988), págs. 1-9.
[10] Suresh Kumar, Nisheeth Joshi y col. “Rule power factor: a new interest measure in associative classification”. En: Procedia Computer Science 93 (2016), págs. 12-18.
[11] Yann LeCun y col. “Gradient-based learning applied to document recog- nition”. En: Proceedings of the IEEE 86.11 (1998), págs. 2278-2324. [12] Titus Livius. The history of Rome. 1896.
[13] Warren S McCulloch y Walter Pitts. “A logical calculus of the ideas im- manent in nervous activity”. En: The bulletin of mathematical biophysics 5.4 (1943), págs. 115-133.
[14] RN Pamela Fox Levin MS, RN Jeanne Beauchamp Hewitt MS y RN Susan Terry Misner MS. “Female workplace homicides: An integrative research review”. En: Workplace Health & Safety 40.5 (1992), pág. 229.
[15] C Gabrielle Salfati y David V Canter. “Differentiating stranger murders: Profiling offender characteristics from behavioral styles”. En: Behavioral Sciences & the Law 17.3 (1999), págs. 391-406.
[16] Qian Sima. Records of the grand historian: Han dynasty. Vol. 65. Columbia University Press, 1993.
[17] Carsten Stephan y col. “Multicenter evaluation of an artificial neural net- work to increase the prostate cancer detection rate and reduce unnecessary biopsies”. En: Clinical chemistry 48.8 (2002), págs. 1279-1287.
[18] Petri Toiviainen. “Modeling the target-note technique of bebop-style jazz improvisation: An artificial neural network approach”. En: Music Percep- tion: An Interdisciplinary Journal 12.4 (1995), págs. 399-413.
[19] Elif Derya Übeyli. “Implementing automated diagnostic systems for breast cancer detection”. En: Expert systems with Applications 33.4 (2007), págs. 1054-1062.
[20] Liming Yao y col. “Synergies Between Association Rules and Collaborative Filtering in Recommender System: An Application to Auto Industry”. En:
Data Science and Digital Business. Springer, 2019, págs. 65-80.
[21] Leonid N Yasnitsky y col. “THE USE OF ARTIFICIAL INTELLIGEN- CE METHODS IN THE ANALYSIS OF SERIAL KILLERS’PERSONAL CHARACTERISTICS”. En: RUSSIAN JOURNAL OF CRIMINOLOGY 9.3 (2015), págs. 423-430.