en Técnicas de Inteligencia Artificial

(1)

Sergio Augusto Celis Esteban.

Jhoan Felipe Sarmiento Ortiz.

Universidad Autónoma de Bucaramanga.

Facultad de Ingeniería.

Bucaramanga, Santander, Colombia.

2020

(2)

en Técnicas de Inteligencia Artificial

Sergio Augusto Celis Esteban.

Jhoan Felipe Sarmiento Ortiz.

Trabajo de grado presentado para optar el título de: Ingeniero de Sistemas.

PhD. Maritza Liliana Calderón Benavides.

Universidad Autónoma de Bucaramanga.

Facultad de Ingeniería.

Bucaramanga, Santander, Colombia.

2020

(3)

RESUMEN ... 8

Resumen ... 8

Palabras Claves ... 8|

Línea de Investigación ... 8

INTRODUCCIÓN ... 9

Introducción ... 9

Planteamiento y Justificación del Problema ... 10

Pregunta de Investigación ... 16

Objetivo General... 16

Objetivos Específicos. ... 16

ESTADO DEL ARTE ... 17

MARCO CONCEPTUAL ... 32

Marco Teórico ... 32

1. Conceptos claves. ... 32

2. Conceptos técnicos ... 37

3. Métricas de evaluación. ... 44

4. Conceptos clínico-patológicos. ... 46

Marco tecnológico. ... 50

DESARROLLO METODOLÓGICO ... 54

Infraestructura tecnológica del sistema. ... 54

1. Tecnologías. ... 54

2. Arquitecturas. ... 56

3. Hardware ... 57

Metodología de los datos ... 58

1. Dataset. ... 59

2. Preprocesamiento de los datos. ... 60

3. Adaptación de los datos para el entrenamiento. ... 62

Metodología de prueba ... 64

(4)

2. Interfaz gráfica. ... 66

3. Bases de datos. ... 67

Implementación del prototipo ... 69

Evaluación del prototipo ... 70

ANÁLISIS DE RESULTADOS ... 71

Selección de la infraestructura tecnológica del sistema. ... 71

1. Lenguaje de programación. ... 71

2. Red neuronal. ... 72

Diseño del prototipo de sistema de información. ... 78

1. Funcionalidades del sistema. ... 78

2. Interfaz gráfica y test de experiencia de usuario. ... 79

Implementación del prototipo. ... 81

CONCLUSIONES ... 88

TRABAJOS FUTUROS ... 90

REFERENCIAS ... 92

ANEXOS ... 99

(5)

Tabla 1. Comparación Lenguajes de Programación para Machine Learning. ... 55

Tabla 2. Métricas promedio de distintos proyectos de clasificación de imágenes con enfoque médico... 56

Tabla 3. Especificaciones técnicas máquina virtual. ... 57

Tabla 4. Diccionario de datos Usuarios. ... 67

Tabla 5. Diccionario de datos Diagnósticos. ... 68

Tabla 6. Matriz de comparación AJP. ... 71

Tabla 7. Decisión final AJP. ... 72

Tabla 8. Resumen métricas de evaluación. ... 73

(6)

Figura 1. Mortalidad y prevalencia del cáncer de mama en Colombia.. ... 11

Figura 2. Incidencia y mortalidad en Bucaramanga, 2014. ... 12

Figura 3. Densidad mamaria. ... 13

Figura 4. Mamografía con microcalcificaciones. ... 15

Figura 5. Relación IA, ML y DL. ... 34

Figura 6. Aprendizaje supervisado. ... 35

Figura 7. Estructura básica de una RNA. ... 35

Figura 8. Ejemplo de una red neuronal convolucional. ... 36

Figura 9. Ejemplos de tensores con sus respectivos rangos (dimensiones). ... 37

Figura 10. Ejemplo de convolución aplicando filtro 3x3 a una imagen 5x5. ... 38

Figura 11. Ejemplo de aplicación de max pooling. ... 39

Figura 12. Ejemplo de no linealidad con la función ReLU. ... 40

Figura 13. Ejemplo de full conected layer... 41

Figura 14. Ejemplo de un TensorBoard. ... 53

Figura 15. Metodología empleada para el tratamiento de los datos. ... 58

Figura 16. Recorte tomado de nuestro dataset, región de interés ROI. ... 62

Figura 17. Imagen diagnóstica antes y después de ser convertida a RGB. ... 63

Figura 18. Diagrama de contexto. ... 65

Figura 19. Ejemplo de interfaz diseñada en Figma. ... 66

Figura 20. Ejemplo de implementación de interfaces en Flutter - Zoom. ... 69

Figura 21. Matriz de confusión VGG16 → 70 – 30. ... 74

Figura 22. Matriz de confusión VGG16 → 90 – 10. ... 76

Figura 23. Matriz de confusión VGG16 - Malignos duplicados. ... 76

Figura 24. Matriz de confusión VGG16 con DropOut → 90 – 10. ... 77

Figura 25. Diagramas de casos de uso del sistema. ... 78

Figura 26. Resumen de resultados test de experiencia de usuario. ... 79

Figura 27. Diseño TabBar - Resultados. ... 80

Figura 28. Logo Minbizia ... 80

Figura 29. Firebase Firestore - Colecciones: usuarios y diagnósticos. ... 81

Figura 30. Firebase Authentication. ... 81

Figura 31. Firebase Storage. ... 82

Figura 32. Interfaces finales – Login. ... 83

Figura 33. Interfaces finales – Dashboard. ... 84

Figura 34. Interfaces finales – Administrador. ... 84

(7)

Anexo 1. Diagramas UML ... 99

Anexo 2. Diseño de interfaces. ... 105

Anexo 3. Resultados del test de experiencia de usuario. ... 112

Anexo 4. Análisis Jerárquico Ponderado (AJP) ... 122

Anexo 5. Métricas de evaluación obtenidas. ... 128

Anexo 6. Acuerdo de transferencia dataset InBreast ... 133

(8)

RESUMEN

Resumen

Según los datos del Observatorio Global de Cáncer, el cáncer de mama es la principal causa de muerte por cáncer en las mujeres. (International for Research on Cancer, 2018). Este trabajo basó su investigación en el afán por la búsqueda de una solución a este problema, y se propuso el desarrollo de un prototipo de sistema de información, basado en técnicas de inteligencia artificial, que permitiera optimizar la labor del cuerpo médico para detectar casos de cáncer y mitigar el riesgo de muerte y otros problemas que presentaban los pacientes. El desarrollo de la interfaz gráfica se realizó con Flutter Web y luego de ciertas pruebas, se definió que la opción conveniente para el sistema era la implementación de la arquitectura VGG16. La red neuronal, fue entrenada con un conjunto de imágenes diagnósticas mamográficas disponibles en la web, con el fin de adoptar un modelo, capaz de clasificar mamografías en cinco categorías: normal, microcalcificación benigna, nódulo benigno, microcalcificación y nódulo maligno.

Palabras Claves

Sistema de información, inteligencia artificial, red neuronal, convolución, clasificación, detección, mamografía, nódulo, microcalcificación, carcinoma mamario.

Línea de Investigación

Inteligencia artificial con enfoque en imágenes médicas.

(9)

INTRODUCCIÓN

Introducción

El presente documento, describe en detalle la problemática presente en el análisis de mamografías y las consecuencias que en ocasiones puede derivar un mal diagnóstico para los pacientes afectados por el cáncer de mama. Se propone así, el desarrollo de un prototipo de sistema de información para la detección de carcinomas mamarios basado en técnicas de inteligencia artificial que sirva de soporte a los radiólogos en su labor de lectura e interpretación de estas imágenes diagnósticas.

El interés por desarrollar este proyecto trasciende lo académico, ya que es despertado por motivos de aporte positivo desde la Ingeniería a una problemática de salud tan relevante y que afecta en su gran mayoría a la población femenina mundialmente.

Se hace alusión, además, a la metodología que se llevó a cabo en el desarrollo del proyecto investigativo, y los resultados obtenidos para cada uno de los objetivos que se plantearon en torno a la solución de dicho problema.

Este proyecto está enfocado en las áreas de conocimiento de Ingeniería de Sistemas y Ciencias de la Salud, promoviendo la cooperación interdisciplinaria en pro del bien común.

(10)

Planteamiento y Justificación del Problema

La problemática que se quiere atacar es clara. Se pretende con el proyecto, seguir aportando a los avances tecnológicos que se dan día a día en la medicina. A continuación, se describen los riesgos e inconvenientes que una enfermedad como el cáncer, deriva en los y las pacientes, y razón por la cual, esta investigación toma un gran valor.

Morbilidad y Mortalidad del Cáncer de Mama.

Según el Observatorio Global de Cáncer (Global Cancer Observatory, 2018) en su informe publicado el 12 de septiembre del 2018, el tipo de cáncer más frecuente en las mujeres de todo el mundo es el cáncer de mama con un total de 2’088.849 casos registrados. Aproximadamente uno de cada cuatro nuevos casos de cáncer diagnosticados en las mujeres es cáncer de mama, además, es la principal causa de muerte por cáncer en mujeres (626.679). (International for Research on Cancer, 2018) Según la CAC en Colombia, hasta el 01 de enero de 2018, se registraron 59.837 casos de cáncer de mama en el SGSSS. Específicamente, para el periodo comprendido entre el 02 de enero de 2017 y el 01 de enero de 2018, se reportaron 6.348 nuevos casos de cáncer de seno, de los cuales 303 (4.8%) corresponden a casos de carcinoma in situ, y 6.045 (95.2%) fueron casos de cáncer de mama invasivo, lo que representa un aumento del 37% en los registros, con relación al periodo anterior (2016 - 2017).

Además, para este mismo periodo, el total de pacientes fallecidos fue 2.522. (Fondo Colombiano de Enfermedades de Alto Costo Cuenta de Alto Costo[CAC], 2018) Sin embargo, en el GLOBOCAN 2018, los últimos datos mundiales sobre el cáncer, las cifras para Colombia varían significativamente, donde los casos nuevos reportados fueron 13.380 y el número de muertes 3.702. (Global Cancer Observatory, 2018)

(11)

En el caso particular de Santander, la prevalencia en el cáncer de mama invasivo fue de 257,6 por 100.000 habitantes, con una mortalidad de 11.3 por 100.000 habitantes, lo que ubica al departamento dentro de los más afectados por esta enfermedad como se observa en la Figura 1.

(12)

Además, en Bucaramanga los datos registrados en el año 2014 se reflejaron con una incidencia de 278 casos de cáncer de mama y 100 pacientes muertos, ubicando de esta forma, al cáncer de mama, como el más frecuente de esta ciudad, entre hombres y mujeres como se muestra en la Figura 2.

Figura 2. Incidencia y mortalidad en Bucaramanga, 2014.

Fuente de Información: Datos del SICC y RPC de Bucaramanga

Examen Mamográfico.

Normalmente, la detección de carcinomas mamarios se ve obstaculizada por la complejidad que conlleva el análisis de mamografías realizado por los radiólogos en su labor. Estos análisis no cuentan con resultados muy precisos y la incertidumbre aumenta en ocasiones por diversas causas: en primer lugar, los procesos analíticos de las mamografías realizados por los expertos son hechos de manera meramente visual, esto genera que se obtengan diferentes opiniones en torno a una observación subjetiva (Radiological Society of North America, 2019) de parte de cada profesional.

Dicha opinión, puede verse influenciada por los diferentes factores fisiológicos de cada paciente que reducen la efectividad del diagnóstico. Entre estos factores

(13)

encontramos la densidad mamaria (Vergara, Vergara, & Vergara Dagobeth, 2013), que hace referencia a la cantidad de tejido glandular presente en el seno y que cuando es abundante entorpece la identificación de anomalías en la mamografía (Figura 3).

Un seno denso cuenta con una sensibilidad mamográfica del 60% frente al rango de 85-95% de los senos grasos (Berg, 2019), esto quiere decir que, al ser el seno más denso, el hallazgo de masas anormales dentro del mismo será más complicado.

En este punto, entra en juego la habilidad interpretativa del radiólogo (Ventura- Alfaro, 2018), este factor se encuentra asociado muchas veces con la experiencia, lo cual puede determinar un obstáculo al momento de interpretar la mamografía. Las más altas tasas de falsos positivos y falsos negativos son presentadas por interpretadores jóvenes con poca experiencia profesional. Para esto, se recomienda que se lleve a cabo una doble lectura de la mamografía, es decir, que dos personas realicen la lectura de manera independiente, sin embargo, esto puede terminar aumentando la incertidumbre cuando los diagnósticos discuerdan.

(14)

Estas causas anteriormente mencionadas, ocasionan perjuicios de todo tipo en la paciente; desde psicológicos (como estrés y preocupación generados por resultados conocidos como falsos positivos donde a las mujeres se les diagnostica cáncer sin que exista realmente), hasta físicos (con la realización de biopsias que los médicos se ven obligados a hacer para tener una certeza en su examen, la creación de carcinomas como causa de la excesiva exposición a rayos X, o incluso retrasos en el tratamiento que pueden llegar, en el peor de los casos, a la muerte, a causa de los conocidos falsos negativos), y económicos (ya que en ocasiones es necesario realizar más de una mamografía que conlleva un costo adicional, o hacer uso de otras técnicas que en su defecto son mucho más costosas que el examen tradicional (Breastcancer.org, 2013)).

En respuesta a este problema previamente expuesto, se considera pertinente el desarrollo de un prototipo de sistema de información que implemente un modelo de redes neuronales para la clasificación de imágenes mamográficas como apoyo para todo aquel que se desempeña en el tratamiento y análisis de estas. Además, el uso adicional de datos históricos del paciente; esto con el fin de obtener resultados más precisos, mitigar errores y generar confianza en los pacientes al momento de recibir un resultado frente a los peligrosos carcinomas mamarios. El proyecto, está enfocado hacia la detección temprana del cáncer, ya que según datos de la ACS (American Cancer Society, 2019)la tasa de supervivencia oscila en un rango del 95 al 100% para los cánceres de mama detectados en estadío 0 o 1, es decir, en su fase temprana, para ello, se debe tener en cuenta los casos de microcalcificaciones, donde el tumor aún no se ha desarrollado por completo y es oportuno para el tratamiento del paciente. En

(15)

la Figura 4 se puede observar un caso de microcalcificación, para un mejor entendimiento de la importancia que esto conlleva, ya que no todo nódulo es maligno.

Figura 4. Mamografía con microcalcificaciones. Copyright Marcela Cauwlaert.

(16)

Pregunta de Investigación

¿De qué manera es posible detectar carcinomas mamarios mediante el procesamiento de imágenes diagnósticas?

Objetivo General

Desarrollar un prototipo de sistema de información para la detección de carcinomas mamarios, basado en técnicas de inteligencia artificial.

Objetivos Específicos.

1. Seleccionar la infraestructura tecnológica del sistema.

2. Diseñar un prototipo de sistema de información, para la detección de cáncer basado en un modelo de redes neuronales.

3. Implementar el prototipo de sistema de información para la detección de cáncer de mama.

4. Evaluar el prototipo sistema de información para la detección de cáncer de mama en imágenes diagnósticas.

(17)

ESTADO DEL ARTE

En este capítulo se presentan los proyectos con los aportes más relevantes para esta investigación.

1. Aprendizaje profundo para mejorar la detección del cáncer de mama en la mamografía de detección. (Shen, Margolies, & Rothstein, 2019)

Problema de investigación. El cáncer de mama es la segunda causa principal

de muerte por cáncer entre las mujeres estadounidenses y se ha descubierto que la mamografía de detección reduce la mortalidad. A pesar de los beneficios, la mamografía de detección está asociada con un alto riesgo de falsos positivos y falsos negativos. La sensibilidad promedio de la mamografía de detección digital en los EE. UU. Es del 86,9% y la especificidad promedio es del 88,9%. Para ayudar a los radiólogos a mejorar la precisión predictiva de la mamografía de detección, el software de detección y diagnóstico asistido por computadora (CAD) 4han sido desarrollados y en uso clínico desde la década de 1990. Desafortunadamente, los datos sugirieron que los primeros sistemas CAD comerciales no habían llevado a una mejora significativa en el rendimiento y el progreso se estancó durante más de una década desde su introducción.

Procedimiento y resultados. Se desarrolló un algoritmo de aprendizaje

profundo que puede detectar con precisión el cáncer de seno en las mamografías de detección utilizando un enfoque de entrenamiento “de extremo a extremo” que aprovecha de manera eficiente los conjuntos de datos

(18)

de entrenamiento con anotaciones clínicas completas o solo el estado del cáncer (etiqueta) de toda la imagen. El método de red convolucional para clasificar las mamografías de detección alcanzó un rendimiento excelente en comparación con los métodos anteriores. En un conjunto de prueba independiente de mamografías de película digitalizada de la Base de datos digital para mamografía de detección (CBIS-DDSM), el mejor modelo individual logró un AUC por imagen de 0.88, y el promedio de cuatro modelos mejoró el AUC a 0.91 (sensibilidad: 86.1%, especificidad: 80,1%). En un conjunto de prueba independiente de imágenes de mamografía digital de campo completo (FFDM) de la base de datos INbreast, el mejor modelo individual logró un AUC por imagen de 0.95, y el promedio de cuatro modelos mejoró el AUC a 0.98 (sensibilidad: 86.7%, especificidad: 96,1%).

Aportes. Sirvió de guía para el debido entrenamiento de la red neuronal,

usando transfer learning con otro tipo de técnicas como el fine tuning, que consiste en agregar capas personalizadas y descongelar progresivamente las capas de la red base.

2. Reducción de marcas falsas positivas en mamografías: un estudio de comparación retrospectiva utilizando un CAD basado en inteligencia artificial.

Estados Unidos ( Mayo, y otros, 2019)

Problema de investigación. La alta tasa de marcas falsas positivas que se

presentan al usar actualmente los sistemas CAD convencionales. Estas marcas pueden distraer al radiólogo intérprete generando ruido y conducen a biopsias y exámenes innecesarios. Para evaluar la utilidad de dichos sistemas se emplean los falsos positivos por imagen (FPPI). Por lo cual comúnmente

(19)

cuando hay una tasa alta de FPPI se presentan quejas por parte de los radiólogos. Además, en los EE. UU en retiros y análisis de falsos positivos se gastan aproximadamente $ 4 mil millones de dólares. Para el paciente, estas mamografías de detección de resultados falsos positivos crean ansiedad innecesaria y pueden llevar al paciente a una biopsia que no era necesaria.

Procedimiento. Se compararon dos sistemas un sistema CAD tradicional con

uno basado en Inteligencia Artificial (IA) para determinar si se podía utilizar para reducir los FPPI. En donde se analizó una base de datos de 250 mamografías con ambos.

Resultados obtenidos y conclusiones. Se presentó una reducción del 69% en

el FPPI general con AI-CAD en comparación con CAD. La evaluación por tipo de lesión muestra un rendimiento superior de AI-CAD tanto para masas como para calcificaciones. Hubo una reducción general del 83% en FPPI para calcificaciones con AI-CAD y una reducción del 56% para la masa. FPPI para masas fue mayor que FPPI para calcificaciones para ambos sistemas.

3. Detección de cáncer de cabeza y cuello en histología digitalizada de diapositivas completas utilizando redes neuronales convolucionales (Halicek, Shahedi, &

Little, 2019))

Problema de investigación. La detección temprana del cáncer de mama es

crucial por lo cual la mamografía es esencial como herramienta de diagnóstico. El cáncer de mama generalmente ocurre en el área fibroglandular del tejido mamario. El tejido fibroglandular distorsiona, hace que las mamografías parezcan brillantes, esta apariencia se describe como Densidad

(20)

Mamográfica o también conocida como Densidad Mamaria. La porción de densidad mamaria contiene conductos, elementos lobulares y tejido fibroso de la mama, entre otras características. El radiólogo evalúa la proporción de grasa y el tejido fibroglandular de la región mamaria en la interpretación de las imágenes mamográficas. El resultado es subjetivo y varía de un radiólogo a otro. El problema es que existen varias maneras de medir la densidad mamaria por ejemplo algunos consideran importante eliminar el musculo pectoral en el procesamiento de la imagen, otros consideran importante no eliminarlo.

Además, en el tejido cercano la piel cuando se presentan anomalías en esta zona a simple vista suele ser muy difícil detectarlas debido a que es muy delgado, en las mamografías suele no verse o presentar mucha distorsión en la imagen.

Procedimiento. En este estudio, utilizaron 381 imágenes digitalizadas de

diapositivas completas (WSI) de 156 pacientes con cáncer de cabeza y cuello para entrenar, validar y probar una red neuronal convolucional inception-v4.

Para la comparación, probamos el método de diagnóstico propuesto en un conjunto de datos de código abierto de WSI de ganglios linfáticos centinela con metástasis de cáncer de mama, CAMELYON 2016, para obtener la localización del cáncer basada en parches y diagnósticos de cáncer a nivel de diapositivas.

Resultados obtenidos y conclusiones. El método propuesto es capaz de detectar y localizar SCC (Carcinoma de Células Escamosas) primario de cabeza y cuello en WSI con un AUC de 0.916 para pacientes en el grupo de

(21)

prueba de SCC y 0.954 para pacientes en el grupo de prueba de carcinoma de tiroides. Además, el método propuesto es capaz de diagnosticar WSI con diapositivas de cáncer versus diapositivas normales con un AUC de 0.944 y 0.995 para los grupos de prueba de SCC y carcinoma de tiroides, respectivamente. El diseño experimental produce un método robusto con potencial para ayudar a crear una herramienta para aumentar la eficiencia y la precisión de los patólogos que detectan cánceres de cabeza y cuello en imágenes histológicas.

4. Speed Up Robust Features (SURF) con el componente principal análisis-apoyo vector máquina (PCA-SVM) para clasificaciones benignas y malignas. Malasia (Salleh, Mahmud, Rahman, & Yasiran, 2017)

Problema de investigación. Se estima que en una mamografía siempre habrá

un error del 10% al 30% durante el proceso de detección. Después de que se complete el procedimiento de detección, se llevará a cabo la etapa de mamografía de diagnóstico por parte del radiólogo. En esta etapa, el radiólogo diagnosticará si el cáncer está clasificado como benigno o maligno. Del mismo modo, el error humano también ocurre durante esta etapa. Se han realizado numerosos estudios para superar este error. El diagnóstico asistido por computadora (CAD) se ha demostrado que reduce la tasa de error y aumenta el rendimiento del detección y clasificación del cáncer de mama para ayudar el radiólogo en la evaluación del cáncer, de decidir si es benigno o maligno.

(22)

Si el cáncer es clasificado como benigno, el radiólogo decidirá si el procedimiento de biopsia es esencial para el paciente correspondiente o no.

Además, el CAD es crucial para determinar el tipo de tratamiento que se le da al paciente, así como para reducir la tasa de mortalidad.

Procedimiento. Se propone un nuevo componente de diagnóstico asistido por

computadora (CADx) para el cáncer de mama clasificaciones Se llevaron a cabo cuatro fases principales en esta investigación. La primera fase es preprocesamiento, esto es seguido por la fase de extracción de características usando Speed Up Robust Características (SURF). La siguiente fase es la selección de características usando el Componente Principal Análisis (PCA).

La fase final es la fase de clasificación para clasificar el cáncer. Tres diferentes clasificadores; Máquina de vectores de soporte (SVM), análisis discriminante lineal (LDA) y Decisión Tree (DT) se compararon en esta investigación. Se propuso un nuevo componente CADx basado en SURF con PCA-SVM para clasificar el cáncer de mama, ya sea benigno o maligno. El método SURF se utiliza como extracción de características. Los núcleos finos gaussianos muestran el núcleo óptimo que se utilizó en la investigación.

Resultados obtenidos y conclusiones. Los resultados obtenidos muestran que

el PCA-SVM realiza la más alta precisión con 92.9% de precisión en comparación con otros clasificadores. También está comprobado que el componente PCA en la fase de selección de funciones puede reducir el FNR, así como aumentar la precisión de la CADx propuesto. Se espera que estos hallazgos ayuden al radiólogo para tomar decisiones y reducir la tasa de error

(23)

en el diagnóstico de mamografías. También se recomienda que todo el CADx se extienda a automatizar el proceso, esto es importante para reducir los costos computacionales, así como para aumentar el rendimiento del CADx.

5. Inteligencia artificial en imagenología del cáncer: desafíos clínicos y aplicaciones. Estados Unidos (Bi, y otros, 2019)

Problema de investigación. El cáncer sigue frustrando a pacientes,

investigadores y médicos a pesar de todo. Dada esta complejidad, surgen dilemas en todas las etapas del tratamiento del cáncer, incluida la detección temprana confiable; distinción precisa de lesiones preneoplásicas y neoplásicas; determinación de márgenes tumorales infiltrativos durante el tratamiento quirúrgico; seguimiento de la evolución tumoral y la resistencia potencial adquirida a los tratamientos a lo largo del tiempo; y predicción de agresividad tumoral, patrón de metástasis y recurrencia. Los avances tecnológicos en imágenes médicas y biomarcadores mínimamente invasivos son prometedores para abordar tales desafíos en todo el espectro de detección, tratamiento y monitoreo del cáncer. Sin embargo, la interpretación del gran volumen de datos que generan estos avances presenta un aluvión de nuevos desafíos potenciales.

Procedimiento. Se realizó una investigación sobre las diferentes aplicaciones

de la IA para la detección de diferentes tipos de cáncer y su evolución a lo largo del tiempo, en base a esto se plantearon una serie de desafíos o inconvenientes que esta aun representa y como esta se proyecta.

(24)

Resultados obtenidos y conclusiones. A pesar de los éxitos reportados de la

IA en las imágenes de cáncer, se deben superar varias limitaciones y obstáculos antes de la adopción clínica generalizada. Con la creciente demanda de imágenes CT201 y MR202, los proveedores de atención generan constantemente grandes cantidades de datos. Los estándares, incluido el Sistema de archivo y comunicación de imágenes (PACS) y las Imágenes digitales y las comunicaciones en medicina (DICOM), han asegurado que estos datos estén organizados para facilitar el acceso y la recuperación. Sin embargo, tales datos rara vez se seleccionan en términos de etiquetado, anotaciones, segmentaciones, garantía de calidad o idoneidad para el problema en cuestión. La conservación de datos médicos representa un obstáculo importante en el desarrollo de soluciones clínicas automatizadas, ya que requiere profesionales capacitados, lo que hace que el proceso sea costoso tanto en tiempo como en costos. Estos problemas se ven exacerbados por los métodos que requieren mucha información, incluidas las redes neuronales profundas. Los métodos no supervisados y auto supervisados no requieren un etiquetado explícito y, por lo tanto, prometen aliviar algunos de estos problemas, mientras que los datos sintéticos pueden permitir una ruta más rápida hacia la curación, abordar el desequilibrio de clase inevitable y mitigar las preocupaciones de privacidad del paciente. La evaluación comparativa estandarizada es de particular importancia en el dominio médico, especialmente dada la multitud de modalidades de imágenes y sitios anatómicos, así como estándares de adquisición y hardware. También, Se debe mejorar el acceso a los conjuntos de datos disponibles para promover la

(25)

colaboración intelectual. Se debe alentar a los grupos institucionales, profesionales y gubernamentales a compartir datos validados para apoyar el desarrollo de algoritmos de IA, lo que requiere superar ciertas preocupaciones técnicas, legales y quizás éticas fundamentales. Por ejemplo, los Institutos Nacionales de Salud recientemente compartieron un cofre de repositorios de rayos X y tomografías computarizadas para ayudar a los científicos de IA.

Tales esfuerzos llevan la expansión a una audiencia mucho más amplia en todos los estados de la enfermedad.

6. Inteligencia artificial explicable para el cáncer de mama: un enfoque de razonamiento visual basado en casos. Paris, Francia (Jean-Baptiste Lamy, Boomadevi Sekar, Gilles Guezennec, Jacques Bouaud, & Brigitte Séroussi, 2019)

Problema de investigación. La falta de comprensibilidad en los enfoques de

clasificación basados en inteligencia artificial, esto es particularmente cierto para los enfoques de "caja negra" como el aprendizaje profundo. Sin embargo, los médicos generalmente prefieren entender cómo el sistema produce una recomendación y los sistemas automáticos de apoyo a la decisión a menudo se perciben como una amenaza y una pérdida de control. De hecho, hace años, los médicos clasificaron la comprensibilidad como la característica más deseable de un sistema de apoyo a la decisión clínica. Según el informe de Villani sobre inteligencia artificial recomiendan "abrir la caja negra de la inteligencia artificial", con un enfoque especial en la medicina.

(26)

Procedimiento. Se propone un método CBR (Razonamiento Basado en

Casos) que puede ejecutarse automáticamente como un algoritmo y presentarse visualmente en una interfaz de usuario para proporcionar explicaciones visuales o para razonamiento visual. Después de consultar casos similares, se muestra en una interfaz visual similitudes cuantitativas y cualitativas entre dicha consulta y los casos similares, por lo que se puede clasificar de una manera fácil y totalmente explicable la consulta a través del razonamiento visual. Combina un enfoque cuantitativo (visualizado por un diagrama de dispersión basado en Escalamiento multidimensional en coordenadas polares, preservando distancias que involucran la consulta) y un enfoque cualitativo (ajuste de visualización usando cajas de arcoíris).

Aplicaron este método para la detección del cáncer de seno en un conjunto de datos real en cáncer de mama. También se probó la interfaz propuesta durante un pequeño estudio de usuarios (Médicos Expertos).

Resultados obtenidos y conclusiones. En comparación con los algoritmos de

"recuadro negro" como el aprendizaje profundo, las respuestas de los sistemas CBR se pueden justificar fácilmente utilizando los casos similares como ejemplos. Sin embargo, la mayoría de los sistemas CBR se limitan a la visualización de casos similares. Este método cualitativo tiene una precisión de clasificación comparable a los algoritmos de k-vecinos más cercanos, pero es más entendible. Los expertos médicos encontraron interesante el enfoque visual, ya que explica por qué los casos son similares a través de la visualización de las características compartidas del paciente.

(27)

7. Detección invasiva precisa y reproducible del cáncer de mama en imágenes de diapositivas completas: un enfoque de aprendizaje profundo para cuantificar la extensión del tumor (Cruz-Roa, y otros, 2017)

Problema de investigación. La identificación manual de la presencia y

extensión del cáncer de seno por parte de un patólogo es crítica para el manejo del paciente para la estatificación del tumor y para evaluar la respuesta al tratamiento. Sin embargo, este proceso es tedioso y está sujeto a variabilidad entre e lectores. Para que los métodos computarizados sean útiles como herramientas de soporte de decisiones, deben ser resistentes a los datos adquiridos de diferentes fuentes, diferentes protocolos de tinción(coloración), corte y diferentes escáneres.

Procedimiento. El objetivo de este estudio fue evaluar la precisión y solidez

de un método basado en el aprendizaje profundo para identificar automáticamente la extensión del tumor invasivo en imágenes digitalizadas.

Se presentó un nuevo método que emplea una red neuronal convolucional para detectar la presencia de tumor invasivo en imágenes de diapositivas completas. Este enfoque implicó entrenar al clasificador en casi 400 ejemplares de múltiples sitios diferentes y escáneres, y luego validaron de forma independiente en casi 200 casos de The Cancer Genome Atlas.

Resultados obtenidos y conclusiones. El enfoque utilizado arrojó un coeficiente Dice del 75.86%, un valor predictivo positivo del 71.62% y un valor predictivo negativo del 96.77% en términos de evaluación píxel por

(28)

píxel en comparación con las regiones anotadas manualmente de carcinoma ductal invasivo.

8. Método de Pronóstico en Cáncer de Mama (México Patente nº WO2017095213, 2017)

Problema de investigación. La incidencia de cáncer de mama ha aumentado

en los últimos 30-40 años, la mortalidad se ha mantenido estable, como resultado, probablemente, del diagnóstico precoz y de la mejora en las opciones de tratamiento que incluyen cirugía, radioterapia, quimioterapia, terapia hormonal e inmunoterapia, sin embargo, la administración racional de estos tratamientos, caros y con frecuencia desagradables, requiere de la identificación tanto de los pacientes con enfermedad localizada con mayor riesgo de recurrencia y aquellos que presentan metástasis distante o micro metástasis, los cuales es improbable que respondan a las terapias locales. Por lo tanto, es altamente deseable contar con métodos objetivos, prácticos y de fácil acceso que permitan evaluar el pronóstico de un paciente con cáncer de mama y con base en ello tomar decisiones sobre el manejo clínico que debe brindar el médico, principalmente en cuanto a la definición de las opciones terapéuticas que puede utilizar y el seguimiento de cada paciente. En este sentido, los biomarcadores están desempeñando un papel cada vez más importante en la detección y manejo clínico de los pacientes con cáncer. En el caso particular del cáncer de mama, existen ya diversos métodos de pronóstico basados en la determinación de biomarcadores, sin embargo, siguen

(29)

presentando desventajas en cuanto a la facilidad de aplicación del método y el costo asociado. Los métodos basados en la determinación de ARN mensajero (mRNA, por sus siglas en inglés) presentan dificultades técnicas debido a la labilidad de esta molécula, además de que no ofrecen la posibilidad de realizar la determinación en fluidos biológicos de más fácil acceso, como el suero, ya que deben realizarse directamente sobre el tejido tumoral. Otros métodos descritos en el estado de la técnica, basados en moléculas más estables como los microARNs (microRNAs o miRNAs, por sus siglas en inglés), no son los suficientemente específicos como para ofrecer una firma compacta y con resultados claros y bien definidos para su uso clínico.

Procedimiento. La presente invención se refiere a métodos útiles para

determinar el pronóstico de un individuo diagnosticado con cáncer de mama, mediante la determinación del nivel de expresión de una firma de miRNAs asociados al fenotipo troncal en células de cáncer de mama que comprende miRNAs hsa-miR-224, hsa-miR-372, hsa-miR-10b, hsa-miR-548a, hsa-miR- 589, hsa-miR-127, hsa-miR-133a, hsa-miR-135b y hsa-miR-189/hsa-miR-24- 1 o un subconjunto de la misma, su comparación con perfiles de expresión tipo de dicha firma y el cálculo del pronóstico.

Resultados obtenidos y conclusiones. La presente invención supera las

deficiencias del estado de la técnica al proporcionar nuevos métodos moleculares útiles para establecer un pronóstico en pacientes con cáncer de mama con base en una firma compacta de marcadores biológicamente estables, que permite un análisis e interpretación sencillos y eficaces, que es

(30)

reproducible a bajo costo y que ofrece la posibilidad de ser determinado en muestras biológicas menos invasivas como el suero o la saliva. El hecho de contar con una firma compacta de biomarcadores, lo suficientemente robusta para su uso clínico, permite que los métodos descritos sean más sensibles y específicos en la práctica clínica, al poder emplear metodologías como el PCR cuantitativo de transcripción reversa (RT-qPCR) o el PCR digital de transcripción reversa (RT-dPCR), lo cual impacta además en el empleo de una menor cantidad de ácidos nucleicos permitiendo procesar muestras de biopsia o fluidos biológicos más pequeñas. El tamaño pequeño de los microRNAs, así como su estabilidad, permiten su paso desde el tumor hacia los fluidos biológicos, lo que hace posible su medición en sangre periférica y sus derivados, leche, saliva y orina, entre otros. La desregulación de este conjunto específico de miRNAs (entendida ya sea como subexpresión o como sobreexpresión) está directamente relacionada con el pronóstico de un individuo con cáncer de mama.

9. Marcador para Predecir Metástasis del Cáncer de Mama (España Patente nº WO2015036643, 2015)

Problema de investigación. El hecho de que la mayoría de las muertes en

pacientes con cáncer por tumores sólidos se produce posterior a la metástasis lo hace que sea crucial comprender los mecanismos moleculares y celulares que permiten a un tumor metastatizar.

Procedimiento. La invención se relaciona con un método para predecir metástasis en un sujeto diagnosticado con cáncer de mama y tratado con un

(31)

taxano, con un método para la selección de pacientes de cáncer de mama que presentan riesgo de desarrollar metástasis tras el tratamiento con taxano y con un método in vitro para el diseño de una terapia personalizada de un sujeto que sufre de cáncer de mama y que está siendo tratado con taxano basados en determinar el nivel de GRP94 y/o FN14. Asimismo, la invención se relaciona con una composición que comprende un taxano y un inhibidor de GRP94 y/o un inhibidor de FN14 y con su uso en el tratamiento de metástasis cerebral.

Resultados obtenidos y conclusiones. Si el nivel de expresión de GRP94 y/o

el nivel de FN 14 está disminuido con respecto a dicho valor de referencia entonces dicho sujeto no es susceptible de ser tratado con un agente adecuado para el tratamiento de la metástasis cerebral o en donde si el nivel de expresión de GRP94 y/o el nivel de FN14 está incrementado con respecto a dicho valor de referencia entonces dicho sujeto es susceptible de recibir un tratamiento con un agente adecuado para el tratamiento de la metástasis cerebral. Se presenta una relación entre una composición que comprende un taxano y un inhibidor de GRP94 y/o un inhibidor de FN14, en donde si el taxano es docetaxel entonces el inhibidor de FN 14 no es el compuesto de fórmula.

(32)

MARCO CONCEPTUAL

Las bases teóricas, juegan un papel importante, en el desarrollo y sustentación de un proyecto. En esta sección, se presenta el marco teórico utilizado, para el entendimiento necesario y completo del trabajo, así como una descripción de las herramientas utilizadas en su desarrollo.

Marco Teórico

Los fundamentos teóricos que sostienen la investigación son mostrados a continuación. Estos, se encuentran organizados en cuatro grupos: conceptos claves, conceptos técnicos, métricas de evaluación y conceptos clínico-patológicos.

1. Conceptos claves.

Se ubicaron como conceptos claves, los términos base o fundamentales que son aplicados en este proyecto:

Sistema de información: Es un conjunto de elementos encargados de recibir información y procesarla, para convertirla en respuestas de fácil entendimiento al usuario.

Inteligencia artificial (IA). La inteligencia artificial (IA) es una rama de la ciencia informática en la que las máquinas realizan tareas como una mente humana, tales como aprender o razonar. El término inteligencia artificial representa un conjunto de disciplinas de software, lógica, informática y filosofía que están destinadas a hacer que las computadoras realicen funciones que se pensaba que eran exclusivamente humanas, como percibir el significado en el lenguaje escrito o hablado, aprender, reconocer expresiones

(33)

faciales, etc. El campo de la inteligencia artificial tiene una larga historia tras de sí, con muchos avances anteriores, como el reconocimiento de caracteres ópticos, que en la actualidad se consideran como algo cotidiano. (Hewlett Packard Enterprise Development LP, 2019)

Machine learning (ML). Es una disciplina científica del ámbito de la Inteligencia Artificial que crea sistemas que aprenden automáticamente.

Aprender, en este contexto, quiere decir identificar patrones complejos en millones de datos. La máquina que realmente aprende es un algoritmo que revisa los datos y es capaz de predecir comportamientos futuros. (Gonzaléz A.

, 2014)

Deep learning (DL). Es un subconjunto de machine learning que entrena a una computadora para que realice tareas como las hacemos los seres humanos, como el reconocimiento del habla, la identificación de imágenes o hacer predicciones. En lugar de organizar datos para que se ejecuten a través de ecuaciones predefinidas, el Deep learning configura parámetros básicos acerca de los datos y entrena a la computadora para que aprenda por cuenta propia reconociendo patrones mediante el uso de muchas capas de procesamiento. (SAS Institute, 2019).

(34)

Aprendizaje supervisado. Es el más común utilizado, incluye algoritmos tales como regresión lineal y logístico, clasificación de clases múltiples y máquinas de vectores de soporte. Se llama así porque el desarrollador actúa como una guía para enseñar al algoritmo las conclusiones a las que debe llegar, es decir la salida del algoritmo ya es conocida. Es similar a la forma en que un niño podría aprender de un maestro. Requiere que los posibles resultados del algoritmo ya sean conocidos, y que los datos utilizados para entrenarlo estén previamente etiquetados con las respuestas correctas. Por ejemplo, un algoritmo de clasificación aprenderá a identificar animales después de haber sido entrenados en un conjunto de datos de imágenes que están apropiadamente etiquetadas con las especies del animal y algunas características de identificación. (Gonzaléz L. , 2018).

(35)

Red neuronal artificial (RNA). Es un sistema que busca simular el funcionamiento del cerebro humano. Está compuesta por un conjunto de

“neuronas” interconectadas entre sí mediante enlaces. Estos conjuntos son llamados capas y cada capa toma como entradas las salidas de la capa anterior.

Dichas entradas se multiplican por un peso, se agregan los resultados parciales y mediante una función de activación se calcula la salida. (Calvo, 2017).

Figura 7. Estructura básica de una RNA. (Espejel, 2019)

(36)

Red neuronal convolucional. Es muy similar a la red neuronal ordinaria. Son comúnmente utilizadas para la clasificación de imágenes por su buen rendimiento. Una de sus principales características, es la capacidad de reconocer un objeto en particular, sin importar el lugar en que se encuentre.

Funciona en base a la extracción de características principales en cada una de sus capas, (bordes, iluminación, formas, etc.). El objetivo es reducir progresivamente la dimensión de la entrada, obteniendo de esta manera, los parámetros relevantes que aporten a la respuesta final. (Lopez Briega, 2016).

(PLOS, 2019)

(37)

2. Conceptos técnicos

En este apartado, se ubican los conceptos que se usaron en la implementación de la red neuronal convolucional.

Tensor. Hace referencia a una estructura de datos, o conjunto de valores primitivos, por ejemplo, números flotantes o enteros, organizados en un array de 1 o N dimensiones. El rango del “tensor” sería el número de dimensiones.

(Zaforas, 2017). Por ejemplo:

• Un único número (un escalar) sería un tensor de rango 0

• [1. ,2., 3.]: un array sencillo sería un tensor de rango 1

• [[1., 2., 3.], [4., 5., 6.]]: una matriz de 2×3 sería un tensor de rango 2, ya que tiene dos dimensiones (alto y ancho).

•

[[[1., 2., 3.]], [[7., 8., 9.]]]: este sería un ejemplo de un tensor de rango 3 con dimensiones 2x1x3.

Figura 9. Ejemplos de tensores con sus respectivos rangos (dimensiones). Copyright Leonardo Araujo Santos. Extraída de (Araujo Santos, 2019)

(38)

Convolución. Es una operación matemática que extrae propiedades de una imagen de entrada. Consta de dos elementos: una matriz de imágenes y un filtro o núcleo que se encarga de preservar la relación entre píxeles. (Espejel, 2019)

Como se observa en la Figura 10, la imagen (matriz verde), es operada mediante un filtro o kernel, que la recorre (matriz amarilla), el cual va extrayendo una representación de las características relevantes de los pixeles que toma en cada paso, obteniendo una nueva imagen (matriz rosada), con dimensión reducida, que agrupa estas características. Las características extraídas, dependen del filtro usado en cada convolución. (Prabhu, 2018) Stride. Es el número de desplazamientos de píxeles sobre la matriz de entrada.

Cuando el stride es 1, movemos los filtros de a 1 píxel por vez. Cuando el stride es 2, movemos los filtros de a 2 píxeles a la vez y así sucesivamente. Es el paso que da el filtro mientras recorre la imagen. (Prabhu, 2018)

(39)

Pooling. La sección de agrupación de capas (pooling), reduce el número de parámetros cuando las imágenes son demasiado grandes. Esta agrupación espacial también es llamada submuestreo, y reduce la dimensionalidad de cada imagen, pero retiene información importante. Puede ser de diferentes tipos:

• Max pooling: Selecciona los pixeles más brillantes.

• Average pooling: Suaviza la imagen, quita nitidez.

• Min pooling: Selecciona los pixeles más oscuros.

La agrupación máxima o max pooling, toma el elemento más grande del mapa de características seleccionado. Average pooling, hace la agrupación de estas características por medio de un promedio, y el min pooling, se encarga de capturar el valor más pequeño de dicho mapa. (Prabhu, 2018)

(40)

Padding. A veces, el filtro por sus dimensiones no se ajusta perfectamente a la imagen de entrada. Hay dos opciones:

1. Rellenar la imagen con ceros (zero-padding) para que se ajuste.

2. Dejar suelta la parte de la imagen donde el filtro no encaja. Esto se llama relleno válido (valid padding) y mantiene solo una parte válida de la imagen. (Prabhu, 2018)

ReLU. Significa Unidad Lineal Rectificada, y es una operación no lineal. La salida es ƒ (x) = max (0, x). Es decir, todo valor que sea positivo se mantendrá igual, sin embargo, aquel valor que sea negativo se convertirá en cero.

(Prabhu, 2018)

Batch normalization: La normalización por lotes es una técnica para entrenar redes neuronales muy profundas que estandariza las entradas a una capa para cada mini lote. Esto tiene el efecto de estabilizar el proceso de aprendizaje y reducir drásticamente la cantidad de épocas de entrenamiento requeridas para entrenar redes profundas. La normalización por lotes permite que cada capa de una red aprenda por sí misma un poco más independientemente de otras capas. (Brownlee, 2019)

(41)

Flatten: Es la capa encargada de agrupar cada pixel de la imagen en un arreglo de una dimensión. En otras palabras, aplanar la matriz que representa la imagen.

Full connected layer or dense layer. Son capas que están completamente conectadas (densas) por las neuronas en una capa de red. Cada neurona en una capa densa recibe una entrada de todas las neuronas presentes en la capa anterior, por lo tanto, están densamente conectadas.

En otras palabras, la capa densa es una capa totalmente conectada, lo que significa que todas las neuronas de una capa están conectadas con las de la capa siguiente. (Rampurawala, 2019)

Dropout. Es una función de regularización de la red neuronal, y muy útil para evitar problemas como el sobreajuste (overfitting). Cuenta con un parámetro P que permite regular cuál es la probabilidad de mantener los valores de entrada de dicha neurona en tiempo de entrenamiento. Si se asigna, por ejemplo, un DropOut entre la capa 2 y 3 del modelo, y se define que el

(42)

parámetro P sea de 0.4, se está indicando que todos los valores que van a salir de la capa 2 en tiempo de entrenamiento tienen un 40% de probabilidad de llegar a la capa 3, y todos los demás serán forzados a ser 0. Es importante destacar que en Keras, el parámetro que utiliza la capa DropOut funciona de manera inversa, es decir, establece la probabilidad de eliminar el valor.

(Araque Volk, 2019)

Softmax. Es una función de activación que convierte un vector real en un vector de probabilidades categóricas. Los elementos del vector de salida están en el rango (0, 1) y suman 1. Cada vector se maneja de forma independiente.

Softmax a menudo se usa como activación para la última capa de una red de clasificación porque el resultado podría interpretarse como una distribución de probabilidad, es decir, asigna una probabilidad para cada categoría en una clasificación. (Keras, 2020)

Batch. Es el parámetro que define el número de muestras en las que se divide el dataset para ser entrenado. Por ejemplo, si se tiene un dataset con 1250 datos, y se define un tamaño de lote (batch_size) de 100, la red tomará grupos de 100 datos y va aprendiendo de ellos. Comienza con los datos 1 a 100, 101 a 200, y así sucesivamente. En este caso, se tienen 13 pasos, donde el último, tomará un lote que estará conformado por 50 datos únicamente. (itdxer, 2019)

Transfer learning. El aprendizaje por transferencia es un método de aprendizaje automático en el que un modelo desarrollado para una tarea se reutiliza como punto de partida para un modelo en una segunda tarea.

(43)

Es un enfoque popular en el deep learning donde los modelos pre-entrenados se utilizan como punto de partida en las tareas de procesamiento de la visión por computadora y el lenguaje natural, dados los vastos recursos informáticos y de tiempo necesarios para desarrollar modelos de redes neuronales sobre estos problemas y los enormes saltos de habilidad. que proporcionan sobre problemas relacionados. (Brownlee, A Gentle Introduction to Transfer Learning for Deep Learning, 2019)

Entrenamiento (training dataset). Es la muestra de datos utilizada para ajustarse al modelo. Es decir, el conjunto de datos etiquetados que se utiliza para entrenar el modelo. El modelo ve y aprende de estos datos. (Shah, 2017)

Validación (validation dataset). Es la muestra de datos utilizada para proporcionar una evaluación de un modelo ajustado en el conjunto de datos de entrenamiento, mientras se ajustan los hiperparámetros del modelo. En este punto, la red neuronal tiene conocimiento de las etiquetas de los datos. (Shah, 2017)

Prueba (test dataset). Es la muestra de datos utilizada para proporcionar una evaluación del ajuste final del modelo en el conjunto de datos de entrenamiento. El conjunto de datos de prueba proporciona el estándar de oro utilizado para evaluar el modelo. Solo se usa una vez que un modelo está completamente entrenado (usando los conjuntos de entrenamiento y validación). El conjunto de prueba es generalmente lo que se usa para evaluar modelos competidores y son datos de los cuales el modelo no tiene conocimiento de sus etiquetas. (Shah, 2017)

(44)

Mapa de calor. Un mapa de calor (heatmap) es una representación gráfica de datos donde los valores se representan por color; el color rojo representa la zona de mayor relevancia. Los mapas de calor facilitan la visualización de datos complejos y su comprensión. (Hotjar, 2020)

3. Métricas de evaluación.

Las métricas usadas para la evaluación del modelo fueron: accuracy, precision, recall y F1 score. El cálculo de estas métricas se hace en base a los valores de falsos y verdaderos, positivos y negativos, las convenciones se muestran a continuación:

• TP → Verdaderos positivos, clasificar como positiva una clase positiva.

• TN→ Verdaderos negativos, clasificar como negativa una clase negativa.

• FP → Falsos positivos, clasificar como positiva una clase negativa.

• FN → Falsos negativos, clasificar como negativa una clase positiva.

Accuracy. Es la medida de rendimiento más intuitiva y es simplemente una relación entre la observación predicha correctamente y el total de observaciones. Se puede pensar que, si se tiene una alta precisión, entonces el modelo es muy bueno. Sin embargo, esto es cierto solo cuando se tiene conjuntos de datos simétricos donde los valores de falsos positivos y falsos negativos son casi iguales. Por lo tanto, se debe buscar otros parámetros para evaluar el rendimiento de su modelo. (Renuka Joshi, 2016)

𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑇𝑃 + 𝑇𝑁

𝑇𝑃 + 𝐹𝑃 + 𝑇𝑁 + 𝐹𝑁

Precision. Es la relación entre las observaciones positivas predichas correctamente y el total de observaciones positivas predichas, es decir, cuáles

(45)

de las predicciones positivas, en realidad lo son. Responde a la pregunta ¿Qué proporción de las predicciones positivas eran positivas en realidad? (Google developers, 2020)

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑃

Recall. Es la proporción de observaciones positivas predichas correctamente con respecto a todas las observaciones en la clase real, es decir, la capacidad del modelo para clasificar correctamente las clases positivas. Responde a la pregunta ¿Qué proporción de positivos reales se predijo correctamente?

(Google developers, 2020)

𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑁

F1-score. El F1 score se puede interpretar como un promedio ponderado de precisión y recall, donde un F1 score alcanza su mejor valor en 1 y el peor puntaje en 0. La contribución relativa de precision y recall al F1 score es igual.

(scikit-learn developers, 2020)

𝐹1 𝑠𝑐𝑜𝑟𝑒 =

2×(𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛×𝑟𝑒𝑐𝑎𝑙𝑙) (𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑟𝑒𝑐𝑎𝑙𝑙)

AUC: Significa "área bajo la curva ROC". Esto quiere decir, que el AUC mide toda el área bidimensional por debajo de la curva ROC completa. Oscila en un rango de valor del 0 al 1. Un modelo cuyas predicciones son un 100%

incorrectas tiene un AUC de 0.0; otro cuyas predicciones son un 100%

correctas tiene un AUC de 1.0. (Google developers, 2020)

(46)

Loss: Es una penalidad por una predicción incorrecta. Esto quiere decir que es un número que indica qué tan incorrecta fue la predicción del modelo en un solo ejemplo. Si la predicción del modelo es perfecta, la pérdida es cero;

de lo contrario, la pérdida es mayor. (Google developers, 2020)

4. Conceptos clínico-patológicos.

Para la realización del trabajo, fue necesario hacer una investigación del área en que se está aplicando este prototipo de sistema de información. A continuación, se muestran los conceptos que fueron necesarios para el entendimiento real del problema y el planteamiento de la solución que se presenta.

Cáncer. Células anormales que se multiplicar sin control y pueden invadir tejidos cercanos. (Fondo Colombiano de Enfermedades de Alto Costo Cuenta de Alto Costo[CAC], 2018)

Mamografía. La mamografía es un tipo de imagen médica especializada que utiliza un sistema de dosis baja de rayos X para visualizar el interior de las mamas. Un examen de mamografía ayuda en la detección temprana y el diagnóstico de las enfermedades mamarias en las mujeres. (Radiological Society of North America, 2019)

Carcinoma mamario. Un carcinoma es el cáncer que empieza en la piel o en los tejidos que revisten o cubren los órganos internos. El carcinoma mamario es el cáncer que se forma en los tejidos del seno (mama). El tipo de cáncer de mama más común es el carcinoma ductal, que empieza en el revestimiento de

(47)

los conductos delgados que llevan leche desde los lobulillos de la mama hasta el pezón. Otro tipo de cáncer de mama es el carcinoma lobulillar, que empieza en los lobulillos (glándulas lácteas) de la mama. El cáncer de mama invasivo es el que se diseminó desde el sitio donde empezó (conductos de la mama o lobulillos) hasta el tejido normal que los rodea. El cáncer de mama se presenta tanto en hombres como en mujeres, aunque el cáncer de mama masculino es poco frecuente. (NIH ... Transformación de Descubrimientos en Salud, 2019)

Falso positivo. El falso positivo, hace referencia al resultado de una prueba que indica que una persona tiene cierta enfermedad o afección cuando en realidad no la tiene. Es decir, que el examen dice que la paciente tiene cáncer de mama, cuando en realidad no es así. (NIH ... Transformación de Descubrimientos en Salud, 2019)

Falso negativo. El falso negativo es todo lo contrario al falso positivo. Hace referencia al resultado de una prueba que indica que una persona no tiene cierta enfermedad o afección cuando en realidad la tiene. Es decir, que el examen dice que la paciente no tiene cáncer, cuando en realidad si lo tiene.

(NIH ... Transformación de Descubrimientos en Salud, 2019)

Densidad mamaria. Los senos están conformados por lobulillos, conductos, tejidos adiposos y tejido conectivo fibroso.

• Los lobulillos producen leche y a menudo se les llama tejido glandular

• Los conductos son tubos diminutos que llevan la leche desde los lobulillos al pezón

(48)

• El tejido fibroso y la grasa son los que dan el tamaño y la forma a los senos, y mantienen los otros tejidos en su lugar

• Los senos se observarán densos si se tiene mucho tejido fibroso o glandular sin tanta grasa en los senos. Algunas mujeres tienen más tejido mamario denso que otras. Para la mayoría de las mujeres, los senos se vuelven menos densos con la edad, aunque para algunas mujeres, la densidad cambia poco (American Cancer Society, 2019)

Hay diferentes grados de densidad de la mama, desde tejido poco denso o inexistente hasta tejido muy denso. Cuanta más densidad haya, más difícil es encontrar tumores y otros cambios en una mamografía. (NIH ...

Transformación de Descubrimientos en Salud, 2019)

Sensibilidad mamográfica. Es la probabilidad de clasificar correctamente a un individuo enfermo, es decir, la probabilidad de que para un sujeto enfermo se obtenga en la prueba un resultado positivo. La sensibilidad es, por lo tanto, la capacidad de la mamografía para detectar el cáncer. (Pita Fernández &

Pértegas Díaz, 2010)

Especificidad mamográfica. Es la probabilidad de clasificar correctamente a un individuo sano, es decir, la probabilidad de que para un sujeto sano se obtenga un resultado negativo. En otras palabras, se puede definir la especificidad como la capacidad para detectar a quienes no tienen cáncer de mama. (Pita Fernández & Pértegas Díaz, 2010)

(49)

Biopsia. Remoción de células o tejido, para ser examinado por el patólogo.

(Fondo Colombiano de Enfermedades de Alto Costo Cuenta de Alto Costo[CAC], 2018)

Nódulos mamarios. Consisten en una masa o aumento de volumen que puede tener distintas causas. Una de ellas es la acumulación de líquido en una fina membrana y en estos casos reciben el nombre de quistes (cambios fibroquísticos), los que no tienen ninguna relación con el cáncer. En cambio, si la protuberancia es producto de una formación de contenido sólido, sin líquido en su interior, se le debe considerar como un tumor mamario, que puede ser benigno o maligno (cáncer de mama). (Camacho Neira, 2017)

Microcalcificaciones. Son las lesiones no palpables más frecuentes de la mama. Son diminutos depósitos de calcio en el tejido mamario que se observan en una mamografía en forma de pequeños puntos blanquecinos.

(RBA, 2018)

Morbilidad. Proporción de enfermedad en una población determinada.

(Fondo Colombiano de Enfermedades de Alto Costo Cuenta de Alto Costo[CAC], 2018).

Carcinoma in situ. Células anormales que se encuentran en el lugar donde se formaron inicialmente y no se han diseminado. (Fondo Colombiano de Enfermedades de Alto Costo Cuenta de Alto Costo[CAC], 2018)

(50)

Carcinoma invasivo. Cáncer que se ha diseminado más allá de la capa de tejido de la cual se desarrolló, infiltrando el tejido sano. (Fondo Colombiano de Enfermedades de Alto Costo Cuenta de Alto Costo[CAC], 2018).

Marco tecnológico.

Para el cumplimiento de cada objetivo planteado, se tuvo que acudir a una lista de herramientas profesionales, que proveyeron los recursos suficientes y necesarios para cumplir con cada actividad de la mejor manera.

Cygwin: Es un conjunto de herramientas de desarrollo, elaborada por Red Hat, para proporcionar un comportamiento similar a los sistemas Unix en Windows. (Linux Adictos, 2019)

WinSCP: Es una aplicación gratuita de transferencia de archivos de código abierto, exclusiva de Windows, que utiliza el Protocolo de transferencia de archivos Secure Shell y el Protocolo de copia segura para la transferencia de archivos simple o segura entre la computadora local y un servidor remoto. ( Wayne, 2020)

Pydicom: Pydicom es un paquete de Python para trabajar con archivos DICOM. Fue hecho para inspeccionar y modificar datos DICOM de una manera fácil. Las modificaciones se pueden volver a escribir en un nuevo archivo. Puede ejecutarse en cualquier lugar donde se ejecute Python sin ningún otro requisito, aunque se necesita NumPy si se manipulan datos de píxeles. (Python Software Fundation, 2020)

(51)

OpenCV: OpenCV-Python es una librería de código abierto con enlaces de Python diseñada especialmente para resolver problemas de visión por computadora.

(OpenCV, 2020)

NumPy: Es el paquete fundamental para la computación científica con Python.

Proporciona un objeto de matriz multidimensional y una variedad de rutinas para operaciones rápidas en matrices, que incluyen matemática, lógica, manipulación de formas, clasificación, álgebra lineal básica, operaciones estadísticas básicas, simulación aleatoria y mucho más. (NumPy, 2020)

Scikit learn: Es una biblioteca en Python que proporciona muchos algoritmos de aprendizaje supervisados y sin supervisión. Se basa en tecnologías como NumPy, Pandas y Matplotlib. (Codecademy, 2020)

TensorFlow. TensorFlow es una biblioteca de código abierto dirigida al aprendizaje automático a través de una serie de tareas. Ha sido desarrollado por Google para satisfacer las necesidades de sistemas capaces de construir y entrenar redes neuronales para detectar y descifrar patrones y correlaciones, análogos al aprendizaje y razonamiento usados por los humanos. (Ortego Delgado, 2017)

Flutter. Flutter es el kit de herramientas de interfaz de usuario de Google para crear aplicaciones compiladas de forma nativa en dispositivos móviles, web y de escritorio desde una única base de código. (flutter-dev, 2020)

Flask. Es un marco web, esto significa que Flask proporciona herramientas, bibliotecas y tecnologías que permiten crear una aplicación web. Esta aplicación web puede ser una página web, un blog, un wiki o ser tan grande como una aplicación de

(52)

calendario basada en la web o un sitio web comercial. En este trabajo, se usó esta herramienta para crear un api, como unión de nuestra red neuronal, con el frontend elaborado en Flutter. (Kushai Das, 2020)

Firebase. Firebase es un Back-end-as-a-Service (Baas). Proporciona a los desarrolladores una variedad de herramientas y servicios para ayudarlos a desarrollar aplicaciones de calidad y aumentar su base de usuarios. Está construido sobre la infraestructura de Google. Firebase se clasifica como un programa de base de datos NoSQL, que almacena datos en documentos similares a JSON. En Firebase, un documento es un conjunto de pares clave-valor definidos por un esquema. Un grupo de documentos forma una colección. (Educative, 2020)

StarUML. Es una plataforma de modelado de software que admite Unifited Modeling Language (UML). Se basa en la versión 1.4 de UML y proporciona once tipos diferentes de diagramas. (documentation.help, 2020)

Figma. Figma es una herramienta de diseño y creación de prototipos basada en la nube para proyectos digitales. Está hecho para que los usuarios puedan colaborar en proyectos y trabajar prácticamente en cualquier lugar. Si bien, esta herramienta se parece mucho a otras opciones de creación de prototipos, el diferenciador clave es la capacidad de trabajar con equipos en proyectos. (Cousins, 2019)

Maze-Design. Maze es una herramienta de prueba de usabilidad en línea que puede usar prototipos de alta fidelidad para preparar la configuración del entorno de test de usabilidad / UT remoto. Permite que usuarios reales interactúen con el prototipo definiendo misiones. Con esto, se recopila información práctica para un posterior