Herramienta móvil para la segmentación asistida y análisis de imágenes médicas

(1)

Herramienta M´

ovil para la

Segmentaci´

on Asistida y An´

alisis de

Im´

agenes M´

edicas

Mar´ıa Cecilia Sachetti

Trabajo de grado presentado como requisito para optar al t´ıtulo de: Ingenier´ıa de Sistemas

Directores: Dra. Mariana del Fresno

Dr. Lucas Lo Vercio

Universidad Nacional del Centro de la Provincia de Buenos Aires Facultad de Ciencias Exactas

(2)

(3)

Resumen

El uso de dispositivos móviles ha aumentado exponencialmente durante las últimas décadas, alcanzando diversos ámbitos, incluido el de la medicina. En la actualidad existen diversas aplicaciones móviles desarrolladas para la asistencia al diagnóstico y tratamientos médicos, capaces de procesar archivos en formato DICOM en estos dispositivos. Dentro del procesamiento de las imágenes médicas, una de las etapas más importantes consiste en la segmentación, es decir la delineación de estructuras anatómicas o patológicas. En este punto es que existen limitaciones en las aplicaciones existentes, especialmente en la obtención de segmentaciones completas y correctas de acuerdo al tejido que se observa. Este proyecto presenta una herramienta móvil para sistemas Android cuya funcionalidad principal consiste en corroborar la validez de distintos tipos de segmentaciones realizadas por el usuario. Según la imagen médica, la herramienta proporciona las geometr´ıas y validaciones de forma correspondientes a los tejidos que pueden observarse. El desarrollo cuenta con un diseño flexible que facilita incluir nuevos tipos de segmentaciones y validaciones de manera sencilla. Las pruebas realizadas sobre distintos dispositivos muestran que la aplicación hace un eficiente uso de la memoria. También se comprobó la adaptabilidad de las interfaces de la aplicación a pantallas de distintos tamaños.

(4)

(5)

Agradecimientos

A mis familiares y amigos.

A mis papás, Cristina y Fernando, gracias por haberme dado, con tanto esfuerzo, la posibilidad de estudiar lo que eleg´ı, por crear este futuro para m´ı y por alentarme siempre a seguir adelante. A mis hermanos y amigos por cada palabra de felicitación y apoyo ante cada paso que me acercaba más a esta meta, por más pequeño que fuera. ¡Gracias!

A Daniel.

Gracias por acompañarme durante todo este tiempo, por tus consejos y aportes cada vez que los necesité, por entenderme en los momentos en que no parec´ıa fácil finalizar este proyecto y siempre motivarme a seguir. Gracias por estar siempre a mi lado.

A la universidad p´ublica argentina.

(6)

(7)

Contenido

Res´umen I

Agradecimientos III

Lista de figuras VII

Lista de tablas IX

Lista de bloques de c´odigo X

1 Introducci´on 1

1.1 Motivaci´on . . . 1

1.1.1 Dispositivos m´oviles . . . 1

1.1.2 Asistencia al diagn´ostico por computadora . . . 2

1.2 Estado del arte . . . 4

1.2.1 Soluciones existentes para iOS . . . 4

1.2.2 Soluciones existentes para Android . . . 6

1.3 Propuesta . . . 7

2 Segmentación de imágenes médicas 9 2.1 Etapas del procesamiento de imágenes médicas . . . 9

2.1.1 Captura . . . 11

2.1.2 Preprocesamiento . . . 11

2.1.3 Extracci´on de caracter´ısticas . . . 12

2.1.4 Segmentaci´on . . . 12

2.1.5 Registraci´on . . . 13

2.2 Segmentación manual, automática y semiautomática . . . 13

2.2.1 Modelos deformables . . . 14

2.3 Evaluaci´on de la segmentaci´on . . . 15

2.4 Segmentaciones de inter´es . . . 16

3 Diseño e implementación 18 3.1 Consideraciones de programación para dispositivos móviles Android . . . 18

3.1.1 Elecci´on de la API . . . 18

(8)

3.1.3 Memoria . . . 21

3.2 Programaci´on en Android . . . 22

3.2.1 Componentes de la aplicaci´on . . . 22

3.2.1.1 Activity . . . 23

3.2.1.2 Listeners . . . 23

3.2.2 Librer´ıa DICOM . . . 24

3.2.3 Framework de IoC e inyecci´on de dependencias . . . 25

3.2.4 Método de segmentación automática . . . 28

3.2.5 Compatibilidad . . . 29

3.3 Implementaci´on . . . 30

3.3.1 Validadores . . . 33

3.3.2 Escenarios de validaci´on . . . 33

4 Resultados 37 4.1 Usabilidad . . . 37

4.1.1 Apertura y segmentaci´on v´alida de un archivo DICOM . . . 39

4.1.2 Errores de validaci´on . . . 42

4.1.3 Segmentaci´on autom´atica mediante modelos deformables . . . 42

4.2 Extensi´on . . . 43

4.2.1 Implementaci´on de nuevos validadores . . . 43

4.2.2 Mensajes de error . . . 46

4.2.3 Nuevos tipos de segmentaci´on . . . 49

4.2.4 Interfaz de usuario . . . 50

4.2.5 Segmentaciones implementadas . . . 53

4.2.5.1 Ultrasonido intravascular (IVUS) . . . 53

4.2.5.2 Retinograf´ıa . . . 55

4.2.5.3 Ultrasonido carot´ıdeo . . . 55

4.2.5.4 Tumor cerebral . . . 57

4.3 Uso de recursos computacionales . . . 57

4.3.1 Resultados en emuladores . . . 57

4.3.2 Resultados en dispositivos reales . . . 64

4.4 Pruebas en distintas pantallas . . . 64

5 Conclusiones y trabajos futuros 68 5.1 Conclusiones . . . 68

5.2 Trabajos Futuros . . . 69

(9)

Lista de Figuras

2-1. Etapas del procesamiento de im´agenes m´edicas. . . 10

3-1. Distribuci´on de dispositivos entre las versiones de la API. . . 20

3-2. Interfaz e implementaciones para la exportaci´on de la base de datos en dife-rentes formatos. . . 26

3-3. Pantallas de información y configuración de la aplicación en sistema Android 7.0 (API nivel 24) . . . 31

3-4. Diagrama de clases correspondiente al dise˜no de los tipos de segmentaciones y sus validadores. . . 34

3-5. Diagrama de secuencia correspondiente a la validaci´on de una segmentaci´on. 35 4-1. Apertura de un archivo DICOM . . . 40

4-2. Visualización del frame y selección del tipo de segmentación . . . 41

4-3. Segmentaci´on de lumen-´ıntima en un estudio IVUS. . . 42

4-4. Errores de validaci´on durante segmentaci´on de IVUS. . . 43

4-5. Segmentaci´on semiautom´atica mediante modelos deformables . . . 44

4-6. Interfaz a implementar para la creaci´on de nuevos validadores. . . 45

4-7. Implementaci´on del validador de contorno cerrado. . . 46

4-8. Implementaci´on del validador abstracto de contornos curvos conc´entricos . . 47

4-9. Implementaci´on del validador de exterioridad para contornos curvos conc´ entri-cos. . . 48

4-10.Implementaci´on del validador de interioridad para contornos curvos conc´ entri-cos. . . 48

4-11.Definición de claves para los mensajes de error utilizados por los validadores. 48 4-12.Definición de la traducción de los mensajes de error. . . 49

4-13.Definici´on del nuevo tipo de segmentaci´onIVUS lumen-intima eIVUS media-adventitia. . . 50

4-14.Definici´on de las segmentaciones relacionadas para los nuevos tipo de segmen-taci´on IVUS lumen-intima e IVUS media-adventitia. . . 51

4-15.Creaci´on de una nuevaactivity en el entorno de desarrollo Android Studio. . 52

4-16.Layout correspondiente a la nueva activity, incluyendo al archivo contenedor de los elementos de la vista content ivusseg.xml. . . 52

4-17.Layout contenedor de los elementos de la nueva vista para el estudio IVUS. . 53

(10)

4-19.Bot´on para la selecci´on del nuevo tipo de estudio IVUS en el layout de la

activity SelectSegmentationActivity . . . 54

4-20.Modificaciones en SelectSegmentationActivity para asignar comportamiento al nuevo bot´on asociado al estudio IVUS . . . 55

4-21.Diagrama de secuencia correspondiente a la validaci´on de una segmentaci´on de tipo IVUS media-adventitia . . . 56

4-22.Tipos de segmentaciones implementadas en la herramienta. . . 58

4-23.Uso de la memoria RAM durante el inicio de la aplicaci´on en el perfil de hardware 1. . . 60

4-24.Uso de la memoria RAM durante el inicio de la aplicaci´on en el perfil de hardware 2. . . 60

4-25.Uso de la memoria RAM durante la manipulaci´on de un archivo DICOM en el perfil de hardware 1. . . 61

4-26.Uso de la memoria RAM durante la manipulaci´on de un archivo DICOM en el perfil de hardware 2. . . 61

4-27.Uso de la memoria RAM durante la realizaci´on de segmentaciones en el perfil de hardware 1. . . 62

4-28.Uso de la memoria RAM durante la realizaci´on de segmentaciones en el perfil de hardware 2. . . 62

4-29.Uso de la memoria RAM y CPU durante la realizaci´on de segmentaciones en el perfil de hardware 1. . . 63

4-30.Uso de la memoria RAM y CPU durante la realizaci´on de segmentaciones en el perfil de hardware 2. . . 63

4-31.Uso de recursos en dispositivo Samsung Galaxy A3. . . 64

4-32.Uso de recursos en dispositivo Moto Z Play. . . 65

4-33.Adaptabilidad de las interfaces en dispositivo Samsung Galaxy A3. . . 66

4-34.Adaptabilidad de las interfaces en dispositivo Moto Z Play. . . 66

(11)

Lista de Tablas

1-1. Comparación entre soluciones existentes y sus caracter´ısticas para la manipu-lación de imágenes DICOM en sistemas iOS y Android . . . 8

(12)

3-1. Segmento del m´odulo DicomSegModule que provee una dependencia de tipo IDbExporter para la exportaci´on de la base de datos en formato XML . . . . 27

3-2. Componente MainActivityComponent encargado de inyectar las dependencias necesarias en la clase MainActivity . . . 27

3-3. Segmento de la actividad MainActivity que permite la inyecci´on mediante Dagger de una dependencia de interfaz IDbExporter . . . 28

3-4. Segmento del archivo manifiesto donde se indican los permisos requeridos por la aplicaci´on . . . 30

(13)

1 Introducci´

on

El auge de los dispositivos móviles en los últimos años ha causado una gran repercu-sión en muchos aspectos, no sólo de la vida cotidiana de las personas, sino también de las tecnolog´ıas afines a su evolución y desarrollo. El campo de la medicina no se vio exento de este crecimiento y se ha vuelto frecuente la adopción de estos dispositivos por parte de los profesionales de la salud para acceder rápidamente a la información cl´ınica.

Las imágenes médicas conforman uno de los aspectos más importantes de la información de un paciente, ya que su análisis permite al médico realizar tareas fundamentales como el diagnóstico de enfermedades y el monitoreo de tratamientos. En los últimos años ha tomado relevancia la asistencia que las herramientas informáticas pueden brindar en estos aspectos. Estas herramientas facilitan considerablemente el análisis y procesamiento, sobre todo en un contexto donde ha aumentado el número de modalidades de captura existentes, y el tamaño de las imágenes.

En particular, la asistencia a la segmentación o detección de áreas de interés dentro de una imagen es de particular importancia ya que permite reducir el tiempo y esfuerzo que esta tarea puede demandar por parte del especialista, a la vez que posibilita lograr resultados más precisos, completos y repetibles.

En la actualidad existen distintas aplicaciones para dispositivos móviles destinadas a la manipulación de imágenes médicas, cada una de ellas con distintas caracter´ısticas y limitaciones. Es entre estas limitaciones, relacionadas principalmente a la necesidad de ob-tener segmentaciones completas y correctas, que surge la motivación para el desarrollo de la herramienta presentada en este trabajo.

1.1. Motivaci´

on

1.1.1. Dispositivos m´

oviles

(14)

La aparición de los smartphones sobre el final de los años 90 y la popularización de las

tablets hacia el año 2010 trajeron consigo una creciente cantidad de aplicaciones destinadas a simplificar no solo actividades cotidianas sino también actividades laborales. As´ı, los dis-positivos móviles se integraron completamente a la rutina de las personas, formando parte de su vida no solo personal, sino también profesional. De esta manera, en medio del auge de las tecnolog´ıas móviles, se generó un ambiente propicio para el desarrollo de la denominada

computaci´on ubicua (oubicomp) [3], tecnolog´ıa que est´a disponible en todo momento y lugar, es decir, onmipresente.

1.1.2. Asistencia al diagn´

ostico por computadora

Desde el descubrimiento de los rayos X, el campo de las imágenes médicas ha evolu-cionado exponencialmente, tanto en la práctica cl´ınica como en el ámbito académico. Una imagen médica permite la visualización de partes del cuerpo, tejidos u órganos, con el princi-pal objetivo de asistir al diagnóstico, tratamiento y monitoreo de enfermedades [4]. Gracias a la tomograf´ıa computada (CT), las imágenes de resonancia magnética (MRI), la tomo-graf´ıa por emisión de positrones (PET), el ultrasonido y otras modalidades de obtención de imágenes médicas, los médicos radiólogos (profesionales especializados en llevar a cabo estudios mediante imágenes médicas, y en su posterior análisis) y demás especialistas pueden observar el interior del cuerpo humano con gran detalle [5].

Desde sus comienzos, debido a la existencia de diversos fabricantes y métodos de ob-tención de imágenes médicas, los dispositivos utilizados para capturarlas dieron origen a dis-tintos formatos de imágenes y formas de transmisión de dicha información. A fin de resolver estas diferencias y posibilitar la interconexión de los equipos surgió DICOM (Digital Imaging and Communications in Medicine), el estándar aceptado mundialmente para el almacena-miento, visualización y transmisión de imágenes médicas [6]. DICOM permite persistir en forma sistematizada imágenes y anotaciones, y visualizar esta información en diferentes dis-positivos, independientemente de la plataforma en que se obtuvieron. Habitualmente, las imágenes DICOM adquiridas en las instituciones de salud desde las distintas modalidades (CT, MRI, ultrasonido, rayos X, etc.) son almacenadas en sistemas PACS (Picture Archiving and Communication System) para su gestión eficiente. Un servidor PACS es un sistema que permite el almacenamiento y la transmisión de imágenes médicas dentro de una institución hospitalaria. Estos sistemas también proveen servicios para la visualización de las imágenes DICOM y ofrecen distintas facilidades para acceder a ellas desde las estaciones de trabajo, bajo determinados protocolos de seguridad [7].

(15)

1.1 Motivaci´on 3

(Computer-Aided Diagnosis - CAD). Este tipo de herramientas han evolucionado notable-mente en los últimos años, contando actualmente con distintas alternativas automáticas o semiautomáticas, que en muchos casos se incorporan a la práctica cotidiana para asistir a los profesionales [8]. El avance en la tecnolog´ıa de adquisición de imágenes médicas digitales y el incremento de modalidades y resolución de las mismas han convertido al análisis automático en un componente fundamental para el diagnóstico y tratamientos en el ámbito cl´ınico.

Entre las facilidades provistas por las aplicaciones CAD se encuentran la visualización, segmentación y análisis de imágenes médicas. La segmentación consiste en particionar una imagen en diferentes secciones, segmentos o estructuras significativas [9]. Representa uno de los procesos fundamentales debido a que facilita la detección, caracterización y visualización de las regiones de interés dentro de la imagen, y por lo tanto su resultado afecta las subse-cuentes etapas de análisis [10]. A partir de las segmentaciones obtenidas se pueden extraer diversos indicadores de utilidad sobre la geometr´ıa, estructura y medidas de las regiones de interés; por ejemplo, el ancho de la pared arterial para estimar el riesgo cardiovascular, o el nivel de vascularización en tumores cerebrales, para estimar la proyección de evolución del mismo.

Durante la utilización de aplicaciones de asistencia al diagnóstico médico, los profesio-nales suelen efectuar anotaciones sobre las imágenes, para dejar evidencia del diagnóstico o tratamiento realizado. Por lo tanto, es necesario un correcto resguardo de las mismas junto a las imágenes médicas y la información del paciente, ya que contribuye a enriquecer su historia cl´ınica. Además, esta información es de utilidad en el desarrollo de interconsultas con otros especialistas, para transmitir y discutir diagnósticos.

Por el lado de la investigación en métodos de segmentación y análisis de imágenes, las anotaciones de los especialistas son especialmente requeridas para el diseño y validación de los algoritmos computacionales para CAD. Para la investigación sobre métodos de segmentación automática de imágenes médicas, cuyo fin es obtener segmentaciones sin ningún tipo de supervisión, es necesario contar con las correspondientes anotaciones de los especialistas para el entrenamiento de los algoritmos desarrollados o para determinar la exactitud de los resultados obtenidos [11].

(16)

en cuenta algunos aspectos importantes en el desarrollo de aplicaciones móviles, relativos a la seguridad y capacidad de transmisión y visualización de las imágenes, dependiendo de la tecnolog´ıa utilizada [15].

La última generación de dispositivos móviles se caracteriza por poseer pantallas t´ acti-les, que simplifican considerablemente su utilización. Esta caracter´ıstica puede facilitar a los profesionales tareas como la de seleccionar áreas de interés sobre una imagen médica. En relación a los requisitos necesarios para una correcta segmentación puede ser de gran utili-dad para los médicos contar con ciertas gu´ıas que faciliten la obtención de segmentaciones apropiadas y completas.

Es as´ı, en el contexto previamente presentado, que la computación ubicua se ha inte-grado fuertemente en el ámbito de la medicina, permitiendo que la tecnolog´ıa para asistir a los profesionales médicos esté disponible en todo momento y lugar, colaborando muchas veces de forma transparente para conseguir resultados con mayor rapidez y cada vez más confiables en las áreas de diagnóstico y tratamiento de enfermedades.

1.2. Estado del arte

Dentro de la amplia gama de dispositivos móviles táctiles disponibles en el mercado, se ha estimado que alrededor de un 80 % de los mismos utilizan el sistema operativo Android [16]. Esta plataforma tiene la ventaja de ser open source, lo que permite tener acceso a su código fuente e implementar personalizaciones del mismo. Otra gran ventaja que posee, es que existen entornos de desarrollo gratuitos para implementar aplicaciones para dicho sistema, los cuales funcionan tanto en sistemas Linux como Windows. Actualmente, como se verá mas adelante, existen varias aplicaciones Android que permiten la visualización y análisis de archivos DICOM.

En segundo lugar, con una cuota de mercado de 13 % aproximadamente, se encuen-tra iOS [16]. A diferencia de la flexibilidad ofrecida por Android en cuanto al desarrollo de aplicaciones, en el caso de iOS es necesario contar con una computadora Mac, ya que los entornos disponibles no funcionan en ningún otro sistema operativo más que iOs mismo. También existen aplicaciones que operan sobre archivos DICOM para esta plataforma, como por ejemplo OsiriXR [17]. Esta aplicación incluye entre sus caracter´ısticas, la visualización de las imágenes y herramientas de ajuste y medición [18]. Pero, al igual que las aplicacio-nes existentes para Android, no dispone de una herramienta para marcar o segmentar las imágenes considerando la geometr´ıa del objeto de interés.

1.2.1. Soluciones existentes para iOS

(17)

1.2 Estado del arte 5

para la comunicación de imágenes y es capaz de recibir imágenes transmitidas por dicho protocolo de comunicación desde cualquier PACS.

Esta aplicación es gratuita en su versión para 32 bits, pero su versión de 64 bits que alcanza mejores prestaciones, es paga. También existe otra versión paga denominada OsiriX MD, que además de incluir la versión para 64 bits, incluye soporte por email y plugins con ayuda al usuario.

Entre las caracter´ısticas más importantes con respecto a la manipulación de imágenes DICOM se encuentran las siguientes:

Lectura y visualizaci´on de archivos DICOM Una imagen 2D (dos dimensiones) consiste

en una imagen expresada en un plano. En su aplicación en la informática médica, las acciones sobre este tipo de imágenes consisten simplemente en zoom y desplazamientos en cualquiera de las direcciones del plano. En el caso de imágenes 3D (tres dimensiones), en cambio, se pueden realizar acciones propias de cuerpos en el espacio. Tradicionalmente, las imágenes médicas generadas por los equipos son 2D, pero mediante la obtención de muchos escaneos y su combinación mediante algoritmos de reconstrucción apropiados pueden obtenerse modelos 3D. Por último, las imágenes 4D (4 dimensiones, o 3D+t) consisten en una serie temporal de imágenes 3D, con las cuales los profesionales pueden observar movimientos y cambios a través del tiempo en el estudio que se le realiza al paciente.

OsiriX cuenta con visualizaci´on de im´agenes 2D, 3D y 4D. Para los dos primeros tipos de visualizaciones posee herramientas que permiten ajustar el contraste y el brillo de la imagen, hacer zoom, moverse sobre la imagen, rotarla, medir distancias, entre otras.

Una limitación de esta aplicación con respecto a la visualización se presenta con im´ age-nes más grandes a 1024x1024 pixeles. En dicho caso, la aplicación redimensionará la imagen para hacerla igual o más pequeña que dicho tamaño.

Formatos de imágenes OsiriX puede manejar imágenes DICOM, como as´ı también JPEG lossy, JPEG lossless, JPEG-LS, y JPEG 2000 [19].

Herramientas de segmentación En relación con esta funcionalidad, OsiriX provee una herramienta de pincel para hacer anotaciones sobre las imágenes médicas y para indicar áreas mediante rectángulos o c´ırculos, pero carece de herramientas de segmentación complejas. Sin embargo, existen algunos plugins que agregan dicha funcionalidad a la aplicación para distintos formatos de imágenes y distintos tipos de estudios, utilizando diferentes algoritmos.

Algunos ejemplos destacados de estos plugins [20] son:

(18)

Ejection Fraction: Permite medir la fracción de eyección del ventr´ıculo izquierdo en resonancias magnéticas card´ıacas, mediante un proceso semi automático paso a paso.

Hip Arthroplasty Templates: Consiste en un plugin de planificación digital preopera-toria para reemplazo de articulaciones en condiciones artr´ıticas de cadera. Permite al cirujano seleccionar de una biblioteca de plantillas y superponerlas electrónicamente en una imagen DICOM. El cirujano puede entonces realizar las mediciones necesarias para el proceso de planificación de plantillas y pre-operatorio en un entorno digital.

Memoria Dependiendo de la cantidad de imágenes que se deseen abrir, lo cual también está determinado por el tipo de estudio que se quiere visualizar, hay que tener en cuenta la cantidad de memoria del dispositivo. OsiriX está preparado para levantar hasta 3000 imágenes (como por ejemplo, una tomograf´ıa computada 4D), pero para ello requerirá estar corriendo en un dispositivo con al menos 4GB de memoria RAM.

1.2.2. Soluciones existentes para Android

Actualmente existen varias aplicaciones desarrolladas para la plataforma Android que manipulan im´agenes DICOM, pero con muy pocas caracter´ısticas en comparaci´on con las que ofrece Osirix de iOS.

La gran mayor´ıa de las aplicaciones de este tipo que se encuentran disponibles para descargar enGoogle Play Storeconsisten meramente en visualizadores que no poseen ninguna cualidad extra además de la posibilidad de ver la imagen y su metadata en el dispositivo, y funciones simples como zoom,panning (movimiento paralelo sobre el plano de vista actual, utilizado generalmente cuando la imagen es más grande que la pantalla en la cual se está mostrando) y exportación de la imagen hacia algún otro formato como jpeg o png. Entre ellas se destaca DICOM Droid Pro [21], que además posee filtros para ajustar el contraste y brillo de la imagen, herramientas de medición y dibujo de formas como c´ırculos, rectángulos o mano alzada.

En menor medida, Google Play Store también ofrece una serie de aplicaciones que permiten visualizar imágenes médicas pre-cargadas, orientadas a estudiantes de medicina con fines didácticos. En este tipo de aplicaciones, las imágenes disponibles (las cuales no están representadas en todos los casos en el formato estándar DICOM) le permiten al usuario realizar un diagnóstico sobre la imagen y poner a prueba sus conocimientos de análisis. Ejemplo de aplicaciones de este tipo son Radiology 4 Med Students [22] e Imaging Anatomy

[23].

(19)

1.3 Propuesta 7

completamente todos los tags y metadata que contengan para asegurar la confidencialidad de la informaci´on del paciente al que pertenece el estudio.

Por último, existen otras aplicaciones desarrolladas en entornos de investigación que otorgan nuevas funcionalidades. Una de ellas, m3DICOM, consiste en una arquitectura cliente-servidor, de la cual se obtienen las segmentaciones de un archivo DICOM y con ellas se generan modelos 3D de las mismas del lado del cliente móvil [25]. Otra aplicación existente permite la colaboración online de varios usuarios para analizar imágenes médicas, donde se pueden hacer anotaciones simultáneamente y marcar áreas de interés en tiempo real sin alterar los datos originales [26]. Sin embargo, entre todas sus caracter´ısticas, no posee una verificación de las anotaciones a mano alzada sobre las imágenes, as´ı como tampoco permite almacenarlas en el archivo de la imagen.

En la tabla 1-1 se resumen las caracter´ısticas más importantes para la manipulación de imágenes DICOM presentes en las soluciones existentes para los dos sistemas en conside-ración, iOS y Android.

1.3. Propuesta

El objetivo de este trabajo final ha sido el desarrollo de una aplicación para dispositivos táctiles móviles con sistema operativo Android, que permita al médico seleccionar áreas de interés sobre una imagen médica, aprovechando las ventajas de la computación ubicua. El sistema provee soporte para asistir y agilizar la tarea del profesional en el análisis de una imagen o una secuencia de imágenes diagnósticas que sean consideradas.

(20)

(21)

2 Segmentaci´

on de im´

agenes m´

edicas

Una imagen médica es toda imagen que permite observar el interior del cuerpo humano o partes de él, obtenida mediante la irradiación de distintos tipos de energ´ıa que interactúan con la muestra, es decir, con el paciente. Comúnmente se denomina “modalidades de imagen” a las diferentes técnicas de obtención de imágenes médicas. Las imágenes médicas produ-cen información cl´ınica fundamental para obtener diagnósticos precisos y tomar decisiones acertadas en el tratamiento de enfermedades.

Debido a la existencia de diferentes modalidades de captura, as´ı como también de la existencia de distintos fabricantes de dispositivos para dicho fin, surgió la necesidad de unificar el formato de las imágenes médicas. De esta forma nace el estándar DICOM, el cual define no solo un formato de almacenamiento común para las imágenes, sino también todo un protocolo de comunicación de las mismas. En el presente trabajo, es de interés el área de almacenamiento del estándar DICOM.

A partir de la estandarización del almacenamiento provista por DICOM, los dispositivos de distintas modalidades y fabricantes almacenan las imágenes resultantes de un estudio en un único archivo, el cual incluye no solo las imágenes mismas, sino también información del paciente (identificador, nombre, sexo, fecha de nacimiento), información del estudio (médico tratante, hora, fecha, descripción), datos del equipo (modelo, fabricante), entre otros datos. Mantener toda esta metadata en un solo archivo es de gran utilidad, ya que de ésta manera es imposible que una imagen sea separada de su correspondiente información por error.

Uno de los problemas fundamentales en el análisis de imágenes médicas es la segmen-tación de las mismas, la cual consiste en el particionamiento de una imagen en distintas regiones significativas [7], permitiendo identificar los l´ımites de estructuras anatómicas o re-giones de interés (por ejemplo, órganos o tumores) dentro de una imagen [27]. La importancia de la segmentación radica en que permite la localización de anomal´ıas, asistir al diagnóstico, cuantificar las diferencias que podr´ıan existir en estudios de seguimiento de una anomal´ıa previamente detectada y asistir en el planeamiento de tratamientos o cirug´ıas [28].

2.1. Etapas del procesamiento de im´

agenes m´

edicas

(22)

Mejoramiento de la imagen: Por ejemplo, reducci´on del ruido o aumento de la nitidez.

Reconocimiento de patrones: Por ejemplo, detecci´on autom´atica de una determinada forma o textura.

Reducción de datos a información más fácil de manejar o interpretar: Por ejemplo, la reducción de una imagen a un conjunto de objetos, caracter´ısticas o medidas.

S´ıntesis: Consiste en crear nuevas im´agenes a partir de otras ya existentes. Por ejemplo, reconstrucci´on de una escena tridimensional a partir de fotograf´ıas bi-dimensionales.

Combinación de imágenes: Combinar imágenes correspondientes a la misma escena, pero que fueron creadas con dos modalidades diferentes.

Compresión de datos: Para reducir el tamaño de los archivos de imágenes y acelerar la transmisión de los mismos a través de una red.

El procesamiento de imágenes médicas se puede dividir en cinco etapas diferentes (fi-gura 2-1), de las cuales solo algunas pueden llegar a ser necesarias dependiendo de los requerimientos de la aplicación involucrada. En primer lugar se encuentra la etapa de cap-tura de la imagen (Sección 2.1.1) mediante algún dispositivo. A continuación, en la etapa de preprocesamiento (Sección 2.1.2) se mejora el aspecto de la imagen mediante diferentes técnicas para facilitar las etapas subsiguientes. En la etapa de extracción de caracter´ısticas (Sección 2.1.3) se obtienen propiedades de interés de la imagen, útiles para la aplicación en la cual será utilizada. En la etapa de segmentación (Sección 2.1.4) se delimitan las áreas de interés a analizar. Finalmente, en la etapa de registración (Sección 2.1.5) es posible combinar distintas imágenes de la misma escena, con el fin de correlacionar información.

(23)

2.1 Etapas del procesamiento de im´agenes m´edicas 11

2.1.1. Captura

La primera etapa del procesamiento de imágenes médicas está siempre dada por la captura de la imagen y consiste en la obtención de la misma mediante alguna técnica o modalidad espec´ıfica.

El factor que define las diferentes modalidades es el tipo de energ´ıa utilizada. Alguna de las modalidades más usadas son: radiación electromagnética por rayos X, radiación elec-tromagnética por rayos gamma (medicina nuclear), radiación electromagnética por ondas de radio (resonancia magnética) y energ´ıa ultrasónica (ecograf´ıa) [30]. Para obtener la imagen médica, diferentes dispositivos de acuerdo a la modalidad utilizada, registran la interacción de la energ´ıa con la muestra. Finalmente, esa información es procesada por computadora para traducirla en imágenes que los profesionales médicos pueden analizar o que pueden ser la entrada para la siguiente etapa del procesamiento de imágenes.

2.1.2. Preprocesamiento

El prepocesamiento de las imágenes médicas tiene como objetivo mejorar la apariencia visual de la imagen, resaltar caracter´ısticas importantes y suprimir o atenuar las carac-ter´ısticas no deseadas. Mediante el preprocesamiento se obtienen imágenes cuya posterior utilización o interpretación resulta más sencilla.

Comúnmente la calidad de una imagen médica se ve deteriorada debido a la heteroge-neidad de los tejidos, la presencia de cuerpos extraños o artefactos, errores de hardware y

software, o movimientos del paciente durante la captura. Estos defectos pueden ocultar de-talles anatómicos y por ende, reducir la detectabilidad de lesiones [31]. El preprocesamiento de las imágenes tiene como fin corregir estos defectos mediante diferentes técnicas.

Algunas de las t´ecnicas de preprocesamiento son:

Resampleo (resampling): Se trata de una técnica cuyo fin es crear una nueva versión de la imagen, con diferente ancho y alto en p´ıxeles. Para agrandar una imagen ( up-sampling), esta técnica hace que aumente la cantidad de p´ıxeles, lo cual suele resultar en una imagen más borrosa debido a la disminución de información por p´ıxel. Por otro lado, al achicar una imagen (downsampling), es necesario descartar información de la imagen original, sin embargo ésto puede resultar en una imagen más n´ıtida [32].

Realce de contraste: Es común que las imágenes digitales posean un pobre contraste debido a un rango de escala de grises reducido. Mediante ajustes en la intensidad de cada p´ıxel, puede mejorarse notablemente el contraste de la imagen [33]. La existencia de contraste en una imagen permite diferenciar más fácilmente distintos objetos de interés.

(24)

de las imágenes médicas. A estos componentes se los conoce como ruido de fondo [34]. Los p´ıxeles pertenecientes al ruido en una imagen tienen la caracter´ıstica de tener un nivel de intensidad muy diferente a sus vecinos. Distintos algoritmos de preprocesa-miento, dependiendo el tipo de ruido en cuestión, se encargan de eliminar la intensidad de dichos p´ıxeles para lograr una imagen de mayor calidad.

2.1.3. Extracci´

on de caracter´ısticas

Esta etapa del procesamiento de imágenes médicas consiste en extraer diferentes propie-dades o indicadores de las imágenes, las cuales son de utilidad para el especialista encargado de su análisis. Una caracter´ıstica o indicador es un escalar que cuantifica una determinada propiedad de un punto o vecindario de la imagen. Dependiendo del problema a abordar, se determinarán las caracter´ısticas que será necesario extraer de la imagen.

El espacio de caracter´ısticas puede dividirse en tres categor´ıas generales [35]:

De intensidad: Caracterizan cada región de interés de la imagen mediante los valores de niveles de gris de las mismas. Otra aproximación para la obtención de este tipo de caracter´ıstica consiste en medir la diferencia entre el nivel de gris medio de la región y el nivel de gris medio de los p´ıxeles circundantes.

Geométricas: Se basan en la forma de las regiones de interés a analizar dentro de la imagen, calculándose por ejemplo, a partir del tamaño, área y borde de las mismas.

De textura: El análisis de la textura de regiones de interés tiene importantes aplica-ciones en la práctica cl´ınica, como por ejemplo la segmentación y la diferenciación de lesiones. Las caracter´ısticas de textura se pueden obtener mediante diferentes técnicas, las cuales se diferencian en su manera de medir las interrelaciones entre los p´ıxeles de la imagen [36].

2.1.4. Segmentaci´

on

Como se mencionó en la introducción al cap´ıtulo, la segmentación es el proceso de ex-traer una o más regiones de interés de una imagen. En las imágenes médicas, la segmentación consiste en delinear estructuras anatómicas o patológicas, las cuales resultan homogéneas respecto a una o más caracter´ısticas (como intensidad, color o textura).

(25)

2.2 Segmentación manual, automática y semiautomática 13

En la sección 2.2 se detallarán los distintos tipos de segmentación existentes, inclu-yendo las ventajas y desventajas de cada uno. También se hará hincapié en el método de segmentación de modelos deformables que se ha considerado en este trabajo (Sección 2.2.1).

2.1.5. Registraci´

on

La registración de imágenes consiste en alinear y combinar distintas imágenes de la misma escena, encontrando puntos de una imagen que puedan ser mapeados a los corres-pondientes puntos de la otra imagen.

En el caso de las imágenes médicas, esta etapa del procesamiento es de gran utilidad para correlacionar información procedente de imágenes capturadas mediante distintas mo-dalidades. Las imágenes utilizadas durante la etapa de registración pueden provenir de un mismo paciente (registro intra-paciente), o de distintos pacientes (registro inter-paciente).

Para llevar a cabo el registro de im´agenes generalmente se utiliza alguno de los siguien-tes criterios:

Marcadores: Consiste en la alineación mediante puntos caracter´ısticos (denominados marcadores olandmarks) que describen a un objeto de interés dentro de la imagen, los cuales pueden ser identificados en cada una de las imágenes que se desean combinar. Dichos puntos pueden ser indicados manual o automáticamente.

Segmentación:Consisten en la alineación de forma r´ıgida o deformable de estructuras previamente segmentadas. El éxito de estos tipos de registros de imágenes depende del preprocesamiento previo y de la segmentación.

Intensidad: Compara los patrones de intensidad en las imágenes. A pesar de que alinear imágenes según este criterio es el más costoso en cuanto a recursos computacio-nales, es el método que logra el mayor nivel de precisión [38].

2.2. Segmentaci´

on manual, autom´

atica y semiautom´

atica

Existen diferentes técnicas de segmentación de imágenes, las cuales se distinguen por el grado de intervención humana como parte del proceso y su grado de automatización.

(26)

La segmentación automática es aquella en la cual las regiones de interés son deter-minadas automáticamente mediante algoritmos que procesan la imagen, sin la necesidad de intervención humana. Este tipo de segmentación resulta muy útil para segmentar una gran cantidad de imágenes, ya que es capaz de realizar las segmentaciones con gran rapidez. Sin embargo, la segmentación puramente automática frecuentemente no es muy precisa en presencia de múltiples objetos y en la ausencia de bordes definidos [41].

Por último, la segmentación semiautomática se refiere al proceso en el cual uno o varios pasos manuales preceden o siguen a un paso automático, con el fin de lograr resultados más exactos. Por ejemplo, algunas técnicas de segmentación semiautomática pueden requerir el ingreso manual de puntos de referencia o de inicio que luego serán tomados como entrada para el algoritmo de segmentación automática. En otros casos de segmentación semiautomática, las segmentaciones arrojadas por el paso automatizado son corroboradas y editadas por un experto para obtener un resultado final más preciso.

2.2.1. Modelos deformables

Debido a la complejidad y variabilidad de las estructuras anatómicas, la segmentación de áreas de interés es uno de los principales problemas del procesamiento de imágenes m´ edi-cas. Es común que los tejidos blandos (tejidos no óseos como músculos, vasos sangu´ıneos, grasa y órganos) dentro de una misma imagen médica no sean lo suficientemente diferen-ciables unos de otros. As´ı mismo, las deficiencias de los dispositivos de captura y el ruido pueden hacer que los l´ımites de las estructuras sean confusos y desconectados [42].

Los modelos deformables, también conocidos como contornos activos o snakes, son técnicas semiautomáticas extensamente utilizadas para la detección de bordes de los objetos de una imagen. Según la propuesta original [43], la aplicación de este modelo comienza con la definición manual de una curva inicial, cercana al objeto de interés que se desea delimitar. A continuación, esta curva es deformada dinámicamente, cambiando su forma, orientación y tamaño en base a información extra´ıda de la imagen subyacente. Finalmente, la curva detiene su evolución al alcanzar su objetivo, es decir, los bordes del área de interés.

Matemáticamente, una curva deformable o snake es una curva C(s) = (X(s), Y(s)), donde S ∈ [0,1]. La curva se desplaza a través del dominio de la imagen de manera que se minimice la función de energ´ıa especificada. Esta función de energ´ıa, puede variar depen-diendo de la implementación deseada, pero generalmente se trata de una función formada por dos partes: fuerzas internas y fuerzas externas.

Esnake =Einterna+Eexterna (2-1)

(27)

2.3 Evaluaci´on de la segmentaci´on 15

los cuales controlan la tensión y la rigidez de la curva, respectivamente. Por su lado,Eexterna tiende a alejar o empujar la curva hacia los bordes de acuerdo a las propiedades de la imagen. La posición final de la curva estará dada por la solución m´ınima de la ecuación de fuerzas 2-1.

A continuación se detalla la ecuación que describe la evolución de la curva en el tiempo, en particular en el intervalo de tiempo t a t + ∆t. Las fuerzas internas están dadas por α(t)_i que representa las fuerzas de tracción,β_i(t) las fuerzas de flexión,γ_i(t)las fuerzas inflacionarias y finalmente δ(t)_i que representa las fuerzas externas:

x(_it+∆t) =x(t)−∆t(aα_i(t)+bβ_i(t)−cγ_i(t)−dδ(_it)) (2-2)

2.3. Evaluaci´

on de la segmentaci´

on

Debido a la existencia de diferentes métodos de segmentación, es necesario contar con métricas que sean capaces de determinar la calidad de los contornos resultantes de cada uno de ellos. Algunos métodos de segmentación podr´ıan ser más eficaces para delimitar ciertas estructuras anatómicas, y no tan eficientes en otras. Por ello, es importante medir las prestaciones de cada método en la segmentación de la misma región de interés.

Para evaluar eficientemente un m´etodo de segmentaci´on, es necesario considerar los siguientes tres criterios [44]:

Precisi´on: Grado en que el contorno generado se corresponde con la realidad.

Eficiencia: Cantidad de tiempo y esfuerzo requeridos para realizar la segmentaci´on.

Repetibilidad: Medida en la cual se producir´ıa el mismo resultado en diferentes sesiones se segmentaci´on, para el mismo contorno a delimitar.

A continuación, se detallan algunas métricas existentes para la evaluación de segmen-taciones:

Jaccard Index (JI): Los p´ıxeles de una imagen pueden ser considerados como per-tenecientes al objeto siendo segmentado (tanto en la realidad como en el resultado de la segmentación), o como no pertenecientes al mismo. El ´ındice (o medida) de Jaccard es una relación entre el número de p´ıxeles coincidentes y el número total de p´ıxeles coincidentes y p´ıxeles no coincidentes.

Hausdorff Distance (HD):Mide el grado de diferencia entre dos segmentaciones A y B, calculando la distancia del punto de A que est´e m´as lejos de cualquier punto de B y viceversa.

(28)

2.4. Segmentaciones de inter´

es

Como se mencionó en la sección 2.2, la segmentación manual suele ser la más exacta. Sin embargo, como todo método que involucra intervención humana, no está exento de erro-res. Para que una segmentación sea precisa, no solo debe delimitar correctamente la región de interés, sino también cumplir con las propiedades geométricas inherentes al objeto segmenta-do. Por ejemplo, algunas estructuras anatómicas son representadas por un contorno cerrado y es posible que durante la segmentación el profesional médico realice una segmentación que no cumple con esta caracter´ıstica.

Seguidamente, se describen algunos estudios m´edicos y las regiones de inter´es com´ unmen-te segmentadas en cada uno de ellos:

Ultrasonido Intravascular (IVUS):Es un estudio por ultrasonido realizado con un cat´eter introducido en las arterias coronarias, el cual toma im´agenes axiales donde se pueden observar las paredes de dichas arterias.

Este procedimiento permite observar la totalidad de la pared de la arteria y proporcio-nar información importante sobre la acumulación de placa. La placa está compuesta por grasas, colesterol, calcio y otras sustancias que se encuentran en la sangre. Dicha placa provoca un engrosamiento de las paredes y puede llegar a obstruir el flujo normal en la arteria. Es por esto que es de interés medir el tamaño de la misma, indicando el borde exterior de la pared denominado comúnmente como interfaz media-adventicia (MA) y el borde interior denominado interfaz lumen-´ıntima (LI).

Retinografia:Es una prueba diagnóstica no invasiva que permite obtener una imagen del fondo del ojo mediante un sistema de lentes acoplados a una cámara fotográfica. En este estudio se puede observar la retina, el disco óptico o pupila y los vasos sangu´ıneos que alimentan la retina.

Ultrasonido Carot´ıdeo:Consiste en un estudio por ultrasonido que genera imágenes laterales de las arterias carótidas, ubicadas a cada lado del cuello y que se encargan de transportar la sangre desde el corazón al cerebro. De igual manera que el estudio IVUS, permite observar posibles obstrucciones o estrechamientos de las arterias, producto del engrosamiento de sus paredes debido a la placa o coágulos.

Para determinar el estrechamiento, es de inter´es para los profesionales m´edicos analizar las interfaces lumen-´ıntima y media-adventicia de las arterias involucradas en el estudio.

(29)

2.4 Segmentaciones de inter´es 17

(30)

La plataforma Android est´a basada en Linux, y al igual que el mismo tiene una ar-quitectura de capas de software de c´odigo abierto. Una de estas capas ofrece un completo

framework que permite a los desarrolladores crear aplicaciones para una amplia gama de dis-positivos m´oviles en un entorno de lenguaje Java. La API Java de Android ofrece diferentes componentes y servicios como un sistema de vista para crear las interfaces y administra-dores de recursos, notificaciones y actividades, los cuales facilitan el desarrollo mediante la reutilizaci´on.

En el siguiente cap´ıtulo se enumeran todos los aspectos que fueron considerados para la implementación de la herramienta presentada, as´ı como también el uso de distintas librer´ıas externas. Dichas librer´ıas fueron integradas para llevar adelante no solo los requerimientos propuestos por este trabajo (Sección 1.3), sino que esta implementación también pueda ser extendida en el futuro.

Finalmente, se presentan los diseños resultantes para la funcionalidad de segmentación y sus validaciones, lo que representa una de las caracter´ısticas más importantes de la apli-cación, as´ı como también los distintos escenarios existentes para la validación exitosa y no exitosa de una segmentación.

3.1. Consideraciones de programaci´

on para dispositivos

m´

oviles Android

3.1.1. Elecci´

on de la API

Una API (Aplication Programming Interface) es una interfaz proporcionada por una aplicación, que permite que otras aplicaciones se comuniquen con ella y puedan hacer uso de sus funciones. Para este caso de estudio, además, la interfaz del sistema operativo Android proporciona un nivel de abstracción entre distintas capas de software, como la capa del sistema y la de las aplicaciones de usuario. Por lo tanto, la API de Android permite a los desarrolladores crear aplicaciones que interactúen con dicho sistema, accediendo a los métodos que provee.

(31)

3.1 Consideraciones de programaci´on para dispositivos m´oviles Android 19

hardware, nuevas tecnolog´ıas emergentes y experiencia de los usuarios, los sistemas opera-tivos para móviles, en particular Android, están en continuo cambio y mejora. Mantenerse actualizado con la última versión de una API, a pesar del posible esfuerzo que podr´ıa impli-car, siempre trae los grandes beneficios de desarrollar aplicaciones más completas, seguras y eficientes.

Lograr un alcance a la mayor cantidad de usuarios posibles es un aspecto muy impor-tante a la hora de decidir que versión de una API utilizar para desarrollar una aplicación. Es as´ı como, entre los criterios más importantes a tener en cuenta, se encuentra la cantidad de dispositivos compatibles con cada una de las versiones. En el caso de la API de Android, existen muchas versiones aún vigentes. En la tabla3-1 se muestran las estad´ısticas actuales de la distribución del total de dispositivos existentes entre cada una de las versiones de la API de dicha plataforma. La figura 3-1representa estos mismos datos de forma gráfica [45].

Versi´on Nombre API Distribuci´on 2.3.3 -2.3.7 Gingerbread 10 0.6 % 4.0.3 -4.0.4 Ice Cream Sandwich 15 0.6 %

4.1.x 16 2.3 %

4.2.x 17 3.3 %

4.3

Jelly Bean

18 1.0 %

4.4 KitKat 19 14.5 %

5.0 21 6.7 %

5.1 Lollipop 22 21.0 %

6.0 Marshmallow 23 32.0 %

7.0 24 15.8 %

7.1 Nougat 25 2.0 %

8.0 Oreo 26 0.2 %

Tabla 3-1: Distribuci´on de dispositivos entre las versiones de la API. No se incluyen versiones con un porcentaje menor al 0,1 %

(32)

Figura 3-1: Distribuci´on de dispositivos entre las versiones de la API.

3.1.2. Tama˜

no de pantalla

Android es capaz de ejecutarse en distintos dispositivos que poseen diferentes tamaños y resoluciones de pantallas. Esta plataforma proporciona un entorno de desarrollo unifor-me para que las aplicaciones funcionen en todos los dispositivos y se encarga de la mayor parte del trabajo para adecuar la interfaz de usuario a la pantalla en la que se muestra. A pesar de estas facilidades, para que la misma aplicación se vea de forma apropiada en to-das las configuraciones de pantalla compatibles, aún es necesario seguir las buenas prácticas recomendadas y hacer ciertos ajustes a las interfaces.

En el desarrollo de aplicaciones Android, un layout es un contenedor de una o más vis-tas, que controla el comportamiento de las mismas, as´ı como la posición de los elementos que contienen. Existen diferentes tipos de layouts que pueden utilizarse para diversos fines. Sin embargo, como buena práctica se aconseja usar RelativeLayout, que aplica posicionamiento relativo para distribuir las vistas/elementos secundarias/os [46]. Este tipo delayout permite, por ejemplo, especificar que un botón aparezca “a la derecha de” un campo de entrada de texto.

Las densidades de pantalla para los sistemas Android se miden en dpi (dots per inch

- puntos por pulgada). Esta medida indica la cantidad de p´ıxeles por pulgada que posee la pantalla. Cuanto mayor sea este número, mayor será la densidad de p´ıxeles. Existen varias densidades disponibles según cada dispositivo:

ldpi: lowdensity (∼120 dpi) mdpi: mediumdensity (∼160 dpi)

(33)

3.1 Consideraciones de programaci´on para dispositivos m´oviles Android 21

xhdpi: extra high density (∼320 dpi)

Otra práctica recomendada que ayuda a que una aplicación se vea adecuadamente en distintas pantallas, es la utilización de la unidad de medida dp (density-independent pixels

o p´ıxeles independientes de la densidad) dentro de los layouts. Esta medida consiste en una unidad de p´ıxeles virtuales para expresar las dimensiones o la posición del diseño con independencia de la densidad. Se utiliza con propósitos de desarrollo y es la que se debe usar al definir el diseño de la interfaz del usuario. Un dp es equivalente a un p´ıxel f´ısico en una pantalla de 160 dpi, la cual se considera como valor de referencia para una pantalla de densidad media. Luego, en tiempo de ejecución, estas unidades son mapeadas por el sistema Android a la densidad real de la pantalla. Entonces, utilizando esta unidad de medida, los tamaños de pantalla se agrupan en cuatro categor´ıas generales:

xlarge:al menos 960dp x 720dp large:al menos 640dp x 480dp normal:al menos 470dp x 320dp small:al menos 426dp x 320dp

Es relevante destacar que para obtener una buena calidad de imagen deben tenerse en cuenta ambos par´ametros: los p´ıxeles por pantalla y el tama˜no de la misma (aunque este ´

ultimo se mida en p´ıxeles independientes de la densidad, como se mencionó, dicha medida es solo para fines de desarrollo). Por ejemplo, si se cuenta con una gran pantalla pero con una poca cantidad de p´ıxeles por pulgada, la calidad de los detalles será bastante pobre. Por el contrario, si disponemos de una pantalla con una alta cantidad de dpi y un tamaño de pantalla normal o reducido, el resultado será una calidad de imagen mucho mayor. Por lo tanto, ambos criterios van de la mano a la hora de determinar la resolución de un dispositivo.

3.1.3. Memoria

La memoria RAM de un dispositivo móvil posee caracter´ısticas f´ısicas muy diferentes a la memoria RAM presente en una computadora de escritorio, como su tamaño mucho menor y su eficiencia orientada a consumir la menor cantidad posible de bater´ıa. En general, la memoria RAM de una computadora de escritorio es ampliamente más rápida que la presente en un dispositivo móvil. Es por ello que es de suma importancia que las aplicaciones desarrolladas para sistemas móviles hagan un uso eficiente de la misma, utilizando la menor cantidad posible.

(34)

Otro concepto importante del manejo de la memoria en Android, es que la memoria RAM no utilizada es considerada como memoria desperdiciada. Por tal motivo, se intenta utilizar la mayor cantidad de memoria posible, sin llegar nunca al l´ımite disponible, para aumentar la eficiencia. Cuantas m´as aplicaciones que se usan frecuentemente se encuen-tren pre-cargadas en memoria, mayor ser´a la eficiencia y menor el consumo de bater´ıa del dispositivo.

Para desarrollar aplicaciones que hagan un uso óptimo de la memoria, es necesario tener en cuenta todos los conceptos mencionados con respecto a la administración de la misma en sistemas Android. Existe una lista de consejos y buenas prácticas [47] que los desarrolladores deben seguir para mejorar el uso de la memoria en aplicaciones Android, entre los cuales se encuentran los siguientes que fueron especialmente tenidas en cuenta para el desarrollo de la herramienta presentada:

Evitar la creación innecesaria de objetos. No ocupar memoria con objetos temporales o con un corto ciclo de vida si puede evitarse. De esta forma, cuando la creación de objetos sea la m´ınima posible, el proceso de garbage collection ocurrirá con menor frecuencia.

Hacer uso de servicios con precaución. Los servicios son un tipo de componente de una aplicación Android que puede realizar operaciones de larga ejecución en segundo plano y que no proporciona una interfaz de usuario.

Utilizar librer´ıas externas optimizadas. Muchas librer´ıas externas frecuentemente est´an escritas para dispositivos no m´oviles y pueden funcionar ineficientemente en Android.

Evitar el uso de clases embebidas (inner classes) no estáticas en lasactivities (compo-nente de una aplicación Android que será detallado en la siguiente sección). En Java, las clases anónimas no estáticas tienen una referencia impl´ıcita a su clase contenedo-ra. Si no se tienen precauciones, mantener estas referencias puede resultar en que la

activity sea retenida cuando de otra manera ser´ıa eligible por el garbage collect. No olvidar cerrar los cursores luego de consultar una base de datos. Si se requiere mantener un cursor por un tiempo considerable, el mismo debe ser utilizado cuidado-samente y ser cerrado tan pronto como concluya la tarea sobre la base de datos.

3.2. Programaci´

on en Android

3.2.1. Componentes de la aplicaci´

on

(35)

3.2 Programaci´on en Android 23

definir el comportamiento general de la herramienta. Cada componente es ´unico, y puede requerir de otros componentes para llevar a cabo sus tareas. A continuaci´on se describen los principales componentes utilizados en este trabajo.

3.2.1.1. Activity

Una actividad o activity es un componente que representa una pantalla dentro de la aplicaci´on, mediante la cual el usuario puede interactuar y realizar las tareas que est´en disponibles dentro de la misma.

La representaci´on de la pantalla en s´ı misma, no se encuentra dentro de este tipo de componente, sino en archivos xml denominados layouts asociados a cada uno de ellos. Cada activity, entonces, tiene su correspondiente layout el cual le permite acceder a todos los elementos de la vista para asignarle a cada uno de ellos el comportamiento que debe ejecutarse cuando el usuario realiza acciones sobre ellos.

Una aplicación está normalmente formada por múltiplesactivities que se vinculan entre s´ı, determinando el flujo de la misma. Generalmente, una de lasactivities de la aplicación se denomina como “principal”, por ser la primer pantalla que se le presenta al usuario. A partir de all´ı, laactivitity principal puede iniciar otrasactivities de acuerdo a las acciones realizadas por el usuario, y as´ı sucesivamente con cada una que se vaya ejecutando a continuación.

Para mantener un registro de lasactivities ejecutadas, cada vez que se inicia una nueva, la misma capta el foco del usuario y es agregada a la denominada “pila de activities”. Esta pila sigue un mecanismo FIFO (First In, First Out), lo que significa que cuando el usuario termina de interactuar con la activity actual y presiona el botón “atrás” del dispositivo, la misma es removida de la pila (y por lo tanto destruida), reanudándose la activity anterior.

3.2.1.2. Listeners

Un listener es una interfaz que se registra en una vista y cuya función es capturar un evento. Los eventos son interacciones que el usuario realiza sobre los elementos de la vista. Por ejemplo, para que la aplicación responda cuando un usuario hace click (o tap) sobre un botón, dicho elemento debe tener registrado unlistener mediante su método setOnClic-kListener, y dicho listener implementar el método onClick. Comúnmente, para implementar esta funcionalidad se debe extender la clase listener deseada e implementar los métodos correspondientes, pero dado que las vistas utilizan los listeners recurrentemente para hacer sus tareas, ésto no ser´ıa práctico. Para evitar ésto, las clases de vista contienen una colec-ción de interfaces anidadas concallbacks que permiten definir estos métodos más fácilmente, directamente en el código de la clase de la vista.

Uno de loslisteners más destacados de la aplicación, es el que se registra para el elemen-to que visualiza la imagen DICOM. Estelistener se encarga de capturar el evento onTouch, es decir, cuando el usuario toca y desliza sobre la imagen para realizar la segmentación del

(36)

3.2.2. Librer´ıa DICOM

En la actualidad existen varias librer´ıas o toolkits que permiten manipular archivos DICOM mediante el lenguaje de programación Java. Algunas de ellas soportan la manipu-lación de estructuras de datos DICOM (no solamente imágenes, sino también waveforms o reportes estructurados) y/o servicios provistos por el estándar (como el env´ıo de mensajes, encriptación y firma electrónica) [48]. También existen librer´ıas que únicamente permiten realizar operaciones sobre las imágenes, como lectura de frames, lectura de encabezados y conversión de las imágenes a otro formato más convencional como JPG.

Para la elección de la librer´ıa con la cual desarrollar la aplicación, no solamente se debió tener en cuenta que la misma provea las funcionalidades necesarias para llevar a cabo las tareas requeridas sobre los archivos DICOM, sino también otros aspectos como la licencia a la cual estuviera sujeto su uso, y la posibilidad de integración con una implementación para el sistema Android.

Entre las librer´ıas mencionadas en [48] se destaca dcm4chee, una librer´ıa open source

muy completa y ampliamente utilizada para manipular archivos DICOM en aplicaciones Java. La misma fue considerada como primera opción para el desarrollo de la aplicación, pero debió ser descartada ya que no es posible su integración con un desarrollo para Android. Esto se debe a quedcm4chee utiliza clases del paquete AWT de Java, el cual no es soportado en Android.

Otras librer´ıas, como DeCaMino y Java Dicom Toolkit, fueron directamente descar-tadas por poseer s´olo licencias comerciales ya que uno de los objetivos propuestos es una aplicaci´on extensible, y las licencias privativas puede ser un limitante para futuros desarro-llos.

Finalmente, se determinó queImebra [49] era la librer´ıa adecuada ya que cumple con todas las condiciones necesarias. Esta librer´ıa, además de realizar las operaciones habituales sobre archivos DICOM, como lectura de frames, lectura de valores de tags, modificación y escritura dedatasets, entre otras, posee una versión compatible para el desarrollo en Android. Por último, Imebra se encuentra bajo licencia GPLv2 (GNU General Public License), con lo cual su utilización para proyectos sin fines de lucro y código abierto es gratuito.

A pesar de haber encontrado la librer´ıa adecuada, en el primer intento de uso de la mis-ma para leer unframe dentro de algún archivo DICOM, se obten´ıa constantemente un error. El mismo no daba demasiados detalles sobre qué era lo que estaba fallando exactamente. Ante la imposibilidad de saber qué era lo que estaba sucediendo, se contactó con el autor de la librer´ıa para obtener ayuda. Muy amablemente, el autor constató que el error proven´ıa de un bug dentro de la misma librer´ıa. Luego de arreglarlo, y de realizar otras modificaciones para que los errores obtenidos no fueran tan cr´ıpticos, actualizó la versión disponible en la sitio web de Imebra.

(37)

las operaciones requeridas por la aplicaci´on desarrollada.

3.2.3. Framework de IoC e inyecci´

on de dependencias

Como parte de los requerimientos de la herramienta, es necesaria la exportación de los datos generados en algún formato que pueda ser luego importado en otras herramien-tas. Debido a que los formatos requeridos por éstas pueden ser variados, es necesaria una implementación flexible de esta funcionalidad, de manera que nuevos formatos puedan ser soportados sin que ésto implique un engorroso cambio de la implementación.

La inversi´on de control o IoC (Inversion of Control) es un mecanismo provisto por diferentes librer´ıas mediante el cual el control del flujo de la aplicaci´on pasa a ser, en gran parte, controlado por la misma librer´ıa en lugar de el desarrollador.

Una de las formas de la IoC es la inyección de dependencias, que consiste en quitar de las clases la responsabilidad de encontrar las referencias a los objetos que necesitan en tiempo de ejecución. Esto ayuda enormemente a evitar el acoplamiento, consiguiendo un diseño flexible y reutilizable.

Sin embargo, los sistemas Android poseen ciertas caracter´ısticas que dificultan el uso de librer´ıas de inyecci´on de dependencias en sus aplicaciones. Las m´as relevantes son [50]:

No es recomendable mantener demasiados objetos en desuso en la memoria del dispo-sitivo. A pesar del significativo incremento de la memoria disponible en smartphones

y tablets, mantener un solo grafo de objetos puede resultar perjudicial.

Las activities son las clases de entrada de toda aplicación Android. Este tipo de clase es creada por el sistema a partir de reflexión, con lo cual no es posible sobreescribir sus constructores, algo fundamental que debe llevar a cabo todoframework que busque la inversión de control.

El sistema Android posee la caracter´ıstica de detener aplicaciones en caso de necesitar recuperar memoria. Si esto sucede, el usuario abrirá la aplicación nuevamente y espera que ésta inicie rápidamente.

Muchos de los frameworks existentes para inyección de dependencias en Android uti-lizan reflexión, e inicializan las aplicaciones escaneando el código en busca de annotations. Este procedimiento es ineficiente en el contexto de un dispositivo móvil, ya que consume una significativa cantidad de ciclos de CPU y memoria RAM, provocando una notable demora al momento de iniciar la aplicación.

(38)

El cambio principal enDagger2 se basa en que el grafo de dependencias es creado, en su mayor´ıa, en tiempo de compilación. De esta manera es posible detectar errores que antes solo eran descubiertos en tiempo de ejecución, antes de que inicie la aplicación. Por consiguiente, esto mejora enormemente el tiempo de arranque, ya que el grafo de dependencias no se genera cada vez que inicia la aplicación, algo de suma importancia en aplicaciones móviles.

Dagger se compone principalmente de los siguientes elementos:

Módulos: Son clases que contienen las dependencias que luego serán utilizadas en otras clases mediante la anotación @Inject. Dichas dependencias son obtenidas me-diante una serie de métodos proveedores. Un módulo puede estar asociado a uno o más componentes.

Componentes:Son las clases encargadas de inyectar las dependencias.

La herramienta presentada hace uso de Dagger2 para conseguir una implementación flexible de la exportación de la base de datos. Por medio de la inyección de dependencias, resulta muy sencillo reemplazar la implementación de la clase exportadora, por diferentes instancias que realicen la tarea en distintos formatos.

En la figura 3-2 se muestra la interfaz IDbExporter, encargada de definir los métodos necesarios para la exportación de la base de datos, as´ı como también su implementación para formato XML. También se incluyen dos posibles implementaciones más para otros formatos, JSON y algún formato personalizado.

Figura 3-2: Interfaz e implementaciones para la exportaci´on de la base de datos en diferentes formatos.

El módulo DicomSegModule se encarga de proveer las instancias de las dependencias que requieran otras clases de la aplicación. En el bloque de código 3-1 se muestra un seg-mento de dicho módulo, y el método provideDbExporter() que provee una instancia de la implementación de la interfaz exportadora para el formato XML.

El componente MainActivityComponent, cuyo c´odigo se muestra en el bloque 3-2, es el encargado de inyectar las dependencias requeridas por la clase asociada (en este caso

(39)

@ M o d u l e

p u b l i c c l a s s D i c o m S e g M o d u l e {

p u b l i c D i c o m S e g M o d u l e () {

}

...

@ P r o v i d e s @ S i n g l e t o n

I D b E x p o r t e r p r o v i d e D b E x p o r t e r () {

r e t u r n new D b X m l E x p o r t e r () ;

}

... }

Bloque de Código 3-1: Segmento del módulo DicomSegModule que provee una dependencia de tipo IDbExporter para la exportación de la base de datos en formato XML

@ S i n g l e t o n

@ C o m p o n e n t( m o d u l e s = { D i c o m S e g M o d u l e .c l a s s})

p u b l i c i n t e r f a c e M a i n A c t i v i t y C o m p o n e n t {

v o i d i n j e c t ( M a i n A c t i v i t y m a i n A c t i v i t y ) ;

s t a t i c f i n a l c l a s s I n i t i a l i z e r {

p r i v a t e I n i t i a l i z e r () {

}

p u b l i c s t a t i c M a i n A c t i v i t y C o m p o n e n t i n i t () {

r e t u r n D a g g e r M a i n A c t i v i t y C o m p o n e n t . b u i l d e r ()

. d i c o m S e g M o d u l e (new D i c o m S e g M o d u l e () ) . b u i l d () ;

} } }

(40)

Finalmente, la clase MainActivity que requiere una instancia de un exportador de la base de datos, simplemente hace eso de su respectivo componente,MainActivityComponent, para lograr la inyecci´on de la dependencia, tal como se muestra en el bloque de c´odigo 3-3.

p u b l i c c l a s s M a i n A c t i v i t y e x t e n d s A p p C o m p a t A c t i v i t y {

@ I n j e c t

p u b l i c I D b E x p o r t e r d b E x p o r t e r;

@ O v e r r i d e

p r o t e c t e d v o i d o n C r e a t e ( B u n d l e s a v e d I n s t a n c e S t a t e ) {

...

M a i n A c t i v i t y C o m p o n e n t c o m p o n e n t = M a i n A c t i v i t y C o m p o n e n t . I n i t i a l i z e r . i n i t () ;

c o m p o n e n t . i n j e c t (t h i s) ; ...

}

Bloque de C´odigo 3-3: Segmento de la actividad MainActivity que permite la inyecci´on mediante Dagger de una dependencia de interfaz IDbExporter

De igual manera que para la exportación de la base de datos en distintos formatos, la inyección de dependencias también es utilizada para asignar de forma flexible las clases que proveen las fuerzas externas al algoritmo snakes de segmentación semi-automática. Dichas fuerzas podr´ıan requerir de nuevas implementaciones para modificar el funcionamiento del algoritmo, y mediante la inyección de dependencias, este cambio puede llevarse a cabo sin esfuerzo.

3.2.4. M´

etodo de segmentaci´

on autom´

atica

Una caracter´ıstica extra de la aplicación presentada es la posibilidad de generar una segmentación mediante semi-automatización. Una vez realizada una segmentación, el médico puede optar por ajustarla automáticamente. Esta tarea es llevada a cabo mediante la técnica de modelos deformables mencionada en detalle en la sección 2.2.1.

Para llevar a cabo este requerimiento, fueron evaluadas las librer´ıas más utilizadas para el procesamiento de imágenes que ya incluyen alguna implementación de modelos deforma-bles.

(41)

A continuación, se puso el foco sobre ImageJ2, una librer´ıa que no tiene dependencia alguna con ImageJ sino que consiste una reescrituración completa de dicha API. En esta reescrituración se puso un énfasis particular para no hacer uso de clases de AWT. Sin em-bargo, a pesar de que todas las dependencias con AWT fueron eliminadas, aún hace uso de otras clases que tampoco son soportadas por Android.

Otra librer´ıa considerada fue OpenCV4Android, la cual es una versi´on adaptada de

OpenCV para programación en Android, tambiénopen source. A pesar de que fue posible su integración con el entorno de desarrollo para Android, en OpenCV4Android no se encontró una implementación del algoritmo snakes como con la que cuenta OpenCV en su primera versión. Esto se debe a que el proyectoOpenCV4Android surge a partir de la segunda versión de OpenCV, en la cual se migró casi toda la funcionalidad hacia una API enteramente en C++, reemplazando la anterior en C. Desgraciadamente, el algoritmo snakes, entre otros, quedó fuera de dicha migración. En comunicaciones con desarrolladores que colaboran en el proyecto OpenCV, los mismo confirmaron que dichos algoritmos no van a ser incluidos por el momento, con lo cual el uso de esta librer´ıa fue finalmente descartado para la herramienta presentada.

Agotadas las opciones de librer´ıas posibles, se decidió integrar al proyecto una imple-mentación en Java del algoritmo snakes provista por un usuario del foro francés Develop-pez.com [52]. Únicamente fue necesaria la adaptación del código alcore java de Android, ya que el mismo utilizaba clases que se encuentran fuera de él.

3.2.5. Compatibilidad

Como se mencionó en la sección 3.1.1, la m´ınima versión de la API de Android para desarrollar la aplicación, se determinó en la de nivel 19. En el otro extremo, como versión máxima soportada, se eligió el nivel 26, lo que significa el último nivel existente al d´ıa de la fecha. De esta manera se lograr cubrir la mayor cantidad posible de dispositivos soportados. Sin embargo, cubrir un amplio rango de versiones como en este caso, puede acarrear el problema de tener que incluir código extra para lograr la compatibilidad con algún nivel espec´ıfico de la API.