Comparaci´ on - Extracci´ on de caracter´ısticas

4.2 Extracci´ on de caracter´ısticas

5.1.3 Comparaci´ on

En las figuras 5-6, 5-7, 5-8 , se puede observar el resultado de la segmentación sobre 2 imágenes aleatorias de cada clase. El tiempo que toma la segmentación semántica es de en promedio 106.8 segundos, mientras que la segmentación usando el umbral de Otsu tarda 6.14 segundos.

Segmentaci´on sem´antica _Otsu

(a) Carcinoma

5.1 Segmentaci´on 49

Segmentaci´on sem´antica _Otsu

(a) Melanoma

Figura 5-7: Segmentaci´on usando redes neuronales convolucionales y el m´etodo de otsu

Segmentaci´on sem´antica _Otsu

(a) Nevus

Figura 5-8: Segmentaci´on usando redes neuronales convolucionales y el m´etodo de otsu

Aunque los resultados de ambos métodos son similares, el resultado de la segmentación semántica permite apreciar un poco más el detalle de la lesión; para este proyecto se usó la

segmentación por el método de Otsu para obtener una rápida segmentación de la base de datos que servir´ıa como conjunto de entrenamiento para el clasificador, sin embargo, para las evaluaciones individuales del clasificador se usará la segmentación semántica ya que el resultado

5.2. Extracci´on de caracter´ısticas

Para la extracción de caracter´ısticas se transformaron las imágenes dermatoscópicas a diferentes espacios de Color y se aplicó el descriptor de forma tipo SURF para hallar y describir los puntos de interés sobre cada uno de los 3 canales en las diferentes representaciones de color. Cada punto de interés es descrito a través de SURF como un vector de 64 posiciones, el cuál es concatenado con el vector de 3 posiciones que describe el color en ese punto de interés; la combinación de la información de forma y color permitirá incrementar la capacidad representativa del descriptor, además de mejorar el desempeño del clasificador. Las caracter´ısticas obtenidas de cada imagen de entrenamiento y sus descripciones se guardaron en vectores, para luego ser agrupadas en 250 conjuntos utilizando el algoritmo de aprendizaje no supervisado knn (Kluster by Nearest neighbor). Cada conjunto representa una palabra visual y la frecuencia de aparición de estas palabras en la imagen permitirá construir un vocabulario visual que servirá para representarla.

A continuación se muestran los histogramas de caracter´ısticas para una imagen elegida arbi- trariamente de cada clase. El histograma tiene un total de 250 caracter´ısticas y la frecuencia en éstas ayudará al clasificador a encontrar una barrera óptima entre clases. (figuras 5-9,5- 10,5-11)

Usando la frecuencia de cada palabra en el histograma de caracter´ısticas, el clasificador

Figura 5-9: Histograma de caracter´ısticas para el carcinoma

5.3 Clasificaci´on 51

Figura 5-10: Histograma de caracter´ısticas para el Melanoma

Figura 5-11: Histograma de caracter´ısticas para el nevus melanoc´ıtico

Se us´o el bag of words sobre im´agenes segmentadas, para eliminar la influencia de elementos no deseados como vellos, que pudieran interferir en el entrenamiento del clasificador.

5.3. Clasificaci´on

Se realizaron varias pruebas con diferentes clasificadores, entre ellos arboles de decisiones, k-means y SVM; a partir de la precisi´on se determin´o que el mejor clasificador para este problema fue el SVM.

El entrenamiento del SVM tomó 48.633 segundos y se obtuvo una precisión de 78 %, en la matriz de confusión (figura 5-13, página 55) se puede observar el desempeño del clasificador para cada clase.

Para las pruebas se utilizó la representación en Bag of Words de imágenes segmentadas transformadas a diferentes espacios de color para extraer las caracter´ısticas, en la tabla 5- 3se puede ver la precisión obtenida para cada espacio de color.

Tabla 5-3: Resultados del clasificador SVM para diferentes espacios de color

Espacio de Color Precisi´on SVM

CIELAB 65 % NTSC 68 % Opponent Space 70 % XYZ 70 % YCBCR 55 % HSV 78 %

En la tabla 5-3 se observa que el espacio de color que brinda más información y permite encontrar una representación en bag of words más significativa es el HSV, seguido del Op- ponent Space y el XYZ. A partir de los resultados mostrados en la tabla 5-3, es posible observar que las caracter´ısticas obtenidas a partir de los espacios HSV y RGB son más representativas que las de otros espacios de color. La extracción de caracter´ısticas se realizó a partir de la aplicación del operador SURF sobre los diferentes canales de la imagen en los distintos canales de color, en las imágenes dermatoscópicas, el color brinda información importante y no es suficiente la información de luminancia.

Al mismo tiempo es importante la información de la forma y la descripción de los puntos de interés, al realizar la representación en bag of words sobre los histogramas de cada imagen, la información de la forma se perd´ıa y la exactitud del clasificador no superaba el umbral del 50 %, dejando como resultado más de la mitad de las muestras de prueba clasificadas de manera errónea.

5.3 Clasificaci´on 53

el sistema fue probado con un total de 300 imágenes, 100 en cada clase y en la diagonal se puede observar el número de aciertos para cada clase. Teniendo en cuenta el sistema con mejor desempeño, se realizaron pruebas individuales en 10 imágenes para visualizar los resultados del entrenamiento, en la figura 5-12 se muestran los resultados obtenidos para cada prueba, de las 10 pruebas realizadas, 9 acertaron en la clasificación y 1 falló, la evaluación del clasificador en el total de la base de test se puede observar a través de la matriz de confusión.

Figura 5-12: Visualización de los resultados para el sistema con mejor desempeño, se to- maron 10 imágenes al azar y se clasificaron para verificar el funcionamiento del clasificador, de las 10 imágenes, una fue clasificada erroneamente

5.3 Clasificaci´on 55

Figura 5-13: Matriz de confusi´on para espacio de color HSV, con una precisi´on de 78.3 %

Figura 5-15: Matriz de confusi´on para espacio de color NTSC, con una precisi´on de 68 %

5.3 Clasificaci´on 57

Figura 5-17: Matriz de confusi´on para espacio de color YCBCR, con una precisi´on de 55 %

Figura 5-19: Matriz de confusi´on para espacio de color Opponent Space, con una precisi´on de 70 %

6 Conclusiones y recomendaciones

6.1. Conclusiones

En este trabajo se presentó un modelo basado en la segmentación semántica capaz de alcanzar la precisión de un dermatólogo experto en un 92.96 % pero que tarda en promedio 416.5 segundos en ejecutarse, en comparación, se presentó un modelo basado en la segmentación por umbral óptimo capaz de alcanzar una precisión del 90.63 % de un dermatólogo experto y cuyo tiempo de ejecución se reduce a 28.98 segundos. Además, se comprobó que tener en cuenta la morfolog´ıa casi circular de las lesiones pigmentadas, mejora considerablemente la segmentación, lo cual, junto con otras operaciones morfológicas elimina elementos que no aportan información relevante para la clasificación. Las pruebas se realizaron sobre una computadora con sistema operativo Windows 10, 16Gb de memoria RAM y 2Tb de disco duro.

El modelo Bag Of Words permite cuantificar cada punto de interés en una palabra visual y luego representar cada imagen a través de un histograma de palabras visuales. En este trabajo los puntos de interés conten´ıan información tanto de color como de forma, caracter´ısticas representativas para la clasificación de lesiones pigmentadas en la piel. Los resultados mostraron que el espacio de color más representativo para este tipo de imágenes es el HSV, con el cual se obtuvo un clasificador con una precisión del 78.3 %.

Para clasificar los histogramas de palabras visuales, obtenidos a partir de las imágenes segmentadas, se entrenó un sistema basado en Support Vector Machine (SVM). Los mejores resultados se obtuvieron utilizando un kernel Gaussiano y un factor de regu- lación bajo que permitiera aumentar la tolerancia a errores; se alcanzó una precisión máxima del 78.3 % y aunque éste porcentaje no es suficiente para una aplicación médi- ca, es un buen resultado como primer paso en la detección y clasificación automática de cáncer en la piel.

6.2. Recomendaciones

Concluido este proyecto, se considera que los siguientes aspectos se pueden trabajar para mejorar el desempe˜no del clasificador:

Evaluar las diferentes técnicas de segmentación en otros espacios de color para obtener resultados diferentes y que permitan aislar de manera rápida y efectiva la lesión pigmentada de la piel.

Extender los estudios sobre extracción de caracter´ısticas en imágenes dematoscópicas, con el fin identificar que descriptores representan mejor las imágenes y la diferencia entre clases.

Entrenar e implementar un sistema basado en Deep Learning que sea capaz de aprender las caracter´ısticas de la imagen dermatosc´opica y clasificarla de manera eficaz.

Estudiar y aplicar las estrategias de fusión dentro del esquema de BagOfWords para mejorar el rendimiento del algoritmo y potenciar la capacidad de representación y discriminación de los descriptores de la imagen.

Bibliograf´ıa

[1] Clasificaci´on. Universidad de Murcia. – Informe de Investigaci´on. – 18 p.

[2] Procesamiento morfol´ogico. Universidad Politectica de Madrid, Kapitel 6

[3] dermoscopedia – Allan Halpern:Computer Assisted Diagnosis — dermoscopedia.

2018. – Online; accessed 9-May-2018

[4] ABC Medicus. 250 personas mueren al a˜no por c´ancer de piel en Colombia. 2013

[5] Arroyave-Giraldo, Maribel ; Restrepo-Mart´ınez, Alejandro ; Vargas- Bonilla, Francisco. Incidencia de la Segmentación en la Obtención de Región de

Inter´es en Im´agenes de Palma de la Mano. 2011

[6] Codella, Noel C F. ; Gutman, David ;Celebi, M E. ;Helba, Brian ;Marchetti,

Michael A. ; Dusza, Stephen W. ; Kalloo, Aadi ; Liopyris, Konstantinos ; Jan,

C V. ; Watson, I B M T J. ; Heights, Yorktown: No Title. (2017), p. 1–5

[7] Corralo, David S. Dermatoscopia digital. 2015

[8] community of dermatologists, International. ISIC Project. 2018

[9] Fernandez, Pita ;D´ıaz, Pértegas ;Unidad de Epidemiolog´ıa Cl´ınica y Bioes- tad´ıstica.;Complexo Hospitalario Universitario de A Coruña. (España):

Pruebas diagn´osticas: Sensibilidad y especifidad. Espa˜na, 2010, p. 120–124

[10] Gao, Huilin ; Dou, Lihua ; Chen, Wenjie ; Sun, Jian: Image classification with

Bag-of-Words model based on improved SIFT algorithm. En: 2013 9th Asian Control Conference, ASCC 2013 (2013), Nr. 60925011, p. 2–7. ISBN 9781467357692

[11] Gil, Pablo ; Torres, Fernando ; Ortiz Zamora, Francisco G. Detecci´on de objetos

por segmentaci´on multinivel combinada de espacios de color. 2004

[12] Gonzalez, Rc (University of T. ; Woods, Re (MedData I.: Digital image processing.

third Edit. Pearson Prentice Hall, 2002. – 190 p.. – ISBN 0201180758

[13] INC: Análisis de la Situación del Cáncer en Colombia 2015. 2017. – 336 p.. – ISBN

[14] Instituto Mexicano del Seguro Social: Abordaje Diagn´ostico de Melanoma

Maligno. Mexico, 2010

[15] International Skin Imaging Collaboration. ISIC 2018: Skin Lesion Analysis

Towards Melanoma Detection. 2018

[16] International Telecommunication Union: Studio encoding parameters of digital

television for standard 4:3 and wide-screen 16:9 aspect ratios (ITU-R BT.601-7). En:

Recommendation ITU-R BT.601-7 7 (2011), p. 19

[17] Jim´enez Rodr´ıguez, Ma Jos´e. Apuntes de catedra: Procesamiento de Imagenes Digi-

tales. 2017

[18] K, Alexander Mordvintsev & A. Open Source Computer Vision. 2013

[19] _MathWorks: Introducing Deep Learning with MATLAB. 2018. – 15 p.

[20] Ministerio de Salud y Protecci´on Social, ESE, Instituto Nacional de C. Ma-

nual para la detección temprana del cáncer de piel y recomendaciones para la disminu- ción de exposición a radiación ultravioleta

[21] _{Noel C. F. Codella, David Gutman, M. Emre Celebi, Brian Helba, Mi-}

chael A. Marchetti, Stephen W. Dusza, Aadi Kalloo, Konstantinos Liopyris, Nabin Mishra, Harald Kittler, Allan H. Skin Lesion Analysis Toward

Melanoma Detection: A Challenge at the 2017 International Symposium on Biomedical Imaging (ISBI), Hosted by the International Skin Imaging Collaboration (ISIC). 2017 [22] Pardo, Constanza ; Cendales, Ricardo: Incidencia, mortalidad y prevalencia de

C´ancer en Colombia 2007-2011. Vol. 1. 2015. – 148 p.. – ISBN 9789585883253

[23] Ralph Braun; Kerl, Katrin. Histopathologic correlation of dermoscopic structures.

2018

[24] Segmentación, Prácticas De: Prácticas de Robótica y Visión Artificial. Universidad

de Murcia, Kapitel 9

[25] Smith, S.: Digital Signal Processing: A Practical Guide for Engineers and Scien-

tists. Elsevier Science, 2013 (Demystifying technology series). – 373–390 p.. – ISBN 9780080477329

[26] Soille, P.: Morphological Image Analysis: Principles and Applications. Springer Berlin

Heidelberg, 2013. – ISBN 9783662050880

[27] Trabocchi, Osvaldo ;Sanfilippo, Fabián. Segmentación por Umbralización – Método

Bibliograf´ıa 63

[28] Tschandl, Philipp ;Rosendahl, Cliff ;Kittler, Harald: The HAM10000 dataset, a

large collection of multi-source dermatoscopic images of common pigmented skin lesions. En: Scientific Data 5 (2018), aug, p. 180161. – ISSN 2052–4463

[29] Venegas-Barrera, Crystian S. ; Manjarrez, Javier: Visual Categorization with

Bags of Keypoints. En: Revista Mexicana de Biodiversidad 82 (2011), Nr. 1, p. 179– 191. – ISBN 9780335226375

[30] Vitaly Bushaev. Stochastic Gradient Descent with momentum. 2017

[31] Zaballos Diego, Pedro ; Carrera, Cristina ; Puig, Susana ; Malvehy, Josep:

Criterios dermatosc´opicos para el diagn´ostico del melanoma. En: Medicina Cutanea Ibero-Latino-Americana 32 (2004), Nr. 1, p. 3–17. – ISSN 02105187

In document Detección de melanomas a partir de imágenes dermatoscópicas (página 62-77)