4.2 Extracci´ on de caracter´ısticas
5.1.3 Comparaci´ on
En las figuras 5-6, 5-7, 5-8 , se puede observar el resultado de la segmentaci´on sobre 2 im´agenes aleatorias de cada clase. El tiempo que toma la segmentaci´on sem´antica es de en promedio 106.8 segundos, mientras que la segmentaci´on usando el umbral de Otsu tarda 6.14 segundos.
Segmentaci´on sem´antica Otsu
Segmentaci´on sem´antica Otsu
(a) Carcinoma
5.1 Segmentaci´on 49
Segmentaci´on sem´antica Otsu
Segmentaci´on sem´antica Otsu
(a) Melanoma
Figura 5-7: Segmentaci´on usando redes neuronales convolucionales y el m´etodo de otsu
Segmentaci´on sem´antica Otsu
Segmentaci´on sem´antica Otsu
(a) Nevus
Figura 5-8: Segmentaci´on usando redes neuronales convolucionales y el m´etodo de otsu
Aunque los resultados de ambos m´etodos son similares, el resultado de la segmentaci´on sem´antica permite apreciar un poco m´as el detalle de la lesi´on; para este proyecto se us´o la
segmentaci´on por el m´etodo de Otsu para obtener una r´apida segmentaci´on de la base de datos que servir´ıa como conjunto de entrenamiento para el clasificador, sin embargo, para las evaluaciones individuales del clasificador se usar´a la segmentaci´on sem´antica ya que el resultado
5.2.
Extracci´on de caracter´ısticas
Para la extracci´on de caracter´ısticas se transformaron las im´agenes dermatosc´opicas a dife- rentes espacios de Color y se aplic´o el descriptor de forma tipo SURF para hallar y describir los puntos de inter´es sobre cada uno de los 3 canales en las diferentes representaciones de color. Cada punto de inter´es es descrito a trav´es de SURF como un vector de 64 posiciones, el cu´al es concatenado con el vector de 3 posiciones que describe el color en ese punto de inter´es; la combinaci´on de la informaci´on de forma y color permitir´a incrementar la capa- cidad representativa del descriptor, adem´as de mejorar el desempe˜no del clasificador. Las caracter´ısticas obtenidas de cada imagen de entrenamiento y sus descripciones se guardaron en vectores, para luego ser agrupadas en 250 conjuntos utilizando el algoritmo de aprendizaje no supervisado knn (Kluster by Nearest neighbor). Cada conjunto representa una palabra visual y la frecuencia de aparici´on de estas palabras en la imagen permitir´a construir un vocabulario visual que servir´a para representarla.
A continuaci´on se muestran los histogramas de caracter´ısticas para una imagen elegida arbi- trariamente de cada clase. El histograma tiene un total de 250 caracter´ısticas y la frecuencia en ´estas ayudar´a al clasificador a encontrar una barrera ´optima entre clases. (figuras 5-9,5- 10,5-11)
Usando la frecuencia de cada palabra en el histograma de caracter´ısticas, el clasificador
Figura 5-9: Histograma de caracter´ısticas para el carcinoma
5.3 Clasificaci´on 51
Figura 5-10: Histograma de caracter´ısticas para el Melanoma
Figura 5-11: Histograma de caracter´ısticas para el nevus melanoc´ıtico
Se us´o el bag of words sobre im´agenes segmentadas, para eliminar la influencia de elementos no deseados como vellos, que pudieran interferir en el entrenamiento del clasificador.
5.3.
Clasificaci´on
Se realizaron varias pruebas con diferentes clasificadores, entre ellos arboles de decisiones, k-means y SVM; a partir de la precisi´on se determin´o que el mejor clasificador para este problema fue el SVM.
El entrenamiento del SVM tom´o 48.633 segundos y se obtuvo una precisi´on de 78 %, en la matriz de confusi´on (figura 5-13, p´agina 55) se puede observar el desempe˜no del clasificador para cada clase.
Para las pruebas se utiliz´o la representaci´on en Bag of Words de im´agenes segmentadas transformadas a diferentes espacios de color para extraer las caracter´ısticas, en la tabla 5- 3se puede ver la precisi´on obtenida para cada espacio de color.
Tabla 5-3: Resultados del clasificador SVM para diferentes espacios de color
Espacio de Color Precisi´on SVM
CIELAB 65 % NTSC 68 % Opponent Space 70 % XYZ 70 % YCBCR 55 % HSV 78 %
En la tabla 5-3 se observa que el espacio de color que brinda m´as informaci´on y permite encontrar una representaci´on en bag of words m´as significativa es el HSV, seguido del Op- ponent Space y el XYZ. A partir de los resultados mostrados en la tabla 5-3, es posible observar que las caracter´ısticas obtenidas a partir de los espacios HSV y RGB son m´as re- presentativas que las de otros espacios de color. La extracci´on de caracter´ısticas se realiz´o a partir de la aplicaci´on del operador SURF sobre los diferentes canales de la imagen en los distintos canales de color, en las im´agenes dermatosc´opicas, el color brinda informaci´on importante y no es suficiente la informaci´on de luminancia.
Al mismo tiempo es importante la informaci´on de la forma y la descripci´on de los puntos de inter´es, al realizar la representaci´on en bag of words sobre los histogramas de cada imagen, la informaci´on de la forma se perd´ıa y la exactitud del clasificador no superaba el umbral del 50 %, dejando como resultado m´as de la mitad de las muestras de prueba clasificadas de manera err´onea.
5.3 Clasificaci´on 53
el sistema fue probado con un total de 300 im´agenes, 100 en cada clase y en la diagonal se puede observar el n´umero de aciertos para cada clase. Teniendo en cuenta el sistema con mejor desempe˜no, se realizaron pruebas individuales en 10 im´agenes para visualizar los resultados del entrenamiento, en la figura 5-12 se muestran los resultados obtenidos para cada prueba, de las 10 pruebas realizadas, 9 acertaron en la clasificaci´on y 1 fall´o, la evaluaci´on del clasificador en el total de la base de test se puede observar a trav´es de la matriz de confusi´on.
Figura 5-12: Visualizaci´on de los resultados para el sistema con mejor desempe˜no, se to- maron 10 im´agenes al azar y se clasificaron para verificar el funcionamiento del clasificador, de las 10 im´agenes, una fue clasificada erroneamente
5.3 Clasificaci´on 55
Figura 5-13: Matriz de confusi´on para espacio de color HSV, con una precisi´on de 78.3 %
Figura 5-15: Matriz de confusi´on para espacio de color NTSC, con una precisi´on de 68 %
5.3 Clasificaci´on 57
Figura 5-17: Matriz de confusi´on para espacio de color YCBCR, con una precisi´on de 55 %
Figura 5-19: Matriz de confusi´on para espacio de color Opponent Space, con una precisi´on de 70 %
6 Conclusiones y recomendaciones
6.1.
Conclusiones
En este trabajo se present´o un modelo basado en la segmentaci´on sem´antica capaz de alcanzar la precisi´on de un dermat´ologo experto en un 92.96 % pero que tarda en promedio 416.5 segundos en ejecutarse, en comparaci´on, se present´o un modelo basado en la segmentaci´on por umbral ´optimo capaz de alcanzar una precisi´on del 90.63 % de un dermat´ologo experto y cuyo tiempo de ejecuci´on se reduce a 28.98 segundos. Adem´as, se comprob´o que tener en cuenta la morfolog´ıa casi circular de las lesiones pigmentadas, mejora considerablemente la segmentaci´on, lo cual, junto con otras operaciones morfol´ogicas elimina elementos que no aportan informaci´on relevante para la clasificaci´on. Las pruebas se realizaron sobre una computadora con sistema operativo Windows 10, 16Gb de memoria RAM y 2Tb de disco duro.
El modelo Bag Of Words permite cuantificar cada punto de inter´es en una palabra visual y luego representar cada imagen a trav´es de un histograma de palabras visuales. En este trabajo los puntos de inter´es conten´ıan informaci´on tanto de color como de forma, caracter´ısticas representativas para la clasificaci´on de lesiones pigmentadas en la piel. Los resultados mostraron que el espacio de color m´as representativo para este tipo de im´agenes es el HSV, con el cual se obtuvo un clasificador con una precisi´on del 78.3 %.
Para clasificar los histogramas de palabras visuales, obtenidos a partir de las im´agenes segmentadas, se entren´o un sistema basado en Support Vector Machine (SVM). Los mejores resultados se obtuvieron utilizando un kernel Gaussiano y un factor de regu- laci´on bajo que permitiera aumentar la tolerancia a errores; se alcanz´o una precisi´on m´axima del 78.3 % y aunque ´este porcentaje no es suficiente para una aplicaci´on m´edi- ca, es un buen resultado como primer paso en la detecci´on y clasificaci´on autom´atica de c´ancer en la piel.
6.2.
Recomendaciones
Concluido este proyecto, se considera que los siguientes aspectos se pueden trabajar para mejorar el desempe˜no del clasificador:
Evaluar las diferentes t´ecnicas de segmentaci´on en otros espacios de color para obte- ner resultados diferentes y que permitan aislar de manera r´apida y efectiva la lesi´on pigmentada de la piel.
Extender los estudios sobre extracci´on de caracter´ısticas en im´agenes dematosc´opicas, con el fin identificar que descriptores representan mejor las im´agenes y la diferencia entre clases.
Entrenar e implementar un sistema basado en Deep Learning que sea capaz de aprender las caracter´ısticas de la imagen dermatosc´opica y clasificarla de manera eficaz.
Estudiar y aplicar las estrategias de fusi´on dentro del esquema de BagOfWords para mejorar el rendimiento del algoritmo y potenciar la capacidad de representaci´on y discriminaci´on de los descriptores de la imagen.
Bibliograf´ıa
[1] Clasificaci´on. Universidad de Murcia. – Informe de Investigaci´on. – 18 p.
[2] Procesamiento morfol´ogico. Universidad Politectica de Madrid, Kapitel 6
[3] dermoscopedia – Allan Halpern:Computer Assisted Diagnosis — dermoscopedia.
2018. – Online; accessed 9-May-2018
[4] ABC Medicus. 250 personas mueren al a˜no por c´ancer de piel en Colombia. 2013
[5] Arroyave-Giraldo, Maribel ; Restrepo-Mart´ınez, Alejandro ; Vargas- Bonilla, Francisco. Incidencia de la Segmentaci´on en la Obtenci´on de Regi´on de
Inter´es en Im´agenes de Palma de la Mano. 2011
[6] Codella, Noel C F. ; Gutman, David ;Celebi, M E. ;Helba, Brian ;Marchetti,
Michael A. ; Dusza, Stephen W. ; Kalloo, Aadi ; Liopyris, Konstantinos ; Jan,
C V. ; Watson, I B M T J. ; Heights, Yorktown: No Title. (2017), p. 1–5
[7] Corralo, David S. Dermatoscopia digital. 2015
[8] community of dermatologists, International. ISIC Project. 2018
[9] Fernandez, Pita ;D´ıaz, P´ertegas ;Unidad de Epidemiolog´ıa Cl´ınica y Bioes- tad´ıstica.;Complexo Hospitalario Universitario de A Coru˜na. (Espa˜na):
Pruebas diagn´osticas: Sensibilidad y especifidad. Espa˜na, 2010, p. 120–124
[10] Gao, Huilin ; Dou, Lihua ; Chen, Wenjie ; Sun, Jian: Image classification with
Bag-of-Words model based on improved SIFT algorithm. En: 2013 9th Asian Control Conference, ASCC 2013 (2013), Nr. 60925011, p. 2–7. ISBN 9781467357692
[11] Gil, Pablo ; Torres, Fernando ; Ortiz Zamora, Francisco G. Detecci´on de objetos
por segmentaci´on multinivel combinada de espacios de color. 2004
[12] Gonzalez, Rc (University of T. ; Woods, Re (MedData I.: Digital image processing.
third Edit. Pearson Prentice Hall, 2002. – 190 p.. – ISBN 0201180758
[13] INC: An´alisis de la Situaci´on del C´ancer en Colombia 2015. 2017. – 336 p.. – ISBN
[14] Instituto Mexicano del Seguro Social: Abordaje Diagn´ostico de Melanoma
Maligno. Mexico, 2010
[15] International Skin Imaging Collaboration. ISIC 2018: Skin Lesion Analysis
Towards Melanoma Detection. 2018
[16] International Telecommunication Union: Studio encoding parameters of digital
television for standard 4:3 and wide-screen 16:9 aspect ratios (ITU-R BT.601-7). En:
Recommendation ITU-R BT.601-7 7 (2011), p. 19
[17] Jim´enez Rodr´ıguez, Ma Jos´e. Apuntes de catedra: Procesamiento de Imagenes Digi-
tales. 2017
[18] K, Alexander Mordvintsev & A. Open Source Computer Vision. 2013
[19] MathWorks: Introducing Deep Learning with MATLAB. 2018. – 15 p.
[20] Ministerio de Salud y Protecci´on Social, ESE, Instituto Nacional de C. Ma-
nual para la detecci´on temprana del c´ancer de piel y recomendaciones para la disminu- ci´on de exposici´on a radiaci´on ultravioleta
[21] Noel C. F. Codella, David Gutman, M. Emre Celebi, Brian Helba, Mi-
chael A. Marchetti, Stephen W. Dusza, Aadi Kalloo, Konstantinos Liopyris, Nabin Mishra, Harald Kittler, Allan H. Skin Lesion Analysis Toward
Melanoma Detection: A Challenge at the 2017 International Symposium on Biomedical Imaging (ISBI), Hosted by the International Skin Imaging Collaboration (ISIC). 2017 [22] Pardo, Constanza ; Cendales, Ricardo: Incidencia, mortalidad y prevalencia de
C´ancer en Colombia 2007-2011. Vol. 1. 2015. – 148 p.. – ISBN 9789585883253
[23] Ralph Braun; Kerl, Katrin. Histopathologic correlation of dermoscopic structures.
2018
[24] Segmentaci´on, Pr´acticas De: Pr´acticas de Rob´otica y Visi´on Artificial. Universidad
de Murcia, Kapitel 9
[25] Smith, S.: Digital Signal Processing: A Practical Guide for Engineers and Scien-
tists. Elsevier Science, 2013 (Demystifying technology series). – 373–390 p.. – ISBN 9780080477329
[26] Soille, P.: Morphological Image Analysis: Principles and Applications. Springer Berlin
Heidelberg, 2013. – ISBN 9783662050880
[27] Trabocchi, Osvaldo ;Sanfilippo, Fabi´an. Segmentaci´on por Umbralizaci´on – M´etodo
Bibliograf´ıa 63
[28] Tschandl, Philipp ;Rosendahl, Cliff ;Kittler, Harald: The HAM10000 dataset, a
large collection of multi-source dermatoscopic images of common pigmented skin lesions. En: Scientific Data 5 (2018), aug, p. 180161. – ISSN 2052–4463
[29] Venegas-Barrera, Crystian S. ; Manjarrez, Javier: Visual Categorization with
Bags of Keypoints. En: Revista Mexicana de Biodiversidad 82 (2011), Nr. 1, p. 179– 191. – ISBN 9780335226375
[30] Vitaly Bushaev. Stochastic Gradient Descent with momentum. 2017
[31] Zaballos Diego, Pedro ; Carrera, Cristina ; Puig, Susana ; Malvehy, Josep:
Criterios dermatosc´opicos para el diagn´ostico del melanoma. En: Medicina Cutanea Ibero-Latino-Americana 32 (2004), Nr. 1, p. 3–17. – ISSN 02105187