Desarrollo de herramientas de cálculo de rasgos para la clasificación de imágenes en microscopía celular
61
0
0
Texto completo
(2) Universidad Central “Marta Abreu” de Las Villas Facultad de Ingeniería Eléctrica Centro de Estudios de Electrónica y Tecnologías de la Información. TRABAJO DE DIPLOMA Desarrollo de herramientas de cálculo de rasgos para la clasificación de imágenes en microscopía celular. Autor: Sergio Bárbaro Huergo Suárez e-mail: [email protected]. Tutor: Dr. C. Juan Valentín Lorenzo Ginori Profesor Titular Consultante. CEETI. FIE e-mail; [email protected]. Santa Clara, Cuba 2013 “Año 55 de la Revolución".
(3) Hago constar que el presente trabajo de diploma fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de estudios de la especialidad de Ingeniería Biomédica, autorizando a que el mismo sea utilizado por la Institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos, ni publicados sin autorización de la Universidad.. Firma del Autor Los abajo firmantes certificamos que el presente trabajo ha sido realizado según acuerdo de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada.. Firma del Autor. Firma del Jefe de Departamento donde se defiende el trabajo. Firma del Responsable de Información Científico-Técnica.
(4) i. PENSAMIENTO. El éxito consiste en obtener lo que se desea. La felicidad, en disfrutar lo que se obtiene. Ralph Waldo Emerson.
(5) ii. DEDICATORIA. A la memoria de mi abuelita Irma que tanto luchó para que yo estudiara y siempre me apoyó durante mis primeros estudios, nunca te olvidaré. A la memoria de mi papá que siempre quiso que yo fuera un profesional, ojalá estuvieras aquí. A mi mamá que tanto se ha sacrificado por mí para que hoy llegara hasta aquí y a mi hermanito Jorge Alain, los quiero mucho. A Rafael Ramos, mi padrastro, le debo gran parte de este triunfo. A mis tíos Jose y Raúl que tanto se preocupan por mí..
(6) iii. AGRADECIMIENTOS A mi abuelita y mi papá por toda la educación y el apoyo que me dieron. A mi mamá y mi padrastro que han estado conmigo siempre, apoyándome cuando más lo necesitaba, muchas gracias a Ramos por la computadora que utilicé para la tesis. A mi tutor Juan V. Lorenzo Ginori por lograr que sintiera seguridad durante esta investigación, por su puntualidad y empeño. A mis tíos que son un gran apoyo en mi vida. Muy especialmente a mi amigo José Daniel y sus padres por la ayuda que me ha brindado durante estos cinco años, me han dado seguridad y aliento, este triunfo es de ustedes también. Muchas gracias a ese negro de oro, Osmar de telecomunicaciones, por ayudarme tanto durante mi carrera, especialmente en ese tercer año cuando pensé que no podía. A mi novia que tanto me ha apoyado durante la realización de este trabajo, a sus padres también le doy las gracias. Al decano Barrios y los profesores de mi carrera que tanto me apoyaron en mi tercer año para que siguiera adelante, cuando la vida se empeñó en hacerme pasar por duros momentos con mi padre. A toda la gente de Corralillo, Yilena, Julio Molina, Marleni y Julito por apoyarme tanto en la vida y en la carrera. A mis amigos desde la vocacional Rafael, Inoldys, Christian, Ismael, Jorge Morales, Jorge Luis, y a los de la Universidad: Sandy, Yendys, Publio, Lisbel, Ángel Sarmiento, todos han sido partícipes de mis estudios. A Ketia y Luis Ángel que tanto me han ayudado. A todos los que de una forma u otra contribuyeron a este logro de mi vida..
(7) iv. TAREA TÉCNICA. 1. Realizar una amplia búsqueda y un análisis crítico de la literatura científica publicada sobre el tema de la clasificación de imágenes de microscopía celular, con énfasis en el problema de la extracción de rasgos. 2. Implementar en Matlab nuevos rasgos los cuales no estén presentes en las funciones regionprops y graycoprops de Matlab, que posibiliten el uso de nuevas facilidades en la clasificación de células. 3. Realizar una evaluación básica mediante herramientas estadísticas, de las características de los nuevos rasgos, que se relacionen con las mejoras que puedan obtenerse como resultado de la incorporación de los mismos en tareas de clasificación.. Firma del Autor. Firma del Tutor.
(8) v. RESUMEN. La clasificación de objetos tales como las células o núcleos que aparecen en imágenes de microscopía celular de diferentes tipos, constituye una tarea de gran importancia en variadas aplicaciones. Existen herramientas computacionales para calcular diferentes rasgos de estos objetos, con el propósito de realizar la clasificación de los mismos empleando algoritmos apropiados. No obstante, los sistemas comúnmente utilizados no incluyen rasgos más específicos, que pueden estar relacionados con atributos de la imagen tales como el color o la textura. El presente trabajo tiene como propósito desarrollar una herramienta en Matlab, complementaria de la función regionprops en el sentido de que permita calcular otros rasgos no incluidos en esta, que puedan resultar útiles a los efectos de realizar clasificaciones como las mencionadas anteriormente y realizar una valoración de los posibles resultados de su empleo en la tarea de clasificación..
(9) vi. TABLA DE CONTENIDOS. PENSAMIENTO .....................................................................................................................i DEDICATORIA .................................................................................................................... ii AGRADECIMIENTOS ........................................................................................................ iii TAREA TÉCNICA ................................................................................................................iv RESUMEN ............................................................................................................................. v INTRODUCCIÓN .................................................................................................................. 1 CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS. EN IMÁGENES DE MICROSCOPÍA CELULAR ............................................................... 5 1.1 La prueba de Papanicolaou como objeto de estudio en la extracción de rasgos ......... 5 1.1.1 La imagen médica digital ..................................................................................... 6 1.1.2 Generalidades sobre la extracción de rasgos y la clasificación de imágenes en microscopía celular .............................................................................................. 7 1.1.3 Dificultades que se presentan al clasificar imágenes digitales ........................... 9 1.1.4 Adquisición de la imagen digital ...................................................................... 10 1.2 Algoritmos típicos usados en la clasificación ........................................................... 11 1.3 Rasgos comúnmente usados en la clasificación ........................................................ 12 1.3.1 Rasgos basados en la forma ............................................................................... 13 1.4 Rasgos computados por regionprops y rasgos basados en la entropía .................... 13 1.5 Rasgos basados en la textura de las imágenes ......................................................... 14 1.5.1 Definición de textura ........................................................................................ 15 1.5.2 Matriz de co-ocurrencia .................................................................................... 16 1.6 Rasgos calculados a partir de la matriz de co-ocurrencia: coeficientes de textura de Haralick ..................................................................................................................... 17.
(10) vii CAPÍTULO 2.. MATERIALES Y MÉTODOS................................................................ 19. 2.1 Base de datos Herlev ................................................................................................. 19 2.1.1 Agrupamiento de las células para su análisis.................................................... 21 2.2 Cálculo de los rasgos geométricos ............................................................................ 22 2.3 Formación del cell array modificado........................................................................ 22 2.4 Cálculo de la matriz de co-ocurrencia....................................................................... 24 2.5 Cálculo de los rasgos de textura................................................................................ 26 RESULTADOS Y DISCUSIÓN .......................................................................................... 28 3.1 Resultados de la extracción de los rasgos geométricos............................................. 28 3.1.1 Comportamiento de los rasgos geométricos extraídos, con respecto a todas las clases .................................................................................................................. 30 3.2 Cell array modificado ............................................................................................... 31 3.2.1 Resultados de la extracción de los rasgos de textura ......................................... 32 3.2.2 Comportamiento de los rasgos de textura extraídos, con respecto a todas las clases .................................................................................................................. 34 3.2.3 Aplicación de los resultados obtenidos ............................................................. 36 CONCLUSIONES Y RECOMENDACIONES ................................................................... 37 Conclusiones ..................................................................................................................... 37 Recomendaciones ............................................................................................................. 37 REFERENCIAS BIBLIOGRÁFICAS ................................................................................. 38 ANEXOS .......................................................................................................................... 41 Anexo I ............................................................................................................................. 41 Anexo II ............................................................................................................................ 42 Anexo III ........................................................................................................................... 43 Anexo IV........................................................................................................................... 45.
(11) viii Anexo V ............................................................................................................................ 45 Anexo VI........................................................................................................................... 47 Anexo VII ......................................................................................................................... 48.
(12) INTRODUCCIÓN. 1. INTRODUCCIÓN. La clasificación de imágenes en microscopía celular es de gran importancia para la detección y el diagnóstico de enfermedades tales como el cáncer cervical y la malaria, por mencionar algunas. Para dicha clasificación se hace imprescindible la extracción de los rasgos que permitan que esta sea lo más precisa posible. Para la obtención de los rasgos por medios computacionales a partir de las imágenes, se utilizará el Procesamiento Digital de Imágenes (PDI) el cual nos brinda las herramientas necesarias. La aplicación del PDI viene dada porque en la actualidad para el diagnóstico de dichas enfermedades u otras se obtienen imágenes digitales de las células que se desea analizar, este análisis en algunos casos es realizado por expertos humanos, lo que trae como consecuencia la subjetividad en los resultados, esto viene dado por la experiencia que pueda tener el especialista o el cansancio luego del análisis de gran cantidad de imágenes. Por tanto el PDI se dirige a poder automatizar este proceso de clasificación logrando mejores resultados y evitando la aparición de errores, entre los cuales tienen especial importancia los posibles falsos negativos, es decir, que algunos casos realmente positivos pasen, por una u otra razón, inadvertidos, ya que estos implican que el paciente que está siendo atendido se le dé un resultado equivocado sobre una enfermedad de la cual es portador. Es por lo antes expuesto que se insiste en evitar estos resultados erróneos poco deseados por la paciente y el especialista. En un intento más elaborado para evitar los falsos negativos y neutralizar en lo posible la rutina del trabajo de diagnóstico citológico, algunos laboratorios de investigación en unión con la industria han promovido el desarrollo de sistemas expertos con diferentes enfoques, unos orientados a reevaluar los casos clasificados como negativos en la observación convencional (screening secundario), otros como detectores automáticos de.
(13) INTRODUCCIÓN. 2. lesiones que deberán ser confirmadas o rechazadas por el ojo humano experto (screening primario). Es evidente que el objetivo de la automatización debería ser la detección automática de células atípicas, incluso aún cuando éstas sean muy pocas y se encuentren entre miles normales. Esto permitirá aprovechar las ventajas adicionales de los sistemas automáticos. particularmente por. la. objetividad que estos aportan al trabajar con. imágenes digitales (matrices de datos numéricos). Así se logra mayor discriminación de los niveles de gris percibidos por el ojo humano y se amplía el espectro lumínico más allá de los límites de lo humanamente visible. Estos equipos constan básicamente de un hardware relativamente sencillo: microscopio con autoenfoque. motorizado, cámara de. vídeo de alta resolución o cámara fotográfica digital, monitor de vídeo de alta resolución y un sistema de almacenamiento en disco duro. El software utiliza parámetros diversos (rasgos) que finalmente llevan al desarrollo de una función discriminante que permite tomar decisiones clasificatorias, lo que ha determinado que la automatización del proceso para la clasificación de imágenes constituya en la actualidad un problema científico de gran relevancia. La importancia de este trabajo es que implementará una función que permita calcular rasgos de textura, que al ser utilizados por un clasificador junto a los parámetros que devuelve la función regionprops de Matlab se logre una clasificación más precisa. La aplicación más cercana de este trabajo es el uso de estas características en un trabajo paralelo que aborda específicamente el problema de la clasificación, en el cual se utilizarán para clasificar imágenes las matrices de rasgos que contengan los rasgos de regionprops unidos a los rasgos de textura calculados aquí. Las imágenes que se procesarán en esta investigación son las contenidas en la base de datos Herlev. Estas imágenes son obtenidas de la prueba de Papanicolaou, conocida comúnmente como prueba citológica. Esta investigación se realiza tomando en cuenta los lineamientos 131 y 132 del VI Congreso del PCC que plantean: 131. Sostener y desarrollar los resultados alcanzados en el campo de la biotecnología, la producción médico-farmacéutica, la industria del software y el proceso de informatización de la sociedad, las ciencias básicas, las ciencias naturales, los estudios y el empleo de las fuentes de energía renovables, las tecnologías sociales y educativas, la transferencia.
(14) INTRODUCCIÓN. 3. tecnológica industrial, la producción de equipos de tecnología avanzada, la nanotecnología y los servicios científicos y tecnológicos de alto valor agregado. 132. Perfeccionar las condiciones organizativas, jurídicas e institucionales para establecer tipos de organización económica que garanticen la combinación de investigación científica e innovación tecnológica, desarrollo rápido y eficaz de nuevos productos y servicios, su producción eficiente con estándares de calidad apropiados y la gestión comercializadora interna y exportadora, que se revierta en un aporte a la sociedad y en estimular la reproducción del ciclo. Extender estos conceptos a la actividad científica de las universidades. Por lo antes expuesto se propusieron los siguientes objetivos:. Objetivo General: Desarrollar herramientas de cálculo de rasgos de textura para la clasificación de imágenes en microscopía celular, con la utilización de herramientas de Procesamiento Digital de Imágenes.. Objetivos Específicos: 1.. Realizar un análisis crítico de la información científico-técnica sobre los diferentes. rasgos utilizados en la clasificación de imágenes, enfatizando en los relacionados con la textura de una imagen que no aparecen incluidos en las funciones regionprops y graycoprops de Matlab. 2. Implementar programas en Matlab para el cálculo de los rasgos de textura propuestos a partir del análisis de la literatura científica, orientados al análisis de imágenes en microscopía celular. 3. Construir las matrices de rasgos basados en la textura de los núcleos celulares en la prueba de Papanicolaou y realizar una valoración de los posibles resultados de su empleo en la tarea de clasificación..
(15) INTRODUCCIÓN. 4. Organización del informe El presente trabajo se desarrolló en tres capítulos antecedidos por una introducción en la que se expone la necesidad actual que lleva a la realización de esta investigación. En el capítulo 1 se plantean los fundamentos teóricos sobre el cálculo de rasgos en imágenes de microscopía celular. En el capítulo 2 quedan descritos los materiales utilizados para la realización de la investigación y la descripción de los programas implementados en Matlab para el cálculo de los rasgos geométricos y los de textura. En el capítulo 3 se recogen los resultados de esta tesis y la discusión de los mismos. Continúa este informe con las conclusiones y las recomendaciones. Se citan en el trabajo 35 referencias bibliográficas y por último se muestran en los anexos los programas realizados en Matlab..
(16) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 5. IMÁGENES DE MICROSCOPÍA CELULAR. CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN IMÁGENES DE MICROSCOPÍA CELULAR. En este capítulo se presentan los fundamentos teóricos sobre el cálculo de rasgos en imágenes de microscopía celular y se recoge una revisión bibliográfica crítica sobre el estado del arte en esta temática. El capítulo cuenta con seis epígrafes distribuidos de la siguiente forma. En el epígrafe 1.1 se describe la prueba de Papanicolaou como objeto de estudio en la extracción de rasgos. El epígrafe 1.2 se refiere a los algoritmos típicos usados en la clasificación. En el epígrafe 1.3 se abordan los rasgos comúnmente usados en la clasificación mientras que en el epígrafe 1.4 se tratan los rasgos computados por regionprops. En el epígrafe 1.5 se describen los rasgos basados en la textura de las imágenes y en el epígrafe 1.6 se muestra una relación de los rasgos calculados a partir de la matriz de co-ocurrencia. 1.1. La prueba de Papanicolaou como objeto de estudio en la extracción de rasgos. Por más de 30 años el método más efectivo para reducir las muertes por cáncer cervical ha sido la prueba de Papanicolaou [1] o conocida comúnmente como prueba citológica, llamada así en honor a su creador Georgios Papanicolaou, médico griego que fue pionero en citología y detección temprana del cáncer [2]. Esta prueba consiste en el análisis en un microscopio de un frotis que contiene una muestra de células de la cérvix (ver Figura 1), previamente sometidas a un proceso especial de tinción. Esta prueba, no obstante, tiene limitaciones debido a que en ocasiones existe solapamiento de las células, además la iluminación no siempre es homogénea, y el principal factor que hace vulnerable los resultados es el observador humano, quien en algunos casos emite un resultado que puede estar desviado de la realidad, producto de la subjetividad y del cansancio y la rutina asociados a la observación de una gran cantidad de muestras o por no contar con la experiencia necesaria. Es por todas las razones expuestas que en los últimos años se ha hecho un gran esfuerzo en el orden de contribuir a automatizar el análisis de estas.
(17) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 6. IMÁGENES DE MICROSCOPÍA CELULAR. imágenes, basado en la posibilidad de trabajar con imágenes digitales, las cuales se procesan con un software de procesamiento digital de imágenes desarrollado para este fin. La correcta caracterización de las muestras obtenidas en el frotis depende en gran medida de la apariencia del núcleo de las células. Esto es basado en que los núcleos son una parte estructural importante que exhibe significativos cambios cuando una célula es afectada por una enfermedad.. Figura 1. Localización de las células columnares y células escamosas. 1.1.1. La imagen médica digital. Las imágenes médicas digitales y sus aplicaciones en la medicina han ayudado al desarrollo de sistemas de diagnóstico basados en el análisis de las imágenes, dado su fácil acceso mediante una computadora, por ser transferibles a cualquier parte en muy poco tiempo a través de las redes de comunicaciones digitales y por no deteriorarse físicamente con el tiempo. Una de las cualidades más favorables de las imágenes digitales, es que admiten determinados procedimientos posteriores a su adquisición, con el fin de mejorar sus cualidades en función de cada tipo de diagnóstico, a la vez que se pueden realizar procedimientos para extracción o identificación de parámetros de importancia clínica. Una imagen médica digital es la representación gráfica de una estructura, región, órgano o tejido del cuerpo humano que se obtiene a través de procesos físicos y computacionales ordenados para este fin [3] [4]. En términos matemáticos, una imagen médica digital a [m,n] descrita en un espacio de dos dimensiones (2D), se pude obtener como resultado de una imagen analógica a(x,y) en espacio continuo también de 2D a través de un proceso de muestreo que es referido.
(18) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 7. IMÁGENES DE MICROSCOPÍA CELULAR. frecuentemente como digitalización. La imagen continua de 2D a(x,y) es dividida en m filas y n columnas. Un elemento de esta matriz recibe el nombre de píxel. El valor asignado a las cooredenadas enteras [m,n] con {m=0, 1, 2,…, M-1} y {n=0, 1, 2,…, N-1} es a[m,n] [5]. Dichas imágenes se utilizan para realizar estudios sobre la evolución de un paciente bajo determinado tratamiento médico, siendo estas importantes también en el diagnóstico de determinadas enfermedades o lesiones. En la figura 2 se observan imágenes médicas digitales obtenidas por distintos métodos.. Figura 2. Ejemplos de imágenes obtenidas por diversas modalidades, a) Radiografía Digital, b) Resonancia Magnética Nuclear, c)Tomografía por Emisión de Positrones, d) Tomografía Axial Computarizada, e) Imagen digital de un frotis en la prueba de Papanicolaou. 1.1.2. Generalidades sobre la extracción de rasgos y la clasificación de imágenes en. microscopía celular El Procesamiento Digital de Imágenes (PDI) tiene como objetivo el mejoramiento de la información gráfica para la interpretación humana y el procesamiento de la escena para la percepción automática por computadora [6], en este tiene gran aplicación la clasificación de imágenes en microscopía celular, pero para lograr una buena clasificación, es decir, que se obtengan resultados confiables, se deben seguir una serie de pasos que van desde la obtención de la imagen hasta su clasificación (ver Figura3)..
(19) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 8. IMÁGENES DE MICROSCOPÍA CELULAR. Figura 3. Esquema general del análisis de imágenes.. La imagen es adquirida de forma digital, con la ayuda de métodos computacionales, en el caso de este trabajo la imagen que se obtiene es sobre la prueba de Papanicolaou. Poder automatizar este proceso de captura de la imagen permite un ahorro de tiempo y además garantiza una mayor calidad, posibilitando obtener las imágenes de todos los campos correspondientes al frotis [7]. Debe quedar claro que en el estudio que nos ocupa la captura no fue automatizada. Posteriormente se realiza el acondicionamiento de la misma, necesario para mejorar su calidad mediante la eliminación total o parcial del ruido que esta contenga, también se hacen modificaciones en la iluminación y el contraste [8]. Para extraer los rasgos de una célula con el objetivo de clasificarla por medios computacionales, hay que segmentarla. En la prueba de Papanicolaou, la segmentación de los citoplasmas celulares se hace difícil debido al solapamiento entre células y a las variaciones de intensidad y color, mientras que los núcleos son más fáciles de segmentar con calidad pues aparecen mejor definidos en las imágenes. Es por esto que se trata de extraer rasgos de los núcleos [9] y en especial este trabajo trata de la extracción de rasgos de textura de esos núcleos. Es necesario lograr una diversidad de rasgos que permitan discernir cuales son las células que presentan anomalías y cuales son sanas.. Observar en la Figura 4 la. segmentación de los núcleos. Por lo antes planteado es que en este trabajo además de los.
(20) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 9. IMÁGENES DE MICROSCOPÍA CELULAR. rasgos que ofrece regionprops basados en la forma geométrica del núcleo se calcularon un conjunto de rasgos de textura basados en los coeficientes de Haralick [10]. El último paso de este proceso sería la clasificación para determinar con la mayor exactitud posible en qué clases o categorías podrían quedar definidos los patrones hallados en la anterior etapa, célula anómala (positiva) o célula normal (negativa). Dicha clasificación pudiera tener un rango más amplio, tal como ocurre en la base de datos Herlev [11] cuyas células fueron clasificadas en siete clases.. Figura 4. a) Imagen obtenida en la Prueba de Papanicolaou, b) núcleo de una célula segmentada. Con el desarrollo acelerado de las investigaciones biomédicas se ha logrado un considerable avance en las aplicaciones del PDI. Varias son las herramientas computacionales que permiten que se realice el diagnóstico de una enfermedad sin tener que acudir directamente a especialistas, estos solo evaluarían el resultado final de la clasificación computarizada. Se hace imprescindible para el logro de un procesamiento certero la realización de dos etapas fundamentales: la extracción de los rasgos y su empleo en el proceso de clasificación. 1.1.3. Dificultades que se presentan al clasificar imágenes digitales. Al clasificar imágenes, se presenta la posibilidad de encontrar problemas que dificultan el procesamiento. Esto viene dado por la presencia de ruido, variabilidad en la posición, inclinación, orientación, rotación o escalamiento de los objetos contenidos en la imagen, variaciones de la iluminación (o factores equivalentes en otros sistemas de imaginología), que inciden sobre la uniformidad de los colores, las sombras, el contraste y la textura. Además existe gran variabilidad de los patrones en diferentes aplicaciones: los patrones biológicos pueden ser muy variables en el tiempo para un mismo paciente o en el mismo.
(21) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 10. IMÁGENES DE MICROSCOPÍA CELULAR. momento para diferentes pacientes. Existen limitaciones propias del estado actual de la ciencia y la tecnología, equilibrio entre velocidad de procesamiento y calidad del análisis. En los procesos de reconocimiento y clasificación se requiere una adecuada calibración del proceso de adquisición de la imagen. 1.1.4. Adquisición de la imagen digital. La adquisición digital de la imagen es el primer paso en cualquier sistema en el que se aplique el PDI. Un sistema general de formación de una imagen digital consta de un sistema óptico (microscopio) , un sensor (cámara digital) y un digitalizador (PC), (ver Figura 5).. Figura 5. Formación de una imagen donde f (µ,β) es la radiación reflejada y g (i,j) es la información digital. Una vez que la imagen digital se obtiene es posible someterla a diferentes procedimientos matemáticos, según los objetivos que se definan. Cuando una imagen es la representación óptica de un objeto iluminado por una fuente de radiación luminosa, en la formación de esta intervienen los elementos siguientes: el objeto, la fuente radiante y el sistema de formación de la imagen. Es por ello que todo modelo matemático que pretenda reflejar de forma fiel esta realidad física debe tomar en consideración la fuente de radiación (la cual puede ser luz visible, de Rayos-X, radiación ultrasónica, infrarroja u otra), la física de la interacción de la radiación y el objeto, además del sistema de adquisición empleado..
(22) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 11. IMÁGENES DE MICROSCOPÍA CELULAR. 1.2. Algoritmos típicos usados en la clasificación. Un clasificador digital es una herramienta computacional que se utiliza para determinar una clase etiquetada a partir de un conjunto de características o rasgos que se colocan como atributos de entrada en el clasificador. Existen para el aprendizaje por parte de los clasificadores dos técnicas conocidas como: aprendizaje supervisado que es el que se basa en entrenar al clasificador a partir de ejemplos conocidos, y no supervisado donde el algoritmo aprende a partir de patrones de entrada para los que no se especifiquen los valores de sus salidas. Los clasificadores que se analizan en este capítulo utilizan el aprendizaje supervisado. En la literatura referente al tema se encuentra un amplio uso de ambas técnicas para la clasificación por ejemplo: las redes neuronales artificiales (RNA) [12], [13] las máquinas de soporte vectorial (SVM) [14] [15] [16], k vecinos más cercanos (knn) [17], así como el clasificador Bayesiano [18]. Con respecto a los que se basan en aprendizaje no supervisado tenemos el Spectral Clustering y a fuzzy C-means [19]. A continuación se describen algunos clasificadores: . El clasificador lineal:. El clasificador lineal toma una decisión de clasificación, utilizando el valor de una combinación lineal de los rasgos o características de los objetos a clasificar. Las características de un objeto son típicamente presentadas en un vector llamado vector de rasgos o características. Los clasificadores lineales son utilizados habitualmente en situaciones donde la velocidad de la clasificación es importante, ya que a menudo son los clasificadores más rápidos. Además, los clasificadores lineales con frecuencia funcionan muy bien cuando el número de rasgos es grande. . El clasificador basado en la distancia de Mahalanobis:. Se basa en el cálculo de la distancia con respecto a un vector (de rasgos) prototipo y que se toma la decisión sobre la base de la menor distancia. Su utilidad radica en que es una forma de determinar la similitud entre dos variables aleatorias multidimensionales, en este caso los vectores de rasgos de los objetos a clasificar. Se diferencia de la distancia euclidiana en que tiene en cuenta la correlación entre las variables aleatorias. . El método de los k vecinos más cercanos:.
(23) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 12. IMÁGENES DE MICROSCOPÍA CELULAR. En el método de los k vecinos más cercanos (knn, k nearest neighbors) está basado en la clasificación supervisada. Este es un procedimiento de clasificación no paramétrico dónde se estima el valor de la función de densidad de probabilidad o directamente la probabilidad posterior de que un elemento x pertenezca a la clase Cj a partir de la información proporcionada por el conjunto de prototipos. En la fase de clasificación, el ejemplo, del que no se conoce su clase, es representado por un vector en el espacio de rasgos. Se calcula la distancia entre los vectores almacenados y el nuevo vector, y se seleccionan los k ejemplos más cercanos. El nuevo ejemplo es clasificado con la clase que más se repite en los vectores seleccionados. Este método considera que los vecinos más cercanos nos dan la mejor clasificación y esto se hace utilizando todos los atributos; el problema de dicha suposición es que es posible que se tengan muchos atributos irrelevantes que dominen sobre la clasificación: dos atributos relevantes perderían peso entre otros veinte irrelevantes. Finalmente, antes de asignar pesos es recomendable identificar y eliminar los atributos que se consideran irrelevantes. . Máquinas de soporte vectorial:. Las máquinas de soporte vectorial han sido muy utilizadas en los procesos de clasificación [20] [21]. Constituyen un método de clasificación que consiste en construir hiperplanos en un espacio multidimensional para separar los casos de diferentes clases. 1.3. Rasgos comúnmente usados en la clasificación. La clasificación de las células obtenidas de forma digital, es el último paso en el análisis de imágenes, que se inicia con la adquisición de las mismas. La calidad del resultado obtenido en esta última fase depende en su mayoría de la capacidad que tengan los rasgos extraídos de caracterizar la zona de interés en el estudio, ya sean del núcleo o del citoplasma. Los rasgos que se obtienen en este trabajo son los relacionados con el núcleo y se encuentra en la literatura que se hallan también rasgos del citoplasma [11], y en ambos casos resulta determinante la extracción de las características que determinen el estado de afectación que pueda tener dicha estructura celular ante una enfermedad..
(24) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 13. IMÁGENES DE MICROSCOPÍA CELULAR. Existen gran variedad de rasgos utilizados en la literatura con los que se puede determinar cuánta desviación de la normalidad tiene una célula. La mayoría de las características con las que se trabaja en la actualidad son basadas en la forma y textura del núcleo y del citoplasma.. 1.3.1. Rasgos basados en la forma. Varias técnicas cualitativas y cuantitativas han sido desarrolladas para caracterizar la forma de los objetos contenidos en una imagen. Estas técnicas son utilizadas para la clasificación de objetos en sistemas de reconocimiento de patrones. Algunas de estas técnicas se aplican solo a imágenes binarias, otras pueden ser extendidas a imágenes en escala de grises [22]. En el análisis de la literatura existente relacionada con la prueba de Papanicolaou, se encontró que la extracción de los rasgos basados en la forma del núcleo celular ha sido de mucha ayuda al realizar la clasificación. En [23] se extrajeron un conjunto de rasgos que contenían información correspondiente a la forma y textura del núcleo. En el artículo [24] se utiliza para los experimentos la base de datos Herlev donde para clasificar los núcleos se extraen rasgos relacionados con la forma. En [25] tampoco se hallan rasgos de textura para la clasificación sino que viene dada solo por características representativas de la forma geométrica. Para la clasificación automatizada de las células obtenidas en la prueba citológica, en [26] aunque la prueba citológica que se realiza es de base líquida, técnica diferente a la aplicada en las imágenes de la base de datos Herlev, también se determinan un conjunto de características, algunas de estas son: perímetro del núcleo, el área, longitud máxima, el ancho, la proporción de núcleo y áreas de citoplasma, otros parámetros relacionados con la textura se describen incluyendo la entropía de la matriz de coocurrencia (ECM) y el contraste de la matriz de co-ocurrencia (CCM). 1.4 Rasgos computados por regionprops y rasgos basados en la entropía Para obtener características de una imagen etiquetada se utiliza la herramienta regionprops presente en Matlab, son varios los rasgos que devuelve esta herramienta. En este trabajo se determinó utilizar solamente las siguientes características:.
(25) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 14. IMÁGENES DE MICROSCOPÍA CELULAR. Intensidad Máxima: especifica el valor del píxel con la intensidad máxima en la región. Intensidad Media: especifica el término medio de toda la intensidad en la región. Intensidad Mínima: especifica el valor del píxel con la intensidad mínima en la región. Solidez: especifica la proporción de los píxeles en el casco convexo que están también en la región. Computado como Área/Área convexa. Área: El número real de píxeles en la región. Perímetro: cantidad de píxeles en el contorno de la región. Excentricidad: El área y el perímetro también se emplearon a partir de la siguiente relación: Área. (1). Perímetro. Existen otros rasgos importantes para la clasificación que no se generan con regionprops, ejemplo de esto se encuentra la entropía de Shannon, la entropía de energía logarítmica y la entropía de umbral definidas estas en [27]. Entropía de Shannon: E ( ) = −∑. log(. ). (2). Entropía de la energía logarítmica E ( ) = ∑ log(. ). (3). Entropía de umbral E ( ) = 1 if | | >. (4). Donde E3(s) es el número de píxeles en la imagen en escala de grises que están por encima de un umbral p. 1.5 Rasgos basados en la textura de las imágenes La discriminación de diferentes texturas tiene aplicaciones en la segmentación de imágenes en regiones, en la detección de objetos y la clasificación e interpretación de imágenes en.
(26) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 15. IMÁGENES DE MICROSCOPÍA CELULAR. una variedad de aplicaciones que van desde las imágenes de satélites (teledetección) hasta la microscopía electrónica. La textura es una importante característica discriminativa de la imagen y su uso en la clasificación de imágenes digitales está basado en la necesidad de incluir patrones de variabilidad en el análisis [28]. Se conoce que la textura es una propiedad que poseen todas las superficies. Se han formalizado teóricamente modelos de análisis de textura creándose expresiones matemáticas las cuales se han automatizado, esto ha facilitado la extracción de rasgos de textura para alcanzar una mejor clasificación. Los avances obtenidos en este campo justifican el interés creciente que se observa en la clasificación automática de imágenes basadas en descriptores de textura extraídos de las imágenes. 1.5.1. Definición de textura. En la revisión bibliográfica realizada sobre el tema se encontraron diversos conceptos de textura dados por diferentes autores. Una definición de la noción de textura es que son las características físico-estructurales dadas a un objeto por el tamaño, forma, arreglo y proporciones de sus partes [29]. La descripción de la textura de una región puede determinarse con distintos modelos teóricos, los principales utilizados en el PDI son: el Estadístico, el Espectral y el de MultiResolución. Este trabajo se basa en el modelo estadístico de 2do. Orden (matriz de coocurrencia) ya que es adecuada para texturas de origen aleatorio y que no responden a un patrón determinado además de que tiene en cuenta la posición relativa de los píxeles entre sí. Modelo Estadístico: caracteriza a la textura por las propiedades estadísticas de la intensidad en niveles de gris (NG). Los métodos de la estadística de 1er. Orden utilizan el histograma de los NG y describen bien las texturas simples, mientras que la Estadística de 2do. Orden captura la información de contexto de una región de la imagen mediante diferentes principios (co-ocurrencia, cadenas de píxeles, espectro de textura)..
(27) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 16. IMÁGENES DE MICROSCOPÍA CELULAR. Figura 6. De izquierda a derecha las propiedades de la textura son: suavidad, rugosidad y regularidad. 1.5.2. Matriz de co-ocurrencia. Los métodos de análisis de textura en el dominio del espacio pueden ser clasificados, a su vez, sobre la base de diferentes unidades de análisis: el píxel, los elementos de borde y los extremos de los tonos de gris. La mayoría de los diferentes desarrollos teóricos sobre análisis de textura toman como la unidad básica de análisis el píxel cuando plantean las definiciones matemáticas de los descriptores. La matriz de co-ocurrencia quedó definida por Haralick como: en la que cada elemento (i, j) de la misma, es la probabilidad que un píxel separado por un desplazamiento fijo δ=(r, θ) de un píxel con nivel de gris i, tenga un nivel de gris j [30]. A continuación se muestra una matriz de co-ocurrencia que se toma como la cantidad de veces que ocurre la adyacencia horizontal de los niveles i y j:. Figura 7. Matriz de co-ocurrencia (GLCM), calculada a partir de una imagen de 4x5..
(28) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 17. IMÁGENES DE MICROSCOPÍA CELULAR. 1.6. Rasgos calculados a partir de la matriz de co-ocurrencia: coeficientes de textura. de Haralick Para obtener los rasgos de textura se utilizó, luego de realizar una búsqueda acerca del cálculo de los rasgos de Haralick a partir de matrices de co-ocurrencia, una función obtenida en la Web [31], que halla 22 de estas características (ver Tabla 1): Tabla 1. Rasgos de textura computados por la función Rasgos Salida de la función Autocorrelación (out.autoc) Contraste (out.contr) Correlación de Matlab (out.corrm) Correlación de la función (out.corrp) Prominencia del cluster (out.cprom) Sombra del cluster (out.cshad) Disimilitud (out.dissi) Energía (out.energ) Entropía (out.entro) Homogeneidad de Matlab (out.homom) Homogeneidad de la función (out.homop) Máxima probabilidad (out.maxpr) Suma de cuadrados: varianza (out.sosvh) Promedio de la suma (out.savgh) Varianza de la suma (out.svarh) Entropía de la suma (out.senth) Diferencia de varianza (out.dvarh) Diferencia de entropía (out.denth) Información de la medida de correlación1 (out.inf1h) Información de la medida de correlación2 (out.inf2h) Diferencia inversa normalizada (INN) (out.indnc) Momento normalizado de la diferencia inversa (out.idmnc). A modo de ejemplo, a continuación se definen matemáticamente siete de estos rasgos, dentro de los que se encuentran los cuatro que computa la función graycoprops [32]: energía, correlación, contraste, homogeneidad. Una definición matemática de los demás puede encontrarse en [33] donde P es una componente de la matriz de co-ocurrencia en una posición determinada por (i, j)..
(29) CAPÍTULO 1.. FUNDAMENTOS TEÓRICOS SOBRE EL CÁLCULO DE RASGOS EN. 18. IMÁGENES DE MICROSCOPÍA CELULAR. Energía = ∑ ,. (, ). Correlación = ∑ , Entropía = − ∑ ,. (. (5) ). (, ). (6). ( , ) log ( , ). Diferencia inversa normalizada = ∑ , ( −. Sombra del cluster = ∑ ,. Prominencia del cluster = ∑ , Contraste = ∑ , ( − ) Homogeneidad = ∑ ,. (, ) (, ) (. ). )+ ( −. (7) (. (, ). ). − )+. (8). (, ) −. (9) (, ). (10) (11) (12).
(30) CAPÍTULO 2. MATERIALES Y MÉTODOS. 19. CAPÍTULO 2. MATERIALES Y MÉTODOS. En este segundo capítulo se tratarán los materiales que se utilizaron y los métodos que se siguieron para obtener los rasgos de textura, cuenta con una distribución de cinco epígrafes. El epígrafe 2.1 explica en que consiste la base de datos Herlev. El epígrafe 2.2 explica como se realizó el cálculo de los rasgos geométricos. El epígrafe 2.3 trata la formación del cell array modificado. El epígrafe 2.4 explica como se realizó el cálculo de la matriz de coocurrencia. El epígrafe 2.5 aborda el cálculo de los rasgos de textura. 2.1. Base de datos Herlev. La base de datos Herlev fue creada en el Hospital Universitario Herlev, de Dinamarca. En la misma, con el trabajo de varios técnicos experimentados y doctores en medicina se creó una base que contiene 917 imágenes celulares obtenidas a partir de células cervicales (ver Figura 8), las cuales fueron divididas en siete clases [11]. Cada célula fue examinada por dos técnicos y las muestras que resultaron más difíciles de clasificar fueron analizadas también por un doctor en medicina, en caso de no haber igualdad de criterios la muestra fue descartada. Las imágenes que resultaron seleccionadas fueron acondicionadas y segmentadas por el personal del hospital.. Figura 8. Célula de la base de datos Herlev..
(31) CAPÍTULO 2. MATERIALES Y MÉTODOS. 20. Tabla 2. Distribución de las 917 células en siete clases Clases. Categorías. 1 2 3 4 5 6 7. Normal Normal Normal Anormal Anormal Anormal Anormal. Tipo de célula. Cantidad de células. Superficial escamosa epitelial Intermedia escamosa epitelial Columnar escamosa epitelial Ligera escamosa displasia Moderada escamosa displasia Severa escamosa displasia Carcinoma in situ. 74 70 98 182 146 197 150. Subtotal. 242. 675. Como se observa en la Tabla 2 las tres primeras clases pertenecen a células normales, mientras que las cuatro restantes pertenecen a células anómalas. Tabla 3. Codificación de las siete clases. Nombre de la clase Normal Superficial Normal Intermedia Normal Columnar Normal Ligera Anormal Moderada Anormal Severa Anormal Carcinoma. Código Supsqepmodif Intsqepmodif colepmodif mild_sqnkdmodif mod_sqnkdmodif sev_sqnkdmodif sqcelcarcimodif. Para facilitar el trabajo con las imágenes, a cada clase se le asignó un código que las identifica, como se muestra en la Tabla 3. A continuación se muestra un ejemplo de las imágenes con las que se trabajó:.
(32) CAPÍTULO 2. MATERIALES Y MÉTODOS. 21. Figura 9. a) Célula perteneciente a la clase 6 (anómala) en formato (RGB), b) imagen segmentada, donde pueden observarse el núcleo (azul claro) y el citoplasma (azul oscuro). 2.1.1. Agrupamiento de las células para su análisis. Esta investigación se realizó a partir de imágenes de células que estaban contenidas en un cell array [34] (ver Figura 10), estas se encontraban concatenadas en una misma celda: 1.. Una máscara binaria para el núcleo. 2.. La célula en escala de grises. 3.. La célula a color (RGB). Figura 10. Imagen contenida en una celda del cell array para una célula del tipo Anormal Carcinoma. Para acceder a este array se creó un programa que permitiera mostrar las imágenes contenidas para poder trabajar con ellas, a continuación se explica el programa: . se carga la clase (código asignado)..
(33) CAPÍTULO 2. MATERIALES Y MÉTODOS. . se guarda en una variable la posición dentro del array que se desea mostrar.. . se muestra la imagen contenida en la variable.. . se realizan los mismos pasos para las dos imágenes restantes.. 2.2. 22. Cálculo de los rasgos geométricos. Para la extracción de estos rasgos se tomó un programa creado en un trabajo de diploma anterior [34], aquí en este trabajo se utiliza para la confección de la matriz de rasgos (véase el Anexo I), dicho programa se describe a continuación: . Se leen las imágenes almacenadas en los array ya creados (array para cada una de las clases), que contienen a su vez las células de las imágenes cervicales en escala de grises, en el espacio RGB, y la máscara binaria correspondiente al núcleo de las mismas.. . Se definen los rasgos a extraer (los descritos en el epígrafe 1.4 del Capítulo 1).. . Se define un ciclo de iteraciones donde se aplica regionprops a las células en escala de grises y la máscara binaria de los núcleos.. . Luego se crea la matriz de rasgos.. Además de estos rasgos que genera regionprops también se calculó la entropía de Shannon, la entropía de la energía logarítmica y la entropía de umbral. La función que se creó para obtener los rasgos anteriores se describe a continuación (véase el Anexo II): Function E= shentrop (imag, mask, casos): . Como argumentos de entrada se coloca la imagen, la máscara correspondiente a la imagen y se definen los casos.. . Para el caso (1) se obtiene la entropía de Shannon, para el caso (2) la entropía de la energía logarítmica y para el caso (3) la entropía de umbral.. 2.3. A la salida se obtienen los distintos valores de entropía. Formación del cell array modificado. Para calcular la matriz de co-ocurrencia es imprescindible trabajar con la imagen en escala de grises, ya que la función utilizada se basa en el conteo de las adyacencias de píxeles de acuerdo con los niveles de intensidad que estos presentan..
(34) CAPÍTULO 2. MATERIALES Y MÉTODOS. 23. Partiendo de que el objetivo de este trabajo es la extracción de rasgos de textura del núcleo celular, es necesario crear un programa que permita extraer de la imagen en escala de grises, su zona de interés (núcleo). Los pasos que se siguieron para extraer la zona de interés del núcleo, se describen a continuación (véase el Anexo III): . Se carga la celda del cell array deseada.. . Se trabaja con la imagen binaria o máscara del núcleo.. . Se realizan erosiones sucesivas de la máscara del núcleo, con elementos estructurante cuadrados que incrementan su tamaño en iteraciones sucesivas. El proceso se inicia con un píxel como SE cuadrado inicial e incrementando la longitud de su lado en un píxel por cada iteración, hasta erosionar el núcleo completamente y que este desaparezca.. . Se toma la imagen binaria erosionada que corresponde al SE cuadrado anterior a la ultima iteración que erosionó el núcleo completamente y se selecciona un píxel de la misma.. . Con el mismo SE del paso anterior se realiza una dilatación de este píxel, el resultado será un cuadrado máximo inscrito en el núcleo.. . Se toma este cuadrado binario como máscara, de modo que al ser multiplicada punto a punto con la imagen en escala de grises, se obtiene una imagen cuadrada en escala de grises que contiene los rasgos de textura.. En la siguiente figura quedan reflejados los resultados que se obtienen con el programa anterior, se muestra como referencia la imagen número 30 de la clase 7 (carcinoma anormal).
(35) CAPÍTULO 2. MATERIALES Y MÉTODOS. 24. Figura 11. De izquierda a derecha se tiene: célula en escala de grises perteneciente a la clase siete, máscara binaria correspondiente a la célula en escala de grises, en blanco lo que sería la zona de interés del núcleo e imagen resultante al multiplicar la máscara binaria por la imagen en escala de grises, esta es la zona de interés del núcleo. Una vez obtenida esta región de interés se crea el cell array modificado que contiene cuatro imágenes: original (RGB), en escala de grises, máscara binaria para el núcleo y la región de interés del mismo (ver Figura 15) 2.4. Cálculo de la matriz de co-ocurrencia. El método que se utilizó en este trabajo para extraer los rasgos de textura fue basado en el modelo estadístico de 2do. Orden para el cual se tienen en cuenta los niveles de gris de la imagen en escala de grises. El software Matlab contiene una función llamada graycomatrix [32] la cual crea una matriz de co-ocurrencia (GLCM) de los niveles de gris de la imagen. Esta GLCM se calcula teniendo en cuenta la ocurrencia de un píxel con valor i (intensidad en escala de grises) con un píxel de valor j, de forma horizontal y adyacente. Se puede especificar otro píxel en el espacio haciendo uso del parámetro Offset. El offset determina un arreglo de Px2 que especifica la distancia entre el píxel de interés y su vecino. Cada fila del arreglo es un vector de dos elementos [row_offset, col_offset]. La sintaxis row_offset representa el número de filas entre el píxel de interés y su vecino mientras que col_offset representa el número de columnas entre el píxel de interés y su vecino. Como que el offset se expresa en ángulo se muestra el siguiente gráfico que representa como determinar el ángulo basado en la distancia D= 1:.
(36) CAPÍTULO 2. MATERIALES Y MÉTODOS. 25. La sintaxis de la función para calcular la GLCM se plantea a continuación: glcms = graycomatrix (I, param1, val1, param2,val2,...) I: imagen con la que se trabajará param : parámetro que se le calculará a la imagen val: valor que tendrá el parámetro En este trabajo para obtener la matriz de co-ocurrencia se creó un programa utilizando la función graycomatrix, a la que se le introducen como argumentos de entrada la imagen deseada y el parámetro offset: glcmin= graycomatrix (J, 'Offset', of) glcmin: matriz de co-ocurrencia J: imagen en escala de grises 'Offset': parámetro que se desea especificar of: valor del parámetro A continuación se describen los pasos del programa (véase el Anexo IV): . Se carga la clase deseada, presente en un cell array modificado.. . Se crea un ciclo for que permita analizar todas las imágenes en escala de grises pertenecientes a la zona de interés del núcleo.. . Con la función imadjust presente en la ayuda de Matlab se realiza un ajuste lineal de la intensidad de las imágenes en escala de grises que serán procesadas para hallarles su matriz de co-ocurrencia.. . Se determina el offset que se le introducirá como argumento de entrada a la función graycomatrix, teniendo este los siguientes valores: (1, 4 y 7), desplazado en cuatro.
(37) CAPÍTULO 2. MATERIALES Y MÉTODOS. 26. direcciones (0°, 45°, 90° y 135°). Se obtienen cuatro matrices por cada valor de offset. . Para lograr una matriz resultante (matriz de co-ocurrencia o GLCM) se tomó el máximo. valor por posiciones entre las cuatro matrices y ese máximo se colocó en. la misma posición pero de una nueva matriz. Esta será la matriz de co-ocurrencia a utilizar.. Figura 12. a) Célula en escala de grises perteneciente a la clase 7, b) máscara binaria correspondiente a la célula en escala de grises, en rojo se tiene el núcleo y en blanco la zona de interés a extraer, c) imagen resultante al multiplicar la máscara binaria por la imagen en escala de grises, esta es la zona de interés del núcleo y d) luego de aplicar un ajuste lineal de la intensidad de la imagen resultante, con la función imadjust. 2.5. Cálculo de los rasgos de textura. El cálculo de los descriptores de textura se realizó con la utilización de la siguiente función (véase el Anexo V): Función [out] = GLCM_Features1 (glcmin, pairs) glcmin: matriz de co-ocurrencia que se toma como argumento de entrada. pairs: bandera que toma valores 1 o 0 según la matriz de co-ocurrencia sea simétrica o no. En este caso se utiliza el valor 0 que corresponde con una GLCM no simétrica..
(38) CAPÍTULO 2. MATERIALES Y MÉTODOS. 27. La función ‘GLCM_Features 1’ ayuda a calcular los rasgos para las diferentes matrices de co-ocurrencia que se coloquen como argumento de entrada en la función. Las matrices de co-ocurrencia son guardadas en una matriz de dimensiones [I x J x N], donde N es el número de matrices de co-ocurrencia calculadas usando diferentes direcciones y desplazamientos a partir de un algoritmo determinado. Normalmente los valores de I y J corresponden al parámetro ‘NumLevels’ de la matriz de co-ocurrencia computada con la función graycomatrix. En este trabajo se realizó una validación de la función que se utilizó para la extracción de los rasgos de textura. Dentro de los rasgos que devuelve dicha función se incluyen cuatro características de textura que son calculadas con la función graycoprops de Matlab, por tanto se aplicó esta función de Matlab a las matrices de co-ocurrencia obtenidas (véase el Anexo VI) y se compararon los resultados obtenidos con los de la función. Se comprobó que los coeficientes obtenidos por ambos métodos coinciden en un 100%, este resultado se ilustra en la tabla 7..
(39) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 28. RESULTADOS Y DISCUSIÓN. En este capítulo se realizó un análisis de los resultados obtenidos durante el desarrollo de este trabajo, basado en la extracción de los rasgos geométricos que genera regionprops y en los rasgos que describen la textura de una imagen. Además se realizó un análisis comparativo entre los dos tipos de rasgos que se calculan en cuanto a: la capacidad que tienen estos para caracterizar las células contenidas dentro de una clase determinada o entre clases. 3.1. Resultados de la extracción de los rasgos geométricos. En este epígrafe se exponen los resultados luego de extraer los rasgos que describen la forma geométrica del núcleo. Para lograr una mejor descripción del desempeño que tienen estas características en el momento de la clasificación, se calculó la media y la desviación estándar de cada rasgo para cada clase, donde los rasgos calculados se identifican con números en la tabla 4. Los resultados de la media y la desviación estándar se muestran en la tabla 5. Tabla 4. Correspondencia de cada rasgo con un número. Número 1 2 3 4 5 6 7 8 9. Rasgo Relación* Entropía Intensidad Media Intensidad Máxima Intensidad Mínima Solidez Excentricidad Área Perímetro. *El parámetro Relación corresponde a la ecuación (1).
(40) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 29. Tabla 5. Media y desviación estándar de cada rasgo para cada una de las clases.. Clases media 1 std media 2 std media 3 std media 4 std media 5 std media 6 std media 7 std. 1 0.27 0.01 0.26 0.01 0.29 0.44 0.25 0.02 0.25 0.01 0.24 0.02 0.3 0.78. 2 4.46 0.41 4.82 0.42 4.85 0.49 5.13 0.42 5.01 0.5 5.06 0.5 5.03 0.46. 3 0.26 0.07 0.26 0.08 0.37 0.1 0.38 0.07 0.36 0.06 0.37 0.09 0.38 0.07. 4 0.36 0.07 0.38 0.09 0.5 0.15 0.51 0.09 0.49 0.09 0.51 0.13 0.52 0.1. Rasgos 5 6 0.21 0.97 0.07 0.01 0.19 0.97 0.09 0.02 0.29 0.94 0.08 0.03 0.28 0.96 0.05 0.02 0.27 0.96 0.05 0.01 0.28 0.95 0.06 0.03 0.3 0.95 0.05 0.03. 7 0.57 0.17 0.6 0.17 0.67 0.18 0.61 0.15 0.64 0.15 0.69 0.15 0.72 0.14. 8 626.81 206.89 1309.1 391.51 1584.3 700.87 4677.9 1903.7 3861.9 1654.7 2939.2 1475.9 2975.8 1281.9. 9 92.88 15.84 138.58 20.61 160.49 39.83 273.2 58.21 245.5 52.07 220.61 55.1 226.39 53.92. En la tabla anterior ha quedado representada la media y la desviación estándar de cada rasgo dentro de una clase. Esto nos da una idea de cuánto caracteriza un rasgo a una célula en el momento de la clasificación. Si tomamos como ejemplo la primera clase se observa que el rasgo uno y el rasgo tres pudieran no ser tan buenos a la hora de discernir entre la clase 1y 2, ya que la media en ambos rasgos tiene valores similares. Los rasgos 8 y 9 como se observa pudieren ser mejores a la hora de distinguir la primera clase de la segunda. Es importante el análisis de los rasgos obtenidos para poder realizar una selección de los mismos, facilitando así la técnica conocida como reducción de la dimensionalidad. Al aplicar la función regionprops con el fin de obtener características relacionadas con la geometría del núcleo nos limitamos solo a estos rasgos. Existen además características tan importantes como la entropía que no son generadas con regionprops y que fueron calculadas en este trabajo, descritas en la tabla 6..
(41) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 30. Tabla 6. Rasgos que no se calculan con regionprops. Clases 1 2 3 4 5 6 7. Células 1ra 2da 1ra 2da 1ra 2da 1ra 2da 1ra 2da 1ra 2da 1ra 2da. E (s) 4.69 4.11 5.04 5.13 5.65 5.39 4.81 4.56 6.05 4.94 5.91 5.03 4.63 5.04. Rasgos* E (s) -243.06 -160.27 -427.25 -507.26 -510.8 -725.39 -353.96 -283.89 -753.95 -268.92 -652.35 -350.06 -238.95 -347.1. E (s) 0 0 107 81 3340 3156 2906 2393 4166 0 3322 3293 360 1687. * E (s) corresponde a la entropía de Shannon, E (s) pertenece a la entropía de la energía logarítmica y E3(s) representa la entropía de umbral. En la tabla anterior se observan tres valores de entropía para las dos primeras células de cada clase, la diferencia entre el resultado obtenido en la entropía de Shannon con respecto a la entropía de la energía logarítmica viene dada por sus ecuaciones (ver ecuación (2) y (3)). Los valores mostrados de la entropía de umbral corresponden a los píxeles de la imagen en escala de grises que tiene un valor de intensidad igual o superior a 0.3.. 3.1.1. Comportamiento de los rasgos geométricos extraídos, con respecto a todas las clases. El rendimiento de un rasgo en el momento de la clasificación se puede valorar con respecto a la capacidad que tiene este al discernir a qué clase determinada pertenece una célula dada. Para tener una idea preliminar del comportamiento de estos rasgos según lo antes planteado, se realizó una normalización de cada uno de estos coeficientes, este resultado se muestra en las siguientes gráficas..
(42) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 31. Figura 13. Comportamiento de los primeros cinco rasgos en cada una de las clases.. Figura 14. Comportamiento de los rasgos del seis al nueve en cada una de las clases.. 3.2. Cell array modificado. Los rasgos de textura fueron extraídos de una región del núcleo, determinada como zona de interés. Dicha zona quedo incluida en un cell array facilitando el acceso a ella para el cálculo de los coeficientes de textura..
(43) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 32. Figura 15. Cell array modificado perteneciente a la primera célula de la clase 4. 3.2.1. Resultados de la extracción de los rasgos de textura. Para aplicar la función que calcula los rasgos de textura [31], fue necesario hacer una comprobación de la veracidad de los resultados que esta ofrece. En la tabla 7 se muestran los valores de los coeficientes que calcula graycoprops comparados y los valores de esos mismos coeficientes calculados con la función. Tabla 7. Comparación entre graycoprops y la función. Clases 1. 2. 4. 5. Rasgos Contraste Correlación Energía Homogeneidad Contraste Correlación Energía Homogeneidad Contraste Correlación Energía Homogeneidad Contraste Correlación Energía Homogeneidad. Métodos Función Graycoprops 1.23 1.23 0.78 0.78 0.05 0.05 0.68 0.68 0.91 0.91 0.84 0.84 0.05 0.05 0.72 0.72 0.78 0.78 0.82 0.82 0.08 0.08 0.75 0.75 0.44 0.44 0.92 0.92 0.08 0.08 0.81 0.81.
(44) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 33. En la tabla anterior se puede observar que los valores de los rasgos obtenidos con la función de la Web y los obtenidos con la función de Matlab coinciden en un 100% independientemente del método utilizado, lo que demuestra que se puede utilizar la función (Web) para el cálculo de los coeficientes de textura. Los resultados mostrados corresponden a la primera célula. Para realizar un análisis del desempeño que tienen los rasgos de textura calculados se procedió de la misma forma que en los rasgos geométricos. Se calculó la media y la desviación estándar de cada rasgo para cada una de las clases normales y anómalas, mostrándose en las tabla 8 y tabla 9 respectivamente. Tabla 8. Media y desviación estándar de cada rasgo para las clases normales.. 1 Rasgos* 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22. media 13.94 3.32 0.22 0.22 101.32 7.33 1.32 0.07 3.2 0.57 0.52 0.15 15.31 7.24 32.51 2.13 3.32 1.44 -0.07 0.42 0.87 0.96. std 4.49 1.37 0.27 0.27 59.68 7.28 0.35 0.03 0.33 0.07 0.09 0.07 4.72 1.25 11.78 0.18 1.37 0.19 0.06 0.14 0.03 0.02. Clases 2 media std 21.11 2.84 3.4 2.02 0.38 0.32 0.38 0.32 147.95 69.06 -0.23 5.03 1.33 0.51 0.04 0.02 3.49 0.29 0.57 0.1 0.52 0.13 0.09 0.04 22.88 2.57 8.95 0.61 51.2 8.09 2.36 0.13 3.4 2.02 1.41 0.29 -0.12 0.12 0.49 0.24 0.87 0.04 0.96 0.02. 3 media 18.07 3.12 0.38 0.38 137.38 4.49 1.29 0.05 3.41 0.57 0.52 0.11 19.26 8.24 42.57 2.32 3.12 1.4 -0.11 0.49 0.87 0.96. std 3.73 1.58 0.28 0.28 62.21 7.47 0.41 0.01 0.23 0.09 0.11 0.04 3.94 0.87 10.36 0.11 1.58 0.24 0.1 0.19 0.04 0.02.
(45) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 34. *En la tabla 8 se muestran 22 rasgos donde el nombre de cada uno de ellos corresponde con los de la tabla 1, se toman en el mismo orden.. Tabla 9. Media y desviación estándar de cada rasgo para las clases anómalas. Clases Rasgos* 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22. 4 media 21.25 2.3 0.54 0.54 162.51 0.42 1.06 0.05 3.34 0.62 0.58 0.11 22.29 8.87 50.91 2.37 2.3 1.26 -0.16 0.57 0.89 0.97. 5 std 4.58 1.33 0.26 0.26 63 8.91 0.4 0.02 0.31 0.1 0.12 0.05 4.66 0.99 13.8 0.1 1.33 0.27 0.14 0.23 0.04 0.02. media 18.95 2.58 0.51 0.51 164.37 3.82 1.14 0.05 3.38 0.6 0.56 0.11 20.06 8.37 44.25 2.38 2.58 1.3 -0.15 0.56 0.89 0.97. 6 std 3.43 1.57 0.28 0.28 64.72 6.93 0.44 0.02 0.3 0.1 0.12 0.04 3.63 0.8 9.7 0.11 1.57 0.28 0.14 0.23 0.04 0.02. media 17.74 2.45 0.53 0.53 175.12 5.05 1.1 0.05 3.34 0.61 0.57 0.12 18.93 8.04 40.75 2.37 2.45 1.28 -0.17 0.58 0.89 0.97. 7 std 4 1.48 0.27 0.27 70.84 9.3 0.43 0.02 0.31 0.1 0.13 0.05 4.05 0.94 10.74 0.12 1.48 0.29 0.14 0.22 0.04 0.02. media std 17.91 3.55 2.75 1.69 0.51 0.29 0.51 0.29 183.1 71.91 6.39 8.48 1.17 0.47 0.05 0.02 3.39 0.31 0.6 0.11 0.56 0.13 0.1 0.04 18.98 3.77 8.1 0.84 41.31 9.68 2.39 0.11 2.75 1.69 1.32 0.3 -0.16 0.14 0.58 0.22 0.88 0.04 0.96 0.02. *En la tabla 9 se muestran 22 rasgos donde el nombre de cada uno de ellos corresponde con los de la tabla 1, se toman en el mismo orden. 3.2.2. Comportamiento de los rasgos de textura extraídos, con respecto a todas las. clases Siguiendo la idea expresada en el sub epígrafe 3.1.1 se muestran a continuación una serie de gráficas que dan una idea de la variabilidad de los rasgos (normalizados) para cada clase..
(46) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. Figura 16. Comportamiento de los cinco primeros rasgos en cada una de las clases.. Figura 17. Comportamiento de los rasgos del seis al 10 en cada una de las clases.. Figura 18. Comportamiento de los rasgos del 11 al 14 en cada una de las clases.. 35.
(47) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 36. Figura 19. Comportamiento de los rasgos del 15 al 18 en cada una de las clases.. Figura 20. Comportamiento de los rasgos del 19 al 22 en cada una de las clases. 3.2.3. Aplicación de los resultados obtenidos. Una aplicación concreta de los resultados obtenidos fue en la clasificación realizada en [35] donde los rasgos que se utilizaron fueron los calculados en este trabajo. Se observó un mejor rendimiento de los clasificadores con la utilización de los rasgos basados en la forma geométrica del núcleo. Esta clasificación presentó mejores resultados cuando se basó en la unión de los rasgos de textura con los geométricos. Se demuestra de esta forma que los rasgos de textura aportan características significativas en el momento de la clasificación..
(48) CONCLUSIONES Y RECOMENDACIONES. 37. CONCLUSIONES Y RECOMENDACIONES. Conclusiones Se realizó un análisis crítico de la bibliografía relacionada con el tema, donde es evidente el uso de los rasgos de textura en la tarea de clasificación de imágenes celulares. Se logró extraer la zona de interés del núcleo en escala de grises mediante operaciones morfológicas. Al cell array inicial que contenía la imagen (RGB), la imagen en escala de grises y la máscara binaria, se le agregó una cuarta imagen correspondiente a la zona de interés del núcleo en escala de grises. Se implementó un programa en Matlab capaz de extraer los rasgos de textura del núcleo, obteniéndose 22 características de textura, que al ser agrupadas en una matriz pueden ser utilizadas en el proceso de clasificación. Recomendaciones Realizar una investigación más exhaustiva sobre los valores de offset a elegir y las direcciones que se tomarán para el cálculo de las matrices de co-ocurrencia. Extraer mayor cantidad de coeficientes de textura de las imágenes, como por ejemplo aplicando conceptos de granulometría morfológica, con el objetivo de lograr de esta forma una mejor clasificación. Aplicar métodos de selección de rasgos que permitan realizar una reducción de la dimensionalidad de los datos a partir de determinar cuáles son los rasgos más significativos a los efectos de la clasificación..
Figure
+7
Documento similar