• No se han encontrado resultados

Segmentación y clasificacón de imágenes

N/A
N/A
Protected

Academic year: 2017

Share "Segmentación y clasificacón de imágenes"

Copied!
157
0
0

Texto completo

(1)

ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y

ELÉCTRICA

UNIDAD PROFESIONAL “ADOLFO LÓPEZ MATEOS”

INGENIERÍA EN COMUNICACIONES Y ELECTRÓNICA

“Segmentación y Clasificación

de Imágenes

PROYECTO TERMINAL

QUE PARA OBTENER EL TITULO DE:

INGENIERO EN COMUNICACIONES Y ELECTRÓNICA

PRESENTA:

Esaú García Martínez

ASESORES:

M. en I. Carlos Mira González

Dr. Rabindranath Reséndiz Vázquez

M. en C. Pedro Gustavo Magaña del Río

(2)
(3)
(4)

O B J E T I V O

(5)

Índice

Contenido

INGENIERIA EN COMUNICACIONES Y ELECTRONICA ... I

1. INTRODUCCION AL PROCESAMIENTO DIGITAL DE IMÁGENES ... 2

1.1 Introducción ... 2

1.2 Definiciones preliminares ... 3

1.3 Información contenida en una imagen ... 8

1.4 Formación de imágenes en el ojo humano. ... 13

1.5 Aplicaciones. ... 16

1.6 El sistema de procesamiento de imagen digital. ... 18

1.7 Interdisciplinariedad del procesamiento digital de imágenes. ... 22

2. OBTENCION DE IMÁGENES MÉDICAS. ... 25

2.1 Orientación de una imagen. ... 25

(6)

2.3 Tomografía computarizada (TC). ... 33

2.4 Radioisótopos ( ��� �) ... 36

2.5 Resonancia magnética (RM). ... 41

2.6 Ultrasonido. ... 47

3. SEGMENTACIÓN DE IMÁGENES. ... 55

3.1 Descripción ... 55

3.2 Consideraciones en la segmentación. ... 56

3.3 Revisión de las principales técnicas de segmentación. ... 58

3.4 Artefactos de imagen y su impacto en la segmentación ... 67

4. CLASIFICACIÓN Y CLASIFICADOR BAYESIANO ... 72

4.1 Introducción. ... 72

4.2 Descripción de un clasificador. ... 73

4.3 Clasificador bayesiano. ... 76

(7)

4.5 Funciones discriminantes. ... 96

5. DESARROLLO Y RESULTADOS... 136

5.1 Resultados experimentales para la segmentación... 136

5.2 Resultados experimentales para la clasificación... 152

5.3 Validación de resultados del clasificador bayesiano. ... 160

6. CONCLUSIONES. ... 165

7. Acrónimos ... 167

8. Bibliografía y Referencias. ... 169

(8)
(9)

INTRODUCCIÓN

La influencia e impacto de las imágenes de los diferentes objetos que son sujetos de estudio e interpretación es de primordial importancia en la sociedad moderna, dado que constituyen la percepción e interpretación de los fenómenos del mundo en el que se habita; su aplicación a diferentes disciplinas orientadas a la solución de la problemática que se pretende solucionar es aplicable en todos los ámbitos que van desde el personal, social, familiar, económico, científico, etc.

Estas imágenes debes ser interpretadas de muy diversas formas dependiendo del sistema al que sirvan de elemento de entrada, convirtiéndose de facto en un componente crítico en la ciencia, la tecnología y en otras áreas que no pueden ser desarrolladas sin él, todo ello en un orden o secuencia perfectamente establecido; siendo este orden conocido comó procesamiento de imágenes.

El procesamiento digital de imágenes se ha convertido en una herramienta fundamental que sirve de apoyo a diversas disciplinas orientadas a proporcionar elementos certeros para la adecuada toma de decisiones; si aunado a esto se considera el rápido y continuo progreso en el desarrollo de métodos y análisis en la interpretación de imágenes, es posible notar que el reconocimiento y la clasificación de imágenes se han convertido en uno de los subcampos más importantes dentro de la imagen científica.

(10)
(11)

ANTECEDENTES

(12)

C

APÍTULO 1

|

“INTRODUCCION AL

PROCESAMIENTO

(13)

1. INTRODUCCION AL PROCESAMIENTO DIGITAL DE

IMÁGENES

1.1 Introducción

(14)

1.2 Definiciones preliminares

1.2.1 Imagen digital

Matemáticamente una imagen está definida comó una función bidimensional,

, donde y representan coordenadas espaciales en un plano, y en cualquier par de coordenadas representa la intensidad o el nivel de gris que una imagen posee en esa coordenada. En la figura 1.1 se observa que la esquina superior derecha de la imagen, tiene coordenadas (1,1).

Figura 1.1 Cameraman. Una imagen puede ser vista comó una función bidimensional con coordenadas , .

(15)

partícula de luz (fotón) dentro del campo de visión de una imagen. Cada pixel tiene información numérica, si una imagen tiene pixeles con un soló valor numérico, se dira que la imagen está representada por escalas de grises, y si los pixeles tienen un arreglo de tres número se dira que la imagen es a color. La figura 1.1 es un claro ejemplo de una imagen en escala de grises, en cambio, la figura 1.2 es una imagen a color donde cada pixel contenido en la imagen tiene tres valores numéricos.

(16)

1.2.2 Formatos de imagen digital.

Actualmente al trabajar con imágenes, es necesario almacenarlas, transmitirlas y desplegarlas de una manera eficiente, esto ha llevado al desarrollo de estándares que definen el formato de una imagen. En términos simples, el formato de una imagen consiste en la forma en la que la imagen es almacenada o la forma en la cual se almacenan los valores numéricos que poseen los pixeles que forman una imagen. Hay un extenso número de formatos que han sido reconocidos internacionalmente para el almacenamiento de una imagen. Algunos de los más usados se mencionan brevemente a continuación:

.bmp, imagen de mapa de bits (por sus siglas en inglés bit mapped picture), es una formato de imagen básico, puede guardar imágenes sin mucha pérdida en su calidad y fue originada para trabajar en el sistema operativo Windows.

.gif, formato de intercambio de gráficos (por sus siglas en inglés graphics interchange format) limitado a guardar imágenes de 256 colores (8 bits).

.jpg, .jpeg grupo conjunto de expertos en fotografía (por sus siglas en inglés joint photographic experts group) uno de los formatos más comúnmente usado, en cámaras.

.png gráficos de redes portátiles (del inglés portable networks graphics) formato diseñado para sustituir .gif. Fue aprobado por la IEEE en 1996.

(17)

1.2.3 Tipos de imágenes.

La elección de un formato de imagen se puede determinar, en su mayor parte, no sólo por el contenido de la imagen, sino también por el tipo de datos que la imagen contiene, a continuación se mencionan algunos de los principales tipos de imágenes.

Imágenes binarias; también conocidas comó imágenes lógicas, son imágenes

en dos dimensiones donde cada pixel tiene uno de dos valores 0 o 1. El cero corresponde al color negro y el uno corresponde al color blanco. La imagen de un fax es un ejemplo de una imagen binaria.

Imágenes en escala de grises; imágenes en dos dimensiones donde cada

pixel tiene un soló valor numérico asignado, usualmente estos van del 0 al 255 o en la escala de 0.0 a 1.0. Para una imagen en escala de grises de 16 bits las intensidades de gris asignadas en cada pixel irán de 0 a 65535.

Imágenes a color; comó ya se mencionó anteriormente cuando un pixel tiene

asignado un arreglo de tres valores, cada valor asignado corresponde a una cantidad de color verde azul o rojo (RGB del inglés red, green and blue).

Imágenes de color falso; son imágenes que tienen colores que difieren de

aquellas que una fotografía común exhibe. El término de color falso se refiere a aquellas imágenes que despliegan colores que no están dentro del rango del espectro electromagnético que el ojo humano percibe.

1

.

2.4 Histograma de una imagen.

(18)

número de pixeles que contiene una imagen, mente estos son representados en el eje vertical, mientras que el eje horizontal queda reservado para los niveles de intensidad que cada pixel tiene asignado. En la figura 1.3 se puede apreciar el histograma de una imagen de 8 bits.

Figura 1.3 Histograma de imagen de 8 bits

(19)

1.3 Información contenida en una imagen

1.3.1 Introducción.

De los cinco sentidos (vista, oído, tacto, olfato y gusto) que el hombre tiene para percibir el ambiente que lo rodea, la vista es la más poderosa de todas, ya que la misma al recibir y analizar una imagen, involucra gran parte de la

actividad cerebral; “una imagen dice más que mil palabras”. Desde los

primeros días de la ciencia, cuando aún no había un leguaje matemático formal, era costumbre de los investigadores y científicos el grabar sus observaciones de una forma gráfica o pictórica. Leonardo da Vinci fue uno de los primeros en usar estos medios para ilustrar y conservar sus descubrimientos y anotaciones (fig. 1.4)

(20)

En la actualidad es difícil concebir un mundo sin imágenes, la tecnología de esta época ha extendido las posibilidades para la observación visual y la interpretación de información contenida en una imagen, la fotografía hace posible que de una manera objetiva y precisa se preserven escenas o circunstancias para su posterior análisis y para una mejor exanimación.

Telescopios y microscopios han permitido apreciar otras regiones para las cuales el ojo humano no está habilitado, estos instrumentos han extendido el rango visual del ojo humano trayendo como consecuencia la visualización de objetos a diferentes escalas. La tecnología también puede compensar limitaciones que son inherentes al ojo humano. El ojo humano es receptivo solamente a un muy pequeño rango de frecuencias dentro del espectro electromagnético (fig. 1.5), no obstante hay sensores que son capaces de detectar radiación electromagnética fuera de ese rango de frecuencias.

(21)

Las imágenes pueden formarse a partir de muchos tipos de dispositivos que utilizan diferentes mecanismos de formación, y, en consecuencia, los sistemas de formación de imágenes pueden ser clasificados de acuerdo a varios tipos de criterios. La tabla 1.1 clasifica los sistemas de acuerdo con el tipo de radiación o campo que se utiliza para formar una imagen. La radiación electromagnética es la más utilizada en los sistemas de formación de imágenes.

La banda de radiofrecuencia se usa en astronomía y en la resonancia magnética (MRI). Las microondas se utilizan en imágenes de radar, ya que pueden penetrar las nubes y otras condiciones atmosféricas que interfieren con la formación de imágenes utilizando la luz visible. Un gran número de sistemas hacen uso de la luz visible y la radiación infrarroja, como la detección remota y sistemas de seguridad. La radiación ultravioleta se utiliza bastamente en el área médica, por ejemplo los rayos-X se utilizan en el trabajo de diagnóstico médico, y en la industria, para detectar errores en manufactura.

(22)

1.3.2 Entropía.

La entropía mide el promedio global de la información contenida en una imagen en bits por pixel. El concepto de entropía viene del campo de la teoría de la información, en donde la información puede ser vista como la reducción de incertidumbre. Una manera de entender la entropía es considerar la cantidad de estados que un sistema puede tomar: Un sistema con una entropía baja tomara un pequeño número de tales estados mientras un sistema de alta entropía tomara una cantidad grande de dichos estados. En el caso de una imagen, esos estados corresponderían a los niveles de gris los cuales cada pixel puede adoptar. Por ejemplo, en un pixel de 8 bits hay 256 estados y si todos esos estados están igualmente ocupados la entropía del sistema será alta, en cambio, en una imagen binaria la entropía será más baja ya que los únicos estados que se tomarán serán 1 ó 0.

La información contenida en un mensaje está dada por:

= log (� ) = −log� (1.1)

(23)

cuando los mismos dicen algo desconocido que es cuando realmente llevan cantidades de información grandes.

Si soló dos eventos son posibles (0 y 1) en la ecuación 1.1, entonces el logaritmo se volverá de base 2, y la unidad de información será el bit. Por ejemplo si los dos eventos son igualmente probables � = � =

entonces la información contenida cuando uno de los dos eventos ocurre es:

= = − log = .

1.3.3 Ruido

En una imagen el ruido son todas aquellas fluctuaciones aleatorias e indeseadas dentro de la misma. Las principales fuentes de ruido en un sistema de imagen digital son los fotones, los cuales surgen de la interacción de las ondas electromagnéticas con la materia, el ruido también pueden surgir del ruido electrónico que es ocasionado por detectores o amplificadores en dichos sistemas. Otra de las principales fuentes de ruido es la digitalización de una imagen principalmente el llamado ruido de cuantización.

1.3.4 Relación Señal a Ruido.

La Relación Señal a Ruido SNR (del inglés signal to noise ratio) de una imagen regularmente puede ser estimada de la imagen misma de una manera directa. La señal o intensidad media de la imagen estará caracterizada por el cuadrado del valor medio de los pixeles contenidos en toda la imagen, ̅ y el ruido estará caracterizado por la varianza de los valores de pixel, �� , sin

(24)

de ruido. La Relación Señal a Ruido de una imagen expresada en decibeles (dB), se define por:

= log ̅

⁄ = log ̅ � (1.2)

En muchas imágenes se busca distinguir un objeto de su “fondo”, por ejemplo un tumor rodeado por tejido, se buscará reducir el ruido, en este caso el tejido, con la finalidad de poder apreciar el tumor. Como se verá en el capítulo 5, adquisición de imágenes médicas, cualquiera que sea el método de adquisición de una imagen (rayos-X, resonancia magnética, etc.) siempre se buscará disminuir la Relación Señal a Ruido, ya sea calibrando los detectores o haciendo más intenso un campo o aumentando la frecuencia de una onda.

1.4 Formación de imágenes en el ojo humano.

Como se vio anteriormente el rango de percepción del ojo humano es muy pequeño que va de aproximadamente los 400 a 750 nm. Es sabido que el procesamiento digital de imágenes se basa en formulaciones matemáticas y de muchas otras áreas (ver sección 1.6), es por ello que para diseñar sistemas eficientes de procesamiento de imágenes se tiene que tener una comprensión básica de la formación de las imágenes en el ojo humano.

La forma que posee el ojo humano es la de una esfera achatada en los bordes, con un radio promedio de 20 mm (ver figura 1.6).

(25)

la pupila donde vuelve a ser reflejada por el cristalino, este a su vez forma una imagen invertida en la capa más profunda del ojo, la retina.

Figura 1.6 Globo ocular.

(26)

millones distribuidos a lo largo de esta capa. Los bastones reciben ese nombre debido a su forma alargada además son muy sensibles y permiten ver luz con una longitud de onda de aproximadamente 498 nm, es decir, luz muy tenue.

Fig. 1.7 Fotorreceptores. Estructura de los fotorreceptores del ojo humano

Los conos se encuentran en una menor cantidad, aproximadamente de 6 a 7 millones y se encuentran ubicados en una región circular cerca de la retina, los conos al contrario de los bastones son mucho más sensibles a la luz. Hay tres tipos de conos, los cuales al trabajar juntos permiten la visión a color; conos-A (distinguen el rojo, “amplia longitud de onda”) sensibles a longitudes

de onda de aproximadamente 564 nm, conos-M (distinguen el verde,

“mediana longitud de onda”) sensibles a longitudes de onda de

aproximadamente 533 nm y conos-P (distinguen el azul, “pequeña longitud de onda”) sensibles a longitudes de onda de aproximadamente 437 nm.

Los bastones de la retina son capaces de responder a bajas intensidades de

(27)

altos niveles de intensidad (visión fotópica, “altos niveles de iluminación”);

estos fotorreceptores se pueden adaptar a un amplio rango de intensidades de luz, del orden de1010, que se conoce como el “rango dinámico”.

Aunque el ojo tiene un rango dinámico amplio, no puede distinguir simultáneamente estos niveles de intensidad, en lugar de ello el mismo se adapta a regiones dentro del rango dinámico total por medio del proceso conocido como acomodamiento o adaptabilidad de brillo. Es por ello que al diseñar sistemas de procesamiento digital de imágenes, se debe de considerar todas estas variables dentro del funcionamiento del ojo humano, consideraciones como; si las imágenes son tomadas con un bajo o un alto nivel de luminosidad, si las imágenes son tomadas con un sensor de luz con ciertas longitudes de onda, imágenes tienen distintos niveles de intensidad, consideraciones que determinarán si el sistema de procesamiento digital es eficiente.

1.5 Aplicaciones.

En esta secciónse discutiran algunas aplicaciones que tiene el procesamiento de imágenes. Los ejemplos demuestran que el procesamiento digital de una imagen permite analizar eficientemente la información contenida en una imagen para su uso en distintos campos.

(28)

Figura 1.8 Detección remota satelital.

IMÁGENES MÉDICAS: en este campo se usa el procesamiento digital de imágenes para generar imágenes de alta calidad que sirvan para ser analizadas de una manera confiable y así poder dar un diagnostico acertado con base una una buena observación. Imágenes de ultrasonido, Rayos-X, Tomografía Computarizada (CT) e Imágenes por Resonancia Magnética (IRM) son imágenes de las cuales se hace un gran uso en la labor médica. En el capítulo 5 se verán a detalle las formas en las que las imágenes médicas se obtienen y sus métodos de adquisición.

(29)

las impresiones hechas por las crestas o relieves de las puntas de los dedos, no todas las personas tienen el mismo arreglo de patrones, los patrones de un individuo permanecen sin cambio a través de su vida, es decir, sus demás características fisiológicas pueden cambiar excepto sus huellas dactilares.. El propósito del procesamiento digital de imágenes en este campo es usado para monitorear actividades maliciosas, rastreo de delincuentes e identificación personal, privada y en algunos países en sus elecciones.

Fig. 1.9 Huella digital

1.6 El sistema de procesamiento de imagen digital.

Un sistema de procesamiento de imagen digital eficiente (fig. 1.10) está compuesto de un conjunto de equipos físicos (cámaras, sensores, computadoras, etc.) y software (programas informáticos) que tiene distintas funciones, a continuación se analizan los aspectos más importantes de un sistema de procesamiento digital:

Adquisición de imágenes, usando sensores que sean apropiados para detectar el

(30)

capturar las imágenes de interés del objeto en la mejor manera posible. Si la imagen detectada es una imagen continua, será necesario que dicho sistema cuente con un convertidor analógico digital.

Fig. 1.10 Sistema de procesamiento de imagen digital

Almacenamiento de imágenes, ya sea temporalmente usando memorias de

acceso aleatorio (RAM Random Access Memory) o de una manera permanente utilizando medios magnéticos (discos duros), medios ópticos (CD-ROM’s o DVD’s) o incluso en memorias flash.

Procesamiento de imagen mediante software, mejoramiento de la imagen,

(31)

Despliegue de la imagen, desplegando los resultados de la manera más nítida

posible, ya sea en un monitor de computadora, en una pantalla de T.V., en este caso será necesario tener un convertidor digital a analógico.

1.6.1 Procesamiento de imagen mediante software.

Son variados los procesos a los que se puede someter una imagen, la figura 1.12 ha descrito cinco de las principales, sin embargo, hay muchas otras que se pueden realizar, en seguida se mencionarán algunas de ellas, aunque en algunos casos no es necesario llevarlas a cabo, esto dependiendo de la calidad de la imagen obtenida o en función del tipo de resultado a la cual este orientada la aplicación.

Mejoramiento de la imagen, el mejoramiento de una imagen puede implicar el

ajuste del brillo de la imagen, si fuera demasiado obscura o demasiado brillante, también puede implicar la modificación de su contraste, si se llegara a tener una imagen que se compone solamente de algunos tonos de gris dándole un aspecto descolorido. Alternativamente, podría implicar suavizar una imagen que contenga una gran cantidad de ruido o moteado o afilar una imagen de manera que los bordes dentro de ella sean más fáciles de ver.

Restauración de la imagen, en ocasiones las imágenes se encuentran

(32)

Compresión de la imagen, reduce la cantidad de datos necesarios para

describir la imagen. Las imágenes requieren de grandes cantidades de memoria, por ejemplo una imagen de 512 x 512 pixeles requiere aproximadamente 0.25 MB de espacio en memoria, esto es comparable a un documento que abarca 40 páginas de texto. La compresión reduce el tamaño en memoria ocupado por la imagen de tal forma que la misma pueda ser almacenada y transportada más eficientemente (tabla 1.1). La compresión es posible gracias a que las imágenes tienden a tener información que es redundante o repetitiva. Esquemas alternativos de almacenamiento pueden almacenar información de una manera más efectiva con algoritmos de compresión y descompresión que no afectan la calidad de la imagen, este tipo de esquemas son de suma importancia en el área médica. También existen técnicas de almacenamiento que pueden lograr imágenes con menor espacio en memoria, sin embargo, estas técnicas no conservan todos los datos de la imagen original, pero que pueden mantener una calidad aceptable en la imagen.

Síntesis de imagen, crea nuevas imágenes a partir de otras.

Segmentación, Divide una imagen en sus partes constituyentes.

(33)

1.7 Interdisciplinariedad del procesamiento digital de imágenes.

Por naturaleza, el procesamiento digital de imágenes es una ciencia interdisciplinaria en muchos aspectos. Primeramente porque el procesamiento de imágenes incorpora dentro de su estudio conceptos de varias áreas del conocimiento y la ciencia, antes de que se procese una imagen, se necesita conocer cómo es que las características de dicha imagen están relacionadas al objeto de estudio. Esto incluye varios procesos físicos que van desde la radiación con la materia a la geometría y la radiometría de imagen. Un sensor de imagen convierte la radiación incidente de una u otra manera en una señal eléctrica, después esta señal es convertida en números digitales y es procesada por una computadora digital que extrae los datos relevantes. En esa cadena de procesos (fig. 1.9) están involucradas áreas como la física, ciencias de la computación y matemáticas así como otras que incluyen óptica, física de espacio solido, diseño de chips, arquitectura de las computadoras, algebra, estadística, probabilidad, teoría de gráficas, métodos numéricos, etc. Desde el punto de vista de la ingeniería se abarcan áreas como ingeniería óptica, ingeniería electrónica e ingeniería de software.

(34)

El segundo aspecto de la importancia que tiene la interdisciplinariedad del procesamiento digital de imagen radica en las amplias aplicaciones que esta puede tener, casi no hay áreas en ciencias naturales o disciplinas técnicas donde el procesamiento de imágenes no se use. Como se vio en la sección 1.5 el procesamiento de imágenes se ha vuelto de vital importancia en muchas áreas, se han creado relaciones que han permitido que la misma tenga un fuerte crecimiento y se siga contemplando aun para muchas aplicaciones presentes y futuras.

(35)

C

APÍTULO

2

|

“OBTENCIÓN DE

(36)

2. OBTENCION DE IMÁGENES MÉDICAS.

Actualmente la imagen médica es utilizada ampliamente en diagnósticos médicos debido a su elegibilidad, su eficiencia y a su capacidad de evaluación segura. Este capítulo es introductorio y está diseñado para dar una revisión breve de las principales técnicas, tecnología y terminología de los principales métodos de obtención de imagen médica.

2.1 Orientación de una imagen.

Antes de discutir las diferentes modalidades de la imagen médica, es de gran importancia el entender las diferentes orientaciones que puede tomar una imagen, de las cuales hay tres; axial, coronal y sagital, las mismas pueden ser apreciadas en las figuras 2.1 y 2.2.

(37)

Figura 2.2 Orientaciones basicas de una imagen, en el cerebro humano.

En la imagen médica, el plano axial abarca el plano X-Z, el cual divide el cuerpo humano en las posiciones superior e inferior separando la cabeza de los pies. La orientación coronal es el plano XY, el cual en la imagen 5.1, es el plano perpendicular a la tierra dividiendo el cuerpo humano en la región ventral y dorsal, es decir, en la vista frontal, que es la más comúnmente usada. El plano sagital o vista lateral es también un plano perpendicular a la tierra, pero este distingue la posición izquierda y derecha del cuerpo humano

2.2 Rayos-X.

(38)

este efecto persistió incluso cuando el tubo se colocó en una caja de cartón. Pronto se dio cuenta de que el tubo no estaba emitiendo sólo luz, sino que también emitía un tipo de radicación a la que llamó rayos-X debido a su naturaleza misteriosa. Este nuevo tipo de radiación no sólo viajaba a través de la caja de cartón. Röntgen descubrió que era atenuada de una manera diferente por diversos tipos de materiales y que podía, al igual que la luz, ser capturada en una fotografía. Este descubrimiento abrió el camino para su uso en medicina. La primera "foto de Röntgen" de una mano se hizo después del descubrimiento de los rayos -X. No más de unos pocos meses después, las radiografías eran utilizadas en análisis clínicos. La naturaleza de los rayos-X de onda corta como radiación electromagnética fue establecida por Max von Laue en el año 1912.

Los rayos-X son ondas electromagnéticas y a su vez la radiación electromagnética consiste de fotones, la energía de cada fotón con frecuencia y longitud de onda se define como:

= ℎ =ℎ

Donde ℎ es la constante de Planck y es la velocidad de la luz en el vacío; ℎ = . 9 × −6 . El espectro electromagnético (ver figura 1.4) se puede dividir en

distintas bandas, empezando con las ondas de radio usadas en imágenes por resonancia magnética y extendiéndose sobre las microondas, el infrarrojo, la luz ultravioleta y los rayos-X. la longitud de onda de los rayos-X es del orden de los Angstroms − y consecuentemente, la energía correspondiente de un fotón es

del orden de = . × − 9 .

(39)

como radiación Bremsstrahlung. Este tipo de radiación, Bremsstrahlung, es la que produce un espectro continuo de rayos-X

Figura 2.3 Estructura interna de un tubo de Rayos-X

Interacción con la materia.

(40)

Interacción con el cuerpo humano.

Los rayos-X interactúan con el cuerpo humano ya sea por absorción, donde un fotón de rayos-X es absorbido al liberarse un electrón de la capa más baja de un átomo o por dispersión donde sólo una parte de la energía del fotón de rayos-X es usada para liberar un electrón de la capa más baja del átomo.El primer método es conocido como radiación de dosis y tiene altas probabilidades de dañar el tejido de un paciente, el segundo método es más seguro pero como consecuencia tiene una pérdida en la calidad de la imagen. Las consecuencias de estas interacciones con el cuerpo humano es que la intensidad del rayo de ve reducida, diferentes tejidos afectan el rayo de una forma distinta, esto dependiendo de su espesor y del coeficiente de atenuación del material µ . La absorción fotoeléctrica depende del número atómico efectivo del material, y de la energía de los rayos-X , de este modo los tejidos como los huesos que tienen un coeficiente de atenuación mayor, atenuarán más los rayos-X que los tejidos blandos. Una imagen obtenida mediante rayos-X, es llamada radiografía, en una proyección plana, la radiografía que se obtendrá será una imagen en dos dimensiones de un objeto tridimensional (figura 2.4).

(41)

Las radiografías pueden incluir distintas proyecciones como:

Radiografía de pantalla fílmica: incluye radiografías de todo el cuerpo, radiografías

abdominales, mamografías (imágenes del pecho, ver figura 2.5A), radiografías dentales (imágenes de los dientes y la quijada, ver figura 2.5B).

Radiografía fluoroscopica: este tipo de radiografías son capturadas en tiempo real

usando un tubo intensificador de imagen para detectar los rayos-X. En consecuencia, su campo de aplicación se centra en las investigaciones en el que el movimiento o la disponibilidad inmediata de las imágenes, o inclusive ambos, son cruciales, ejemplos de estas son las angiografías (las cuales toman imágenes de los vasos sanguíneos, ver figura 2.6).

Radiografías computarizadas; en este tipo de radiografías se sustituye la película fílmica por una película de fosforo.

Calidad de las imágenes obtenidas por Rayos-X.

Resolución.

La resolución de imagen en un sistema de imágenes por medio de rayos-X, depende de varios factores:

La punta del ánodo debe hacer un ángulo grande con el haz de electrones para producir un haz de rayos-X que este bien centrado.

El paciente. Pacientes más robustos causan más dispersión de los rayos-X y como consecuencia el deterioro en la resolución de la imagen.

Las propiedades de dispersión de las pantallas fluorescentes.

La resolución de la película, en la cual será grabada la imagen.

(42)

los rayos-X, el espectro del rayo tiene un importante efecto en el contraste de la imagen. Una radiación suave, como la que se utiliza en mamografías, produce un contraste más alto.

Efectos biológicos.

Incluso en cantidades bajas de rayos-X, la energía depositada por la radiación ionizante puede ser suficiente para dañar o destruir células en el cuerpo. Aunque esto generalmente no tiene ninguna consecuencia negativa, siempre hay una probabilidad de que las modificaciones en las células individuales pueden llevar a contraer cáncer o cambios genéticos en el organismo. Actualmente no hay evidencia de una dosis umbral por debajo del cual la probabilidad de contraer estos efectos secundarios sea cero.

(43)

Figura 2.5 (B) radiografía de una fractura de mandíbula

(44)

En consecuencia y a modo de conclusión las imágenes adquiridas mediante rayos-X, tienen ventajas y desventajas. Una ventaja los son las mamografías que hasta ahora son el mejor medio para detectar el cáncer de mama, hay un menor índice de contaminantes al momento de revelar las imágenes (plomo y químicos usados en el revelado de imágenes fílmicas), facilita la creación de archivos digitales, optimiza la intercomunicación entre distintos tipos de especialistas. Una de las desventajas son las que se han mencionado anteriormente, ya que se han detectado casos en los cuales hay pacientes que son muy sensibles a este tipo de radiación por lo cual se opta por otro tipo de obtención de imágenes médicas, a continuación se hablarán de otros medios de adquisición de imágenes médicas.

2.3 Tomografía computarizada (TC).

La tomografía de rayos-X computarizada o CT es una técnica que produce imágenes de secciones transversales del cuerpo humano, es adecuado pensar en esto como una barra de pan la cual partiremos en partes, cada parte representa una sección transversal de la barra, la tomografía computarizada permite obtener imágenes de cierta parte del cuerpo y de forma transversal como lo sería una sección de el ejemplo de la barra de pan.

(45)

Figura 2.7 Geometría de líneas de rayos-X, en orientación paralela y en abanico

Basados en esas medidas se puede calcular la atenuación en cada punto donde se hicieron incidir los rayos y de ese modo una imagen transversal puede ser construida. La física de los rayos-X, su producción y su interacción con el tejido humano se han discutido ya en la sección anterior.

Las imágenes obtenidas mediante tomografía computarizada, es una de las principales técnicas para obtener imágenes transversales al nivel de los pulmones, el abdomen y los huesos, esto debido a su alta resolución.

(46)

Figura 2.8. Imagen axial al nivel del pecho obtenida por CT, donde se puede apreciar daño en el tejido por enfisema pulmonar.

(47)

son muy comunes en hospitales donde los escáneres son donados y los detectores están mal calibrados.

Figura 2.9 Artefactos. 2.9 (A) artefactos de imagen unidimensional, 2.9 (B) artefactos de anillo.

2.4 Radioisótopos (

��� �

)

(48)

En la medicina nuclear, se administra un trazador en un paciente, por lo general mediante una inyección intravenosa. Un trazador es una molécula que porta un radionúclido el cual estará involucrado en el proceso metabólico. Un trazador también está compuesto por isotopos radioactivos los cuales emiten rayos , que permiten medir la concentración de la molécula trazadora en el cuerpo como una función de la posición y el tiempo. Un isotopo ideal deberá liberar solamente rayos y no liberar partículas y , esto además de que los fotones liberados por los rayos tendrán que tener un rango de energía de entre 70-500 eV para poder ser detectados y generar una imagen medica.

En medicina nuclear hay tres formas de generar una imagen. Gammagrafía plana, en la cual se usa una cámara detectora de rayos para detectar la imagen. Imagen por tomografía, llamada SPECT o tomografía computarizada por emisión monofotónica (en inglés single photon emission computed tomography), en la cual se usa una cámara detectora de rayos que estará rotando alrededor del paciente para obtener imágenes desde distintos ángulos y de este modo generar imágenes de cortes transversales. Y por último la tomografía por emisión de positrones o PET (por sus siglas en inglés de Positron Emission Tomography), la cual detecta pares de fotones gamma con energías de aproximadamente 511 KeV.

2.4.1. Gammagrafía plana.

En esta técnica los rayos son emitidos en todas las direcciones y pasan a través del cuerpo humano al igual que en los rayos X. La radiación penetra en la cámara

(49)

centelleador. A partir de esta información almacenada para gran número de fotones se puede reconstruir una imagen del órgano. En la figura 2.10, se puede ver descrito gráficamente este procedimiento. Las imágenes obtenidas por medio de gammagrafía plana son usadas principalmente para detectar tumores o malformaciones en la estructura ósea del cuerpo humano figura 2.11.

2.4.2. Imágenes SPECT

Como ya se mencionó anteriormente en la técnica de tomografía computarizada por emisión monofotónica, SPECT, se usará una cámara de rayos que estará girando alrededor del cuerpo del paciente con la finalidad de construir una imagen que permita apreciar cortes transversales. Las imágenes obtenidas mediante esta técnica son usadas principalmente para detectar problemas relacionados con la circulación de la sangre en el cerebro y para detectar trastornos en tejidos ubicados en el corazón. (Ver figura 2.12).

(50)

2.4.3. Imágenes PET

Las imágenes obtenidas por tomografía por emisión de positrones (PET) permiten apreciar el funcionamiento fisiológico de un órgano, por ejemplo el metabolismo (ver figura 2.13), esto al incorporase un trazador en una molécula que esté relacionada en el funcionamiento fisiológico a observar (agua ó azúcar) y después es inyectado en el organismo. Cuando un positrón (electrón cargado positivamente), es emitido dentro del cuerpo del paciente, viajará dentro del paciente hasta encontrar un electrón y así desaparecer, generando fotones con una energía de 511keV. En esta técnica a diferencia de la técnica SPECT, se usarán anillos detectores de fotones gamma que tendrán el mismo funcionamiento de la cámara de rayos .

(51)

Figura 2.12 Actividad del miocardio, cuando un paciente es sujeto a una prueba de estrés, obtenida por SPECT.

Figura 2.13. Actividad del miocardio, cuando un paciente es sujeto a una prueba de estrés, obtenida por PET.

Efectos biológicos.

(52)

2.5 Resonancia magnética (RM).

La resonancia magnética (RM) es relativamente una modalidad creciente en la obtención de imágenes médicas. Aunque el fenómeno físico de la resonancia magnética nuclear NMR (por sus siglas en inglés Nuclear Magnetic Resonance) se conoce desde la década de 1940 su aplicación práctica en el campo de la imagen médica se realizó en 1973, cuando Paul C. Lauterbur hizo la primera imagen de RMN. En la mecánica clásica, el momento angular es empleado cuando se habla de la rotación de un objeto alrededor de un eje. Por ejemplo, la descripción del movimiento de la Tierra implica dos momentos angulares: una correspondiente a la rotación (translación) de la Tierra alrededor del Sol, y un segundo que corresponde a su rotación alrededor de su propio eje (rotación). Cuando a finales del siglo XIX se hizo evidente que el átomo tiene una estructura interna, los físicos comenzaron a utilizar modelos mecánicos para explicar los fenómenos dentro del átomo. Por lo tanto, en el modelo atómico de Rutherford, un momento angular está asignado al movimiento del electrón sobre el núcleo. Esto implica que debido a que el electrón es una partícula cargada eléctricamente, su movimiento orbital implica la existencia de un momento magnético (figura 2.14).

(53)

Normalmente, la dirección de estos momentos magnéticos se presenta de manera aleatoria. Sin embargo, al aplicar un campo magnético externo, dichos momentos se alinean a lo largo de la dirección del campo.

Los momentos magnéticos pueden alinearse ya sea en la misma dirección, (en paralelo al campo magnético) que es el estado de energía más bajo, u opuesta a la dirección del campo, (anti-paralelo), que representa una estado superior de energía (Fig. 2.15).

Figura 2.15 Alineación de los momentos magnéticos en un campo magnético externo.

(54)

energía superior, al giro anti-paralelo. La frecuencia de la radiación requerida para causar estos saltos es conocida como la frecuencia de Larmor. No hay otro tipo de frecuencia que estimule estos cambios de estados, de modo que esta frecuencia en particular es un ejemplo de resonancia. La frecuencia de Larmor (frecuencia de resonancia o frecuencia resonante) para el núcleo de hidrogeno en un campo de 1-2 T, corresponde al rango de la radiofrecuencia. Los cambios de estado que ocasionará esta frecuencia reducirán el número de protones alineados al campo externo, es decir, en la dirección de z y resultara en la magnetización, , de la red.

A B

Figura 2.16 Marcos de referencia. 2.16(A). Referencia de laboratorio. Figura 2.16B. Referencia giratoria.

(55)

dirección de � . Esta es la interacción de � , que es mucho más pequeña en magnitud que � , con que hace que este último apunte hacia el plano .

Cuando la longitud del pulso es tal que produce un ángulo de 90° el pulso se denomina a 90° pulso, y la magnetización máxima en el plano se produce. Para un pulso del doble de largo, denominado un pulso de 180 °, la magnetización es dirigida a la dirección – . Una vez que el pulso de RF es apagado, el vector induce una corriente en la bobina de RF que produce el punto inicial y se regresa a su orientación original en el eje . Esta señal es conocida como decaimiento de inducción libre (DIL). El tiempo que le toma a dicha señal regresar a su posición original revela información importante sobre las moléculas en la muestra. Una vez la señal regresa a su posición original, procedimiento conocido como longitudinal, T1, causa que el vector de magnetización de red regrese a en el eje z.

(56)

Adquisición de imágenes.

Los componentes básicos de un escáner de MRI se muestran en la figura 2.17. El primer imán polarizara los protones en el paciente, dicho imán puede ser un electroimán usando bobinas superconductoras, que requieren estar a muy bajas temperaturas o puede ser un imán permanente construido a base de aleaciones de varios metales magnéticos. Las bobinas producirán variaciones en el campo magnético para crear una orientación entre los giros de los protones y recibir la señal FID por inducción magnética, la cual es sitiada alrededor del paciente para obtener la imagen.

Figura 2.17. Principales componentes de un escáner de MR.

(57)

mayor de la red. El mejoramiento de la Relación Señal a Ruido se mejora al incrementarse la intensidad de � . Las imágenes por resonancia magnética se usan principalmente para diagnosticar diversas afecciones causadas en músculos cardiacos, u otras afecciones que van desde rupturas de ligamentos hasta tumores. Las imágenes por resonancia magnética también son muy útiles para examinar el cerebro (ver figura 2.18) y la médula espinal (ver figura 2.19). Nuevas aplicaciones han revelado que las imágenes por resonancia magnética han sido usadas para demostrar atrofias en el cerebro debido a la enfermedad del Alzheimer, además de que esta técnica puede detectar tumores en etapas de desarrollo y etapas más tempranas que cualquier otro tipo de técnicas de imagen médica [18].

(58)

Figura 2.19. Imágenes sagitales obtenidas por MR, de la columna vertebral.

Efectos biológicos.

La obtención de imágenes mediante resonancia magnética es una técnica segura, por ejemplo una mujer que se encuentre embarazada puede someterse a esta prueba pero no así a una prueba de CT O PET. Esto debido a que la MR hace uso de ondas de radiofrecuencia que no son ionizantes. En condiciones de operación normal el único efecto que se presentaría es un incremento en la temperatura del tejido, esto debido a que la energía de las ondas de radiofrecuencia incrementa la vibración de moléculas y átomos [31].

2.6 Ultrasonido.

(59)

portátil. La obtención de imágenes mediante ondas acústicas también se utiliza en otras áreas, como lo son en la detección de grietas en puentes y en las alas de los aviones, en los sistemas de navegación marítimos (SONAR), para detectar submarinos o pescado, además se usa en exploración geológica para detectar bolsas de gas [21].

El principio básico de la ecografía es sencillo. Una onda acústica que se propaga entre distintas partes del cuerpo será reflejada de forma distinta en distintos tipos de tejidos. Si estas reflexiones se miden en función del tiempo, se obtendrá información acerca de la posición del tejido

Generación y detección de un ultrasonido.

Las ondas o pulsos ultrasónicos son generados y detectados por un cristal piezoeléctrico colocado en medio de dos electrodos, dicho cristal tiene la propiedad de deformarse bajo la influencia de un campo eléctrico, además de que sirve tanto como transmisor y como detector. Si un cristal piezoeléctrico es excitado con una señal eléctrica sinusoidal su superficie resonará ocasionando una onda de compresión con la misma frecuencia la cual se propagará a través de los medios circundantes (tejido), este al mismo tiempo detectara ondas de ultrasonido producidas por una señal eléctrica variante en el tiempo. Las ondas de sonido son longitudinales, es decir, los ecos de las ondas se mueven hacia adelante y hacia atrás en la misma dirección en la cual la onda de sonido se propaga. La velocidad del sonido , depende de la densidad del material en la cual se está propagando y de su compresibilidad , de este modo la velocidad como se calcula comó;

=

(60)

Se puede comparar hueso con tejido, los huesos humanos tienen más densidad y una menor compresibilidad que el tejido. La multiplicación de es más pequeña en los huesos que en el tejido, resultando en una velocidad mayor de las ondas de sonido. Cuando una onda de ultrasonido choca con una superficie de tejido que separa dos tejidos con características acústicas distintas, parte de la onda será reflejada y detectada por un transductor. Generalmente. Aquellas ondas que se reflejan con un ángulo de 180° serán las que contribuirán a la ecografía, midiendo el retardo entre la onda transmitida y la onda reflejada y conociendo la velocidad de propagación, se puede conocer las características de un órgano o tejido. Al igual que en los circuitos eléctricos los tejidos presentarán una impedancia debido a las características acústicas de cada tejido, a medida que la impedancia acústica de un tejido se incrementa la velocidad de una onda de sonido se verá reducida, la impedancia acústica se define por:

= = √ (2.2)

(61)

Adquisición de datos.

La adquisición de imágenes es lograda de tres formas:

Modo-A

Inmediatamente después de la transmisión del pulso acústico, el transductor se utiliza como un receptor. Las ondas reflejadas se registran en función del tiempo. Es importante notar que el tiempo y la profundidad de un tejido son equivalentes en una ecografía porque la velocidad del sonido es aproximadamente constante en todo el tejido. Es decir, , multiplicado por el tiempo de viaje del pulso es igual a dos veces la distancia desde el transductor hasta el punto de reflexión.

Esta forma de obtención de imágenes es la más simple ya que es basada en el principio de pulso-eco y es llamada modo-A (modo de amplitud). La señal detectada es a menudo llamada señal de radiofrecuencia (RF) debido a que las frecuencias que maneja son del orden de los MHz y corresponde a las frecuencias de ondas de radio en el espectro electromagnético.

Modo-B

El modo-B (modo de Brillo), es una de las ecografías más comunes y es usada para producir una imagen en dos dimensiones (ver figura 2.20), haciendo que el pulso acústico sea incidido una y otra vez en el cuerpo de un paciente .La figura 2.21 (A) muestra un ejemplo de una señal de RF y su envoltura.

(62)

Figura 2.20. Imagen de un feto humano obtenido por ultrasonido.

A B

(63)

Modo-M

Las imágenes en modo-M (modo de Movimiento), son obtenidas al realizar el proceso de las imágenes en modo-A, de manera repetida. Este tipo de procedimiento da como resultado, una imagen en dos dimensiones [18].

La figura 2.22 muestra el procedimiento de modo-A, en repetidas ocasiones y su representación gráfica. La figura 2.23 da una imagen de una sección del corazón obtenida en modo-M, donde se muestra una contracción del corazón. Las imágenes en modo-M son utilizadas para obtener imágenes de un objeto en movimiento y poderlas observar de manera estática.

(64)
(65)

C

APÍTULO

3

|

(66)

3. SEGMENTACIÓN DE IMÁGENES.

En el capítulo anterior se tuvo una breve introducción al procesamiento digital de imágenes, en el cual se hizo énfasis acerca de cómo está compuesto un sistema de procesamiento de imagen digital, se mencionó también que esta obra estará centrada primordialmente en la segmentación de imágenes. Es por ello que este capítulo está diseñado con la finalidad de revisar algunas de las técnicas de segmentación más usadas actualmente.

La segmentación, es un análisis esencial para la cual se han desarrollado numerosos algoritmos y técnicas. Dentro del campo que incluye el procesamiento de imágenes médicas la segmentación sirve para analizar estructuras anatómicas, distintos tipos de tejido, distribución espacial de los órganos, ubicación de regiones patológicas, etc. La segmentación se puede utilizar también como un paso inicial para la visualización y la comprensión de la información contenida en una imagen. Comúnmente la segmentación de un objeto es lograda identificando todos los pixeles que pertenecen a un objeto o localizando aquellos que forman sus límites [2,4].

3.1 Descripción

La segmentación de imágenes es la división de una imagen en sus regiones

más significativas, para distinguir los objetos o regiones de interés (“primer plano”) de todo lo demás (“su fondo”). El principal objetivo de la segmentación es la partición de una imagen en regiones (llamadas clases o subarreglos) que son homogéneos uno con respecto del otro [10, 28].

(67)

imágenes de CT (tomografía computarizada) o MR (resonancia magnética) para distinguir el tejido patológico, o para distinguir un tumor del tejido normal, además de ser usado por los especialistas de cada área en la planificación de su tratamiento. Hay muchos enfoques para realizar una segmentación y estas pueden ser clasificadas de acuerdo a las características y a la técnica utilizada, las características principales incluyen los valores de gris y de textura que la imagen posea.

Las técnicas de segmentación pueden ser clasificadas de una manera contextual o no contextual. Las técnicas no contextuales ignoran las relaciones que existen entre las características de una imagen, es decir, los píxeles son simplemente agrupados en base a un atributo general que la imagen pueda poseer, tales como su nivel de gris y brillo, no así las técnicas contextuales que se basan principalmente en aquellas relaciones que hay en las imágenes.

3.2 Consideraciones en la segmentación.

Actualmente el lograr la segmentación de una imagen es una tarea difícil. Como se ha discutido a lo largo de esta obra, en ocasiones las imágenes obtenidas por cualquiera de las radiaciones o campos listados en la tabla 1.1 presentan ciertas irregularidades, ciertas inconsistencias, como lo son rl ruido contenido en una imagen, falta de nitidez, falta de consistencia en los objetos a segmentar y de una manera regular se presenta la distorsión que impide que los contornos de los objetos estén bien definidos.

(68)

proveen puntos de partida al momento de realizar una segmentación, es decir, de indicarnos dónde está un objeto y dónde no lo está.

Otra de las consideraciones que deben de ser tomadas en cuenta al realizar una segmentación es la de tener una métrica que permita identificar la consistencia del objeto a procesar, una métrica que provea de información acerca del contorno de dicho objeto.

Los contornos pueden ser débiles en algunas zonas de la imagen, pero quizás no en otras (a menos que se tenga un problema de ambigüedad en el cual la segmentación no pueda ser precisa). Dicha métrica puede ser simplemente la intensidad de la imagen o su color. Por más simples que parezcan estos parámetros darán información valiosa de la imagen a segmentar. Esta es una de las principales razones por las cuales muchos de los métodos de segmentación se centran en contornos.

En resumen, para lograr una segmentación adecuada, es importante considerar los siguientes puntos:

 Tener un indicador que denote que es lo que hay dentro o afuera del objeto de interés.

 Tener una métrica de la cual se pueda obtener información del contorno de la imagen.

 Tener un método de optimización que permita delinear dicho contorno de una manera adecuada.

(69)

3.3 Revisión de las principales técnicas de segmentación.

En esta sección se listan y detallan algunas de las principales técnicas de segmentación y su objetivo principal es el de dar una introducción al lenguaje y terminología que han sido desarrolladas para dichas técnicas.

Aunque actualmente existen numerosas técnicas e incluso otras están siendo desarrolladas o modificadas, se discutiran tres de las técnicas que son basadas en las cualidades generales que tiene una imagen, como su brillo y sus tonalidades de gris.

3.3.1. Umbralización

La técnica de umbralización es una técnica de segmentación que se basa principalmente en la intensidad y brillo que una imagen contiene, hasta ahora se han desarrollado distintas técnicas para llevar a cabo este procedimiento, a continuación se analizan las principales.

3.3.1.1. Umbralización global.

La umbralización global se basa en la suposición de que una imagen tiene un histograma bimodal y que por lo tanto un objeto contenido en dicha imagen

puede ser separado de su “fondo” por una operación que compare los valores de la imagen con un valor de umbral U.

(70)

A B

Fig. 3.1 (A); Histograma bimodal con un valor de umbral seleccionado (B); imagen que muestra objeto a segmentar (letras) su fondo (área gris)

Los pixeles del objeto a segmentar y los de su “fondo” tienen respectivos niveles de

gris que serán agrupados en dos grupos dominantes.

La umbralización de la imagen quedará entonces definida como sigue:

, = { , , > (1)

El resultado de la umbralización es una imagen binaria, donde los pixeles con una intensidad con valor de 1 corresponden al objeto a segmentar, mientras que los pixeles que tienen un valor de 0 corresponden al fondo de la imagen. La figura 3.2, muestra el resultado de una segmentación utilizando el método de umbralización, la imagen original (A), contiene células blancas con un fondo negro. Las intensidades de los pixeles varían entre 0 y 250, el umbral escogido para realizar esta segmentación es de U=127, el histograma de la imagen se muestra en la figura (B)

(71)

Fig. 3.2 Segmentación por umbralización global. (A); imagen original (B); histograma de la imagen (C); resultado de la umbralización con U=127.

3.3.1.2. Umbralización local o adaptable.

(72)

y sus correspondientes umbrales por ultimo en la fig. 3.3C su segmentación con umbralización local y con umbralización global, nótese como al usar umbralización global los resultados no son tan satisfactorios como en los obtenidos con umbralización adaptativa.

Figura 3.3 (B); Imagen “arroz con fondo negro” y su histograma corrspondiente.

(73)

Figura 3.3 (C) Segmentación de imágenes usando umbralización global y local.

3.3.2 Crecimiento de regiones.

Mientras la técnica de umbralización se centra principalmente en las diferentes intensidades que tiene un pixel, el método de la región creciente busca grupos de pixeles que tengan niveles de intensidades similares.

(74)

Figura 3.4 Pixel semilla

. En la figura 3.5 se puede observar la imagen de una angiografía obtenida por MR, en la cual el pixel semilla es colocado en la parte superior de la figura 3.5 (A), en las imágenes subsecuentes se puede apreciar como el algoritmo de la región creciente comienza a comparar las relaciones existentes entre el pixel semilla y sus vecinos, hasta obtener la segmentación en la figura 3.5 (E).

(75)

Una modificación interesante del método de crecimiento de regiones es la llamada técnica de “escalamiento” [11], con el objetivo de auxiliar el procesamiento de imágenes con poco contraste. El proceso de segmentación es muy similar al utilizado en el crecimiento de regiones clásico, la diferencia radica en que en lugar de localizar un punto dentro del objeto a segmentar, primero se buscan 16 puntos que tengan un máximo nivel de color en los límites del objeto a segmentar, después esos puntos son usados como semillas para proceder a la segmentación de la región. Esta técnica es principalmente utilizada en imágenes que tienen muy poco contraste, la figura 3.6 Ilustra este procedimiento.

(76)

El método del crecimiento de regiones puede ser extendido para su utilización en tres dimensiones, la imagen 3.7 muestra una imagen obtenida por resonancia magnética usando solamente siete puntos semilla situados en diferentes regiones anatómicas (materia blanca, materia gris, cráneo, ojo izquierdo, ojo derecho, cristalino derecho y cristalino izquierdo).

Fig. 3.7 Segmentación 3D. Imagen obtenida por resonancia magnética en tres dimensiones utilizando crecimiento de regiones.

(77)

áreas que no pertenecen al objeto de interés. Sin embargo una de las ventajas de la región creciente es que es capaz de segmentar regiones que tienen las mismas propiedades pero que están separadas espacialmente. Algunas de las técnicas de la segmentación por medio de la umbralización local y adaptable, se han incorporado a la segmentación por medio de la región creciente lográndose resultados aceptables en la segmentación de grasa dentro del cuerpo humano, algunas de estas adaptaciones pueden ser consideradas en el trabajo de Regina y Klaus [41].

3.3.3 Algoritmo de cascada.

La segmentación usando el algoritmo de cascada es una técnica que se basa en una región base, que utiliza la morfología de imagen. La misma requiere que se seleccione al menos un pixel (pixel marca) en el interior del objeto a segmentar, también se selecciona un pixel que este fuera del objeto a segmentar y constituya el fondo de la imagen.

Dichos marcadores son escogidos por un operador o son provistos por un procedimiento automático que toma en cuenta a que está orientada la aplicación. Una vez que los pixeles son asignados, comienzan a crecer o buscar similitudes morfológicas usando el algoritmo de cascada.

Para entender dicho algoritmo, se puede pensar en la superficie de una imagen donde el brillo de los pixeles representan elevaciones en un terreno y donde los pixeles obscuros representan valles, posteriormente dicha superficie de terreno se sumerge en agua.

(78)

3.8 Algoritmo de cascada.

3.4 Artefactos de imagen y su impacto en la segmentación

(79)

3.9 (B), se pudo obtener una imagen más homogénea, sin embargo, no en todos los casos es posible hacer el mismo procedimiento, a continuación se hablara de los dos principales artefactos que se presentan en la imagen médica.

Figura 3.9. Artefactos en resonancia Magnética.

3.4.1. Efecto de volumen parcial.

(80)

cadera, las líneas que se ven en la imagen fueron causadas debido a la dispersión de los rayos en la prótesis. Este efecto ocasionará incertidumbre en los límites de dos tipos de tejidos y restar eficiencia a los métodos de segmentación que basan su funcionamiento en detección de bordes.

Figura 3.10 Efecto de volumen parcial. Artefacto ocasionado por prótesis metálica.

3.4.2. Falta de homogeneidad

(81)

La falta de homogeneidad en la intensidad de la imagen degrada el desempeño de los algoritmos de segmentación y como consecuencia puede traer un diagnostico médico erróneo. La corrección de este artefacto es de vital importancia en las imágenes médicas que sirven para el tratamiento de enfermedades relacionadas con el funcionamiento del cerebro humano, en la figura 3.11 se puede apreciar este artefacto.

Figura 3.11 Falta de homogeneidad en imágenes obtenidas por MR.

En la literatura en general se han propuesto distintos algoritmos para hacer que este artefacto se vea disminuido a tal grado de que su impacto en el diagnostico médico sea mínimo o nulo, sin embargo se recomienda que antes de proceder a la

(82)

C

APÍTULO

4

|

CLASIFICACIÓN Y

CLASIFICADOR

(83)

4. CLASIFICACIÓN Y CLASIFICADOR BAYESIANO

4.1 Introducción.

El reconocimiento de patrones o clasificación de patrones es una disciplina que tiene como principal objetivo la clasificación de objetos en un número de categorías o clases. Dependiendo de la aplicación estos objetos se pueden clasificar los pixeles de una imagen, señales de onda o cualquier tipo de medición que necesite ser clasificada. En este capítulo se hace referencia a los objetos como patrones.

El reconocimiento de patrones tiene una larga historia, pero antes de los 1960’s era

(84)

haber una segunda revisión que puede ser realizada por un sistema de procesamiento digital de imágenes que contenga en su software un algoritmo de reconocimiento de patrones.

4.2 Descripción de un clasificador.

Considerese el caso de una clasificación de imagen médica. La figura 4.1 muestra dos imágenes, cada una con una región distinta dentro de ella. La figura 4.1A

muestra el resultado de una lesión “menor” o ”benigna”, la cual será designada como clase A y la imagen 4.1B muestra una lesión “maligna” (cáncer), que será designada

como clase B. También se parte de que se cuenta con una base de datos de la cual es posible obtener más imágenes similares a estas.

Figura 4.1 Regiones correspondiente a clase A y clase B.

El primer paso para realizar una clasificación es la de identificar cantidades

(85)

cada región sombreada de la imagen. Cada punto en la imagen 4.2 corresponde a una imagen diferente de las obtenidas de la base de datos médica. Resultando que los patrones que se parecen a la clase A se agrupan en un área diferente a los patrones de la clase B. La línea recta separa las dos clases. Ahora supongase que se obtiene una imagen nueva y que se desconoce a qué clase pertenece la misma, dicha imagen será designada como (+) y se supondrá también que dicha imagen pertenece a la clase A. La descripción de la clasificación anterior ilustra la razón de ser que hay detrás de una amplia clase de problemas de reconocimiento de patrones. Las medidas utilizadas para la clasificación son el valor medio (µ) y la

desviación estándar (σ) que en este caso se conocen como las características de la

clasificación, es por ello que la clasificación de patrones se apoya ampliamente de la probabilidad.

Se sabe [21], que en una imagen de Rayos-X se esperarán largas variaciones de contraste entre imágenes, esto debido a las diferentes características físicas en el cuerpo de un individuo. La línea recta en la figura 4.2 es conocida como una línea de decisión y la misma constituye un clasificador cuyo principal rol es la de dividir las características de una imagen en regiones que correspondan a la clase A o a la clase B.

Si una de las características de una imagen (brillo, luminosidad, morfología) cae dentro de la clase A, será clasificada como clase A, de otro modo será clasificada como clase B. Sin embargo esto no significa necesariamente que la clasificación sea correcta, en cuyo caso se habla de una clasificación fallida. Para enfrentar esta dificultad, se ha desarrollado lo que se conoce como “entrenamiento del clasificador”,

el cual consiste en tener imágenes de las cuales se conoce su clasificación y estas a su vez se comparan con la clasificación ofrecida por el que se piesa diseñar, esto con el fin de modificar las características y de este modo “entrenarlo” para una

(86)

Figura 4.2 Gráfica de desviación estándar contra valor medio, para un número de imágenes. En este caso clase A (o) y clase B (+). Línea recta representando un clasificador.

Habiendo resaltado las principales características de un clasificador, se señalarán las principales consideraciones en el momento de realizar una clasificación.

 Tipo de campo o radiación de la cual se obtienen las imágenes. Ver tabla (1.1)

 En el ejemplo anterior se uso la desviación estándar porque se conocía cómo se habían adquirido las imágenes. En la práctica las características serán escogidas dependiendo del sistema de procesamiento digital de imagen con el que se cuente y cual sea su método de adquisición de imagen.

 Elegir las características necesarias para la clasificación de la imagen.

 Una vez escogidas las principales características de clasificación, se procede a diseñar un clasificador que permita tener un criterio óptimo en el momento de llevar a cabo esta tarea.

 Finalmente una vez que el clasificador este diseñado se procederá a su

(87)

En la figura 4.3 se muestra un esquema de las etapas que están involucradas en el momento de realizar una clasificación.

Figura 4.4. Etapas en la clasificación.

Como se puede ver son cinco las principales etapas que están involucradas en la clasificación de una imagen. El resto de este capítulo hablara de la etapa de diseño de un clasificador el llamado “Clasificador Bayesiano”, dando primeramente un esbozo de la teoría Bayesiana y su funcionamiento. Posteriormente en capítulos subsecuentes se pondrá en funcionamiento dicho clasificador y se comparará con un método de segmentación de los descritos en el capítulo tres para poner en perspectiva cuales son las ventajas que el mismo tiene sobre otros métodos de clasificación y segmentación.

4.3 Clasificador bayesiano.

4.3.1 Descripcion.

Referencias

Documento similar

quiero también a Liseo porque en mi alma hay lugar para amar a cuantos veo... tiene mi gusto sujeto, 320 sin que pueda la razón,.. ni mande

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

En suma, la búsqueda de la máxima expansión de la libertad de enseñanza y la eliminación del monopolio estatal para convertir a la educación en una función de la

Pero la realidad se impone por encima de todo; la misma Isidora es consciente del cambio: «Yo misma conozco que soy otra, porque cuando perdí la idea que me hacía ser señora, me

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)