CLASIFICACIÓN DE FRAGMENTOS DE OBJETOS EN IMÁGENES DIGITALES

(1)

CLASIFICACI ´ ON DE FRAGMENTOS DE OBJETOS EN IM ´ AGENES DIGITALES

Carolina Barajas-Garc´ıa

¹

, Selene Solorza

¹

y Josu´ e ´ Alvarez-Borrego

²

1

Facultad de Ciencias, UABC.

²

Divisi´ on de F´ısica Aplicada, CICESE e-mail: [email protected], [email protected]

Resumen

La automatizaci´ on del reconocimiento de fragmentos de objetos es un problema de actualidad que por s´ı solo es de gran inter´ es y de un reto para la humanidad al intentar emular las funciones del ojo y del cerebro humano mediante una computadora. Para nosotros los humanos es muy sencillo identificar un fragmento de objeto que se encuentra aislado en un ambiente y pudiera ser un poco m´ as complicado identificarlo si est´ a parcialmente oculto por otro objeto, es decir un problema de oclusi´ on. Transmitir esas instrucciones a un sistema digital es un proceso no trivial. En este trabajo se presenta un sistema digital para la clasificaci´ on de fragmentos de objetos. El fin ´ ultimo de este tipo de trabajos es que estos algoritmos se utilicen, como por ejemplo, en el desarrollo de ojos artificiales utilizados por personas que presentan alg´ un nivel de ceguera.

1 Introducci´ on

El reconocimiento de patrones es un ´ area del procesamiento de im´ agenes, en donde se es- tudian los patrones en la imagen, para extraer la informaci´ on relevante que nos permita describirla de manera cuantitativa, ´ unica y completa [4]. Para automatizar la extracci´ on de patrones, identificaci´ on y clasificaci´ on se pueden utilizar sistemas digitales de reconocimiento de patrones. Un sistema digital, es aquel en el que se realizan operaciones mediante d´ıgitos, las cuales por lo regular se representan en el sistema binario. B´ asicamente un sistema dig- ital se conforma de las etapas de ingreso, procesamiento, transmisi´ on, almacenamiento y despliegue de los datos digitales [5].

Los sistemas digitales de reconocimiento de patrones basados en correlaciones han sido objeto de inter´ es por muchos a˜ nos, sus aplicaciones son diversas y variadas. Por ejemplo en microbiolog´ıa tales sistemas digitales se usan para clasificar microorganismos como bacterias, cromosomas, c´ elulas infectadas, etc. En aspectos de seguridad se utilizan en la identificaci´ on de modelos y placas de autom´ oviles, estructuras ´ oseas, huellas dactilares, entre otros [4]. Los sistemas digitales de correlaci´ on se basan en el hecho de que las im´ agenes son invariantes bajo un conjunto de transformaciones (traslaci´ on, rotaci´ on y escala), por lo que son una herramienta muy ´ util en la identificaci´ on de estructuras microsc´ opicas y macrosc´ opicas, ya que reconocer´ an al objeto independientemente de la posici´ on, orientaci´ on y tama˜ no en el que se presente. Dichas invarianzas se llevan a cabo mediante la transformada de Fourier y Escala en conjunto con filtros lineales y no lineales [2, 6].

1

(2)

En este trabajo se presenta un sistema digital de correlaci´ on lineal invariante a traslaci´ on y rotaci´ on que clasifica fragmentos de objetos en im´ agenes digitales. En la secci´ on 2, se describen las componentes del sistema digital de reconocimiento de patrones. En la secci´ on 3, se determina el nivel de confianza que tiene el sistema en la clasificaci´ on de las im´ agenes digitales. Finalmente, en la secci´ on 4 se exponen las conclusiones.

2 El sistema digital

El sistema digital trabaja con im´ agenes en escala de grises de n×n pixeles. Sea I una imagen dada, donde (x, y) es un pixel de la imagen e I(x, y) su correspondiente valor de intensidad, para x, y ∈ {1, . . . , n} y con (c

_x

, c

_x

) el pixel central de la imagen, definido por

c

_x

=

_n

2

+ 1, si n es par,

b

ⁿ₂

c + 1, si n es impar, (1)

aqu´ı bzc redondea a z al entero m´ as cercano a −∞. El sistema digital es invariante a traslaci´ on, lo cual se logra de una manera sencilla al utilizar el m´ odulo de la transformada de Fourier de la imagen, puesto que para α, β ∈ R, se tiene que

|F T (I(x, y))| = |F T (I(x + α, y + β))|. (2)

2.1 M´ ascaras Bessel

Para obtener la invarianza a rotaci´ on, se construyen m´ ascaras binarias de anillos conc´ entricos usando la raz´ on de la funci´ on Bessel de primer tipo y primer orden entre su argumento,

y(x) =

J1(x−cx)

x−cx

, if x 6= c

_x

,

1, if x = c

x

, (3)

donde x = 1, . . . , n. Con base en la ec. (3), se obtienen las siguientes funciones binarias Z

_P

(x) = 1, si y(x) > 0,

0, si y(x) ≤ 0, Z

_N

(x) = 1, si y(x) ≤ 0,

0, si y(x) > 0. (4) Finalmente, tomando el eje vertical x = c

_x

como eje de rotaci´ on, las funciones Z

_P

(x) y Z

_N

(x) se rotan 180 grados para obtener cilindros conc´ entricos de altura uno y diferente grosor, todos centrados en (c

_x

, c

_x

). Tomando una secci´ on transversal con respecto al eje de simetr´ıa, se generan las m´ ascaras Bessel B

_P

y B

_N

de la Fig. 1a y b, respectivamente [1, 6].

2.2 Las Firmas de la Imagen

El primer paso para obtener la firma de una imagen, por ejemplo la de la Fig. 2a, es

filtrar el |F T (I)| (Fig. 2b) por una m´ ascara Bessel, digamos la B

_P

(Fig. 2c), es decir,

hacer H

_P

= B

_P

∗ |F T (I)| (Fig. 2d), donde ∗ representa una multiplicaci´ on punto a punto.

(3)

Figura 1: (a) M´ ascara Bessel B

_P

. (b) M´ ascara Bessel B

_N

.

Figura 2: (a) I: Actinocyclus ingens - Rattray. (b) |F T (I)|. (c) M´ ascara Bessel B

_P

. (d) H

_P

= B

_P

∗ |F T (I)|, donde ∗ representa una multiplicaci´ on punto a punto. (e) Firma de la Fig. 2a.

Posteriormente, se enumeran los anillos en H

_P

del centro hacia afuera, para obtener el siguiente conjunto

indice = {indice del anillo ∈ ¯ n} , (5) aqu´ı ¯ n = {1, . . . , n : n ∈ N}. Despu´es, los valores de intensidad en cada uno de los anillos se suman para generar la siguiente funci´ on firma [6],

f irma = indice → A ⊂ R, f irma(indice del anillo) = X

H

_P

, si H

_P

(x, y) pertenece a indice del anillo. (6)

En la Fig. 2e se muestra la gr´ afica de la funci´ on f irma asociada a la Fig. 2a.

(4)

3 Clasificaci´ on

Para el reconocimiento de patrones, primeramente hay que determinar la base de datos de las im´ agenes de referencia, β

_R

= R

_j

∈ M

_n×n

: j = 1, . . . , k; k ∈ N . A cada imagen R

_j

hay que asignarle sus dos firmas S

^P

Rj

y S

^N

Rj

, el super´ındice P indica que la firma proviene de la m´ ascara B

_P

y el N de la B

_N

. Luego, se calculan las autocorrelaciones [1, 6],

C

_L

(S

^α

Rj

) = F T

⁻¹

n

|F T (S

^α

Rj

)| e

^iϕ

|F T (S

^α

Rj

)| e

^−iϕ

o

, (7)

donde ϕ es la fase de la transformada de Fourier de la firma S

^α

Rj

, para α = P o N . Poste- riormente, se obtienen los escalares η

^α

Rj

= max n

C

_L

(S

^α

Rj

) o

con los cuales se ponderan las firmas como ˜ S

^α

Rj

= η

^α

Rj

S

^α

Rj

.

El patr´ on en las im´ agenes de referencia R

_j

est´ a caracterizado mediante el valor

r

_Rj

=

max n C

_L

( ˜ S

^P

Rj

) o (N

^P

− 1)σ

²

S˜P Rj

max n C

_L

( ˜ S

^N

Rj

) o (N

^N

− 1)σ

²

S˜N Rj

, (8)

donde N

^α

es la cardinalidad del dominio de ˜ S

^α

Rj

y σ

_˜

Sα Rj

es su desviaci´ on est´ andar. Ahora, para determinar el patr´ on en la imagen problema P , lo primero a realizar es la obtenci´ on de sus dos firmas ponderadas ˜ S

^α

P

. Despu´ es, se calculan las correlaciones de ˜ S

^α

Rj

y ˜ S

^α

P

mediante [1, 6]

C

_L

( ˜ S

^α

Rj

, ˜ S

^α

P

) = F T

⁻¹

n

|F T ( ˜ S

^α

P

)| e

^iφ

|F T ( ˜ S

^α

Rj

)| e

^−iϕ

o

, (9)

donde φ es la fase de la transformada de Fourier de la firma ˜ S

^α

P

. Para, finalmente caracterizar a la imagen problema P con el valor determinado por

r

_P

=

max n C

_L

( ˜ S

^P

Rj

, ˜ S

^P

P

) o (N

^P

− 1)σ

S˜P Rj

σ

S˜P P

max n C

_L

( ˜ S

^N

Rj

, ˜ S

^N

P

) o (N

^N

− 1)σ

S˜N Rj

σ

S˜N P

. (10)

Si r

_P

es similar a r

_Rj

, se tiene que la imagen problema P es igual a la imagen de referencia R

_j

, caso contrario es otra imagen.

Puesto que la imagen R

_j

, por ejemplo la Fig. 2a, puede presentarse en el plano Cartesiano en cualquier ´ angulo de rotaci´ on, entrenaremos al sistema con 360 im´ agenes rotadas de R

_j

. Esas im´ agenes se obtienen al rotar a R

_j

trescientos sesenta grados con ∆θ = 1

^◦

. Despu´ es, se calculan las correspondientes r

^θ

Rj

para cada una de esas im´ agenes rotadas, aqu´ı 0 ≤ θ ≤ 359 representa el ´ angulo al cual se rot´ o R

_j

. Como los datos r

^θ

Rj

no satisfacen una distribuci´ on

(5)

normal pero est´ an normalizados, se utiliza la distribuci´ on Z de Fisher para determinar los intervalos de confianza [3]. El valor Z de Fisher para r

^θ

Rj

est´ a dado por

Z

_rθ Rj

= 1.1513 ln



 1 + r

^θ

Rj

1 − r

^θ

Rj



 . (11)

El intervalo de confianza del 95% para la media Z

_r^θ

Rj

, est´ a dado por

Z

⁻

r^θ

Rj

, Z

⁺

r^θ

Rj

=

Z

_rθ

Rj

− 1.96 σ

_Z

, Z

_rθ Rj

+ 1.96 σ

_Z

, (12)

usando una desviaci´ on est´ andar de σ

_Z

=

^√_n−3¹

, donde n es el tama˜ no de la muestra, en este caso es n = 360. El intervalo de confianza del 99% para la media Z

_rθ

Rj

, est´ a establecido mediante

Z

⁻

r^θ

Rj

, Z

⁺

r^θ

Rj

=

Z

_r^θ

Rj

− 2.575 σ

_Z

, Z

_r^θ

Rj

+ 2.575 σ

_Z

. (13)

Finalmente, el intervalo de confianza para r

^θ

Rj

se obtiene como

ρ

⁻_rθ Rj

= exp

2Z

⁻

r^θ

Rj

− 1

exp 2Z

⁻

r^θ

Rj

! + 1

, ρ

⁺_rθ Rj

= exp

2Z

⁺

r^θ

Rj

− 1

exp 2Z

⁺

r^θ

Rj

! + 1

, (14)

de ah´ı que el intervalo de confianza para el coeficiente de correlaci´ on verdadero ρ

_r^θ

Rj

sea [3],

ρ

⁻

r^θ

Rj

≤ ρ

_r^θ

Rj

≤ ρ

⁺

r^θ

Rj

. (15)

De la imagen de referencia R

_j

y sus im´ agenes rotadas se tienen 360 valores de ρ

⁻

r^θ

Rj

y otros 360 valores para ρ

⁺

r^θ

Rj

, entonces el intervalo de confianza para decidir si una imagen problema es igual a R

_j

, independientemente del ´ angulo de rotaci´ on que presente en el plano, est´ a definido por

min

_0≤θ≤359

ρ

⁻

r^θ

Rj

, max

_0≤θ≤359

ρ

⁺

r^θ

Rj

.

En la Fig. 3 se muestra la interface desarrollada en lenguaje MATLAB del sistema

^R

digital para clasificar im´ agenes que presentan una traslaci´ on y/o rotaci´ on en el plano. La imagen problema (IP) presenta una rotaci´ on con respecto a la imagen de referencia (IR).

Como la rotaci´ on se realiz´ o en una computadora, es por eso que la imagen rotada tiene el

ruido de distorsi´ on llamado diente de sierra. El efecto del ruido introducido al momento de

(6)

Figura 3: Sistema digital para el reconocimiento de patrones en im´ agenes digitales elaborado en lenguaje MATLAB .

^R

Figura 4: Im´ agenes sin un porcentaje de sus datos. (a) 2%. (b) 3%. (c) 4%. (d) 5%. (e) 5%.

rotar la imagen ocasiona que las firmas de ambas im´ agenes no sean iguales (como se muestra

en la interface). Debido a que el sistema es robusto, clasifica apropiadamente a las im´ agenes

que presentan ese tipo de ruido usando un intervalo de confianza del 99% (intervalo en color

rojo en la Fig. 3). El intervalo asociado a la imagen problema (intervalo en color negro) es

un subconjunto del intervalo de la imagen de referencia, esto indica que la imagen problema

es igual a la imagen de referencia. En el caso contrario, la imagen problema es diferente a la

imagen de referencia y para poderla clasificar hay que compararla con otra imagen de la base

de datos de las im´ agenes de referencia β

_R

. Adem´ as, al probar el sistema digital con im´ agenes

que presentan una oclusi´ on o solamente se tiene un fragmento de ellas (Fig. 4), se obtuvo

que el sistema las clasifica eficientemente cuando presentan una oclusi´ on o la eliminaci´ on de

un fragmento de hasta el cinco por ciento con respecto al ´ area del objeto.

(7)

4 Conclusiones

El sistema digital presentado en este trabajo tiene un excelente rendimiento al clasificar im´ agenes en escala de grises que presentan una traslaci´ on, rotaci´ on, ruido diente de sierra y, la oclusi´ on o la eliminaci´ on de un fragmento de hasta el cinco por ciento del ´ area del objeto.

La prueba del sistema se llev´ o a cabo usando im´ agenes digitales de f´ osiles de diatomeas tomadas en un microscopio; dichas diatomeas fueron recolectadas en el Golfo de California, presentan una morfolog´ıa muy similar entre ellas y aun as´ı, el sistema digital clasifica a cada una de ellas con un intervalo de confianza del 99%.

Reconocimientos

Este trabajo fue parcialmente apoyado por los proyectos CONACyT con n´ umeros 102007 y 169174. Carolina Barajas-Garc´ıa es una estudiante de Maestr´ıa en el programa MyDCI que lo oferta la Universidad Aut´ onoma de Baja California y es apoyada con beca del CONACyT.

Referencias

[1] ´ Alvarez-Borrego, J., S. Solorza y M.A. Bueno-Ibarra, “Invariant correlation to position and rotation using a binary mask applied to binary and gray images”, Optics Commu- nications 294, (2013): 105-117.

[2] Fimbres-Castro, C., J. ´ Alvarez-Borrego y M.A. Bueno-Ibarra, “Invariant nonlinear cor- relation and spectral index for diatoms recognition”, Optical Engineering, 51, no. 4 (2012): 047201 1-12.

[3] Fisher, R.A., “Frequency distribution of the values of the correlation coefficient in sam- ples of an indefinitely large population”, Biometrika (Biometrika Trust), 10, no. 4 (1915): 507-521.

[4] Gonz´ alez, R.C., R.E. Woods y S.L. Eddins, Digital Image Processing Using Matlab, 2da ed. New Delhi: Tata McGraw Hill Education Private Limited, 2010.

[5] Lyon, R.G., Understanding Digital Signal Processing, 3ra ed. NJ, USA: Prentice Hall, 2011.

[6] Solorza S. y J. ´ Alvarez-Borrego, “Illumination analysis of the digital pattern recog- nition system by Bessel masks and one-dimensional signatures”, Proc. of SPIE: 8th Iberoamerican Optics Meeting and 11th Latin American Meeting on Optics, Lasers and Applications, 8785 (2013): 878573-1.

Este documento fu´ e formateado con L

^A

CLASIFICACIÓN DE FRAGMENTOS DE OBJETOS EN IMÁGENES DIGITALES

CLASIFICACI ´ ON DE FRAGMENTOS DE OBJETOS EN IM ´ AGENES DIGITALES

Carolina Barajas-Garc´ıa

, Selene Solorza

y Josu´ e ´ Alvarez-Borrego

Facultad de Ciencias, UABC.

Divisi´ on de F´ısica Aplicada, CICESE e-mail: [email protected], [email protected]

Resumen

1 Introducci´ on

1

2 El sistema digital

El sistema digital trabaja con im´ agenes en escala de grises de n×n pixeles. Sea I una imagen dada, donde (x, y) es un pixel de la imagen e I(x, y) su correspondiente valor de intensidad, para x, y ∈ {1, . . . , n} y con (c

, c

) el pixel central de la imagen, definido por

c

=



+ 1, si n es par,

b

c + 1, si n es impar, (1)

aqu´ı bzc redondea a z al entero m´ as cercano a −∞. El sistema digital es invariante a traslaci´ on, lo cual se logra de una manera sencilla al utilizar el m´ odulo de la transformada de Fourier de la imagen, puesto que para α, β ∈ R, se tiene que

|F T (I(x, y))| = |F T (I(x + α, y + β))|. (2)

2.1 M´ ascaras Bessel

Para obtener la invarianza a rotaci´ on, se construyen m´ ascaras binarias de anillos conc´ entricos usando la raz´ on de la funci´ on Bessel de primer tipo y primer orden entre su argumento,

y(x) =



, if x 6= c

,

1, if x = c

, (3)

donde x = 1, . . . , n. Con base en la ec. (3), se obtienen las siguientes funciones binarias Z

(x) =  1, si y(x) > 0,

0, si y(x) ≤ 0, Z

(x) =  1, si y(x) ≤ 0,

0, si y(x) > 0. (4) Finalmente, tomando el eje vertical x = c

como eje de rotaci´ on, las funciones Z

(x) y Z

(x) se rotan 180 grados para obtener cilindros conc´ entricos de altura uno y diferente grosor, todos centrados en (c

, c

). Tomando una secci´ on transversal con respecto al eje de simetr´ıa, se generan las m´ ascaras Bessel B

y B

de la Fig. 1a y b, respectivamente [1, 6].

2.2 Las Firmas de la Imagen

El primer paso para obtener la firma de una imagen, por ejemplo la de la Fig. 2a, es

filtrar el |F T (I)| (Fig. 2b) por una m´ ascara Bessel, digamos la B

(Fig. 2c), es decir,

hacer H

= B

∗ |F T (I)| (Fig. 2d), donde ∗ representa una multiplicaci´ on punto a punto.

Figura 1: (a) M´ ascara Bessel B

. (b) M´ ascara Bessel B

.

Figura 2: (a) I: Actinocyclus ingens - Rattray. (b) |F T (I)|. (c) M´ ascara Bessel B

. (d) H

= B

∗ |F T (I)|, donde ∗ representa una multiplicaci´ on punto a punto. (e) Firma de la Fig. 2a.

Posteriormente, se enumeran los anillos en H

del centro hacia afuera, para obtener el siguiente conjunto

indice = {indice del anillo ∈ ¯ n} , (5) aqu´ı ¯ n = {1, . . . , n : n ∈ N}. Despu´es, los valores de intensidad en cada uno de los anillos se suman para generar la siguiente funci´ on firma [6],

f irma = indice → A ⊂ R, f irma(indice del anillo) = X

H

, si H

(x, y) pertenece a indice del anillo. (6)

En la Fig. 2e se muestra la gr´ afica de la funci´ on f irma asociada a la Fig. 2a.

3 Clasificaci´ on

Para el reconocimiento de patrones, primeramente hay que determinar la base de datos de las im´ agenes de referencia, β

= R

∈ M

: j = 1, . . . , k; k ∈ N . A cada imagen R

hay que asignarle sus dos firmas S

y S

, el super´ındice P indica que la firma proviene de la m´ ascara B

y el N de la B

. Luego, se calculan las autocorrelaciones [1, 6],

C

(S

) = F T

n

|F T (S

)| e

(x) = 1, si y(x) > 0,

(x) = 1, si y(x) ≤ 0,

= R