CLASIFICACI ´ ON DE FRAGMENTOS DE OBJETOS EN IM ´ AGENES DIGITALES
Carolina Barajas-Garc´ıa
1, Selene Solorza
1y Josu´ e ´ Alvarez-Borrego
21
Facultad de Ciencias, UABC.
2Divisi´ on de F´ısica Aplicada, CICESE e-mail: [email protected], [email protected]
Resumen
La automatizaci´ on del reconocimiento de fragmentos de objetos es un problema de actualidad que por s´ı solo es de gran inter´ es y de un reto para la humanidad al intentar emular las funciones del ojo y del cerebro humano mediante una computadora. Para nosotros los humanos es muy sencillo identificar un fragmento de objeto que se encuentra aislado en un ambiente y pudiera ser un poco m´ as complicado identificarlo si est´ a parcialmente oculto por otro objeto, es decir un problema de oclusi´ on. Transmitir esas instrucciones a un sistema digital es un proceso no trivial. En este trabajo se presenta un sistema digital para la clasificaci´ on de fragmentos de objetos. El fin ´ ultimo de este tipo de trabajos es que estos algoritmos se utilicen, como por ejemplo, en el desarrollo de ojos artificiales utilizados por personas que presentan alg´ un nivel de ceguera.
1 Introducci´ on
El reconocimiento de patrones es un ´ area del procesamiento de im´ agenes, en donde se es- tudian los patrones en la imagen, para extraer la informaci´ on relevante que nos permita describirla de manera cuantitativa, ´ unica y completa [4]. Para automatizar la extracci´ on de patrones, identificaci´ on y clasificaci´ on se pueden utilizar sistemas digitales de reconocimiento de patrones. Un sistema digital, es aquel en el que se realizan operaciones mediante d´ıgitos, las cuales por lo regular se representan en el sistema binario. B´ asicamente un sistema dig- ital se conforma de las etapas de ingreso, procesamiento, transmisi´ on, almacenamiento y despliegue de los datos digitales [5].
Los sistemas digitales de reconocimiento de patrones basados en correlaciones han sido objeto de inter´ es por muchos a˜ nos, sus aplicaciones son diversas y variadas. Por ejemplo en microbiolog´ıa tales sistemas digitales se usan para clasificar microorganismos como bacterias, cromosomas, c´ elulas infectadas, etc. En aspectos de seguridad se utilizan en la identificaci´ on de modelos y placas de autom´ oviles, estructuras ´ oseas, huellas dactilares, entre otros [4]. Los sistemas digitales de correlaci´ on se basan en el hecho de que las im´ agenes son invariantes bajo un conjunto de transformaciones (traslaci´ on, rotaci´ on y escala), por lo que son una herramienta muy ´ util en la identificaci´ on de estructuras microsc´ opicas y macrosc´ opicas, ya que reconocer´ an al objeto independientemente de la posici´ on, orientaci´ on y tama˜ no en el que se presente. Dichas invarianzas se llevan a cabo mediante la transformada de Fourier y Escala en conjunto con filtros lineales y no lineales [2, 6].
1
En este trabajo se presenta un sistema digital de correlaci´ on lineal invariante a traslaci´ on y rotaci´ on que clasifica fragmentos de objetos en im´ agenes digitales. En la secci´ on 2, se describen las componentes del sistema digital de reconocimiento de patrones. En la secci´ on 3, se determina el nivel de confianza que tiene el sistema en la clasificaci´ on de las im´ agenes digitales. Finalmente, en la secci´ on 4 se exponen las conclusiones.
2 El sistema digital
El sistema digital trabaja con im´ agenes en escala de grises de n×n pixeles. Sea I una imagen dada, donde (x, y) es un pixel de la imagen e I(x, y) su correspondiente valor de intensidad, para x, y ∈ {1, . . . , n} y con (c
x, c
x) el pixel central de la imagen, definido por
c
x=
n2
+ 1, si n es par,
b
n2c + 1, si n es impar, (1)
aqu´ı bzc redondea a z al entero m´ as cercano a −∞. El sistema digital es invariante a traslaci´ on, lo cual se logra de una manera sencilla al utilizar el m´ odulo de la transformada de Fourier de la imagen, puesto que para α, β ∈ R, se tiene que
|F T (I(x, y))| = |F T (I(x + α, y + β))|. (2)
2.1 M´ ascaras Bessel
Para obtener la invarianza a rotaci´ on, se construyen m´ ascaras binarias de anillos conc´ entricos usando la raz´ on de la funci´ on Bessel de primer tipo y primer orden entre su argumento,
y(x) =
J1(x−cx)x−cx
, if x 6= c
x,
1, if x = c
x, (3)
donde x = 1, . . . , n. Con base en la ec. (3), se obtienen las siguientes funciones binarias Z
P(x) = 1, si y(x) > 0,
0, si y(x) ≤ 0, Z
N(x) = 1, si y(x) ≤ 0,
0, si y(x) > 0. (4) Finalmente, tomando el eje vertical x = c
xcomo eje de rotaci´ on, las funciones Z
P(x) y Z
N(x) se rotan 180 grados para obtener cilindros conc´ entricos de altura uno y diferente grosor, todos centrados en (c
x, c
x). Tomando una secci´ on transversal con respecto al eje de simetr´ıa, se generan las m´ ascaras Bessel B
Py B
Nde la Fig. 1a y b, respectivamente [1, 6].
2.2 Las Firmas de la Imagen
El primer paso para obtener la firma de una imagen, por ejemplo la de la Fig. 2a, es
filtrar el |F T (I)| (Fig. 2b) por una m´ ascara Bessel, digamos la B
P(Fig. 2c), es decir,
hacer H
P= B
P∗ |F T (I)| (Fig. 2d), donde ∗ representa una multiplicaci´ on punto a punto.
Figura 1: (a) M´ ascara Bessel B
P. (b) M´ ascara Bessel B
N.
Figura 2: (a) I: Actinocyclus ingens - Rattray. (b) |F T (I)|. (c) M´ ascara Bessel B
P. (d) H
P= B
P∗ |F T (I)|, donde ∗ representa una multiplicaci´ on punto a punto. (e) Firma de la Fig. 2a.
Posteriormente, se enumeran los anillos en H
Pdel centro hacia afuera, para obtener el siguiente conjunto
indice = {indice del anillo ∈ ¯ n} , (5) aqu´ı ¯ n = {1, . . . , n : n ∈ N}. Despu´es, los valores de intensidad en cada uno de los anillos se suman para generar la siguiente funci´ on firma [6],
f irma = indice → A ⊂ R, f irma(indice del anillo) = X
H
P, si H
P(x, y) pertenece a indice del anillo. (6)
En la Fig. 2e se muestra la gr´ afica de la funci´ on f irma asociada a la Fig. 2a.
3 Clasificaci´ on
Para el reconocimiento de patrones, primeramente hay que determinar la base de datos de las im´ agenes de referencia, β
R= R
j∈ M
n×n: j = 1, . . . , k; k ∈ N . A cada imagen R
jhay que asignarle sus dos firmas S
PRj
y S
NRj
, el super´ındice P indica que la firma proviene de la m´ ascara B
Py el N de la B
N. Luego, se calculan las autocorrelaciones [1, 6],
C
L(S
αRj
) = F T
−1n
|F T (S
αRj
)| e
iϕ|F T (S
αRj
)| e
−iϕo
, (7)
donde ϕ es la fase de la transformada de Fourier de la firma S
αRj
, para α = P o N . Poste- riormente, se obtienen los escalares η
αRj
= max n
C
L(S
αRj
) o
con los cuales se ponderan las firmas como ˜ S
αRj
= η
αRj
S
αRj
.
El patr´ on en las im´ agenes de referencia R
jest´ a caracterizado mediante el valor
r
Rj=
max n C
L( ˜ S
PRj
) o (N
P− 1)σ
2S˜P Rj
max n C
L( ˜ S
NRj
) o (N
N− 1)σ
2S˜N Rj
, (8)
donde N
αes la cardinalidad del dominio de ˜ S
αRj
y σ
˜Sα Rj
es su desviaci´ on est´ andar. Ahora, para determinar el patr´ on en la imagen problema P , lo primero a realizar es la obtenci´ on de sus dos firmas ponderadas ˜ S
αP
. Despu´ es, se calculan las correlaciones de ˜ S
αRj
y ˜ S
αP
mediante [1, 6]
C
L( ˜ S
αRj
, ˜ S
αP
) = F T
−1n
|F T ( ˜ S
αP
)| e
iφ|F T ( ˜ S
αRj
)| e
−iϕo
, (9)
donde φ es la fase de la transformada de Fourier de la firma ˜ S
αP
. Para, finalmente caracterizar a la imagen problema P con el valor determinado por
r
P=
max n C
L( ˜ S
PRj
, ˜ S
PP
) o (N
P− 1)σ
S˜P Rj
σ
S˜P Pmax n C
L( ˜ S
NRj
, ˜ S
NP
) o (N
N− 1)σ
S˜N Rj
σ
S˜N P. (10)
Si r
Pes similar a r
Rj, se tiene que la imagen problema P es igual a la imagen de referencia R
j, caso contrario es otra imagen.
Puesto que la imagen R
j, por ejemplo la Fig. 2a, puede presentarse en el plano Cartesiano en cualquier ´ angulo de rotaci´ on, entrenaremos al sistema con 360 im´ agenes rotadas de R
j. Esas im´ agenes se obtienen al rotar a R
jtrescientos sesenta grados con ∆θ = 1
◦. Despu´ es, se calculan las correspondientes r
θRj
para cada una de esas im´ agenes rotadas, aqu´ı 0 ≤ θ ≤ 359 representa el ´ angulo al cual se rot´ o R
j. Como los datos r
θRj
no satisfacen una distribuci´ on
normal pero est´ an normalizados, se utiliza la distribuci´ on Z de Fisher para determinar los intervalos de confianza [3]. El valor Z de Fisher para r
θRj
est´ a dado por
Z
rθ Rj= 1.1513 ln
1 + r
θRj
1 − r
θRj
. (11)
El intervalo de confianza del 95% para la media Z
rθRj
, est´ a dado por
Z
−rθ
Rj
, Z
+rθ
Rj
=
Z
rθRj
− 1.96 σ
Z, Z
rθ Rj+ 1.96 σ
Z, (12)
usando una desviaci´ on est´ andar de σ
Z=
√n−31, donde n es el tama˜ no de la muestra, en este caso es n = 360. El intervalo de confianza del 99% para la media Z
rθRj
, est´ a establecido mediante
Z
−rθ
Rj
, Z
+rθ
Rj
=
Z
rθRj
− 2.575 σ
Z, Z
rθRj
+ 2.575 σ
Z. (13)
Finalmente, el intervalo de confianza para r
θRj
se obtiene como
ρ
−rθ Rj= exp
2Z
−rθ
Rj
− 1
exp 2Z
−rθ
Rj
! + 1
, ρ
+rθ Rj= exp
2Z
+rθ
Rj
− 1
exp 2Z
+rθ
Rj
! + 1
, (14)
de ah´ı que el intervalo de confianza para el coeficiente de correlaci´ on verdadero ρ
rθRj
sea [3],
ρ
−rθ
Rj
≤ ρ
rθRj
≤ ρ
+rθ
Rj
. (15)
De la imagen de referencia R
jy sus im´ agenes rotadas se tienen 360 valores de ρ
−rθ
Rj
y otros 360 valores para ρ
+rθ
Rj
, entonces el intervalo de confianza para decidir si una imagen problema es igual a R
j, independientemente del ´ angulo de rotaci´ on que presente en el plano, est´ a definido por
min
0≤θ≤359ρ
−rθ
Rj
, max
0≤θ≤359ρ
+rθ
Rj