El procedimiento de combinación de clasificadores por relajación (REL), propuesto en este trabajo de investigación, tiene como precursor, a su vez, el trabajo de Guijarro y col. (2008). En este caso se utiliza un esquema similar, en su concepción, al propuesto en la sección anterior para los MCFs, si bien con las tres diferencias fundamentales siguientes:
a) Se utilizan las probabilidades como los estados iniciales de los nodos, que son las salidas proporcionadas por el clasificador individual BP durante su fase de decisión. Por tanto, en este caso, se cambian probabilidades por grados de pertenencia, que son los utilizados en la inicialización de los MCFs.
b) Posteriormente, son esas probabilidades las que se actualizan de acuerdo con el proceso de relajación probabilista definido en la ecuación (4.24), el cual está basado en los trabajos de investigación de Rosenfeld y col. (1976) y Hummel y Zucker (1983); sustituyendo así, al procedimiento definido en la ecuación (4.17) para los MCFs. µi 4 µk 4 µi4 µk 4 pk 1 pi 1 µk 1 µi 1 pk 2 pi 2 µk 2 µi 2 pk 3 pi 3 µk 3 µi 3 pk 4 pi 4 lk li
Clase 1 Clase 2 Clase 3 Clase 4
µk 1 µi 1 µk 2 µi 2 µk 3 µi 3 rik1 rik 2 rik 3 rik 4 Decisión cik cik cik cik t t+1
c) Los valores de los estados de los nodos comienzan siendo probabilidades en lugar de grados de pertenencia, estas probabilidades son las que se actualizan durante el proceso iterativo, constituyendo los valores de los estados de los nodos en las sucesivas iteraciones.
En resumen, el esquema correspondiente a la fase de entrenamiento, es exactamente el mismo que el propuesto en la figura 4.2; mientras que las diferencias se producen en la fase de decisión, según la descripción que se proporciona a continuación.
Para la mencionada fase de decisión, se parte de la misma estructura de redes que en el caso de los MCFs, es decir una redj por cada clase wj. El número de nodos de cada red
coincide con el número de píxeles en la imagen a clasificar. Cada nodo i en cada redj se
carga inicialmente con los valores de probabilidad proporcionados por el clasificador individual BP, tal y como se ha mencionado previamente. Así al nodo i en la redj,
representado por el vector xi cuyas componentes son los valores espectrales RGB del
píxel asociado, se le asigna la probabilidad de pertenencia a la clase wj dada por la
ecuación (3.9), de forma que el valor del estado inicial viene dado por j
(
|)
i b j i
p =P w x ,
donde el segundo término de esta expresión resulta ser dicha probabilidad, según se describe en la sección 3.3.2.2. Como en el caso de los MCFs los valores de dichos estados se escalan linealmente al rango [−1, +1] en lugar de su rango natural de valores de las probabilidades, esto es [0, +1].
El proceso de relajación probabilista o actualización de los estados viene dado por la siguiente expresión,
( )
1 1( )
( )
2 j j j i i i p t+ = f D + p t (4.24) donde j n 1 j( ) ( )j i k ik kD =
∑
= s t p t tiene el mismo significado que en el caso de la ecuación(4.17), es decir, representa la influencia externa ejercida por el resto de los nodos en la red. Como allí, mediante la aplicación de los principios de la Gestalt, dicha influencia es ejercida exclusivamente por los nodos k en la vecindad 8
i
N de i. La diferencia con
respecto a la mencionada ecuación (4.17) estriba en el hecho de que ahora son las probabilidades las que se actualizan en función de la iteración t. A la vista de la
valor medio entre
( )
j if D y el propio valor de probabilidad p tij( ) en la iteración actual.
La función f se define aquí también como la función tangente hiperbólica con el mismo
factor de suavizado, es decir
( )
j tanh( )
ji i
f D = σD con σ =0.8. Con esta definición de
la función f se consigue que el recorrido de la misma quede limitado al intervalo
[ 1, 1].− +
El coeficiente j( )
ik
s t se define exactamente igual que en la ecuación (4.22), obtenido a
partir de los denominados coeficientes de regularización y contextual. Este último definido exactamente igual que en la ecuación (4.21). La diferencia estriba en el cálculo del coeficiente de regularización con respecto al definido en la ecuación (4.19). En efecto, ahora se obtiene a partir de las probabilidades actualizadas ( )j
k
p t en cada
iteración t, estableciéndose la compatibilidad entre los nodos i y k a través de las
diferencias entre estas probabilidades y los grados de pertenencia j k
µ , éstos últimos proporcionados como salidas por el clasificador individual FC, durante su fase de
decisión. Los grados de pertenencia permanecen invariables a lo largo de todo el proceso de relajación. En consecuencia, el coeficiente de regularización se define como sigue, 1 ( ) , ( ) 0 j j m i k i j ik m i p t k i k r t k , i k µ − − ∈ ≠ = ∉ = N N (4.25)
En definitiva, en este modelo, se intercambian los roles entre los clasificadores FC y BP
en el sentido de que las inicializaciones y los estados varían según el modelo MCF o REL. En cualquier caso, la combinación de los clasificadores se realiza, en ambos casos,
durante la fase de decisión.
Es precisamente en la fase de decisión donde finalmente se determina a qué clase pertenece el píxel i, representado por su nodo equivalente. Esto se lleva a cabo a través
de los valores finales de los estados de los nodos según la regla dada en (4.26), siendo de la misma naturaleza que la definida en la ecuación (3.21).
si j( ) h( ) con 1 2
j i i
4.6
Resumen del capítulo
Este capítulo constituye la clave del trabajo de investigación llevado a cabo. En efecto, en él se describen de forma pormenorizada las estrategias de combinación propuestas. Dichas estrategias se enfocan tanto desde el punto de vista de la combinación píxel a píxel como teniendo en cuenta los píxeles a clasificar y sus vecinos. El primer enfoque da lugar, a su vez, a dos estrategias de índole local, una basada en el paradigma de la teoría de la decisión multi-criterio en el contexto fuzzy, identificada como MCDMF y la otra en la integral fuzzy, IF. En ellas intervienen seis clasificadores individuales FC, BP, BN, SO, L1 y L2, que constituyen la base de las combinaciones. El segundo enfoque origina otras dos estrategias de índole global, una basada en el paradigma de los mapas cognitivos fuzzy MCFs y otra en los procesos de relajación probabilista, REL. En el caso de las estrategias globales se utilizan solamente dos clasificadores individuales, FC y BP. Las dos estrategias globales tienen su fundamento en sendos procesos iterativos basados en la actualización de los estados de un conjunto de nodos, que se asocian con los píxeles de las imágenes a clasificar.
Entrando más detalladamente en los métodos propuestos, en las estrategias de índole local, se ha planteado un procedimiento para determinar la importancia relativa de los clasificadores individuales con el fin de aprovechar dicha información durante la combinación de los mismos.
Por lo que respecta a las estrategias globales, se han definido dos coeficientes, llamados de regularización y contextual, que establecen ciertas relaciones de compatibilidad entre el píxel que se está clasificando y sus vecinos. Estas relaciones tienen su inspiración en los principios de la Gestalt, ya que su aplicación en el campo de las imágenes resulta relativamente fácil a la vez que intuitivo.
En todos los métodos propuestos, tanto locales como globales, la combinación se lleva a cabo durante la fase de decisión, siendo aquí donde se determina la pertenencia de cada píxel a una de las clases disponibles y establecidas durante la fase de entrenamiento. En la fase de aprendizaje, se ha diseñado un mecanismo por el cual, a partir de un clasificador de naturaleza supervisada se consigue un procedimiento de aprendizaje no
supervisado. Esto representa un cierto avance hacia la automatización del proceso conjunto entrenamiento/decisión.
La eficacia de los métodos propuestos se verifica en el capítulo cinco, donde se diseña una batería de pruebas con tal propósito.