Análisis de resultados
exterior 4 3 5 4500 Datos extraídos manualmente a partir de una imagen procedente de un bosque de robles, tomada en un día nublado.
5.4 Diseño de una estrategia general de pruebas
Como se ha mencionado reiteradamente, todos los clasificadores descritos en este trabajo, incluyendo las estrategias combinadas, incluyen tanto una fase de entrenamiento como una de decisión. Los métodos de clasificación individuales se entrenan para después combinarlos convenientemente durante la fase de decisión. Parece lógico pensar, por tanto, que el entrenamiento debe influir necesariamente en el proceso. En consecuencia, para comprobar cómo afecta el aprendizaje a los resultados, se ha diseñado la estrategia general de pruebas, que se expone a continuación, basada en cuatro pasos. En cada paso se realiza un aprendizaje incremental con respecto al paso previo, cuyo objetivo consiste en verificar, cómo a medida que aumenta el aprendizaje se obtienen mejores resultados en la clasificación de las nuevas muestras. Esto tiene su
explicación lógica, ya que cuanto mayor es el conocimiento adquirido por el sistema, mejor y más fácil resulta la decisión a tomar.
Un segundo objetivo de la estrategia de pruebas diseñada consiste en verificar el mejor comportamiento de los métodos combinados frente a las estrategias individuales y dentro de los combinados, comprobar el comportamiento de las estrategias propuestas en este trabajo de investigación frente al resto de las combinaciones.
Los cuatro pasos mencionados son los que se describen a continuación, en ellos se procesan los conjuntos de imágenes SI (inicial), S0, S1, S2 y S3 descritos en la sección 5.2.2 como se indica seguidamente. Por consiguiente, en esta fase se utilizan las imágenes aéreas descritas en la mencionada sección.
a) PASO 0 (inicial):
El conjunto de imágenes procesadas en este paso es exactamente el SI con las 12 imágenes seleccionadas aleatoriamente del conjunto de las 52 disponibles. El objetivo de este paso consiste básicamente en estimar el mejor número de clases existente en dichas imágenes a partir de las muestras disponibles, procedentes de ellas. Para obtener las muestras se realiza un submuestreo por dos sobre cada imagen, que consiste en tomar una fila y una columna de cada dos. Por consiguiente, dado que las imágenes originales son de 512×512 píxeles y que las muestras son píxeles con sus componentes espectrales como propiedades, de cada imagen se obtienen 256×256 muestras, resultando en total 12×256×256 = 786432 muestras para este primer paso inicial.
Con estas muestras se inicia el proceso de partición de las mismas en c clases, para ello se aplica el procedimiento no supervisado descrito en la sección 4.2.1 o equivalentemente en la sección 4.4.1. El procedimiento es que se describe en las mencionadas secciones, sintetizado como sigue:
1. Desde c = 1 hasta c = 8 realizar el proceso de partición de las muestras en clases mediante el procedimiento pseudo-aleatorio descrito en la sección 3.3.1.1.
2. Obtener las variaciones relativas de SE para cada partición obtenida con el actual c, según las ecuaciones (5.5) o equivalentemente su precursora (3.43).
3. Determinar si la partición es válida o no en función de que se verifique o no la relación de la ecuación (5.6).
4. Si la partición es válida, el número de clases para el conjunto de muestras dado se establece el valor de c correspondiente.
5. Conocido el número de clases, las muestras quedan definitivamente asignadas a las respectivas clases, de este modo se pueden estimar los parámetros de aprendizaje asociados con los diferentes clasificadores individuales mediante los correspondientes procesos de entrenamiento, descritos en el capítulo tres. Los parámetros aprendidos se almacenan en la BC.
b) PASO 1
A diferencia del paso previo, donde sólo se realiza la fase de entrenamiento, en éste se lleva a cabo en primer lugar un proceso de decisión para clasificar los píxeles de las imágenes de los conjuntos S0 y S1. En segundo lugar se realiza un nuevo proceso de entrenamiento como se describe seguidamente.
Dados los conjuntos S0 y S1, los píxeles pertenecientes a dichas imágenes se clasifican como pertenecientes a alguna de las c clases obtenidas en el PASO 0. Tras lo cual se calculan los errores de clasificación por comparación de los resultados obtenidos con las correspondientes imágenes de referencia, estas últimas se obtienen según se describe posteriormente en la sección 5.6.
Las muestras clasificadas procedentes del conjunto S1 se añaden como nuevas muestras de entrenamiento a las ya existentes provenientes del conjunto SI. Con todas estas nuevas muestras de entrenamiento se procede a realizar un nuevo proceso de entrenamiento con todos los clasificadores individuales, naturalmente manteniendo el mismo número de clases ˆc ya prefijado. En este nuevo proceso de entrenamiento se estiman de nuevo los parámetros de aprendizaje involucrados en los clasificadores individuales, que quedan finalmente almacenados en la BC y ésta actualizada consecuentemente.
Las muestras clasificadas procedentes de S0 no participan en este nuevo proceso de entrenamiento, esto se ha decidido así intencionadamente con el fin de verificar a través del conjunto testigo S0 cómo influye el proceso de aprendizaje sobre él durante su
clasificación en los pasos posteriores. De esta forma, al no utilizarse dicho conjunto durante el entrenamiento, se evita su propia influencia en su clasificación.
c) PASO 2:
En este paso se procede del mismo modo que en el PASO 1, si bien utilizando los conjuntos S0 y S2. Ahora los resultados de la clasificación procedentes de S2 se añaden a las muestras de entrenamiento disponibles con el fin de realizar un nuevo proceso de entrenamiento; tras lo cual, los nuevos parámetros aprendidos quedan almacenados en la BC. Como en el paso previo, las muestras clasificadas procedentes de S0 no se utilizan en el entrenamiento.
d) PASO 3:
En este paso se procede del mismo modo que en los PASOS 1 y 2, si bien utilizando los conjuntos S0 y S3, de forma que de nuevo se clasifican las muestras procedentes de estos conjuntos, no obstante, ya no se realizan más procesos de entrenamiento.
Como se ha mencionado previamente, en los PASOS 1 y 2 se añaden nuevas muestras para realizar un nuevo proceso de entrenamiento. El número de muestras añadidas en cada uno de estos dos pasos resulta ser 10×512×512 = 2621440, que se corresponde con el resultado de multiplicar el número de píxeles de cada imagen por el número de imágenes en cada conjunto S1 y S2. El número total de muestras de entrenamiento utilizadas durante el proceso de pruebas es, por tanto, la suma de muestras procedentes de las imágenes del conjunto SI, más las procedentes de los conjuntos S1 y S2 que se introducen en los PASOS 1 y 2 respectivamente, haciendo un total de
12 256 256 2 10 512 512 6029312× × + × × × = muestras.
El proceso de pruebas descrito previamente se sintetiza en la figura 5.4, según las dos fases contempladas: decisión y entrenamiento. En él se sigue la numeración indicada
alternando ambas fases de entrenamiento y decisión según se indica:
1) Entrenamiento con las muestras procedentes de SI, se estima el número de clases
más apropiado c y la partición de los datos en esascclases.
3) Entrenamiento con las muestras procedentes de SI y S1
4) Clasificación de las muestras proporcionadas por los conjuntos S0 y S2. 5) Entrenamiento con las muestras procedentes de SI, S1 y S2
6) Clasificación de las muestras proporcionadas por los conjuntos S0 y S3.
Tras cada proceso de clasificación se procede a determinar los porcentajes de error obtenidos en ese momento para cada imagen por comparación con las imágenes de referencia. Por tanto, como puede observarse e indicado previamente, los errores del conjunto S0 se computan tres veces; esto es, en los PASOS 1, 2 y 3, con el fin de determinar su evolución según progresa el aprendizaje.
Por otro lado, tras cada proceso de entrenamiento, los parámetros estimados por cada uno de los clasificadores se almacenan en la BC para su posterior recuperación durante la siguiente fase de decisión.
PASO 0 PASO 1 PASO 2 PASO 3
SI S0 + S1 S0 + S2 S0 + S3 decisión entrenamiento FC S1 S2 Partición + BC BC BC actualización 1 2 3 4 5 6
Figura 5.4 Síntesis de la estrategia de prueba
En la sección 5.5 se describe la fase de entrenamiento inicial realizada en el PASO 0, que incluye la estimación del mejor número de clases. En la sección 5.6 se describe el proceso para generar las imágenes de referencia. Posteriormente, en la sección 5.7 se
analizan los resultados obtenidos en los PASOS 1 a 3 por comparación con esas imágenes de referencia.