• No se han encontrado resultados

CAPÍTULO 2. MODELACIÓN Y AJUSTE DE UN MCD PARA EL ANÁLISIS DE LA

2.3 Agregación de MCD y obtención de prototipos

Dada la complejidad del problema de optimización enunciado en la sección anterior, existe la posibilidad real de que sea un problema multimodal, es decir, existen varias configuraciones que proveen soluciones óptimas. Por tanto, resultados diferentes de las ejecuciones del algoritmo de aprendizaje se pueden interpretar como si varios expertos establecieran los pesos causales entre los conceptos. De esta manera, un proceso de combinación de múltiples matrices causales llevaría a un consenso entre los resultados de las ejecuciones del algoritmo de aprendizaje, es decir, entre las diferentes matrices aprendidas.

Cuando se adoptan los MCD como técnica de representación del conocimiento y simulación, es posible combinar el conocimiento de múltiples expertos a través de una estrategia de agregación, o sea, es posible agregar múltiples MCD en una única representación. La agregación de MCD siempre se desarrolla en un contexto de grupo, lo que permite mejorar la calidad del modelo haciendo el sistema final más robusto ante la ausencia de información o los criterios contradictorios entre expertos. Por lo tanto, el mapa agregado será menos susceptible a los efectos negativos de la incertidumbre (Kosko 1992), típica en los sistemas basados en el conocimiento.

La capacidad de combinar varios MCD en una estructura cognitiva es una importante ventaja sobre otros enfoques (ej. Redes Bayesianas o Redes de Petri). Por ejemplo, no es trivial para un usuario la agregación de Redes Bayesianas sin un dominio de la Teoría de Probabilidades. En el

43

caso de las Redes de Petri, es posible que la red final no se corresponda con el sistema modelado, esto significa que la agregación en estas estructuras no siempre es factible (León, Rodriguez et al. 2010).

Normalmente no hay restricciones en el número de expertos que deben participar en la modelación del sistema, aunque la participación de muchos expertos implica más información. Incluso la Ley de los Grandes Números asegura con probabilidad 1.0, que si el tamaño de la muestra aumenta, entonces el promedio de la muestra convergerá a la matriz con el conocimiento que se desea representar (Kosko 1988).

Sin embargo, en la literatura no existen muchos enfoques para la agregación de MCD. El procedimiento de agregación de mapas más común fue propuesto por (Kosko 1986) y consiste en construir un mapa aumentado donde los conceptos están definidos por el conjunto unión de los nodos de los sub-sistemas que intervienen en el proceso. Luego es necesario computar la dirección e intensidad de las relaciones causales que definen la semántica del mapa aumentado. Para esto se usa un operador de agregación (ej. promedio, mediana, promedio pesado). La Figura 2.4 ilustra el proceso de agregación de dos MCD, utilizando el promedio como operador para estimar el valor causal de las relaciones del sistema final. La exactitud del mapa aumentado dependerá de la calidad del conocimiento y de la capacidad del operador de agregación para combinar el conocimiento (Dickerson and Kosko 1993). Los principales esfuerzos en esta dirección están orientados a proponer operadores menos vulnerables a los efectos del conocimiento contradictorio.

Figura 2.4 Proceso de agregación de dos MCD usando el operador promedio.

Uno de los operadores más usados en la combinación de múltiples MCD es el promedio pesado, el cual asigna a cada experto un peso 𝑤𝑖 ∈ [0,1] de credibilidad. Este peso denota una medida de confiabilidad que se le asigna a cada experto que participa en la modelación del sistema, donde

44

los mapas modelados por usuarios con mayor experticia en el tema tienen mayor importancia a la hora de combinar los pesos causales. Por ejemplo, en el proceso de revisión de un artículo científico los revisores (expertos) deben auto-evaluar su experticia en el tema del manuscrito, de forma tal que la evaluación de los revisores con mayor conocimiento será más influyente en la aceptación o rechazo del artículo. La Figura 2.5 muestra la semántica del operador promedio pesado en el contexto de la agregación de MCD.

Figura 2.5 Semántica del operador promedio pesado. Tomado de (León, Nápoles et al. 2011).

A continuación se presenta una estrategia tomada de (León, Nápoles et al. 2013) para calcular el peso 𝑤𝑖 del 𝑖-ésimo mapa, asumiendo que cada mapa que interviene en la agregación fue previamente ajustado (por ejemplo utilizando el método de aprendizaje propuesto en la sección anterior). Esta estrategia consiste en asignar a cada experto un nivel de credibilidad acorde a la capacidad de predicción del sistema modelado, pues mapas con buena exactitud serán más adecuados para clasificar nuevos patrones.

Por ejemplo, suponga dos mapas para clasificación ajustados a partir de una base de conocimiento. Si el mapa A logra clasificar correctamente el 90% de los objetos y el mapa B solamente logra acertar en el 60% de los casos, entonces el mapa A tendrá una credibilidad 𝑤𝐴 =

0.9, mientras que en el segundo será 𝑤𝐵= 0.6. Esto significa que la matriz de pesos causales del primer mapa es “más confiable” pues ciertamente la exactitud de un mapa es el reflejo de la calidad de los pesos. Por tanto, en este sencillo ejemplo el primer mapa aportará más información al sistema que resulta del proceso de agregación.

45

Siguiendo esta idea, podemos obtener mapas prototipo que agreguen el conocimiento obtenido en varias ejecuciones del algoritmo de aprendizaje. Para realizar este proceso se tomaron los mapas resultantes de 50 ejecuciones del algoritmo de aprendizaje para cada una de las bases de conocimiento estudiadas. Al igual que el ejemplo anterior, la importancia asignada a cada uno de los mapas está dada por el desempeño alcanzado en el proceso de entrenamiento, medido en la exactitud de la clasificación. De esta manera fue posible obtener un prototipo de MCD agregado para cada uno de los fármacos estudiados, expresando el conocimiento intrínseco de la base de conocimiento y reflejando las relaciones causales entre los conceptos y la variable de decisión del modelo propuesto.