La arquitectura de una base de conocimiento léxico conceptual: implicaciones lingüísticas
POSTULADOS DE SIGNIFICADO GUIONES
2.1 El módulo conceptual
El módulo conceptual, que almacena el conocimiento del sentido común que forma parte del razonamiento humano, consta de tres componentes diferentes, que están, a su vez, inspirados en las distinciones establecidas por el modelo de memoria a largo plazo de
Tulving (1985), distinciones que introducimos entre paréntesis:
a) La ontología (o conocimiento semántico) tiene el formato de una jerarquía conceptual IS-A que permite la herencia múltiple no monotónica70. Una ontología nos proporciona una red jerarquizada de todos los conceptos que tenemos en la mente (cf. la Sección 3, que describe la tipología de las unidades conceptuales).
b) El cognicón (o conocimiento procedimental) presenta el conocimiento procedimental que almacenamos en esquemas o guiones conceptuales. Estos esquemas conceptuales o guiones describen una serie de eventos estereotípicos dentro de un marco temporal, por ej. ‘comer en un restaurante’, ‘ir de compras’, ‘cómo alquilar una vivienda en España’, ‘la celebración de una boda en Argentina’ etc.71
c) El onomasticón (o conocimiento episódico) comprende todo aquel conocimiento enciclopédico que tenemos sobre las instancias de entidades y eventos, por ej. la Ópera de Viena, el acueducto de Segovia, Borges, Buenos Aires etc. 72 A diferencia de los otros dos componentes en los que los datos se introducen manualmente, aquí aplicamos un sistema semiautomático pues es posible, a través de reglas de mapeo (mapping rules), importar los datos de recursos como DBPEDIA.
Una cuestión ulterior es determinar qué lenguaje o metodología utilizamos para la descripción del nivel cognitivo y sus tres componentes. En este sentido, a diferencia de otras bases de conocimiento que recurren
70 Recordemos que la herencia monotónica es aquélla en la que el concepto subordinado
hereda todos los atributos de su superordinado, sin excepción alguna. En cambio, la herencia múltiple no monotónica permite que un concepto tenga asignado más de un superordinado y que la información genérica de los superordinados pueda ser rebatida por la más específica de los conceptos subordinados. Por ejemplo, encontramos un problema típico que se estudia en Inteligencia Artificial y que ilustra uno de los ejemplos descritos anteriormente: los pájaros vuelan, el pingüino es un pájaro, PERO el pingüino NO vuela. Este tipo de herencia no monotónica es muy característica de las lenguas naturales, y por tanto es preciso que la ontología sepa tratar estos casos sin que exista redundancia de información ni tampoco una explosión desmesurada de excepciones. Periñán y Arcas (2010) describen el tratamiento de este tipo de herencia en el modelo ontológico de FunGramKB.
71 Para el diseño de estos guiones, hemos adoptado el modelo temporal de la lógica de intervalos de Allen(1983).
72 Por razones de espacio, en este trabajo sólo nos ocuparemos de la ontología (cf. sección 3),
por lo que remitimos a los trabajos de Periñán y Carrión (2011) para una descripción del onomasticón, y a Garrido y Ruiz de Mendoza (2011) y Periñán (2012) para una descripción del cognicón.
al desarrollo de algoritmos para la representación de las propiedades de sus unidades conceptuales, FunGramKB apuesta por crear un lenguaje de representación conceptual propio y común a los tres componentes de la base de conocimiento. Con este lenguaje, que denominamos COREL (Conceptual Representation Language), la profundidad de la descripción semántica es mayor (de grado más fino, fine-grained), que las obtenidas al aplicar métricas y algoritmos, que suelen ser más generalistas (coarse- grained), aunque con la ventaja de que los resultados se obtienen a corto plazo. Así, siguiendo la distinción que establecen Velardi et al. (1991)
entre enfoques basados en una semántica profunda y enfoques basados en una semántica superficial, podemos afirmar que uno de los aspectos dirimentes de FunGramKB con respecto a bases de conocimiento como SIMPLE y EuroWordnet es precisamente la adopción de un enfoque de representación conceptual basado en una semántica profunda. Esta decisión metodológica parece estar en consonancia con el hecho, como indicábamos en la introducción, de que una de las aplicaciones de FunGramKB es el desarrollo de agentes que permitan extraer y recuperar la información, una empresa que reclama la presencia de sistemas de notación y representación inspirados en una metodología basada en una semántica profunda, como la propuesta en nuestro proyecto. Además, desde la perspectiva de la Inteligencia Artificial, el hecho de que utilicemos COREL como el lenguaje de representación común a los tres componentes tiene implicaciones en el funcionamiento del motor de razonamiento, que podrá acceder a un gran volumen de información con un coste menor al procesar representaciones codificadas en el mismo lenguaje.
A modo de ilustración, (1a) y (1b) incluyen la representación conceptual en COREL de la instancia Tah Mahal (que formará parte del onomasticón) y del guión ‘comer en un restaurante’ (que formará parte del cognicón). Como vemos, en los dos casos el metalenguaje es el mismo73: consta de una serie de predicaciones (e1, e2,….e8) ordenadas en una sucesión temporal, un conjunto de operadores (por ej. lógicos, &, ^, |, o de razonamiento, *, +), unidades conceptuales (+ENTER_00, +WAITER_00, +WHITE_00, etc.), que nos proporcionan una descripción exacta de nuestro conocimiento episódico y procedimental de la entidad y el guión que estamos definiendo. Sean pues las siguientes representaciones:74
73 Es imposible hacer justicia a los detalles técnicos de la semántica y la sintaxis que definen
COREL, por lo que remitimos al lector a Periñán y Mairal (2010), que se ocupan por extenso de esta cuestión. Aquí, ofrecemos una visión muy sumaria, sin otro afán que ilustrar esta argumentación.
(1a)
Así, en (1a) podemos leer la siguiente información: el Tah Mahal está en la India, es blanco y de marfil, tiene cuatro torres y un minarete, alguien lo construyó en 1633, forma parte del patrimonio de la humanidad desde 1983, etc.
(1b)
En (1b) podemos leer lo siguiente: un cliente se mueve desde un origen a una meta (un restaurante) porque está hambriento; el camarero lleva al cliente a una mesa; el cliente se sienta en una silla cerca de la mesa; el camarero lleva el menú y la carta de vino y se las da al cliente; el cliente ve el menú y la carta de vinos, elige la comida y la bebida, y pide. El camarero se va a la cocina.