4. Modelo propuesto
4.2. Puntos claves de UNL sobre los que se asienta el modelo
4.2.1. Elementos de la oraci´ on en UNL
4.3.2.3. Casos especiales: la comparaci´ on, los superlativos
En UNL encontramos algunos casos especiales de par´afrasis que requieren un mapeo especial. Algunos de ellos se exponen a continuaci´on:
La comparaci´on
La comparaci´on (expresada en UNL mediante la relaci´onBAS), implica el uso de las UWsmore,less yas as (a los que llamaremos comparativos). La estructura ser´a la expuesta en la Figura 4.6.
Las posibles par´afrasis se pueden dar de las siguientes maneras en el caso de less y more:
Negar el verbo (atributo @not) e intercambiar los conceptos: “Luis corre m´as r´apido que Juan” y “Juan no corre m´as r´apido que Luis”.
Intercambiar los conceptos y usar una caracter´ıstica ant´onima:“Luis corre m´as r´apido que Juan” y “Juan corre m´as despacio que Luis”.
Figura 4.6: Estructura de la comparaci´on. Las relaciones b´asicasaojyobjpueden ser otras (depender´an del tipo de verbo con el que tratemos). Adem´as, en algunos casos puede no mencionarse la caracter´ıstica (por ejemplo, en“10 es m´as que 5”, aunque en ese caso ya no aparecer´ıa la relaci´on BAS y no entrar´ıa en este caso), y hay que tener en cuenta que tanto los conceptos como la caracter´ıstica pueden ser nodos independientes o n´ucleos de subgrafos.
Intercambiar los conceptos y usar el comparativo opuesto: “Luis corre m´as r´apido que Juan” y “Juan corre menos r´apido que Luis”.
Mantener los conceptos y usar el comparativo opuesto y la caracter´ıstica ant´onima:“Luis corre m´as r´apido que Juan” y “Luis corre menos despacio que Juan”.
Otro posible caso de par´afrasis vendr´ıa con la aparici´on de@not y la negaci´on de la caracter´ıstica o el comparador, pero son casos algo extremos y que suelen implicar cierta intenci´on, por lo que no contemplaremos ese caso. Si encontramos en cambio una comparaci´on de igualdad (con as as), la ´unica posibilidad de par´afrasis pasa por intercambiar los conceptos, pero depender´a tambi´en de la situaci´on, as´ı que no lo consideraremos tal. En los ejemplos de aplicaci´on del modelo (Secci´on4.3.6) encontramos un caso pr´actico de comparaci´on.
Los superlativos
En el caso de tratar con superlativos (least ymost), estas UWs actuar´an sobre la caracter´ıstica mediante la relaci´onMAN. La ´unica par´afrasis posible (adem´as de la sinonimia) es que se d´e el superlativo opuesto y un ant´onimo (“Luis es el m´as alto” y “Luis es el menos bajo”).
La coordinaci´on
Como ya hemos comentado al explicar los modificadores ModSC en la Secci´on
4.3.1.2, en ocasiones se pueden intercambiar los subgrafos a los que unen las rela- ciones de coordinaci´on; es lo mismo, por ejemplo“Comprar patatas y manzanas” que “Comprar manzanas y patatas”. No obstante, hay casos en los que el orden es relevante “Compro eso y voy a tu casa” no es lo mismo que “Voy a tu casa y compro eso”, pues implica alg´un tipo de preferencia o informaci´on temporal. Es por ello que en lo respectivo a la coordinaci´on (aplicable a las relaciones del grupo ModSC:AND,ORyAPN), consideraremos que un cambio en el orden puede producir
par´afrasis, pero s´olo la verificaremos si lo que une no son verbos o subgrafos con n´ucleo verbal. Adem´as, consideramos que si se dan ANDy APN, u OR y APN juntos con sustantivos, pueden intercambiarse los conceptos, pues en una enumeraci´on de sustantivos el orden no es relevante (“patatas, manzanas y peras” equivale a “manzanas, peras y patatas”).
4.3.3.
Selecci´on de atributos
Como ya mencionamos previamente, los atributos en UNL son libres (los ex- pertos UNL de cada lengua pueden introducir nuevos atributos cuando lo consi- deren necesario) y en muchos casos subjetivos; esta falta de estandarizaci´on en comparaci´on con las relaciones UNL provoca que el tratamiento de los atributos s´olo pueda sistematizarse hasta cierto punto. La idea tras la selecci´on realizada es, por tanto, decidir qu´e atributos deben coincidir necesariemente en caso de darse; un ejemplo claro es el tiempo verbal: aunque tengamos exactamente el mismo contenido en dos grafos, si tienen distinto tiempo verbal no puede exis- tir la par´afrasis (“Yo voy a comer patatas” y “Yo com´ı patatas”, por ejemplo). Tras analizar los atributos m´as habituales dentro de lasguidelines, extraemos las
siguientes consideraciones en cuanto a atributos que deben coincidir obligatoria- mente:
N´umero (@pl): si en un nodo aparece el plural, en su correspondencia con el grafo a comparar debe aparecer tambi´en. Existen ciertos matices en esta afirmaci´on, pero depender´an de la propia relaci´on que mantengan las palabras; por ejemplo, el equipo y los jugadores, o la poblaci´on y los habitantes, dependiendo del contexto, pueden referirse a lo mismo, pero consideramos esto parte del sentido com´un, fuera por tanto de nuestro ´area de actuaci´on (como indicamos en las hip´otesis de trabajo).
Determinaci´on (@def,@indef y@generic): si en una oraci´on habl´ase- mos de un concepto indefinido y en otra del mismo concepto pero determi- nado, no hablar´ıamos de lo mismo (“Un ni˜no juega” y“El ni˜no juega”, por ejemplo, no tienen por qu´e referirse al mismo ni˜no). Sin embargo, aqu´ı tam- bi´en entramos (al igual que en el caso de los plurales) en el tipo de relaci´on que une dos conceptos: un perro y el animal en frases consecutivas pueden referirse a lo mismo, ya que mantienen una relaci´on de hiperonimia. No obstante, a nivel de comparaci´on frase a frase no necesitaremos mantener el llamado “foco del discurso”2.
Negaci´on (@not): si una frase est´a en negativo, debe estarlo tambi´en la otra (o bien debe expresar lo contrario por medio de antonimia). Es el caso de “Es alto” y “No es alto”, donde en el grafo UNL encontrar´ıamos los mismos nodos con las mismas palabras universales pero en el segundo caso vendr´ıa a˜nadido el atributo @not. En los ejemplos de la Secci´on 4.3.6 encontramos un caso donde la par´afrasis no se da precisamente por esta raz´on.
Atributos verbales y de tiempo: entendemos que si dos oraciones se expresan en distinto tiempo o modo verbal no van a poder decir lo mismo, as´ı como sucesos con distintos tempos. Por tanto, los siguientes atributos deber´an coincidir necesariamente:
• Tiempo:@present, @past, @progress, @begin, @end, @complete, @con- tinue, @custom. Adem´as, existen tiempos que pueden resultar sin´oni-
2Extraemos este t´ermino de la tesis doctoral [24], refiri´endonos a un t´ermino para determinar
mos en ciertos casos, como el futuro o el condicional, que puede ex- presarse en presente o con @future (es decir, que si encontramos una frase con @future y otra en presente, a´un puede existir la par´afrasis). En estos casos, se marcar´a como posible par´afrasis.
• Modo:@imperative, @ability, @may, @obligation, @obligation.not, @pos- sibility, @probability, @should y las posibles correspondencias entre ellas.
• Tempo:@just, @soon, @yet, @although, podr´ıan corresponderse tam- bi´en con algunas relaciones UNL del tipo TIM.
4.3.4.
Medida de similaridad
En el marco de la tesis, hemos observado que no existe ninguna medida de similaridad sem´antica asociada a UNL. Es por ello que parte del trabajo se ha destinado al estudio de las palabras universales y a la creaci´on de una medida que se ajuste a sus caracter´ısticas pertinentes (repasadas anteriormente en 4.2.1.2). Obviamente, esta medida devolver´a para una misma UW el valor 1, que se con- sidera el umbral a partir del cu´al los UWs son sin´onimos (siendo -1 el umbral inferior para la antonimia, pero no estando acotada por dichos valores). Esta fun- ci´on de similaridad no cumplir´a por tanto las condiciones matem´aticas para ser considerada distancia (pues puede tomar valores negativos, no toma valor 0 para una misma UW y no tiene por qu´e cumplir la desigualdad triangular).
La medida de similaridad entre dos verbos UW se dar´a por medio de pesos, que dependen de la comparaci´on de las restricciones de las palabras universales de la siguiente manera:
4.3.4.1. Verbos
1. El tipo de verbo debe ser igual; si no, se descarta la sinonimia (el resultado es 0).
2. Si se da la condici´on anterior, tambi´en puede ser que entre icly el tipo de verbo (do, be, occur) haya algun caso de hiperonimia o hiponimia (como ve´ıamos por ejemplo conshow enexpose(icl>show>do,equ>exhibit,agt> thing,obj>thing,rec>thing)). Si se diese una coincidencia en ese nivel se
le dar´ıa un peso extra entre 0 y 0,5 (cuanto m´as a profunda se diese dicha coincidencia, mayor peso, siendo m´as profunda cuanto m´as a la izquierda est´e en la jerarqu´ıa de flechas). M´as tarde veremos la funci´on espec´ıfica.
3. El siguiente punto a observar es la propia restricci´on de sinonimia, equ. Entre dos UW, esta sinonimia puede ser:
Bidireccional: ambos verbos tienen la misma UW en equ (como en el caso deexpose(icl>show>do,equ>exhibit,...) y demonstrate( icl>show>do,equ>exhibit,...) ), o se tienen mutuamente entre s´ı. Esto da un peso de 1 a la similaridad.
Unidireccional: uno de los verbos tiene como equ al otro, pero no a la inversa. En este caso, podr´ıan ser necesarios modificadores para que se diese la par´afrasis. Pensemos por ejemplo en el caso “Para cenar com´ı patatas” y “Cen´e patatas”: cenar es un caso concreto de comer (ser´ıa pues un hip´onimo), pero la modificaci´on dada por para cenar complementa al hiper´onimo en la frase, provocando la par´afrasis. No obstante, este tipo de comprobaciones necesitar´ıan de una base del conocimiento, una de las limitaciones que mencion´abamos en el planteamiento de la tesis. Dado que no entramos en ese terreno, en caso de encontrar un equ unidireccional, daremos un 0,75 de similaridad, pues no podemos asegurarla al no poder comprobar los modificadores necesarios.
Las ideas anteriores se aplican igual para ant, la restricci´on de antonimia. Si un verbo fuese ant´onimo del otro, daremos valor negativo a la medida (-1 en caso de ser bidireccional y -0,75 en caso de ser unidireccional). Esto ser´a ´util si en caso de la comparaci´on encontramos por ejemplo el atributo@not o la doble negaci´on.
Diferentes equ o ant: en este caso miraremos sucesivamente las res- tricciones de las UWs relacionadas hasta encontrar relaci´on o hasta un determinado nivel de profundidad. Puede que por ejemplo quemorada y hogar no aparezcan como sin´onimos, pero que morada se considere sin´onimo derefugio,hogar decasa y querefugioycasa s´ı se relacionen de alguna manera. En este caso sumaremos tan solo 0,25.
Ninguna relaci´on de equ o ant: si no encontramos ninguna rela- ci´on de tipo sinonimia, no podemos descartar la existencia de la misma.
Una posible soluci´on es buscar la relaci´on entre las headwords en un recurso externo, como un tesauro o una red sem´antica. Tambi´en po- demos recurrir a lematizadores y distancia en cadenas de caracteres. En este caso, las restricciones tipo fld y com pueden ayudar en la desambiguaci´on.
4. Restricciones argumentales: dos verbos sin´onimos deben tener las mis- mas restricciones argumentales. Es posible que alguno cubra m´as relaciones o permita que dichas relaciones las desempe˜nen UWs m´as gen´ericas en la jerarqu´ıa (siendo por ejemplo,thingm´as gen´erico queperson y menos que uw); bastar´a en este caso con que la intersecci´on de los argumentos cubiertos en la frase no sea vac´ıa. Si tenemos por ejemplo que en un verbo elagt>uw y en otro queagt>person, puede darse la par´afrasis, pero entre agt>plant y agt>person no es posible (pues asumimos que el contexto de aplicaci´on no es el mismo, imposibilitando la par´afrasis).
La funci´on sim(U W1, U W2), siendo las UWs de la forma U Wi = HWi(icl >
aiKi > ... > ai2 > ai1 > tipo, equ > bi, ant > ci, rel1 > uwi1, ..., relN > uwiNi)
para verbos (y en general), quedar´a seg´un lo expuesto previamente de la siguiente manera:
sim(U W1, U W2) =simicl(U W1, U W2)·
(simequ(U W1, U W2) +simant(U W1, U W2))·simrel(U W1, U W2)
con
simicl(U W1, U W2) =
(
0 siU W1 y U W2 son verbos de distinto tipo.
1 + 2·kK si son del mismo tipo.
siendo k =max(x, x0) el mayor ´ındice en el que coincidan las restricciones de ambas UWs, es decir, a1x =a2x0, y K =max(K1, K2).
simequ(U W1, U W2) = 1 sib1 =b2 ob1 =HW2, b2 =HW1 0,75 sib1 =HW2 o b2 =HW1
0,25 si∃j ≤J tal que con j concatenaciones encontramos una equivalencia com´un.
f(HW1, HW2) si no hay ning´un equni ant
donde J es un par´ametro que indica a qu´e profundidad queremos buscar la similaridad (intuitivamente, el m´aximo de equ que concatenaremos buscando iterativamente en losequde cada UW hasta dar con alg´un punto com´un) yf(x, y) una funci´on de similaridad aplicable en recursos externos o cadenas de caracteres, normalizada a 1. simant(U W1, U W2) = −1 si c1 =c2 oc1 =HW2, c2 =HW1 −0,75 si c1 =HW2 oc2 =HW1
−0,25 si ∃j ≤J tal que con j concatenaciones encontramos una antonimia com´un.
f(HW1, HW2) si no hay ning´unequ niant
simrel(U W1, U W2) =
(
1 si∀relin tal que in≤Ni, rel1n∩rel2n6=∅
0 si no
si alguno de los dos verbos tiene m´as relaciones que otro, bastar´a con que no aparezcan en el grafo en cuesti´on (depender´a de la forma de aplicar el verbo).