Otras aplicaciones de los marcos en terminología

2.2 LA TERMINOLOGÍA BASADA EN MARCOS

2.2.3 Otras aplicaciones de los marcos en terminología

Los marcos como herramienta de representación léxico-semántica y conceptual dentro del campo de la terminología han experimentado desde principios del siglo actual. En nuestra opinión, este hecho se debe por un lado al éxito de FrameNet en el ámbito de la Lexicografía, lo cual queda

patente en que gran parte de las propuestas del uso de marco en terminología se inspiran en ella, y, por otro lado, en el giro cognitivo experimentado por la terminología como disciplina (Faber 2009a), que comporta el uso de nuevos métodos de representación del conocimiento especializado basados en los descubrimientos provenientes de las ciencias cognitivas, lo cual lleva al empleo de estructuras de gestión del conocimiento como los marcos.

Por ejemplo, los marcos se han aplicado, entre otros, a la terminología jurídica en portugués (Alves, Chishman y Quaresma 2007), a los sistemas de clasificación en Medicina (Wermuth 2009) y a la anotación de corpus médicos para el estudio de verbos especializados (Wandji, L’Homme y Grabar 2013; Wandji, L’Homme y Grabar 2014).

A pesar de que la mayoría de estudios terminológicos que hacen uso de los marcos lo hacen inspirándose en FrameNet, recientemente, han aparecido tres estudios que aplican explícitamente los principios de la TBM. En

primer lugar, Hitcheva (2014) emplea la metodología de la TBM para la representación de colocaciones verbales en el dominio del procesamiento del acero. Asimismo, Peruzzo (2014), crea un evento sobre víctimas de delitos en el dominio del derecho europeo para aplicarlo a la extracción terminológica. Finalmente, Diez-Arroyo (2015) aplica la TBM para estudiar

los neologismos en el lenguaje especializado de la moda.

En los siguientes apartados, haremos un breve repaso por algunas de las propuestas más destacadas inspiradas en la semántica de marcos y que han dado lugar a recursos terminológicos, a saber: el Kicktionary, el Dicionário da Copa do Mundo, BioFrameNet, DiCoEnviro y JuriDiCo.

2.2.3.1 Kicktionary

El Kicktionary26 _{(Schmidt 2006; Schmidt 2009) consiste en un recurso}

terminológico multilingüe (en inglés, alemán y francés) basado en FrameNet que abarca el dominio del fútbol. A diferencia de FrameNet, el

Kicktionary se creó para que constituyera un recurso dirigido a usuarios humanos con la intención de servir de asistencia en la comprensión, traducción y creación de textos sobre fútbol, sin la intención de que fuera utilizado para el procesamiento del lenguaje natural.

Metodológicamente, la mayor diferencia con FrameNet estriba en que se siguió un enfoque bottom-up, esto es, se comenzó por la caracterización de las unidades léxicas para después agruparlas (Schmidt 2006: 76). La estructura del Kicktionary está basada en la diferencia entre escena y marco. Mientras que los marcos son estructuras lingüísticas y, por tanto, tienen unidades léxicas asociadas, las escenas son exclusivamente conceptuales y no tienen unidades léxicas asociadas:

[A] frame is a structural entity used to group linguistic expressions which share a common perspective on a given conceptual scene. Where as a scene is defined in terms of pieces of abstract (and possibly non- linguistic) knowledge, the notion of a frame is concerned with the properties of concrete linguistic means of expressing this kind of knowledge. (Schmidt 2009: 102–103)

Dado el carácter multilingüe del Kicktionary, Schmidt consideró que la combinación de escenas y marcos permitía gestionar mejor las diferencias entre las lenguas incluidas en el recurso (2009: 125). Mientras que tuvieron que crearse marcos específicos de una o dos lenguas (Schmidt 2009: 109), todas las escenas contienen marcos que a su vez tienen unidades léxicas en las tres lenguas.

La única relación entre marcos en el Kicktionary es la existente entre las escenas y los marcos subsumidos en ellas, de las cuales proporcionan una perspectiva concreta. Un ejemplo de escena es Motion, que describe el movimiento

Figura 4. Ilustración incluida en la descripción de la escena Motion (Fuente: Kicktionary)

del balón o de un jugador dentro del campo. Dicha escena incluye siete marcos organizados en tres grupos: the ball moves: Ball_Move, Ball_Land y Ball_Escape; a bouncing ball: Ball_Bounce; y a player moves: Player_Move, Player_Move_With_Ball y Goal_Keeper_Advance.

Las escenas se describen igual que las definiciones de los marcos en FrameNet, aunque a diferencia de este, también se incluyen imágenes que ilustran el evento que representa la escena. En la Figura 4 podemos ver la imagen que ilustra el grupo de marcos the ball moves dentro de la escena Motion.

Por su parte, los marcos se describen dentro de la definición de la escena, por lo que la entrada de un marco en Kicktionary solo incluye la lista de unidades léxicas (normalmente en las tres lenguas), los elementos del marco y un resumen de cuáles elementos del marco aparecen en la estructura argumental de cada unidad léxica. Por su parte, las entradas para las unidades léxicas incluyen ejemplos anotados y un resumen de posibles instanciaciones de cada elemento del marco en la estructura argumental de esa unidad léxica.

En el Kicktionary, a diferencia de FrameNet, las unidades léxicas están relacionadas entre sí mediante distintos tipos de relaciones léxicas (Schmidt 2009: 112–116). Entre unidades léxicas de la misma lengua puede haber relaciones de sinonimia, lo que da lugar a synsets al estilo de WordNet (Fellbaum 1998); la hiperonimia y la meronomia, que generan jerarquías de sustantivos y adjetivos; y la troponimia, que da lugar a jerarquías verbales. Asimismo, entre unidades léxicas de distintas lenguas se establece la relación de equivalencia de traducción.

Una deficiencia del Kitcktionary es la ausencia de definiciones para las unidades léxicas, a pesar de que parece que, en cierta etapa del desarrollo del recurso, sí se confeccionaron algunas definiciones, como se puede observar en Schmidt (2006). Así, por ejemplo, del sustantivo upend en inglés, aprenderemos que se encuentra en la escena Foul y el marco Foul, que tiene varios equivalentes en francés y alemán, que es un tropónimo de foul, pero tendríamos que recurrir a otro recurso para saber qué significa.

Asimismo, el Kicktionary admite tener el mismo problema que ya señalamos en FrameNet (§2.1.2.2) en lo que respecta a la descripción mediante marcos de unidades léxicas no predicativas:

Nouns whose main function is to denote persons and objects (like goal keeper, substitute, byline, penalty area) rather than to describe processes or activities (like most LUs exemplified in the previous sections) constitute a class of words that are especially difficult to characterize. In this case the concept of scenes and frames loses a lot of its intuitiveness. (Schmidt 2009: 110)

Para paliar en cierta medida esa deficiencia, en el Kicktionary se crearon las escenas estáticas Actors (que describe las personas que intervienen en un partido de fútbol) y Field (que describe los objetos que forman parte de o que aparecen en un campo de fútbol durante un partido), que a su vez contienen marcos específicos.

Otro problema que señala Schmidt (2009: 110–112) es la ausencia de fronteras claras entre las distintas escenas y marcos, lo cual se manifestó también en la asignación de unidades léxicas a los marcos. El hecho de que en el Kicktionary, a pesar del hecho de que las actividades que forman parte de un partido de fútbol están regidas por un conjunto de reglas convencionalizadas y que los actores y elementos que forman parte de dichas actividades están claramente delimitados (Schmidt 2009: 103), demuestra, por un lado, los límites difusos de cualquier tipo de estructura conceptual y la enorme influencia que, al final, tienen las decisiones metodológicas que se tomen en la representación de dichas estructuras en un recurso terminológico.

2.2.3.2 Dicionário da Copa do Mundo

El Dicionário da Copa do Mundo27 _{(Salomão, Torrent y Sampaio 2013;}

Torrent, Salomão, Campos et al. 2014; Torrent, Salomão, da Silva Matos et al. 2014) consiste en un diccionario en línea basado en la metodología de FrameNet concebido con la intención de ser de utilidad para no

lingüistas (en particular, turistas, periodistas y trabajadores relacionados con la organización de la Copa del Mundo de Fútbol de 2014). Se trata de un diccionario multilingüe de inglés, portugués brasileño y español, y está centrado en los dominios del fútbol, el turismo y la propia Copa del Mundo (Torrent, Salomão, Campos et al. 2014: 10). En todo el recurso se utilizan los mismos marcos para las tres lenguas, porque según Torrent et al. (2014: 79) los dominios estudiados no varían suficientemente entre culturas como para crear marcos diferenciados. Sin embargo, ello contrasta, con que, como ya se señaló, en el Kicktionary, sí fue necesario crear marcos propios de una o dos lenguas.

La novedad del Dicionário da Copa do Mundo —desde el punto de vista de la terminología y en comparación con FrameNet— es que la metodología empleada incluye además de un enfoque bottom-up, también uno top-down (Torrent, Salomão, da Silva Matos et al. 2014: 81–82). En primer lugar, siguiendo un enfoque bottom-up, se extrajeron de unos corpus específicos de los dominios oraciones con unidades léxicas candidatas y se anotaron empleando etiquetas provisionales para los elementos del marco. A partir de la anotación, se definió una estructura de marcos preliminar. A continuación, el enfoque top-down consistió en alterar dicha estructura de marcos con arreglo a la organización del conocimiento que se propone en la literatura especializada de los dominios en cuestión.

Cabe destacar que si bien el Dicionário da Copa do Mundo no incluye contextos anotados ni información sintáctica, las entradas de cada una de sus unidades léxicas sí contienen una definición. Por lo demás, el resto de características destacables que presenta el Dicionário da Copa do Mundo están relacionadas con la adaptación de la estructura de la base de datos y del sistema de anotación de contextos lingüísticos para su uso en tres lenguas distintas, a pesar de que no están disponibles para el público.

2.2.3.3 BioFrameNet

BioFrameNet28 _{(Dolbey, Ellsworth y Scheffczyk 2006; Dolbey 2009) es una}

extensión de FrameNet para el dominio de la biología molecular centrado particularmente en los procesos de transporte intracelular de proteínas. Se trata de un proyecto actualmente discontinuado que fue el objeto de la tesis doctoral de su creador (Dolbey 2009).

Dado que se trata de una extensión, la estructura de BioFrameNet y su metodología son similares a la de FrameNet. BioFrameNet está formado solamente por dos marcos: Protein_transport y Cause_protein_transport. El marco Protein_transport, que está enlazado con FrameNet mediante la relación Inheritance al marco Motion (Dolbey 2009: 75), cuenta con 4 elementos del marco y 32 unidades léxicas. Por su parte, Cause_protein_transport es el causativo de Protein_transport y, por tanto, les une la relación entre marcos: Is Causative of. Cause_protein_transport tiene 18 unidades léxicas y tiene un EM más que Protein_transport por ser su causativo.

El corpus utilizado para llevar a cabo el proyecto es una colección de textos anotados por el Laboratorio de Bioinformática de Lawrence Hunter de la Universidad de Colorado en Denver (Estados Unidos). Los textos anotados son descripciones de productos génicos obtenidos de la base de datos Gene29_{, del Centro Nacional de Información Biotecnológica de}

Estados Unidos (NCBI). Dicha anotación estaba basada en una jerarquía de clases creada exclusivamente para clasificar fenómenos biológicos con el objetivo de introducir la información en una base de conocimiento. Esto es, no se tomaron en consideración cuestiones lingüísticas durante la anotación, a diferencia de BioFrameNet (Dolbey 2009: 8). El posterior uso de ese corpus anotado llevó al autor a destacar que dicha clasificación basada en conocimientos biológicos no tenía una correspondencia perfecta en la estructura representada en la lengua:

28 _{BioFrameNet no está disponible en línea.}

[T]he differences in biology which motivated division of the knowledge base in to the classes listed above are not directly reflected in the grammar and frame semantics of the language used to characterize these differences (Dolbey 2009: 9).

Así pues, mientras que el Laboratorio de Bioinformática de Lawrence Hunter había definido cinco tipos de mecanismos de transporte de proteínas de acuerdo con criterios biológicos (protein transport, gated nuclear transport, transmembrane transport, vesicular transport y endocytosis), en BioFrameNet, tras el análisis lingüístico y siguiendo las pautas para la creación de marcos en FrameNet, se decidió crear solamente dos marcos distintos: Protein_transport y Cause_protein_transport (Dolbey 2009: 72), siendo simplemente el segundo la variante causativa del primero.

Como queda patente en el proyecto BioFrameNet, la organización de marcos desde un punto de vista conceptual, como es el caso de la TBM, dará como resultados una división del conocimiento en marcos distintos de los que daría una configuración en marcos basada en un análisis sintáctico-semántico como el caso de FrameNet y sus derivados.

2.2.3.4 DiCoEnviro

DiCoEnviro30 _{(L’Homme 2012a; L’Homme 2012b; L’Homme 2015) es un}

recurso terminológico que contiene términos del medio ambiente en inglés, francés, español y portugués desarrollado por el Observatoire de linguistique Sens-Texte de la Universidad de Montreal (Canadá). Se ha compilado adaptando los principios teóricos y metodológicos de la lexicología explicativa y combinatoria (LEC) (Mel’čuk, Clas y Polguère

1995), al igual que su recurso hermano DiCoInfo31 _{(L’Homme 2008), que}

contiene términos de informática.

DiCoEnviro parte de la premisa de que los verbos y sus derivados deben incluirse en los diccionarios especializados, ya que el análisis de los verbos

30 _{Disponible en: <http://olst.ling.umontreal.ca/dicoenviro>.} 31 _{Disponible en: <http://olst.ling.umontreal.ca/dicoinfo>.}

especializados es un buen punto de partida para descubrir la estructura léxica de un campo de conocimiento. (L’Homme 2003: 405). De este modo, en DiCoEnviro se palían algunas de las deficiencias habituales en los recursos terminológicos (L’Homme 2008):

- La ausencia de términos que pertenecen a categorías gramaticales distintas del sustantivo, lo cual supone que términos con el mismo significado, pero de diferente categoría gramatical, se omitan, aunque a veces aparezcan como parte de compuestos.

- La falta de representación de determinadas diferencias semánticas como, por ejemplo, la polisemia regular que se da entre sustantivos deverbales que codifican una actividad o el resultado de esta.

- La omisión de la representación del comportamiento sintáctico de los términos y de su combinatoria.

Por lo tanto, en DiCoEnviro las entradas están dedicadas a términos de distintas categorías gramaticales: verbos, sustantivos, adjetivos, adverbios, así como locuciones. Por otro lado, cada entrada corresponde a una acepción distinta de cada término distinguiéndose así los casos de polisemia tanto regular como irregular (L’Homme 2008).

Una de las principales diferencias de DiCoEnviro con otros recursos terminológicos es que se proporciona la estructura argumental (o actancial, en la terminología de la LEC) de todos los términos predicativos.

No obstante, a diferencia de la LEC, la estructura argumental en DiCoEnviro no se expresa mediante variables (X, Y, Z, etc.), sino mediante roles semánticos (L’Homme 2012b: 382), que, además, van acompañados del término o los términos que típicamente ocupan dicho argumento y una lista con otros términos que pueden instanciar los argumentos (L’Homme 2012a: 238).

Los roles semánticos utilizados en DiCoEnviro se encuentran, al igual que EcoLexicon, en un punto intermedio entre los macrorroles y los roles

semánticos específicos para cada caso. Sin embargo, la lista de roles de DiCoEnviro es mucho más amplia que la de EcoLexicon e incluye, entre otros: AGENTE, PACIENTE, CAUSA, MANERA, RESULTADO, TIEMPO, etc., cuyo

modo de empleo está claramente especificado en una guía para los terminólogos que trabajan en DiCoEnviro (L’Homme, Le Serrec y Laneville 2009).

Una entrada típica de DicoEnviro, como la de la Figura 5, incluye también información gramatical, sinónimos, contextos anotados con una metodología adaptada de la de FrameNet (L’Homme y Pimentel 2012) y relaciones léxicas de tipo paradigmático y sintagmático basadas en las funciones léxicas de la LEC.

Figura 5. Entrada en DiCoEnviro del término degrade (Fuente: DiCoEnviro)

En cuanto a las definiciones, pocas entradas de DiCoEnviro las contienen en comparación con DiCoInfo, que se encuentra en un estado de desarrollo más avanzado en ese respecto. Hasta hace poco la redacción de definiciones en estos dos recursos no contaba con unas reglas precisas. Sin embargo, en San Martín y L’Homme (2014) se esbozaron unas primeras pautas para la confección de definiciones adaptando las reglas definicionales de la LEC (§3.3.9) a las características particulares de estos recursos.

Recientemente, se ha comenzado a dotar al recurso de una estructura de marcos basada en FrameNet para la versión inglesa y francesa de DicoEnviro (L’Homme, Robichaud y Subirats 2014; L’Homme y Robichaud 2014). El enfoque que se sigue consiste en descubrir los marcos de FrameNet evocados por los términos contenidos en DicoEnviro. Para ello, se realiza una comparación con los marcos de FrameNet a partir de la estructura argumental, las anotaciones de contextos y otra información léxico-semántica contenida en las entradas de los términos.

A diferencia de BioFrameNet, DiCoEnviro no es una extensión de FrameNet en sentido estricto. Mientras que BioFrameNet emplea la misma estructura y metodología que FrameNet y enlaza el recurso mediante una relación entre uno de sus marcos y otro de FrameNet, DiCoEnviro detecta aquellos marcos relevantes de FrameNet y los importa a su recurso con adaptaciones de distinto calibre según el caso, como por ejemplo, la sustitución de los elementos del marco por los roles semánticos de DiCoEnviro.

El enfoque empleado en DiCoEnviro toma como punto de partida los términos ya descritos en el recurso para llegar a los marcos; a diferencia de FrameNet, que comienza con la descripción del marco (L’Homme, Robichaud y Subirats 2014). Además, otra de las principales diferencias entre DiCoEnviro y FrameNet es que mientras DiCoEnviro describe los argumentos de cada término, FrameNet asocia los elementos del marco a un marco y no a una unidad léxica concreta (L’Homme, Robichaud y Subirats 2014: 1368). Teniendo eso en cuenta, se determinó que un término en DiCoEnviro evoca probablemente un marco existente en FrameNet si se podía establecer una relación entre los elementos del marco y los argumentos del término. No obstante, los autores tuvieron que establecer normas de equivalencias entre roles semánticos, ya que el inventario de FrameNet es muchísimo más específico que el de DiCoEnviro y, por otro lado, se tuvieron que gestionar determinadas diferencias entre el número de elementos del marco de FrameNet y el de argumentos de los términos en DicoEnviro (L’Homme y Robichaud 2014: 191–192).

Figura 6. Marco Being_at_risk en DiCoEnviro (Fuente: DiCoEnviro)

Por otro lado, L’Homme y Robichaud (2014: 192–193) destacan que los marcos de DiCoEnviro —incluso aquellos tomados de FrameNet sin apenas cambios— difieren en cuanto que los marcos medioambientales son mucho más restringidos que los de FrameNet y que los términos que evocan los marcos podrían considerarse microsentidos (§3.5.3.5.4). Para ilustrarlo ponen el ejemplo del marco Being_at_risk (Figura 6), que importaron de FrameNet:

[T]he Being_at_risk frame in the environment applies only to things such as species, ecosystems, plants, etc. In addition, the number of terms that evoke a frame is often much lower than those recorded in FrameNet. For instance, the terms evoking the Being_at_risk frame in the environment data are the following: sensitivity, threatened, vulnerability, vulnerable (whereas in FrameNet, the list comprises: danger.n, insecure.a, risk.n, safe.a, safety.n, secure.a, security.n, unsafe.a, vulnerability.n, vulnerable.a). (L’Homme y Robichaud 2014: 193)

En los casos en los que no se puede establecer una equivalencia con los marcos de FrameNet, DiCoEnviro crea marcos nuevos propios del dominio del medio ambiente (L’Homme y Robichaud 2014: 193), como,

por ejemplo, Cause_change_into_reusable_material (Figura 7), que contiene los términos en inglés compost y composting que no están contenidos en FrameNet. No obstante, en francés, además de compostage y

In document La representación de la variación contextual mediante definiciones terminológicas flexible (página 121-143)