MARCO SISTÉMICO FUNCIONAL FORMAL
4. Una gramática orientada a la generación de textos escritos
Son hoy numerosos los estudios sobre el discurso científico, en particular sobre las secciones Abstract, Introduction, Method, Results, Conclusions del AICI, especialmente desde la perspectiva de la LSF. Son escasos, sin em- bargo, los estudios sistémico-funcionales que describen formalmente las propiedades sistémicas y estructurales del AICI y que se ocupan de formular generalizaciones probabilísticas sobre la relación de realización entre los niveles superiores (género y registro) y los niveles inferiores (semántica y forma de la lexicogramática). Por otra parte, son también numerosos los estudios sobre generación de textos en diversos dominios, incluido el cientí- fico, pero escasos los estudios sobre la generación de AICIs que parten de una modelización que correlacione propiedades de estratos superiores con propiedades de estratos inferiores de modo de poder usar la gramática tex- tual subyacente como recurso en una asistencia retórico-lingüística interac- tiva. Existe, entonces, por un lado, un vacío teórico-descriptivo en materia de modelización contextual y lingüística del AICI y, por el otro, un vacío en el campo computacional aplicado que contribuya a resolver el problema de escritura que afecta al científico cuya lengua materna no es el inglés y que para difundir su investigación a nivel internacional debe publicar en ese idioma. Éste es el espacio conceptual en el cual se inserta nuestro proyecto RedACTe III, que es continuación de RedACTe I-II (Castel y otros 2002).
El proyecto tiene como objeto de estudio el AbAICI. Como objetivo teó- rico-descriptivo, RedACTe III se propone elaborar una modelización sistémi- co-funcional formal, orientada a la generación de textos, de correlaciones sistemáticas entre las propiedades contextuales y las propiedades lingüísti-
18
En la redacción de esta sección aprovechamos ideas, discusiones y presentaciones pre- vias con los integrantes del proyecto RedACTe.
cas del AbAICI, y, como objetivo aplicado, la construcción de un sistema de principios de escritura asistida de AbAICIs basado en dicha modelización.
Las generalizaciones descriptivas se construyen y se validan sobre la base de un corpus de 700 AICIs manipulado con las herramientas informáti- cas propias de la Lingüística del Corpus.
La aplicación resultante aspira a tener las características distintivas de (i) captar, tanto a nivel de estratos superiores cuanto a nivel de estratos inferio- res, la unidad y la diversidad de las disciplinas objeto de la modelización, (ii) adaptar e instrumentar pedagógicamente la imprescindible conceptualiza- ción retórico-lingüística, (iii) asistir a investigadores locales en la redacción de AbAICIs bien formados, apropiados y competitivos, y (iv) contribuir a superar la desventaja comparativa que, por problemas de "idiomaticidad", tienen gran parte de los científicos locales para publicar en revistas especia- lizadas.
4.1. Objetivos
Los objetivos de RedACTe III pueden resumirse de la siguiente manera.
4.1.1. Objetivos teórico-descriptivos
Describir formalmente en un marco sistémico-funcional orientado a la generación de textos:
4.1.1.1. el potencial de la estructura de género (PEG) del AbAICI;
4.1.1.2. el potencial de propiedades de campo, tenor y medio asociado con (sub)constituyentes de género del AbAICI;
4.1.1.3. el potencial de propiedades semánticas y lexicogramaticales asociado con el potencial de §4.1.1.2;
4.1.1.4. el potencial de correlaciones sistemáticas entre las represen- taciones que resultan de los potenciales descriptos en §§4.1.1.1-4.1.1.3;
4.1.2. Objetivos aplicados
4.1.2.1. Definir formalmente un sistema de principios de escritura basado en la descripción contextual y lingüística desarrollada en §4.1.1.
4.1.2.2. Adaptar didácticamente el sistema formal definido en §4.1.2.1 de modo de definir un sistema interactivo de principios de escritura de AbAICIs que asista desde el punto de vista contextual y lingüístico a investigadores científicos locales cuya lengua materna no es el inglés.
4.1.2.3. Implementar computacionalmente el sistema de escritura asisti- da definido en §4.1.2.2.
4.2. Hipótesis
RedACTe III se propone substanciar las siguientes hipótesis.
4.2.1. Modelización teórico-descriptiva
4.2.1.1. Se puede modelizar el AbAICI, en términos sistémico-fun- cionales orientados a la generación de textos, tanto en los aspectos contex- tuales como en los aspectos lingüísticos; en particular, es posible modelizar correlaciones sistemáticas significativas (esto es, el potencial de regularida- des de realización) entre los estratos ‘superiores’ que modelizan la organi- zación genérica, de campo, de tenor y de medio, por un lado, y los estratos ‘inferiores’ que modelizan la organización semántica, sintáctica, lexical y de puntuación, por el otro.
4.2.1.1.1. Los estratos de §4.2.1.1 pueden ser conceptualizados y forma- lizados en términos de estructuras de rasgos. (Para la noción de “estructura de rasgos”, véase Pollard y Sag 1987, 1994.)
4.2.1.1.2. Las correlaciones sistemáticas existentes entre los diversos estratos pueden ser formalizadas mediante un sistema de reglas de realiza- ción del tipo de las utilizadas en Fawcett y otros (1993).
4.2.2. Desarrollo de un sistema de escritura asistida
4.2.2.1. Se puede concebir principios de escritura de AbAICIs que apro- vechen pedagógicamente las generalizaciones teórico-descriptivas que se obtengan con la substanciación de §4.2.1, en particular, de §§4.2.1.1.2.
4.2.2.1.1. Estos principios de escritura pueden ser también formalizados mediante un sistema de implicaciones basado en estructuras de rasgos.
4.2.2.1.2. El sistema de principios resultante de §4.2.2.1.1 puede ser implementado computacionalmente.
4.2.2.1.3. La implementación que se logre en §4.2.2.1.2 permitirá conce- bir, diseñar y desarrollar una aplicación informática de asistencia contextual y lingüística interactiva en la escritura de AbAICIs destinada a investigado- res científicos cuya lengua materna no es el inglés.
4.3. Metodología
4.3.0. Verificación de hipótesis
En general, la ejecución del proyecto está controlada por las condiciones usuales de adecuación y verificación de hipótesis en los niveles de la obser- vación y la descripción, aunque en el caso que nos ocupa aplicadas a tex- tos, y no a oraciones sueltas; la verificación depende así de la noción de texto apropiado a una circunstancia determinada. Por otra parte, se hace la
habitual evaluación estadística de los datos que surgen de observar una muestra de AICIs construida sobre la base de las necesidades de científicos de universidades y centros de investigación de Mendoza, San Luis y San Juan. Se adopta también el concepto de “probabilidad asociada a rasgos” de la LGC de acuerdo con la distribución observada en la muestra de AICIs.
El proyecto asume una interacción fluida con los expertos, esto es, los investigadores, ya que éstos, por ser los destinatarios del sistema de escri- tura asistida a desarrollar, cumplen la doble función de (a) proveer el cono- cimiento específico de las disciplinas que practican (campo) con sus prácti- cas y convenciones no siempre declaradas, y (b) plantear los problemas característicos que enfrentan a la hora de redactar un AICI para enviarlo, con pedido de publicación, a una revista científica internacional.
La ejecución del proyecto está guiada por las etapas definidas en un cronograma de trabajo, que por razones de espacio no incluimos aquí, de acuerdo con lo descripto en §§4.3.1-4 a continuación.
4.3.1. Etiquetado y análisis del corpus
4.3.1.1. El corpus se etiqueta con las categorías de análisis de la LSF adaptadas a los objetivos teórico-descriptivos de RedACTe III, y orientadas a una manipulación de la muestra mediante las herramientas propias de la Lingüística del Corpus.
4.3.1.2. El análisis del corpus tiene en cuenta lo siguientes pasos y/o aspectos:
4.3.1.2.1. Identificación y categorización de propiedades de género. 4.3.1.2.2. Identificación y categorización de propiedades de registro: campo, tenor y medio.
4.3.1.2.3. Identificación y categorización de propiedades semánticas (ideacionales, interpersonales y textuales) asociadas sistemáticamente a las propiedades de género y de registro relevadas en §§4.3.1.2.1-2.
4.3.2. Definición de una gramática textual del AbAICI
Para substanciar las hipótesis de §4.2.1.1, guiados por los objetivos de §§4.1.1.1-4 y sustentados en los datos obtenidos en §§4.3.1.2.1-3, se cons- truye una gramática textual del AbAICI, en adelante GAbAICI, del tipo pro- puesto en Castel (2004). GAbAICI es un sistema de reglas para la defini- ción, mediante estructuras de rasgos a la Pollard y Sag (1987, 1994) de:
4.3.2.1. el PEG del AbAICI;
4.3.2.2. el potencial de propiedades de campo, tenor y medio asociado con (sub)constituyentes de género del AbAICI mediante reglas a la Fawcett y otros (1993);
4.3.2.3. el potencial de propiedades semánticas y lexicogramaticales asociado con el potencial de §4.1.1.2 a la Fawcett y otros (1993) y Castel y otros (2000);
4.3.2.4. el potencial de correlaciones sistemáticas entre las repre- sentaciones que resultan de los potenciales descriptos en §§4.1.1.1-3 a la Fawcett y otros (1993).
4.3.3. Implementación computacional de GAbAICI
La implementación computacional de GAbAICI tiene como punto de par- tida la implementación de la LGC de Castel (2003). Se introducen todas las modificaciones que resultan necesarias a los fines de RedACTe III, tanto en los aspectos relativos a los estratos superiores y su interacción con los es- tratos inferiores, cuanto a la imprescindible extensión de la lexicogramática. Esta implementación permitirá, por un lado, la evaluación de la adecuación empírica de GAbAICI, y, por el otro, la utilización de GAbAICI como recurso subyacente del sistema de escritura asistida definido en §4.3.4.
4.3.4. Definición de un sistema de escritura asistida 4.3.4.1. Principios de escritura basados en GAbAICI
Las propiedades contextuales y lingüísticas del AbAICI definidas por GAbAICI son interpretadas en RedACTe III como aspectos esenciales de la información/conocimiento que debe poseer un investigador para escribir AbAICIs bien formados y apropiados. GAbAICI se usará para definir un prototipo de sistema de principios que asistan al investigador científico en la escritura de AbAICIs tanto desde el punto de vista contextual cuanto desde el punto de vista lingüístico (véase el objetivo §4.1.2.1 y la hipótesis §4.2.2.1). Estos principios de escritura se formalizan también mediante un sistema de implicaciones basado en estructuras de rasgos.
4.3.4.2. Transposición didáctica
Se hace una adaptación didáctica de la conceptualización requerida para la comprensión y funcionamiento del prototipo de sistema de escritura asis- tida resultante de §§4.3.4.1. (Véase objetivo §4.1.2.2.)
4.3.4.3. Documentación
La documentación relativa al prototipo de sistema de escritura resultante de §§4.3.4.1-2 se elabora como un texto hipervinculado de modo de facilitar la implementación informática prevista en §4.3.4.4. Por documentación en- tendemos un Manual de principios de escritura asistida de AbAICIs, un Glo- sario de términos retórico-lingüísticos, y un Manual de uso de la aplicación. 4.3.4.4. Implementación informática
La implementación informática del prototipo de sistema de escritura asis- tida resultante de §§4.3.4.1-3 se hace en Visual Basic para plataforma Win- dows. Para una eventual etapa de comercialización se prevé una implemen- tación en C++ también para plataforma Windows.
4.3.4.5. Prueba y evaluación
El prototipo de sistema de escritura asistida resultante de §§4.3.4.1-4 se probará y evaluará con investigadores seleccionados de San Juan, San Luis y Mendoza. La selección se hará sobre la base de las disciplinas re- presentadas en el corpus y la masa crítica de científicos practicantes de las mismas.