Resumen de textos especializados en general

2. El resumen automático: estado de la cuestión

2.2. Resumen de textos especializados

2.2.1. Resumen de textos especializados en general

En apartado 1.2.1. hemos mencionado las definiciones técnicas de resumen de texto especializado ofrecidas por el ANSI y por la norma ISO 214-1976 (E).

En este apartado presentamos una perspectiva de las ideas de diversos autores que han profundizado en la investigación sobre el resumen de textos especializados, basándonos en una publicación de Ciapuscio (1998), quien también trata este tema.

Uno de los primeros en investigar sobre el resumen de texto especializado es Graetz (1985), quien, con fines didácticos, trabajó sobre un gran corpus de resúmenes de varios campos científicos, llegando a ofrecer una caracterización del mismo:

The abstract is characterized by the use of past tense, third person, passive, and the non- use of negatives. It avoids subordinate clause, uses phrases instead of clauses, words instead of phrases. It avoids abbreviation, jargon, symbols and other language short-cuts which might lead to confusion. It is written in tightly worded sentences, which avoid repetition, meaningless expressions, superlatives, adjectives, illustrations, preliminaries, descriptive details, examples, footnotes. (Graetz 1985: 25)

Otro autor destacado en la investigación sobre el resumen especializado es Fluck (1988), quien constata la importante función que tienen los resúmenes de textos técnicos para poder acceder a la información especializada. Como hemos señalado anteriormente, sería imposible que los especialistas accediesen en la actualidad a todas las publicaciones de su interés, por lo tanto el resumen se ha vuelto imprescindible para la comunicación científica. Como indica Ciapuscio (1998), los resultados de Fluck (1988) sobre el análisis de la forma y construcción textual, recursos cohesivos, complejidad sintáctica y recursos léxico-estilísticos demuestran la diversidad de realización del resumen en cada disciplina y caracterizan estos textos como construcciones diferentemente estructuradas.

Un tercer autor relevante es Kaplan et al. (1994), quien, basándose en el estudio de resúmenes y artículos de lingüística aplicada, llega a varias conclusiones interesantes. A nuestro entender, la más destacada es que el orden de los pasos que debe seguirse para escribir resúmenes de textos especializados es: Introducción, Métodos,

Resultados y Discusión. Esta idea amplía el trabajo de Swales (1981, 1990), quien con

moves, es decir, en los pasos típicos para redactar una “parte textual”, entendiendo por “partes textuales” los componentes característicos de un texto. Swales (1990) afirma que las partes textuales de un artículo científico son Introducción, Métodos,

Resultados y Discusión (“estructura IMRD”), y que, en la mayoría de los casos, los

resúmenes publicados reflejan dicha estructura.

Vemos a partir del trabajo de estos autores que, a la hora de realizar un resumen, debe tenerse en cuenta el género del texto que se desea resumir. Así, los resúmenes de noticias periodísticas deben contener una referencia global al acontecimiento del que se habla en la noticia y además los detalles más relevantes; los resúmenes de novelas deben contener el argumento general de la trama, pero no deben revelar los detalles ni el final, etc.

Como señalan Kaplan et al. (1994), los resúmenes deben diferenciarse teniendo en cuenta su propósito, audiencia y extensión (lo cual enlaza con los aspectos a tener en cuenta a la hora de elaborar un resumen, explicados en el apartado 1.2.2.). La misma argumentación adoptan otros autores. Así, Teufel y Moens (2002) señalan que el resumen de un artículo científico debe sobre todo capturar la originalidad del trabajo (dado que el propósito de un artículo de este tipo es la presentación de un trabajo científico nuevo), mientras que el resumen de un texto de ámbito general debe presentar brevemente una panorámica del contenido del material en cuestión. Ciapuscio (1998) argumenta, en la misma línea, que el resumen de una publicación científica está escrito con el objetivo de convencer a los revisores de que dicha publicación es novedosa y que debería ser aceptada para su presentación.

A pesar todo esto, la investigación en resumen automático se centró en el pasado básicamente en el discurso general, salvo algunas excepciones, como los primeros experimentos de Luhn (1959), quien empleó frecuencias de palabras para determinar oraciones relevantes para el resumen de textos técnicos, o Pollock y Zamora (1975), quienes presentaron un algoritmo de extracción para resumir textos de química.

A partir de los años noventa, un creciente número de investigadores empezó a centrarse en el resumen automático del discurso especializado (como, por ejemplo, entre otros, Paice 1990, Riloff 1993, Lehmam 1995, McKeown y Radev 1995, Abracos y Lopes 1997, Saggion y Lapalme 2000), aunque a menudo utilizando las mismas estrategias que las empleadas para el discurso general.

Concretamente, el resumen de noticias ha tenido una especial relevancia. Por ejemplo, Abracos y Lopes (1997) usan técnicas estadísticas para seleccionar los contenidos más importantes de artículos de periódicos, y McKeown y Radev (1995) realizan resumen multidocumento por métodos de abstracción de noticias de temas específicos (como, por ejemplo, ataques terroristas) empleando plantillas (templates) de conocimiento provenientes del campo de la Extracción de Información.

Algunos trabajos más recientes sobre resumen automático de textos especializados tienen en cuenta, además, las especificidades del género sobre el que se trabaja. Así, en el ya mencionado trabajo de Teufel y Moens (2002) se sugiere una estrategia de resumen de artículos científicos de lingüística computacional. Mediante la constatación del estatus retórico de cada afirmación contenida en el artículo, se seleccionan para el resumen aquellas que revelan las novedades del trabajo en contraste con el estado de la cuestión de la materia de la que se trata.

Otro trabajo destacado es el de Farzindar et al. (2004), quienes trabajan sobre resumen automático de documentación jurídica especializada. Su objetivo es ayudar a expertos de este ámbito a determinar las ideas clave de un juicio para encontrar otros documentos relacionados que puedan ser relevantes. Farzindar et al. (2004) utilizan la estructura textual para realizar automáticamente un resumen coherente.2 Concretamente, la realización del resumen pasa por cuatro fases:

1) Segmentación de la estructura textual identificando los cinco temas de la estructura del documento: Decision Data, Introduction, Context, Juridical

Reasoning and Conclusion.

2) Eliminación del resumen de información irrelevante (como citaciones de artículos legales).

3) Selección de fragmentos relevantes de las cuatro últimas secciones utilizando marcadores lingüísticos específicos y criterios de posición textual para cada uno de los temas.

4) Agrupación de los fragmentos seleccionados, aplicando un límite de longitud.

2_{Farzindar et al. (2004) emplean el término “estructura temática” para referirse a lo que es} comúnmente conocido como “estructura textual”. Para evitar posibles confusiones, nosotros utilizamos el término ”estructura textual”.

En el apartado siguiente vemos algunos trabajos sobre resumen de textos especializados que se centran en el ámbito médico.

In document Hacia un modelo lingüístico de resumen automático de artículos médicos en español (página 41-44)