• No se han encontrado resultados

El proceso de traducción en un sistema de memorias de traducción

1.3 Las necesidades de los traductores

1.3.2 Los sistemas de memorias de traducción

1.3.2.4 El proceso de traducción en un sistema de memorias de traducción

Para empezar a trabajar en un sistema de memorias de traducción normalmente es necesario crear primero un proyecto de traducción al que luego agregaremos los recursos de apoyo disponibles (que pueden ser una o varias memorias de traducción y uno o varios glosarios terminológicos, según el sistema) y los documentos de partida.

Después de importar los archivos originales se lleva a cabo un análisis de los mismos. Dicho análisis implica normalmente la tokenización y segmentación del texto, donde la primera se refiere a la división del texto en tokens (típicamente palabras) y la segunda a la delimitación en unidades de traducción, como se explicará más adelante. Esto se puede complementar con la lematización, es decir, la reducción de las palabras a sus raíces, o algún tipo de análisis sintáctico, procesos que permiten mejorar el reconocimiento de términos compuestos y fraseología, así como las coincidencias de glosarios y memorias.

Para la segmentación de los textos se utilizan una serie de reglas formuladas mediante expresiones regulares o patrones que permiten dividir el texto en unidades, que según la especificación del estándar TMX pueden ser párrafos, oraciones, frases o bloques. Así pues, se entiende por unidad de traducción un segmento en lengua de partida alineado con el segmento correspondiente en la lengua de llegada (Bowker & Barlow, 2004). Para almacenar e intercambiar las reglas de segmentación, que normalmente pueden ser adaptadas por el usuario, se

desarrolló el estándar SRX, que lamentablemente todavía no es tan ampliamente utilizado como el TMX (Zetzsche, 2011).

Este análisis inicial permite determinar el recuento de palabras a traducir, así como las estadísticas de repeticiones y coincidencias encontradas en las memorias existentes, si es el caso. Estas estadísticas del proyecto luego se actualizarán automáticamente a medida que se avanza en el proyecto y nos permiten saber en todo momento el número de palabras y segmentos traducidos y pendientes de traducir.

Luego de la segmentación y análisis, y antes de empezar el proceso de traducción como tal, es posible realizar una pretraducción de los textos a partir de recursos preexistentes. Esta función se basa en la búsqueda de coincidencias en diferentes fuentes para insertarlas como texto de llegada en aquellos segmentos para los que se encuentren resultados. Las fuentes pueden ser glosarios, memorias de traducción o motores de traducción automática (locales o remotos). En algunos casos, el usuario puede especificar las fuentes a utilizar entre aquellas disponibles o establecer prioridades. Posteriormente, durante la traducción propiamente dicha, el traductor deberá revisar los segmentos pretraducidos y traducir los segmentos que no se pretradujeron.

Otra característica que ofrecen algunos sistemas de memorias de traducción es que para la importación y análisis permiten procesar varios archivos a la vez, lo que se conoce como procesamiento por lotes. Después del análisis y eventual pretraducción de uno o varios archivos, algunas herramientas permiten también generar un archivo en el formato de intercambio XLIFF para traducirlo en otra herramienta. Dicho archivo incluirá todos los segmentos fuente, con o sin traducción, y toda la información necesaria para recrear los archivos traducidos en su formato original.

En cuanto al proceso de traducción propiamente dicho, denominado por algunos autores como traducción interactiva, los sistemas de memorias de traducción presentan el texto original segmento por segmento y el usuario debe ingresar la traducción en el campo correspondiente. En algunos sistemas, como se

mencionó antes, se utiliza el formato de tabla, de modo que los segmentos originales se muestran en una columna y las traducciones en otra. En otros casos, la traducción se ingresa en un campo ubicado debajo del segmento original y es posible configurar si se quieren visualizar todos los segmentos originales o solo el original del segmento activo.

Al abrir o activar un segmento para edición, el sistema lleva a cabo la búsqueda de segmentos similares en los recursos disponibles para el proyecto. En algunos casos, además de los recursos locales, los sistemas permiten también el uso simultáneo de recursos (memorias y glosarios) compartidos a través de la red. Al igual que para la pretraducción, en el modo interactivo algunos sistemas también permiten obtener una primera versión del segmento activo a partir de un motor de traducción automática local o disponible como servicio web, sugerencia que se presenta por lo general en un panel independiente del editor.

Por lo general, tanto para las coincidencias de las memorias como para las sugerencias provenientes de un motor de traducción automática, el usuario tiene la opción de configurar el sistema para que realice la inserción automática al pasar a un segmento sin traducir. En el caso de las memorias, también es posible indicar un porcentaje mínimo de coincidencia, de modo que solo se presentarán o insertarán las coincidencias parciales cuyo grado de similitud sea igual o mayor al porcentaje señalado. Si el usuario prefiere trabajar a partir del segmento vacío, normalmente se tiene la opción de utilizar atajos de teclado para seleccionar entre las sugerencias disponibles e insertar las correspondencias deseadas.

En el caso de las equivalencias de los glosarios y de las etiquetas de formato también es común contar con atajos de teclado que permiten insertarlas fácilmente en el texto de llegada mientras escribimos. Otros elementos que normalmente se pueden configurar para facilitar su inserción mediante atajos de teclado al traducir son los elementos colocables y localizables (en inglés placeables and localizables15). Estos comprenden elementos como fechas, números o medidas que

15 Azzano (2011, p. 38-42) presenta una discusión sobre la variedad de términos utilizados en los sistemas de memorias de traducción y por diferentes autores para referirse a este tipo de elementos: colocables, transferibles, intraducibles, constantes, expresiones paralingüísticas,

siguen diferentes convenciones según el idioma (por ejemplo, el separador de miles en el caso de los números) u otros que se transfieren tal cual de una lengua a otra, como nombres propios, direcciones de correo electrónico o elementos de una interfaz gráfica, por ejemplo (Azzano, 2011).

Una vez finalizada la traducción de un segmento, según la configuración establecida pueden realizarse varias acciones al avanzar al segmento siguiente, como el cambio de estatus del segmento (p. ej. de pendiente a traducido) o su actualización en la base de datos. También es posible configurar el programa para que de manera automática utilice la misma traducción en todos los segmentos repetidos en el mismo proyecto. Esto es lo que se conoce como propagación automática de las repeticiones internas. No obstante, en algunos casos no conviene utilizar la misma traducción en segmentos que aunque sean idénticos en el idioma original pueden requerir traducciones diferentes según el contexto. En estos casos algunos sistemas ofrecen la posibilidad de incluir en la memoria traducciones alternativas para el mismo segmento original.

Otras funciones que tienen que ver con la manipulación de los segmentos incluyen la validación mediante diferentes estatus (sin traducir, traducido, aprobado, entre otros), y la posibilidad de añadir comentarios a las unidades de traducción o de cambiar la segmentación mientras traducimos (dividir un segmento en dos o unir segmentos consecutivos).

Existen otras funciones que pretenden facilitar el trabajo de revisión. Algunos sistemas, por ejemplo, permiten hacer comparaciones entre diferentes versiones e implementan opciones similares al control de cambios de los procesadores de texto. En otros casos, existe la posibilidad de exportar las traducciones en formato de tabla, bien como documento de texto o como hoja de cálculo, para llevar a cabo

invariables entre un par de lenguas dado mientras que para otro par de lenguas pueden requerir ciertas adaptaciones. Es el caso, por ejemplo, de un número con decimales: si traducimos del italiano al español el separador de decimales será el mismo, por lo que en este caso el número sería un elemento colocable; cuando traducimos del inglés al español, por otro lado, es necesario cambiar el separador de decimales, por lo que en este caso el mismo número sería un elemento localizable. De ahí que el autor concluya, acertadamente en nuestra opinión, que el término más adecuado para agrupar este tipo de elementos es "colocables y localizables".

la revisión en herramientas externas. Después de la revisión, el sistema importa de nuevo la tabla y actualiza la memoria con los cambios realizados externamente.

Finalmente, otra opción muy valorada por los traductores es la posibilidad de previsualizar el formato de la traducción en cualquier momento desde la interfaz del editor (Lagoudaki, 2009). De este modo, durante la traducción se pueden tener en cuenta los elementos visuales que acompañan al texto y se puede verificar que la disposición de los elementos no se haya alterado.

Al terminar la traducción, el paso final consiste en crear los archivos traducidos en el formato del texto original. Una vez exportados los archivos finales, es recomendable verificar el formato en la aplicación externa que se utilizó para la creación de los originales, teniendo en cuenta que si se realizan cambios directamente en los archivos finales será necesario actualizar la memoria de traducción para que refleje dichos cambios.