• No se han encontrado resultados

Lenguajes controlados

6. Traducci ´on autom´atica y aplicaciones

6.5. Automatizaci ´on del proceso de traducci ´on

6.5.3. Lenguajes controlados

Cuando la traducci ´on autom´atica se usa para la diseminaci ´on de docu- mentos t´ecnicos de tem´atica homog´enea, puede ser interesante hacer que los documentos originales est´en escritos usando un l´exico est´andar sin am- big ¨uedades sem´anticas y siguiendo unas reglas sint´acticas y de estilo bien determinadas, es decir, en un lenguaje controlado (Wojcik y Hoard 1996; Ar- nold et al. 1994; O’Brien 2003) dise ˜nado de forma que el resultado de la traducci ´on autom´atica pueda ser usado directamente para publicarlo con el m´ınimo posible de postedici ´on.

Un lenguaje controlado es “un subconjunto del lenguaje natural definido con precisi ´on, por un lado restringido en cuanto al l´exico, la gram´atica y el 12Por ejemplo, en ingl´es t´ecnico, la palabra replace presenta una ambig ¨uedad l´exica (v´ease el apartado 7.2.1), puesto que puede querer decir exchange (reemplazar) o put back (volver a colocar).

13Kohl (2008) ofrece indicaciones para escribir textos en ingl´es para una audiencia global, de forma que los textos sean m´as f´aciles de entender para los no nativos y m´as f´aciles de traducir manualmente y autom´aticamente.

6.5. AUTOMATIZACI ´ON DEL PROCESO DE TRADUCCI ´ON 109

estilo, y por otro, posiblemente extendido con terminolog´ıa y construccio- nes gramaticales espec´ıficas de un dominio” (Huijsen 1998).

Un lenguaje controlado tiene a menudo asociado un conjunto de pro- gramas de apoyo que ayudan a evaluar y escribir documentos que cumplan las restricciones. Quien escribe en un lenguaje controlado normalmente usa un editor de textos inteligente que realiza las siguientes tareas:

Comprobar el cumplimiento de las restricciones:

• terminol ´ogicas (como el caso de la palabra replace mencionado m´as arriba); para eso, puede ser ´util acceder a una base de datos terminol ´ogica (como las mencionadas en el cap´ıtulo 5);

• sint´acticas, por ejemplo, haciendo el an´alisis sint´actico de las oraciones y detectando las ambig ¨uedades estructurales (v´ease el apartado 7.2.2), y

• de estilo, por ejemplo, especificando cu´al debe ser el formato de las fechas o de las horas.

Emitir un mensaje de error, lo m´as informativo posible, cuando se detecte una violaci ´on de las especificaciones del lenguaje.

Proponer a la persona usuaria formas alternativas v´alidas al texto err ´oneo.

Como puede apreciarse, los desarrollos t´ecnicos hechos alrededor del di- se ˜no de un lenguaje controlado se relacionan con muchos conceptos que se tratan en este libro.

Un ejemplo hist ´orico de lenguaje controlado que fue utilizado para me- jorar los resultados de la traducci ´on autom´atica —concretamente, los ob- tenidos con un sistema tambi´en hist ´orico llamado Weidner MicroCat— es PACE (Perkins Approved Clear English), el lenguaje controlado usado duran- te los a ˜nos ochenta y parte de los noventa por la empresa de ingenier´ıa Per- kins Engines para facilitar la traducci ´on autom´atica de los manuales que describen las caracter´ısticas y el mantenimiento de estos motores (Newton 1992; Douglas y Hurst 1996). Uno de los principios de PACE es “una pa- labra, un significado”, es decir, se establecen restricciones l´exicas claras a trav´es de un diccionario, cosa que simplifica el dise ˜no de los diccionarios del sistema de traducci ´on autom´atica. Adem´as del l´exico, PACE tambi´en especifica la sintaxis (Arnold et al. 1994, secci ´o 8.3). Otros ejemplos de len- guajes controlados son el ScaniaSwedish usado por la firma de camiones y autobuses Scania (Almqvist y S˚agvall Hein 1996), o el Caterpillar Technical English de la compa ˜n´ıa de maquinaria de excavaci ´on Caterpillar.

Tambi´en hay lenguajes controlados que no est´an espec´ıficamente di- se ˜nados para la traducci ´on autom´atica, como el ingl´es simplificado (Sim- plified English) del AECMA (Asociaci ´on Europea de Industrias Aeroespa- ciales), que se caracteriza por “una sintaxis sencilla, un n ´umero limitado de

110 CAP´ITULO 6. TRADUCCI ´ON AUTOM ´ATICA Y APLICACIONES

palabras, un n ´umero limitado de significados bien definidos por palabra (normalmente uno), y un n ´umero limitado de categor´ıas l´exicas14 por pa- labra (normalmente una)”, con “el objetivo de producir textos breves y no ambiguos”(AECMA 2007).

Algunas de las ventajas del uso de lenguajes controlados (Schwitten 2007) se pueden resumir como sigue:

los textos son m´as sencillos e inteligibles;

el mantenimiento de los documentos es m´as f´acil;

se simplifica el tratamiento computacional de los documentos, en par- ticular la traducci ´on autom´atica.

En cuanto a las desventajas, podemos decir que:

el dise ˜no de un lenguaje controlado no es nada trivial: hay que es- tudiar en profundidad corpus de textos pertenecientes al dominio y tomar decisiones dif´ıciles;

el poder de expresi ´on de un lenguaje controlado es siempre m´as res- tringido;

la escritura de textos en un lenguaje controlado es m´as lenta;

es necesaria una inversi ´on adicional de tiempo en el aprendizaje del lenguaje controlado por parte de los autores.

Las dos ´ultimas desventajas se pueden reducir si se dota a los autores de herramientas inform´aticas, como por ejemplo un editor de textos inteligen- te que les ayude a escribir en el lenguaje controlado.

Por ´ultimo, hay que dejar claro que el uso de un lenguaje controlado es una alternativa a la preedici ´on de los textos, pero que no elimina por completo la necesidad de postedici ´on o, al menos, de revisi ´on de las tra- ducciones en bruto.

6.6.

Cuestiones y ejercicios

1. (*) Elegid un idioma cualquiera que conozc´ais bien, L. Seguramen- te L tenga palabras polis´emicas que en otra lengua L0 tienen m´as de una traducci ´on, seg ´un el sentido que se tome. Elegid tres palabras 14Las categor´ıas l´exicas (o simplemente categor´ıas) son conjuntos de palabras que tienen la misma funci ´on sint´actica; hay categor´ıas mayores, l´exicas o de clase abierta (substantivo, adje- tivo, verbo, etc.) que crecen cuando se a ˜nade l´exico nuevo a la lengua y categor´ıas menores, gramaticales o de clase cerrada (art´ıculos, conjunciones, etc.), que no crecen y contienen pala- bras con funci ´on gramatical. La sintaxis se define normalmente, no en t´erminos de palabras, sino en t´erminos de categor´ıas l´exicas.

6.6. CUESTIONES Y EJERCICIOS 111

de L que tengan este problema y describid c ´omo las tratar´ıais en un lenguaje controlado basado en L. Las reglas que formul´eis para los autores que escriban en el lenguaje controlado tienen que estar escri- tas en L y no tienen que contener referencias a otras lenguas.

2. En los sistemas de traducci ´on autom´atica, la preedici ´on... a) ... reduce la cantidad de postedici ´on.

b) ... es una alternativa a la postedici ´on, que elimina completamen- te esta ´ultima fase.

c) ... imposibilita el uso del sistema para tareas de diseminaci ´on de informaci ´on.

3. Indica en cu´al de estas situaciones de traducci ´on autom´atica son me- nos cruciales la gramaticalidad o naturalidad ling ¨u´ıstica de la traduc- ci ´on.

a) Joan usa Web Translator mientras navega por las p´aginas de In- ternet de la Universit¨at Mainz para saber qu´e asignatura da el profesor Karl-Hans Lehninger y cu´ales son sus intereses investi- gadores.

b) Joan usa Web Translator para hacer una versi ´on en alem´an de su p´agina Web.

c) El personal de IBM traduce patentes europeas para detectar po- sibles avances en correcci ´on de errores de comunicaciones digi- tales.

4. Imaginad que podemos elegir entre dos sistemas de traducci ´on au- tom´atica diferente tAy tB para traducir manuales de televisores del

ingl´es al franc´es, y que se tiene que dise ˜nar un ingl´es controlado para minimizar la postedici ´on. Las reglas del ingl´es controlado, ¿pueden depender del sistema de TA elegido?

a) No, porque los lenguajes controlados se tienen que dise ˜nar in- dependientemente de los sistemas de TA.

b) S´ı, porque en cada caso se tienen que evitar problemas diferen- tes.

c) No, porque la lengua meta de los dos sistemas es la misma. 5. Indica cu´al de estas situaciones de traducci ´on autom´atica es de asimi-

laci´on de informaci ´on:

a) Narciso usa el programa traductor del ingl´es al espa ˜nol Spanish Assistant para leer los documentos electr ´onicos que encuentra en Internet sobre la influencia del euskera sobre el gasc ´on.

112 CAP´ITULO 6. TRADUCCI ´ON AUTOM ´ATICA Y APLICACIONES

b) Joan usa Web Translator para hacer una versi ´on en alem´an de su p´agina Web antes de publicarla en Internet.

c) La empresa Into the Wind traduce autom´aticamente su cat´alogo de dos tipos de cometas a varias lenguas.

6. Muchas veces, la preedici ´on la hace el autor cuando interacciona con el programa de traducci ´on autom´atica. ¿Es posible dise ˜nar un sistema de preedici ´on interactiva para autores monoling ¨ues?

a) S´ı.

b) No. Para preeditar correctamente hay que conocer el idioma de destino.

c) S ´olo para ciertos idiomas con estructura gramatical sencilla co- mo el ingl´es.

7. ¿Cu´al de las siguientes no es una ventaja de los lenguajes controlados? a) Se evita la necesidad de que una persona interaccione con el programa de traducci ´on autom´atica para resolver ambig ¨ueda- des durante la traducci ´on.

b) Los textos meta resultantes son mucho m´as cortos. c) Los textos origen se hacen m´as inteligibles.

8. ¿Por qu´e es necesaria la preedici ´on en los sistemas de traducci ´on au- tom´atica?

a) Para evitar construcciones o frases dif´ıciles de traducir. b) Para que el formato quede m´as agradable a la vista. c) Es una alternativa a la postedici ´on.

9. Imaginad que un traductor profesional cobra 0,05 euros por palabra de texto traducido y que un corrector de textos cobra 0,10 euros por palabra de texto corregido. Imaginad que tenemos un sistema de tra- ducci ´on autom´atica que nos cuesta 0,03 euros por palabra traducida y que produce un 10 % de palabras incorrectas en las traducciones. ¿Conviene adoptarlo y contratar al corrector o es mejor contratar al traductor profesional? (si no sab´eis calcularlo en general, haced los c´alculos con un texto de, por ejemplo, 1000 palabras).

10. La traducci ´on autom´atica instant´anea de p´aginas web durante la na- vegaci ´on es un caso de traducci ´on autom´atica. . .

a) . . . con preedici ´on. b) . . . para la diseminaci ´on. c) . . . para la asimilaci ´on.

6.6. CUESTIONES Y EJERCICIOS 113

11. El “control” de los lenguajes controlados. . .

a) . . . se refiere tanto a la terminolog´ıa como a la sintaxis. b) . . . solo puede referirse a la sintaxis.

c) . . . s ´olo puede referirse a la terminolog´ıa.

12. Cuando se usan para la traducci ´on, los lenguajes controlados restrin- gen directamente. . .

a) . . . la lengua meta. b) . . . la lengua origen.

c) . . . tanto la lengua origen como la lengua meta.

13. Si un anglohablante usa el traductor autom´atico–ingl´es de babelfish.altavista.com para leer en l´ınea el diario brasile ˜no O Globo, est´a usando la traduc-

ci ´on autom´atica para un prop ´osito. . . a) . . . de asimilaci ´on de informaci ´on. b) . . . de diseminaci ´on.

c) . . . para el que no est´a pensada.

14. ¿Cu´al es la alternativa est´andar a la preedici ´on en un entorno de pro- ducci ´on masiva de documentaci ´on multiling ¨ue?

a) El uso de un lenguaje controlado b) El uso de un sistema de interlingua. c) La postedici ´on sistem´atica

15. Fran consulta a trav´es de Internet la base de datos terminol ´ogica IA- TE (v´ease el apartado 5.3) cuando traduce dosieres antiglobalizaci ´on del ingl´es al neerland´es. ¿En cu´al de las tres situaciones siguientes se encuentra?

a) Traducci ´on autom´atica asistida por la persona b) Traducci ´on humana asistida por la m´aquina c) Usa un lenguaje controlado

16. Si enviamos un documento HTML a un servidor de traducci ´on au- tom´atica y despu´es posteditamos el resultado para que sea una tra- ducci ´on aceptable del original antes de publicarla, estamos usando la traducci ´on autom´atica. . .

a) . . . con memoria de traducci ´on. b) . . . para la diseminaci ´on.

114 CAP´ITULO 6. TRADUCCI ´ON AUTOM ´ATICA Y APLICACIONES

c) . . . para la asimilaci ´on.

17. La adopci ´on de un lenguaje controlado en una situaci ´on de traduc- ci ´on de documentos de una lengua a muchas lenguas para la disemi- naci ´on es, en el proceso completo, una alternativa a la. . .

a) . . . postedici ´on repetitiva de los documentos meta. b) . . . la preedici ´on repetitiva de los documentos origen.

c) . . . la traducci ´on de fragmentos ya traducidos anteriormente. 18. Un sistema que sugiere mejoras en el estilo de un documento se pue-

de considerar como . . . a) . . . HAMT. b) . . . MAHT.

c) . . . un sistema de traducci ´on autom´atica ergon ´omico.

19. Una inventora monoling ¨ue consulta documentos web traducidos a su lengua para descubrir si su nuevo invento ha sido patentado antes. Si la traducci ´on se hace mediante un sistema autom´atico, ¿qu´e uso est´a haciendo?

a) Asimilaci ´on; m´as concretamente para aquello que se llama scree- ning.

b) Diseminaci ´on.

c) Postedici ´on, ya que el idioma del documento cambia para que pueda ser entendido.

20. El programa de la Generalitat Valenciana SALT 4.0 traduce textos del espa ˜nol a la variedad valenciana del catal´an y pregunta espor´adica- mente a la persona usuaria qu´e equivalente es m´as adecuado para algunas palabras ambiguas dif´ıciles. Esta es una situaci ´on de. . .

a) . . . postedici ´on.

b) . . . traducci ´on autom´atica asistida por la persona. c) . . . traducci ´on humana asistida por el ordenador.

21. Queremos posteditar un texto traducido autom´aticamente mirando tan poco como sea posible el texto original. ¿Nos ayuda conocer cu´ales son las palabras hom ´ografas (v´ease la p. 122) m´as comunes de la len- gua origen?

a) No, porque las palabras hom ´ografas del texto origen no afectan al texto meta en bruto.

6.6. CUESTIONES Y EJERCICIOS 115

c) S´ı, porque son una fuente muy importante de errores especial- mente dif´ıciles de corregir si no se conoce qu´e ha pasado. 22. Una persona est´a escribiendo un documento en lengua origen que

despu´es ser´a traducido autom´aticamente a m´as de una lengua meta y el sistema que usa para escribir le avisa cuando teclea una pala- bra que dar´a problemas de traducci ´on —y le sugiere alternativas— o cuando escribe una estructura que ser´a dif´ıcil de traducir. Esta es una situaci ´on. . .

a) . . . de preedici ´on.

b) . . . de aplicaci ´on de un lenguaje controlado. c) . . . de postedici ´on.

23. ¿Cu´al de las siguientes situaciones es absurda en traducci ´on autom´ati- ca?

a) La postedici ´on en una aplicaci ´on de asimilaci ´on. b) La postedici ´on en una aplicaci ´on de diseminaci ´on.

c) El uso de un lenguaje controlado en una aplicaci ´on de disemina- ci ´on.

24. Solo una de estas tres afirmaciones es correcta. ¿Cu´al?

a) Los lenguajes controlados definen reglas de postedici ´on.

b) El uso de un lenguaje controlado elimina completamente la ne- cesidad de postedici ´on.

c) Cuando se aplican las reglas de un lenguaje controlado, el tex- to resultante es gramaticalmente aceptable, pero se evitan cons- trucciones y palabras que dan problemas.

25. Un sistema de traducci ´on autom´atica hipot´etico del ruso al espa ˜nol produce texto que es b´asicamente correcto excepto por el hecho de que no genera ni art´ıculos determinados (el, la, los, las) ni indetermi- nados (un, una, unos, unas). ¿Qu´e dir´ıais de este sistema?

a) Que es especialmente adecuado para la asimilaci ´on, pero no tan- to para la diseminaci ´on porque los art´ıculos son m´as del 10 % del texto.

b) Que es especialmente adecuado para la diseminaci ´on, ya que los art´ıculos son palabras muy poco frecuentes en el texto y por lo tanto, no ser´a necesaria mucha postedici ´on.

c) Que no es ´util ni para la asimilaci ´on ni para la diseminaci ´on. 26. ¿Se puede posteditar sin mirar el texto original?

116 CAP´ITULO 6. TRADUCCI ´ON AUTOM ´ATICA Y APLICACIONES

a) S´ı.

b) En general, no. Quien postedita produce una traducci ´on. Por lo tanto, tiene que estar seguro de que el resultado es traducci ´on del texto original.

c) Si el texto es t´ecnico, se puede hacer sin mirar. En otro caso, hay que mirar siempre el texto original.

27. El uso de un lenguaje controlado hace que . . . a) . . . la escritura sea m´as r´apida.

b) . . . el estilo del documento resultante sea m´as homog´eneo. c) . . . el poder de expresi ´on del idioma sea m´as grande.

28. Cuando posteditamos un texto encontramos una palabra que el tra- ductor autom´atico no ha sabido traducir y nos la ofrece en la lengua origen. Sin embargo, este error no ha afectado a la traducci ´on del res- to de la oraci ´on. ¿Qu´e debemos que hacer?

a) Preeditar el texto original completo sustituyendo la palabra por un sin ´onimo que s´ı reconozca el traductor autom´atico y volver a traducir todo el texto.

b) Probar a traducir todo el texto con otro traductor autom´atico. c) Corregirla y seguir posteditando.

29. Si en una f´abrica de frigor´ıficos se usan sistemas de traducci ´on au- tom´atica para traducir a otras muchas lenguas los manuales de los numerosos modelos que se fabrican (y que son muy similares entre s´ı), la soluci ´on m´as eficiente para evitar errores de traducci ´on es. . .

a) . . . regular la manera en la que los autores escriben los manuales. b) . . . posteditar todas las traducciones.

c) . . . preeditar los manuales antes de traducirlos.

30. A la hora de preeditar un texto para traducirlo autom´aticamente con- viene . . .

a) . . . usar frases cortas. b) . . . usar la forma pasiva.

c) . . . usar oraciones subordinadas.

31. La postedici ´on de la traducci ´on realizada por un traductor autom´ati- co es siempre necesaria . . .

a) . . . para usarla con finalidades de diseminaci ´on. b) . . . para usarla con finalidades de asimilaci ´on. c) . . . cuando se ha realizado tambi´en preedici ´on.

6.7. SOLUCIONES 117

6.7.

Soluciones

1. (*) Por ejemplo, si L es el espa ˜nol, palabras como escondite pueden re- ferirse a un lugar donde esconderse (1) o a un juego (2) (en L0=catal´an, amagatall (1) y fet, amagar, fet a amagar o conillets a amagar (2)). En el len- guaje controlado, se podr´ıa evitar el primer significado proponiendo a los autores que usaran la palabra alternativa escondrijo. Las reglas se podr´ıan formular como sigue en espa ˜nol:

escondite ´usese s ´olo en el sentido de “juego del escondite”; ´usese escondrijo si se quiere indicar el lugar donde se esconde alguna persona o cosa.

registro ´usese s ´olo en el sentido de ”transcripci ´on”, ¨ınscripci ´on” uno .oficina de registro”; ´usese inspecci ´on cuando se refiera, por ejem-

plo, a la investigaci ´on detallada de un local por parte de la po- lic´ıa.

explotar ´usese s ´olo en el sentido de .aprovechar econ ´omicamente”;

´usese estallar en el sentido de “deflagrar” (una bomba, etc.) o “reventar” (un globo, etc.).

2. (a) 3. (a) 4. (b) 5. (a)

6. (a). Las preguntas se pueden plantear como en el problema 1. 7. (b)

8. (a)

9. Soluci ´on 1 (n palabras): El traductor profesional traduce un texto de npalabras por 0,05×n euros. El sistema de traducci ´on autom´ati- ca lo traduce por 0,03×n y corregirlo cuesta 0,10×(10/100) × n, es decir, 0,01×n euros porque s ´olo 10 de cada 100 palabras son incorrectas. Por lo tanto, el sistema semiautom´atico cuesta s ´olo (0,03+0,01) × n =0,04×n euros, frente a los 0,05×n euros del traductor profesional.

Soluci ´on 2 (1000 palabras): El traductor profesional traduce un texto de 1000 palabras por 0,05×1000=50 euros. El sistema de traduc- ci ´on autom´atica lo traduce por 0,03×1000=30 euros, y corregirlo cuesta 10 euros, porque en 1000 palabras hay 1000×10/100=100

118 CAP´ITULO 6. TRADUCCI ´ON AUTOM ´ATICA Y APLICACIONES

Por lo tanto, el sistema semiautom´atico cuesta s ´olo 40 euros, frente a los 50 del traductor profesional.

10. (c) 11. (a) 12. (b) 13. (a) 14. (a) 15. (b) 16. (b) 17. (b) 18. (b) 19. (a) 20. (b) 21. (c) 22. (b) 23. (a) 24. (c) 25. (a) 26. (b) 27. (b) 28. (c) 29. (a) 30. (a) 31. (a)

Cap´ıtulo 7

¿Por qu´e es dif´ıcil la traducci ´on

autom´atica? Ambig ¨uedad