2.2 Características lingüísticas de la Lengua de Signos Española
2.2.1 Sistemas de escritura de lengua de signos
A la hora de desarrollar sistemas de traducción automática con leguas de signos, se requiere texto o una representación simbólica para los signos. A continuación, se describen los principales sistemas de escritura que se utilizan.
Español Se come bien
14
2.2.1.1
Sistemas ortográficos: Glosas
Los sistemas ortográficos son aquéllos que únicamente realizan un etiquetado con el que transcriben el signo. Para ello, emplean palabras de la lengua oral, por lo que se trata de un sistema que no describe completamente la representación del signo que escriben. Por tanto, es necesario un conocimiento adicional por parte del lector para su comprensión.
A este tipo de notación pertenecen las glosas, que son una representación semántica de la lengua de signos, en la que el significado del signo se transcribe con la palabra en mayúsculas de su correspondiente en la lengua hablada. Entre las ventajas asociadas a este sistema de notación, destacan la facilidad para utilizarlas (escribirlas y almacenarlas) en sistemas computarizados, y en cualquier tipo de documento, y la sencilla comprensión lectora del contenido escrito para una persona que no conozca la lengua de signos.
Con estas ventajas y teniendo en cuenta que es la alternativa más empleada por la Confederación Estatal de Personas Sordas (CNSE), es el sistema de escritura que se ha considerado más adecuado para el desarrollo de esta tesis doctoral. Ésta es la mejor manera de representación a la hora de realizar experimentos sobre el corpus paralelo. Aunque otros sistemas, como HamNoSys (Prillwitz et al., 1989), SEA (Herrero, 2003) o SiGML (Elliott et al., 2004), se utilizan también en esta tesis a la hora de editar los signos que después representa el agente animado.
Sin embargo, este sistema de escritura de los signos mediante glosas, dada su naturaleza, presenta limitaciones serias en la práctica. Una de las más importantes es su falta de normalización, lo que provoca que distintas personas sordas empleen glosas distintas para el mismo signo y que, además, sea poco intuitiva para aquellas personas sordas que no sepan la lengua escrita o tengan dificultades para comprenderla. Trabajos previos han señalado ya las limitaciones que tienen debido a las discrepancias (Pizzuto et al., 2006) y a interpretar mal los signos individuales frente a los signos en discurso (Pizzuto and Pietrandrea, 2001).
Otra crítica a este sistema de glosas es el hecho de que puede parecer que para traducir una frase en lengua oral a lengua de signos basta con poner en mayúsculas las palabras en la lengua oral. Pero esto es del todo falso; además de cambiar el orden de las frases, hay muchos signos que representan aspectos del discurso que no aparecen en la frase original
2.2.1.2
Sistemas icónicos: Stokoe
Los sistemas icónicos son los que tratan de describir características de los signos, tales como posiciones o movimientos de la mano, mediante símbolos. A diferencia de los anteriores, estos sistemas sí describen completamente los signos.
La notación Stokoe es la primera de este tipo de sistemas. Se desarrolló en 1960 específicamente para la ASL (Stokoe, 1960), posteriormente se ha extendido a la Lengua de Signos Británica (BSL) o Irlandesa (ISL), entre otras. Contempla cuatro
15
factores para la descripción de los signos: “TAB: tabulation” que se refiere a la localización espacial, “DEZ: designator” asociado a la forma de la mano, “SiG: signation” correspondiente al tipo de movimiento articulado y, en los últimos años, se ha añadido un campo más: “orientation”, que describe la orientación de la mano (O’Baoill and Matthews, 2000).
Para la transcripción de los signos, este sistema se organiza secuencialmente en los campos citados anteriormente, empleando el alfabeto latino y la numeración árabe para definir la forma de la mano, y otros símbolos no alfabéticos para la posición, movimiento y orientación de la misma.
La gran desventaja de este sistema es que está enfocado a I+D y no lo conocen las personas sordas. Además, carece de medios para describir las características no manuales, como pueden ser expresiones faciales o movimientos de cabeza y cuerpo. Por otro lado, no existen corpus extensos disponibles en este formato para su uso como corpus paralelo en un sistema de traducción.
2.2.1.3
Sistemas icónicos: SEA
El Sistema de Escritura Alfabética (SEA) (Herrero, 2003) es un sistema de transcripción fonética desarrollado en la Universidad de Alicante. Fue elaborado específicamente para la Lengua de Signos Española (LSE); sin embargo, podría adaptarse a otras lenguas de signos. Para la representación escrita de los signos utiliza caracteres alfabéticos en minúsculas, acentos y algún carácter no-ASCII. Esta característica facilita su uso en ordenadores y su normalización. Como inconvenientes cabe señalar que es poco intuitivo y sólo válido para la LSE.
El signo se divide en distintos campos: lugar (localización), contacto (se refiere a si hay contacto de la mano con el cuerpo), configuración (forma de la mano), orientación (de la mano), dirección (relativo a los movimientos direccionales) y forma (forma de los movimientos).
2.2.1.4
Sistemas pictográficos: HamNoSys
La notación HamNoSys7 (Hamburg Notation System) es un sistema de transcripción fonético para la lengua de signos desarrollado por un grupo de personas sordas y oyentes en la Universidad de Hamburgo, cuya primera versión se generó en 1989 (Prillwitz et al., 1989). Este sistema emplea pictogramas esquemáticos para describir las diferentes características de los signos. Se organiza en los siguientes campos: configuración, orientación, localización y movimientos de la mano. Permite incluir más detalle que el sistema de Stokoe en las descripciones, puesto que contempla características no manuales como pueden ser las expresiones faciales o los movimientos del cuerpo.
7
16
Es una de las notaciones más extendidas a nivel internacional, ya que no es específica de ninguna lengua de signos, sino que puede ser utilizada para transcribir cualquiera. Además, su carácter esquemático la hace mucho más intuitiva.
Sin embargo, los caracteres especiales que utiliza HamNoSys lo hacen poco práctico y tampoco se dispone de corpus amplios con esta notación. Existe un sistema denominado SiGML (Signing Gesture Markup Language) que, basándose en XML, contiene la misma información que la descripción en HamNoSys pero en un formato que pueden procesar los ordenadores, permitiéndose su uso y almacenamiento en los mismos (Elliott et al., 2004).
2.2.1.5
Sistemas pictográficos: Sign writing
SignWriting8 es un sistema de signo-escritura que fue desarrollado en 1974 en EEUU para la Lengua de Signos Americana (ASL). Sus características son muy similares a las de HamNoSys, utilizando pictogramas para la representación de los signos aislados o frases. La principal ventaja con respecto a HamNoSys es la capacidad de transcribir gestos no manuales, como los relacionados con la cara y el cuerpo, de la que carecía HamNoSys hasta las últimas versiones en las que ya se ha empezado a incluir. A diferencia de las notaciones anteriores, con ésta se realiza una escritura vertical de arriba abajo y los pictogramas son más complejos, lo que hace su almacenamiento y escritura más complicados. Al igual que con HamNoSys, existe un formato basado en XML que permite su uso en ordenadores e Internet y se denomina SWML (SignWriting Markup Language)9.
Para la elaboración de esta tesis se emplean varias notaciones: glosas, SEA y HamNoSys. En general, los corpus paralelos contienen frases en LSE formadas por glosas. Se escoge esta notación por ser la más sencilla de procesar por el ordenador y porque además, los expertos en LSE encargados de traducir las frases en español a LSE son conocedores de esta forma de escritura de los signos. Sin embargo, a la hora de editar los signos para que el agente animado los represente, se utiliza la notación SEA, ya que es el único estándar de signo-escritura de LSE incluido en el diccionario normativo desarrollado por la CNSE, y en HamNoSys, por ser la notación más ampliamente extendida y más intuitiva que SEA, además de ser la notación que entiende el agente animado utilizado. Finalmente, se dispone de un editor de signos que permite convertir de SEA a HamNoSys, así como de HamNoSys a SiGML (notación que, basándose en XML, contiene la misma información que la descripción en HamNoSys).
A continuación, en la Tabla 2.2-1 puede verse una comparativa entre las distintas notaciones. 8 http://www.signwriting.org/ 9 http://signwriting.org/forums/software/swml/swml01.html
17
Tabla 2.2-1. Ejemplos de las distintas notaciones para los signos