MÁSTER OFICIAL EN
LENGUA ESPAÑOLA Y LITERATURA HISPÁNICA
Aplicación de las tecnologías de la información y de la
comunicación (TIC) a la Lengua española
Tecnologías del habla, Carme de-la-Mota
GUIÓN DEL CURSO
Interacción entre personas y ordenadores
Conversión de texto en habla
Reconocimiento de habla
Sistemas de diálogo
Interacción entre personas mediatizada por ordenador
Traducción de lenguas orales
Traducción entre lengua oral y lengua de signos
Reconocimiento de habla y generación de caras animadas
para lectura labial
La necesidad de crear y etiquetar corpus orales
1. Interacción
entre personas y ordenadores
Conversión de texto en habla
Reconocimiento de habla
Reconocimiento
Reconocimiento de la lengua
Reconocimiento del habla
Comprensión del habla
Reconocimiento: módulos
J. Llisterri, C. Carbó, M. J. Machuca, C. de-la-Mota, M. Riera, A. Ríos (2003) "El papel de la lingüística en
el desarrollo de las tecnologías del habla“, en M. Casas Gómez (dir.) y C. Varo Varo (ed.) VII Jornadas
de Lingüística. Cádiz: Universidad de Cádiz. ISBN: 84-88423-30-6: 137-191
Vocabulario
Restringido
Sin restricciones
Pausas
Reconocimiento de palabras aisladas
Reconocimiento de habla continua
Locutor
Dependiente del locutor: entrenamiento previo
Reconocimiento
modelo
almacenado
Problemas: los entornos ruidosos
Medios de transporte, oficinas, fábricas…
Tipos de ruidos:
Predecibles
Problemas: segmentación de unidades
Captura de cambios
en la señal
(Richard M.Stern, Xiang Li, Jon Nedel, Mike Seltzer y Rita Singh (2002) “Reconocimiento del habla en ambientes GSM y ruidosos: progreso y enfoques futuros”, Department of Electrical and Computer Engineering and School of Computer Science Carnegie Mellon University
Estimación de fronteras: dendograma
Estimación de fronteras: HMM
basado en el centro del fonema
Detección de la zona estable
+voicing -voicing
-obstruent
+obstruent -sonorant +sonorant
Estimación de fronteras:
conocimiento lingüístico
Búsqueda de la coherencia espectral
Dragon 10, Nuance
Dragon 10, español (Dragon Naturally Speaking)
Nuance
Nuance mobile dictation
Reconocimiento: Windows Vista
Navegación por voz: By voice
Vídeo
Demostración Vi-clone
IBM Via Voice
http://www-4.ibm.com/software/speech/
Philips FreeSpeech 2000
Webgrader
TELL ME MORE® ONLINE
Identificación y verificación del hablante:
la firma vocal
Comparación con voces de una base de
datos
Identificación y verificación de la persona por
la voz: control de acceso, personalización,
bloqueo y desbloqueo de elementos (p.ej. un
terminal), transacciones comerciales por
Identificación y verificación
comparación
voz dubitada
Proyecto VILE
Estudio acústico de la variación
inter e intralocutor en español
2 etapas
VILE: BFF2001-2551, 2001-2004 y
Proyecto VILE y VILE II
BFF2001-2551, 2001-2004 y HUM2005-06980/FILO, 2005-2009
Mª José Albalá y Juana Gil
Laboratorio de Fonética, CSIC
Elena Battaner
Departamento de Comunicación II, Universidad Rey Juan Carlos
Victoria Marrero (IP, VILE II)
Departamento de Lengua Española y Lingüística General,
Universidad Nacional de Educación a Distancia
Mario Carranza, Carme de-la-Mota, Joaquim Llisterri (IP, VILE I),
María Jesús Machuca, Natalia Madrigal, Montse Marquina,
Montserrat Riera y Antonio Ríos
Objetivos del proyecto VILE
1.
Caracterización acústica de los elementos
segmentales y suprasegmentales que contribuyen a
establecer la individualidad de un hablante
2.
Conocimiento fonético para la mejora de los
sistemas de reconocimiento, identificación o
verificación automáticas del locutor
3.
Nuevos datos acústicos para la práctica de la
fonética forense
Etapas del proyecto VILE y VILE II
Delimitación de los fenómenos fonéticos objeto de
interés
Análisis acústico de los fenómenos fonéticos
seleccionados en una muestra de materiales extraída
de corpus disponibles
Estudio de los resultados desde la perspectiva de la
variación interlocutor e intralocutor
Validación perceptiva
Resultados: VILE
Identificación de locutores
F0 aparece como el parámetro más relevante
LTAS aparece como el segundo parámetro más
relevante
Buena identificación de un hablante con una elevada
variación en F2 y con poca variación en F1
Mala identificación de un hablante con una elevada
variación en F1 y con poca variación en F2
Poco peso de la fricativa alveolar sorda [s]
1.3. Sistemas de diálogo
Reconocimiento de habla
Comprensión del lenguaje natural y gestión
del diálogo
Acceso a bases de datos, sistemas de
interrogación y respuesta, entornos
colaborativos, teleoperación, adaptación al
usuario
Sistemas de diálogo: módulos
J. Llisterri, C. Carbó, M. J. Machuca, C. de-la-Mota, M. Riera, A. Ríos (2003) "El papel de la lingüística en
el desarrollo de las tecnologías del habla“, en M. Casas Gómez (dir.) y C. Varo Varo (ed.) VII Jornadas
de Lingüística. Cádiz: Universidad de Cádiz. ISBN: 84-88423-30-6: 137-191
Interpretación semántica:
A primera hora de la mañana
Un poco más tarde [de la hora propuesta por
Estudio de interacciones
Persona
Persona
Mago de Oz
Persona
Persona
diálogo
Foto: teclarosrg
Sistema de diálogo aplicado al control
HIFI (Proyecto EDECÁN, UPM)
Portales de voz :ydilo.com
Banca por teléfono: BpT – Natural vox
Logopedia.
Sistemas virtuales de terapia
ORLA VT
(Oral Reading for Language in Aphasia with Virtual Therapist) The Center of Spoken Language, Colorado