• No se han encontrado resultados

RECONOCIMIENTO DE HABLA Y SISTEMAS DE DIÁLOGO

N/A
N/A
Protected

Academic year: 2021

Share "RECONOCIMIENTO DE HABLA Y SISTEMAS DE DIÁLOGO"

Copied!
39
0
0

Texto completo

(1)

MÁSTER OFICIAL EN

LENGUA ESPAÑOLA Y LITERATURA HISPÁNICA

Aplicación de las tecnologías de la información y de la

comunicación (TIC) a la Lengua española

Tecnologías del habla, Carme de-la-Mota

(2)

GUIÓN DEL CURSO

„

Interacción entre personas y ordenadores

„

Conversión de texto en habla

„

Reconocimiento de habla

„

Sistemas de diálogo

„

Interacción entre personas mediatizada por ordenador

„

Traducción de lenguas orales

„

Traducción entre lengua oral y lengua de signos

„

Reconocimiento de habla y generación de caras animadas

para lectura labial

„

La necesidad de crear y etiquetar corpus orales

(3)

1. Interacción

entre personas y ordenadores

„

Conversión de texto en habla

„

Reconocimiento de habla

(4)
(5)

Reconocimiento

„

Reconocimiento de la lengua

„

Reconocimiento del habla

„

Comprensión del habla

(6)

Reconocimiento: módulos

J. Llisterri, C. Carbó, M. J. Machuca, C. de-la-Mota, M. Riera, A. Ríos (2003) "El papel de la lingüística en

el desarrollo de las tecnologías del habla“, en M. Casas Gómez (dir.) y C. Varo Varo (ed.) VII Jornadas

de Lingüística. Cádiz: Universidad de Cádiz. ISBN: 84-88423-30-6: 137-191

(7)

„

Vocabulario

„

Restringido

„

Sin restricciones

„

Pausas

„

Reconocimiento de palabras aisladas

„

Reconocimiento de habla continua

„

Locutor

„

Dependiente del locutor: entrenamiento previo

(8)

Reconocimiento

modelo

almacenado

(9)

Problemas: los entornos ruidosos

„

Medios de transporte, oficinas, fábricas…

„

Tipos de ruidos:

„

Predecibles

(10)

Problemas: segmentación de unidades

(11)

Captura de cambios

en la señal

(Richard M.Stern, Xiang Li, Jon Nedel, Mike Seltzer y Rita Singh (2002) “Reconocimiento del habla en ambientes GSM y ruidosos: progreso y enfoques futuros”, Department of Electrical and Computer Engineering and School of Computer Science Carnegie Mellon University

Estimación de fronteras: dendograma

(12)

Estimación de fronteras: HMM

basado en el centro del fonema

„

Detección de la zona estable

(13)

+voicing -voicing

-obstruent

+obstruent -sonorant +sonorant

Estimación de fronteras:

conocimiento lingüístico

„

Búsqueda de la coherencia espectral

(14)

Dragon 10, Nuance

Dragon 10, español (Dragon Naturally Speaking)

Nuance

(15)

Nuance mobile dictation

(16)

Reconocimiento: Windows Vista

(17)

Navegación por voz: By voice

Vídeo

Demostración Vi-clone

(18)

„

IBM Via Voice

http://www-4.ibm.com/software/speech/

„

Philips FreeSpeech 2000

(19)

Webgrader

(20)

TELL ME MORE® ONLINE

(21)

Identificación y verificación del hablante:

la firma vocal

„

Comparación con voces de una base de

datos

„

Identificación y verificación de la persona por

la voz: control de acceso, personalización,

bloqueo y desbloqueo de elementos (p.ej. un

terminal), transacciones comerciales por

(22)

Identificación y verificación

comparación

voz dubitada

(23)

Proyecto VILE

„

Estudio acústico de la variación

inter e intralocutor en español

„

2 etapas

„

VILE: BFF2001-2551, 2001-2004 y

(24)

Proyecto VILE y VILE II

„

BFF2001-2551, 2001-2004 y HUM2005-06980/FILO, 2005-2009

„

Mª José Albalá y Juana Gil

Laboratorio de Fonética, CSIC

„

Elena Battaner

Departamento de Comunicación II, Universidad Rey Juan Carlos

„

Victoria Marrero (IP, VILE II)

Departamento de Lengua Española y Lingüística General,

Universidad Nacional de Educación a Distancia

„

Mario Carranza, Carme de-la-Mota, Joaquim Llisterri (IP, VILE I),

María Jesús Machuca, Natalia Madrigal, Montse Marquina,

Montserrat Riera y Antonio Ríos

(25)

Objetivos del proyecto VILE

1.

Caracterización acústica de los elementos

segmentales y suprasegmentales que contribuyen a

establecer la individualidad de un hablante

2.

Conocimiento fonético para la mejora de los

sistemas de reconocimiento, identificación o

verificación automáticas del locutor

3.

Nuevos datos acústicos para la práctica de la

fonética forense

(26)

Etapas del proyecto VILE y VILE II

„

Delimitación de los fenómenos fonéticos objeto de

interés

„

Análisis acústico de los fenómenos fonéticos

seleccionados en una muestra de materiales extraída

de corpus disponibles

„

Estudio de los resultados desde la perspectiva de la

variación interlocutor e intralocutor

„

Validación perceptiva

(27)

Resultados: VILE

Identificación de locutores

„

F0 aparece como el parámetro más relevante

„

LTAS aparece como el segundo parámetro más

relevante

„

Buena identificación de un hablante con una elevada

variación en F2 y con poca variación en F1

„

Mala identificación de un hablante con una elevada

variación en F1 y con poca variación en F2

„

Poco peso de la fricativa alveolar sorda [s]

(28)

1.3. Sistemas de diálogo

„

Reconocimiento de habla

„

Comprensión del lenguaje natural y gestión

del diálogo

„

Acceso a bases de datos, sistemas de

interrogación y respuesta, entornos

colaborativos, teleoperación, adaptación al

usuario

(29)

Sistemas de diálogo: módulos

J. Llisterri, C. Carbó, M. J. Machuca, C. de-la-Mota, M. Riera, A. Ríos (2003) "El papel de la lingüística en

el desarrollo de las tecnologías del habla“, en M. Casas Gómez (dir.) y C. Varo Varo (ed.) VII Jornadas

de Lingüística. Cádiz: Universidad de Cádiz. ISBN: 84-88423-30-6: 137-191

(30)

„

Interpretación semántica:

„

A primera hora de la mañana

„

Un poco más tarde [de la hora propuesta por

(31)

Estudio de interacciones

Persona

Persona

(32)

Mago de Oz

Persona

Persona

diálogo

Foto: teclarosrg

(33)

Sistema de diálogo aplicado al control

HIFI (Proyecto EDECÁN, UPM)

(34)

Portales de voz :ydilo.com

(35)

Banca por teléfono: BpT – Natural vox

(36)

Logopedia.

Sistemas virtuales de terapia

ORLA VT

(Oral Reading for Language in Aphasia with Virtual Therapist) The Center of Spoken Language, Colorado

(37)

Sistemas tutoriales inteligentes

Persona ESTUDIANTE

Ordenador TUTOR

(38)

Interrogativas en tutorías

„

Obtención de datos de PROSODIA sobre

interrogativas con una finalidad aplicada

„

Sistemas tutoriales inteligentes

„

Liscombe, Venditti y Hirschberg (2006)

„

Venditti (2006)

„

Venditti, Hirschberg y Liscombe (2006)

„

Liscombe (2007)

„

Hirschberg (2008)

ITSpoke,

Intelligent Tutoring Spoken Dialogue System

INGLÉS

(39)

1. Interacción

entre personas y ordenadores

„

Conversión de texto en habla

„

Reconocimiento de habla

Referencias

Documento similar

traducción automática y reconocimiento de habla. Conocimiento de los aspectos lingüísticos de las patologías del lenguaje. Conocimiento de la gramática del español y de las técnicas

La primera etapa del sistema es la detección de color, como ya se ha comentado, para la búsqueda de las señales elegidas los colores interesantes son el rojo y el azul, el algoritmo

Fundación Ramón Menéndez Pidal / Universidad Autónoma de Madrid... Fundación Ramón Menéndez Pidal / Universidad Autónoma

¸ Ca peut nous aider ` a traiter le son st´ er´ eo, ` a d´ ecider quelles sont les algorithmes qu’on peut utiliser pour les diff´ erentes cas qu’on peut se trouver et a

Una vez visto la estructura de cada tabla, de ambas bases de datos, y explicado el contenido de cada campo vemos que la aplicación interactuará con las bases de datos no solo

El presente libro pretende contribuir a ello, proponiendo una reflexión crítica sobre los aportes posibles de recoger desde los planteamientos honnethianos, especialmente sobre

Reconocimiento recíproco. L o s beneficiarios del servicio y/o las entidades sociales, a menudo en colaboración con los educadores, llevan a cabo iniciativas para

En este trabajo se propone un m´etodo para reconocer rostros de bajo costo computacional y robusto a cambios de iluminaci´on, postura y expresi´on facial. El m´etodo propuesto se