• No se han encontrado resultados

Tema 7. Reconocimiento del locutor

N/A
N/A
Protected

Academic year: 2021

Share "Tema 7. Reconocimiento del locutor"

Copied!
15
0
0

Texto completo

(1)

Tema 7. Reconocimiento del locutor

7.1.- Introducción 7.2.- Clasificación

7.3.- Fases del reconocimiento 7.4.- Técnicas de reconocimiento 7.5.- Evaluación

(2)

7.1.- Introducción

• Reconocimiento de voz:

• Identificar las palabras pronunciadas.

• Entender el significado.

• Reconocimiento del locutor:

• Averiguar la identidad de la persona que habla

(3)

7.1.- Introducción

• Variabilidad interlocutor:

• En reconocimiento de voz es un problema que dificulta la tarea

• En reconocimiento del locutor contiene la información sobre la identidad

• Diagrama de bloques genérico:

Extracción

características Comparación Plantillas

Pre-

procesado Decisión

Voz

(4)

7.2.- Clasificación

• Según la tarea a realizar:

• Identificación o Autentificación

• Acústica forense

• Muestras dubitadas e indubitadas

• Transcripciones automáticas

• Verificación

• Acceso a instalaciones o sistemas

• Validación de transacciones

(5)

7.2.- Clasificación

• Según la dependencia del texto:

• Dependientes del texto:

• Se entrenan con un texto dado

• Se reconoce ese mismo texto

• Relativamente sencillo

• Independientes del texto

• Cualquier texto de entrada vale

• Más complejo

(6)

7.3.- Fases del reconocimiento

• Hay dos fases:

• Entrenamiento

• Reconocimiento

• Fase de entrenamiento:

• Obtener los modelos característicos de cada locutor

Extracción

características Entrenamiento

Modelo Modelo

Locutor X Voz Locutor X

(7)

7.3.- Fases del reconocimiento

• Fase de reconocimiento:

• Determinar la identidad de un locutor

Verificación

Extracción

características Verificación Modelo Locutor X

Aceptación o Rechazo Voz

Supuesta Identidad: Locutor X

(8)

7.3.- Fases del reconocimiento

• Fase de reconocimiento:

• Determinar la identidad de un locutor

Reconocimiento o Autentificación

Modelos Locutores

Locutor X o

Desconocido

Extracción

características Comparación

Voz

(9)

7.4.- Técnicas de reconocimiento

• Se emplean las mismas técnicas que en reconocimiento de voz

• Ajuste de plantillas (DTW)

• Modelos ocultos de Markov

• Redes neuronales

(10)

7.4.1.- Ajuste de plantillas

• El trabajo a realizar depende mucho de si el sistema es dependiente o independiente del texto

• Sistemas dependientes del texto:

• Método similar al de reconocimiento de voz

• Cada locutor tiene uno o varios patrones en el vocabulario

• Ahora el vocabulario contiene locutores en vez de palabras

• Para comparar dos patrones: DTW

(11)

7.4.1.- Ajuste de plantillas

• Sistemas dependientes del texto:

• Verificación:

• Comparar solamente con el patrón del supuesto locutor.

• Si la distancia es menor que un umbral se acepta

• Identificación:

• Comparar con todos los patrones

• Posibilidades:

• La menor distancia indica el locutor

• Regla de los k vecinos: Las k menores distancias indican el locutor

• Umbral mínimo: para poder indicar “Ninguno”

(12)

7.4.1.- Ajuste de plantillas

• Sistemas dependientes del texto:

• Ejemplo: Regla de los k vecinos (6 vecinos):

• Las 6 menores distancias indican:

• Locutor 2

• Locutor 2

• Locutor 1

• Locutor 3

• Locutor 2

• Locutor 6

• Locutor reconocido: Locutor 2

• Debe haberse superado el umbral mínimo

(13)

7.4.1.- Ajuste de plantillas

• Sistemas independientes del texto:

• Sistema completamente distinto

• Se emplean los estadísticos a largo plazo de la voz

• Valores promedios

• Tasas de errores más elevadas

• Carga computacional elevada

• No funciona en aplicaciones en tiempo real

• Ejemplo de estadísticos a largo plazo:

• Obtener de unos 40 segundos de tiempo…

• F0 media y su desviación típica

• Coeficientes LPC promedios y sus desviaciones típicas

(14)

7.5.- Evaluación

• Para evaluar un sistema de reconocimiento del locutor debemos calcular:

• Tasa de falso rechazo:

• Probabilidad de rechazar a un locutor válido

• Tasa de falsa aceptación:

• Probabilidad de aceptar a un impostor

• Son tasas contrapuestas

• Aumentar una implica disminuir la otra y viceversa

(15)

7.5.- Evaluación

• Umbral de decisión

Referencias

Documento similar

[r]

Un trabajo que utiliza una de estas redes para detectar señales de tráfico de una base de datos china [37], obtuvo una tasa de detección en secuencias de imágenes continua de 99

En un texto posterior Vidal —esta vez en compañía del también locutor de radio Federico Jiménez Losantos— llevará esta idea al extremo y afirmará, ya sin ningún reparo —y

¸ Ca peut nous aider ` a traiter le son st´ er´ eo, ` a d´ ecider quelles sont les algorithmes qu’on peut utiliser pour les diff´ erentes cas qu’on peut se trouver et a

Una vez visto la estructura de cada tabla, de ambas bases de datos, y explicado el contenido de cada campo vemos que la aplicación interactuará con las bases de datos no solo

[r]

SVP, EXECUTIVE CREATIVE DIRECTOR JACK MORTON

Social Media, Email Marketing, Workflows, Smart CTA’s, Video Marketing. Blog, Social Media, SEO, SEM, Mobile Marketing,