Introducción a las Tecnologías del Habla

Anuncio
Introducción a las Tecnologı́as del Habla
Presentación de papers relacionados
Prof. Agustı́n Gravano
Modelización de patrones
melódicos del español para la
sı́ntesis y el reconocimiento de
habla
26 de Noviembre de 2014
Alumna: Ana Sarriés
Juan Marı́a Garrido, Laboratorio de
fonética de la universidad autónoma de
Barcelona, 1991
El paper
2 of 27
El paper
Cómo está organizado
Cap.1 Generalidades
Cap.2 Repaso sobre los estudios existentes hasta aquel momento
Cap.3 Sistema de estilización propuesto
Cap.4 Análisis y clasificación propuesta
Cap.5 Conclusiones
3 of 27
El paper: Generalidades
4 of 27
El paper: Generalidades
¿Qué es la entonación?
Es un fenómeno lingüı́stico relacionado con la percepción de:
Frecuencia fundamental (Fo)
Amplitud
Duración
Relaciona dos planos: el fı́sico y el semántico-funcional
5 of 27
El paper: Repaso estudios existentes
6 of 27
El paper: Repaso estudios existentes
Tomás Navarro, 1981
Propone cuatro grupos de patrones melódicos (modalidad oracional):
Enunciativos
Interrogativos
Exclamativos
Volitivos
7 of 27
El paper: Repaso estudios existentes
Tipos de criterios de reconocimiento
Aproximación por niveles
Aproximación por contornos
8 of 27
Waibel, 1988
Smoothing de la curva de Fo
El paper: Sistema de estilización propuesto
9 of 27
El paper: Sistema de estilización propuesto
Objetivos y alcance
Centrado en el idioma español
en patrones terminales.
en la información de la modalidad oracional.
Utilizable tanto en sı́ntesis como en reconocimiento.
Se excluyó la duración y la amplitud del análisis.
Se excluyeron las variaciones relativas al acento.
10 of 27
El paper: Sistema de estilización propuesto
Procedimiento
1. Localización de puntos de inflexión en la curva de Fo
2. Normalización frecuencial
3. Interpolación mediante rectas
11 of 27
El paper: Análisis y resultados
12 of 27
El paper: Análisis y resultados
Elaboración del corpus
54 frases
Leı́das en un contexto de 30 diálogos
Pares mı́nimos
13 of 27
El paper: Análisis y resultados
Elaboración del corpus -
14 of 27
Fragmento de diálogos utilizados
El paper: Análisis y resultados
Elaboración del corpus -
15 of 27
Clasificación según sı́labas acentuadas
El paper: Análisis y resultados
Grabación del corpus
4 locutores
Magnetófono Revox A77
Mic direccional SENNHEISER MD 441N
16 of 27
El paper: Análisis y resultados
Digitalización del corpus
MACSPEECH LAB
Filtro antialiasing
Muestreo de 10KHz
17 of 27
El paper: Análisis y resultados
Estilización
Se tuneó el umbral para filtrar puntos de inflexión relevantes en
algo menos que 10Hz
Se realizó una normalización temporal
Se estilizaron las curvas de Fo de cada frase
Se tomaron los valores estadı́sticos sobre los valores de la Fo y las
pendientes
18 of 27
El paper: Análisis y resultados
Estilización
19 of 27
El paper: Análisis y resultados
Resultados
20 of 27
El paper: Clasificación propuesta y conclusiones
21 of 27
El paper: Clasificación propuesta y conclusiones
Cuadro para sı́ntesis y reconocimiento
22 of 27
El paper: Clasificación propuesta y conclusiones
Desafı́os
Resolver el umbral de estilización empı́ricamente
Trabajar con un corpus mayor y de habla espontánea
23 of 27
Publicaciones recientes
24 of 27
Publicaciones recientes
GARRIDO, J.M. - LAPLAZA, Y. - KOLZ, B. - CORNUDELLA, M.
(2014).- ”TexAFon 2.0: A text processing tool for the generation
of expressive speech in TTS applications”, Proceedings of LREC
2014, Ninth International Conference on Language Resources and
Evaluation, Reykjavik (Iceland), 26-31 May 2014, ISBN
978-2-9517408-8-4.
KOLZ, B - GARRIDO, J. M. - LAPLAZA, Y. (2014).- ”Automatic
prediction of emotions from text in Spanish for expressive speech
synthesis in the chat domain”, Procesamiento del Lenguaje
Natural, 52.
25 of 27
Publicaciones recientes
Proyecto TexAFon
Herramienta de procesado de texto:
Entrada de texto → Segmentación → Normalización→ Salida con
anotación fonética
Está implementado en python.
Puede utilizarse con los motores de sı́ntesis Cereproc y MBROLA
Idioma español y catalán
26 of 27
Gracias por su atención
27 of 27
Descargar