Introducción a las Tecnologı́as del Habla Presentación de papers relacionados Prof. Agustı́n Gravano Modelización de patrones melódicos del español para la sı́ntesis y el reconocimiento de habla 26 de Noviembre de 2014 Alumna: Ana Sarriés Juan Marı́a Garrido, Laboratorio de fonética de la universidad autónoma de Barcelona, 1991 El paper 2 of 27 El paper Cómo está organizado Cap.1 Generalidades Cap.2 Repaso sobre los estudios existentes hasta aquel momento Cap.3 Sistema de estilización propuesto Cap.4 Análisis y clasificación propuesta Cap.5 Conclusiones 3 of 27 El paper: Generalidades 4 of 27 El paper: Generalidades ¿Qué es la entonación? Es un fenómeno lingüı́stico relacionado con la percepción de: Frecuencia fundamental (Fo) Amplitud Duración Relaciona dos planos: el fı́sico y el semántico-funcional 5 of 27 El paper: Repaso estudios existentes 6 of 27 El paper: Repaso estudios existentes Tomás Navarro, 1981 Propone cuatro grupos de patrones melódicos (modalidad oracional): Enunciativos Interrogativos Exclamativos Volitivos 7 of 27 El paper: Repaso estudios existentes Tipos de criterios de reconocimiento Aproximación por niveles Aproximación por contornos 8 of 27 Waibel, 1988 Smoothing de la curva de Fo El paper: Sistema de estilización propuesto 9 of 27 El paper: Sistema de estilización propuesto Objetivos y alcance Centrado en el idioma español en patrones terminales. en la información de la modalidad oracional. Utilizable tanto en sı́ntesis como en reconocimiento. Se excluyó la duración y la amplitud del análisis. Se excluyeron las variaciones relativas al acento. 10 of 27 El paper: Sistema de estilización propuesto Procedimiento 1. Localización de puntos de inflexión en la curva de Fo 2. Normalización frecuencial 3. Interpolación mediante rectas 11 of 27 El paper: Análisis y resultados 12 of 27 El paper: Análisis y resultados Elaboración del corpus 54 frases Leı́das en un contexto de 30 diálogos Pares mı́nimos 13 of 27 El paper: Análisis y resultados Elaboración del corpus - 14 of 27 Fragmento de diálogos utilizados El paper: Análisis y resultados Elaboración del corpus - 15 of 27 Clasificación según sı́labas acentuadas El paper: Análisis y resultados Grabación del corpus 4 locutores Magnetófono Revox A77 Mic direccional SENNHEISER MD 441N 16 of 27 El paper: Análisis y resultados Digitalización del corpus MACSPEECH LAB Filtro antialiasing Muestreo de 10KHz 17 of 27 El paper: Análisis y resultados Estilización Se tuneó el umbral para filtrar puntos de inflexión relevantes en algo menos que 10Hz Se realizó una normalización temporal Se estilizaron las curvas de Fo de cada frase Se tomaron los valores estadı́sticos sobre los valores de la Fo y las pendientes 18 of 27 El paper: Análisis y resultados Estilización 19 of 27 El paper: Análisis y resultados Resultados 20 of 27 El paper: Clasificación propuesta y conclusiones 21 of 27 El paper: Clasificación propuesta y conclusiones Cuadro para sı́ntesis y reconocimiento 22 of 27 El paper: Clasificación propuesta y conclusiones Desafı́os Resolver el umbral de estilización empı́ricamente Trabajar con un corpus mayor y de habla espontánea 23 of 27 Publicaciones recientes 24 of 27 Publicaciones recientes GARRIDO, J.M. - LAPLAZA, Y. - KOLZ, B. - CORNUDELLA, M. (2014).- ”TexAFon 2.0: A text processing tool for the generation of expressive speech in TTS applications”, Proceedings of LREC 2014, Ninth International Conference on Language Resources and Evaluation, Reykjavik (Iceland), 26-31 May 2014, ISBN 978-2-9517408-8-4. KOLZ, B - GARRIDO, J. M. - LAPLAZA, Y. (2014).- ”Automatic prediction of emotions from text in Spanish for expressive speech synthesis in the chat domain”, Procesamiento del Lenguaje Natural, 52. 25 of 27 Publicaciones recientes Proyecto TexAFon Herramienta de procesado de texto: Entrada de texto → Segmentación → Normalización→ Salida con anotación fonética Está implementado en python. Puede utilizarse con los motores de sı́ntesis Cereproc y MBROLA Idioma español y catalán 26 of 27 Gracias por su atención 27 of 27