TECNOLOGIAS DE LA VOZ CURSO 1998/99 1 CONVOCATORIA

Anuncio
TECNOLOGIAS DE LA VOZ
CURSO 1998/99
1 CONVOCATORIA
Fecha: 20 de Enero de 1999
Duración: 3 h
Teoría: 1 h.; Sin libros ni apuntes
Problemas y Práctica: 2 h.; Con libros y apuntes
Parte 1. Teoría (1,30 h)
1. (1 punto)
Indicar si son o no correctas las siguientes afirmaciones, exponiendo las razones por las que
considera la afirmación correcta o incorrecta.
a. El cepstrum de una señal sonora está compuesto por la suma de la respuesta impulsional del
tracto vocal y del cepstrum de la excitación.
b. El espectro de un sonido sonoro tiene una tendencia general a decaer a razón de 6
dB/octava.
c. El enmascaramiento simultaneo entre dos sonidos aparece siempre y cuando un sonido se
aplique al oído derecho y el otro al oído izquierdo.
d. Aumentando al doble los fons de un tono de 1 kHz se consigue un aumento en la sensación
de intensidad sonora del doble.
e. La técnica de la sustracción espectral, utilizada para eliminar ruido aditivo sobre una señal
de voz, tiene el inconveniente de generar un nuevo ruido denominado ruido musical.
f. La técnica del center clipping aplicada sobre la función de autocorrelación permite detectar
de forma mas precisa la frecuencia central del primer formante.
2. (1 punto)
Dibujar los diagramas de bloques básicos del codificador y descodificador de los sistemas de
codificación de voz por análisis-por-síntesis, CELP y Multipulso, indicando la función de cada
bloque.
3. (1 punto)
Indicar desde el punto de vista de arquitectura del sistema, de la unidad de reconocimiento, del
locutor o usuario y de las fuentes de conocimiento utilizadas, las diferencias más notables entre las
distintas configuraciones de un sistema de reconocimiento automático del habla.
Parte 2. Problema
1. (1,25 puntos)
Una de las aplicaciones de la programación dinámica es la resolución de problemas de
planificación de viajes de un viajante. El problema que se plantea es buscar la ruta más económica
para, partiendo el lunes por la mañana de la ciudad A, llegar el viernes por la noche de nuevo a la
ciudad A habiendo pasado al menos una noche en todas las ciudades. Para realizar la optimización de
la ruta se dispone del coste de una noche de hotel en cada ciudad y del coste del viaje de una ciudad a
otra. Los costes en Euros están especificados en la tabla I y II respectivamente. Encontrar el camino de
mínimo coste que cumple las restricciones especificadas e indicar el coste del mismo.
Ciudad
Coste hotel
A
300
B
100
C
200
D
150
Tabla I. Costes de hotel
A
B
C
0
150
250
150
0
200
250
200
0
300
150
125
Tabla II. Costes de viajes de una ciudad a otra
A
B
C
D
D
300
150
125
0
2. (1,75 puntos)
Para un modelo del tracto vocal compuesto por dos tubos como los indicados en la figura, y
suponiendo que la impedancia de la glotis es infinita y la impedancia en los labios es nula,
a. Calcular la función de transferencia H(w)=Ulabios(w)/Uglotis(w), utilizando la modelización de
los tubos como cuadripolos.
b. Dibujar la estructura lattice correspondiente al modelo de tubos sin pérdidas
c. Para los valores dados y en el caso de que las áreas de los tubos fueran iguales, encontrar las
frecuencias de las tres primeras resonancias.
L1
L0
glotis
A0
A1
labios
A0= 1 cm2, A1= 8 cm2, L0= 8 cm, L1= 4 cm,
Parte 3. Prácticas
1. En la figura se muestra la evolución de la función de autocorrelación localizada para una locución
masculina de la frase “los bárbaros invadieron el imperio romano” que ha sido muestreada a 16
kHz.
a. Indicar de forma razonada, que segmentos pueden ser sonoros y que segmentos pueden ser
sordos
b. ¿Cuál es la frecuencia de pitch para el segmento de voz n=40?
c. A la vista de la evolución de la función de autocorrelación, dibujar la evolución de la
frecuencia de pitch para toda la frase, indicando en que segmentos puede darse un error en la
estimación de la frecuencia de pitch y cual puede ser la razón para que exista el error.
función de autocorrelación localizada
50
100
150
k
200
250
300
350
400
450
500
20
40
60
80
n
100
120
140
2. En la figura se muestra la evolución de la envolvente espectral estimada mediante análisis lpc para
la locución del ejercicio anterior. En análisis se ha realizado con ordenes del predictor de 150, 16,
8, 4 (número de coeficientes del predictor). Indicar de forma razonada la correspondencia entre
las gráficas de la evolución de la envolvente espectral y los ordenes del predictor.
Gráfica A
Gráfica B
Estimación evolución envolvente espectro con lpc
0
1000
1000
2000
2000
3000
3000
frecuencia
frecuencia
Estimación evolución envolvente espectro con lpc
0
4000
4000
5000
5000
6000
6000
7000
7000
8000
8000
0
50
100
150
0
50
100
Gráfica C
Gráfica D
Estimación evolución envolvente espectro con lpc
0
1000
1000
2000
2000
3000
3000
frecuencia
frecuencia
Estimación evolución envolvente espectro con lpc
0
4000
4000
5000
5000
6000
6000
7000
7000
8000
0
50
100
n
150
n
n
150
8000
0
50
100
n
150
Descargar