TECNOLOGIAS DE LA VOZ CURSO 1998/99 1 CONVOCATORIA Fecha: 20 de Enero de 1999 Duración: 3 h Teoría: 1 h.; Sin libros ni apuntes Problemas y Práctica: 2 h.; Con libros y apuntes Parte 1. Teoría (1,30 h) 1. (1 punto) Indicar si son o no correctas las siguientes afirmaciones, exponiendo las razones por las que considera la afirmación correcta o incorrecta. a. El cepstrum de una señal sonora está compuesto por la suma de la respuesta impulsional del tracto vocal y del cepstrum de la excitación. b. El espectro de un sonido sonoro tiene una tendencia general a decaer a razón de 6 dB/octava. c. El enmascaramiento simultaneo entre dos sonidos aparece siempre y cuando un sonido se aplique al oído derecho y el otro al oído izquierdo. d. Aumentando al doble los fons de un tono de 1 kHz se consigue un aumento en la sensación de intensidad sonora del doble. e. La técnica de la sustracción espectral, utilizada para eliminar ruido aditivo sobre una señal de voz, tiene el inconveniente de generar un nuevo ruido denominado ruido musical. f. La técnica del center clipping aplicada sobre la función de autocorrelación permite detectar de forma mas precisa la frecuencia central del primer formante. 2. (1 punto) Dibujar los diagramas de bloques básicos del codificador y descodificador de los sistemas de codificación de voz por análisis-por-síntesis, CELP y Multipulso, indicando la función de cada bloque. 3. (1 punto) Indicar desde el punto de vista de arquitectura del sistema, de la unidad de reconocimiento, del locutor o usuario y de las fuentes de conocimiento utilizadas, las diferencias más notables entre las distintas configuraciones de un sistema de reconocimiento automático del habla. Parte 2. Problema 1. (1,25 puntos) Una de las aplicaciones de la programación dinámica es la resolución de problemas de planificación de viajes de un viajante. El problema que se plantea es buscar la ruta más económica para, partiendo el lunes por la mañana de la ciudad A, llegar el viernes por la noche de nuevo a la ciudad A habiendo pasado al menos una noche en todas las ciudades. Para realizar la optimización de la ruta se dispone del coste de una noche de hotel en cada ciudad y del coste del viaje de una ciudad a otra. Los costes en Euros están especificados en la tabla I y II respectivamente. Encontrar el camino de mínimo coste que cumple las restricciones especificadas e indicar el coste del mismo. Ciudad Coste hotel A 300 B 100 C 200 D 150 Tabla I. Costes de hotel A B C 0 150 250 150 0 200 250 200 0 300 150 125 Tabla II. Costes de viajes de una ciudad a otra A B C D D 300 150 125 0 2. (1,75 puntos) Para un modelo del tracto vocal compuesto por dos tubos como los indicados en la figura, y suponiendo que la impedancia de la glotis es infinita y la impedancia en los labios es nula, a. Calcular la función de transferencia H(w)=Ulabios(w)/Uglotis(w), utilizando la modelización de los tubos como cuadripolos. b. Dibujar la estructura lattice correspondiente al modelo de tubos sin pérdidas c. Para los valores dados y en el caso de que las áreas de los tubos fueran iguales, encontrar las frecuencias de las tres primeras resonancias. L1 L0 glotis A0 A1 labios A0= 1 cm2, A1= 8 cm2, L0= 8 cm, L1= 4 cm, Parte 3. Prácticas 1. En la figura se muestra la evolución de la función de autocorrelación localizada para una locución masculina de la frase “los bárbaros invadieron el imperio romano” que ha sido muestreada a 16 kHz. a. Indicar de forma razonada, que segmentos pueden ser sonoros y que segmentos pueden ser sordos b. ¿Cuál es la frecuencia de pitch para el segmento de voz n=40? c. A la vista de la evolución de la función de autocorrelación, dibujar la evolución de la frecuencia de pitch para toda la frase, indicando en que segmentos puede darse un error en la estimación de la frecuencia de pitch y cual puede ser la razón para que exista el error. función de autocorrelación localizada 50 100 150 k 200 250 300 350 400 450 500 20 40 60 80 n 100 120 140 2. En la figura se muestra la evolución de la envolvente espectral estimada mediante análisis lpc para la locución del ejercicio anterior. En análisis se ha realizado con ordenes del predictor de 150, 16, 8, 4 (número de coeficientes del predictor). Indicar de forma razonada la correspondencia entre las gráficas de la evolución de la envolvente espectral y los ordenes del predictor. Gráfica A Gráfica B Estimación evolución envolvente espectro con lpc 0 1000 1000 2000 2000 3000 3000 frecuencia frecuencia Estimación evolución envolvente espectro con lpc 0 4000 4000 5000 5000 6000 6000 7000 7000 8000 8000 0 50 100 150 0 50 100 Gráfica C Gráfica D Estimación evolución envolvente espectro con lpc 0 1000 1000 2000 2000 3000 3000 frecuencia frecuencia Estimación evolución envolvente espectro con lpc 0 4000 4000 5000 5000 6000 6000 7000 7000 8000 0 50 100 n 150 n n 150 8000 0 50 100 n 150