Las tecnologías del habla Joaquim Llisterri Departament de Filologia Espanyola Universitat Autònoma de Barcelona http://liceu.uab.cat/~joaquim Las tecnologías del habla Joaquim Llisterri Departament de Filologia Espanyola Universitat Autònoma de Barcelona http://liceu.uab.cat/~joaquim 1 Objetivos Este curso tiene como objetivo familiarizar a los participantes con el ámbito de las tecnologías del habla, especialmente en lo que se refiere al conocimiento fonético necesario para el desarrollo y la evaluación de sistemas de conversión de texto en habla, de reconocimiento automático del habla y de diálogo persona-máquina. 2 Contenidos 1. Introducción a las tecnologías del habla La interacción oral con los sistemas informáticos. Ventajas y limitaciones de la comunicación oral persona-máquina. 2. Los sistemas de síntesis del habla Técnicas para la síntesis del habla. La conversión de texto en habla. Los módulos lingüísticos en los sistemas de conversión de texto en habla. Las aplicaciones de la síntesis del habla. 3. Los sistemas de reconocimiento automático del habla Características de los sistemas de reconocimiento automático del habla. Técnicas para el reconocimiento automático del habla. Estructura de los sistemas de reconocimiento. Las aplicaciones del reconocimiento automático del habla. 4. Los sistemas de diálogo Características de los sistemas de diálogo. El diseño de los sistemas de diálogo. Módulos lingüísticos en los sistemas de diálogo. Las aplicaciones de los sistemas de diálogo. Universidad de los Andes, Mérida, Venezuela 9-12 de julio de 2012 1/3 Las tecnologías del habla Joaquim Llisterri Departament de Filologia Espanyola Universitat Autònoma de Barcelona http://liceu.uab.cat/~joaquim 3 Bibliografía básica Bonafonte, A., Escudero, D., y Riera, M. (2006). La conversión de texto en habla. En J. Llisterri, y M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 177-208). Bellaterra - Soria: Universitat Autònoma de Barcelona - Fundación Duques de Soria. Carlson, R., y Granström, B. (2010). Speech synthesis. En W. J. Hardcastle, J. Laver, y F. E. Gibbon (Eds.), The Handbook of Phonetic Sciences (2 ed.). (pp. 781-803). Oxford: Wiley-Blackwell. Cohen, P. R., y Oviatt, S. L. (2006). Multimodal interaction with computers. En K. Brown (Ed.), Encyclopedia of Language y Linguistics. (pp. 376-86). Amsterdam: Elsevier. Garrido, J. M. (2009). Estudios humanísticos y tecnologías del habla. Presente y futuro. En C. de la Mota y G. Puigvert (Eds.), La investigación en humanidades. (pp. 171-82). Madrid: Biblioteca Nueva. Henton, C. (2012). Text-to-Speech synthesis development. En C. A. Chapelle (Ed.), The encyclopedia of applied linguistics. Oxford: Blackwell. Holmes, J. N., y Holmes, W. (2001). Speech Synthesis and Recognition (2. edition). London: Taylor y Francis. Huang, X., y Deng, L. (2010). An overview of modern speech recognition. En N. Indurkhya, y F. J. Damerau (Eds.), Handbook of natural language processing (2 ed.). Boca Raton, FL: CRC Press, Taylor and Francis Group. Huang, B. H., y Rabiner, L. R. (2006). Automatic speech recognition: History. En K. Brown (Ed.), Encyclopedia of Language y Linguistics. (pp. 806-19). Amsterdam: Elsevier. Llisterri, J. (2009). Las tecnologías del habla en las lenguas románicas ibéricas. Studies in Hispanic and Lusophone Linguistics, 2(1), 133-180. Llisterri, J. (2009). Les tecnologies de la parla. Llengua, Societat i Comunicació. Revista de Sociolingüística de la Universitat de Barcelona, 7, 11-19. Llisterri, J., Carbó, C., Machuca, M. J., Mota, C., Riera, M., y Ríos, A. (2003). El papel de la lingüística en el desarrollo de las tecnologías del habla. En M. Casas, y C. Varo (Eds.), VII Jornadas de Lingüística. (pp. 137-91). Cádiz: Servicio de Publicaciones de la Universidad de Cádiz. López-Cózar, R. (2006). Análisis y gestión del diálogo. En J. Llisterri, y M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 119-52). Bellaterra - Soria: Universitat Autònoma de Barcelona - Fundación Duques de Soria. Nusbaum, H. C., y Shintel, H. (2006). Speech synthesis. En K. Brown (Ed.), Encyclopedia of Language y Linguistics. (pp. 19-31). Amsterdam: Elsevier. O’Shaughnessy, D. (2000). Speech Communication. Human and Machine (2. edition). New York: IEEE Press. Renals, S., y King, S. (2010). Automatic speech recognition. En W. J. Hardcastle, J. Laver, y F. E. Gibbon (Eds.), The Handbook of Phonetic Sciences (2nd ed.). (pp. 804-38). Oxford: Wiley-Blackwell. Taylor, P. (2009). Text-to-speech synthesis. Cambridge: Cambridge University Press. Torres, M. I. (2006). El reconocimiento del habla. En J. Llisterri, y M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 81-98). Bellaterra - Soria: Universitat Autònoma de Barcelona - Fundación Duques de Soria. Puede encontrarse una bibliografía más detallada en: http://liceu.uab.cat/ ~joaquim/speech_technology/tecnol_parla/speech_tech_general/ refs_gen_tecnol_parla.html Universidad de los Andes, Mérida, Venezuela 9-12 de julio de 2012 2/3 Las tecnologías del habla Joaquim Llisterri Departament de Filologia Espanyola Universitat Autònoma de Barcelona http://liceu.uab.cat/~joaquim 4 Organización de las sesiones Lunes 9 de julio Introducción a las tecnologías del habla (2 h) La síntesis del habla I (2 h) Martes 10 de julio La síntesis del habla II (2 h) La síntesis del habla: sesión de prácticas (2 h) Miércoles 11 de julio El reconocimiento automático del habla (3 h) Los sistemas de diálogo I (1 h) Jueves 12 de julio Los sistemas de diálogo II (2 h) Ámbitos actuales de aplicación de la fonética: adquisición de segundas lenguas y fonética judicial (2 h) Universidad de los Andes, Mérida, Venezuela 9-12 de julio de 2012 3/3