Les tecnologies de la parla Recerca en Psicologia del Llenguatge: Processament i Comunicació Màster Oficial en Psicologia de la Cognició i de la Comunicació 18 de gener de 2011 Les tecnologies de la parla Joaquim Llisterri Departament de Filologia Espanyola Universitat Autònoma de Barcelona http://liceu.uab.cat/~joaquim 1. Materials de la sessió Els materials de la sessió es troben a: http://liceu.uab.cat/ ~joaquim/speech_technology/UAB_PCC_11/UAB_PCC_11. html 2. 2.1. Continguts La comunicació persona-ordinador i la comunicació persona-persona mediada per ordinador Les tecnologies de la parla en el context de la comunicació personaordinador. Els avantatges de l’entrada i de la sortida vocal. Les tecnologies de la parla en el context de la comunicació persona-persona mediada per ordinador. La conversió entre modalitats. 2.2. La conversió de text en parla Els objectius de la conversió de text en parla. Les tècniques de conversió de text en parla i les unitats de síntesi. Els mòduls lingüístics dels sistemes de conversió de text en parla: tractament previ del text, anàlisi lingüística, transcripció fonètica automàtica i mòdul prosòdic. Les aplicacions de la conversió de text en parla. Guió de la sessió i bibliografia bàsica 1/4 Les tecnologies de la parla Recerca en Psicologia del Llenguatge: Processament i Comunicació Màster Oficial en Psicologia de la Cognició i de la Comunicació 18 de gener de 2011 2.3. El reconeixement automàtic de la parla Els objectius del reconeixement automàtic de la parla. El disseny dels sistemes de reconeixement automàtic de la parla. Els principals mòduls d’un sistema de reconeixement automàtic de la parla: parametrització del senyal, models acústics, model de llenguatge i diccionari de pronunciació. Les aplicacions del reconeixement automàtic de la parla. Tecnologies relacionades amb el reconeixement: identificació i verificació automàtiques del parlant i identificació automàtica de la llengua. 2.4. Els sistemes de diàleg Els objectius dels sistemes de diàleg. El disseny dels sistemes de diàleg. Els principals mòduls d’un sistema de diàleg: reconeixement automàtic de la parla, comprensió de la parla, gestió del diàleg, generació de parla i conversió de text en parla. Les aplicacions dels sistemes de diàleg. La traducció automàtica de la parla. 3. Bibliografia bàsica Bonafonte, A., Escudero, D., i Riera, M. (2006). La conversión de texto en habla. A J. Llisterri i M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 177-208). Bellaterra Soria: Universitat Autònoma de Barcelona - Fundación Duques de Soria. Carlson, R., i Granström, B. (2010). Speech synthesis. A W. J. Hardcastle, J. Laver, i F. E. Gibbon (Eds.), The handbook of phonetic sciences (2nd ed.). (pp. 781-803). Oxford: Wiley-Blackwell. Furui, S. (2006). Automatic speaker recognition and verification. A K. Brown (Ed.), Encyclopedia of language and linguistics. (pp. 619-27). Amsterdam: Elsevier. doi:10.1016/B0-08-044854-2/00919-6 Garrido, J. M. (2009). Estudios humanísticos y tecnologías del habla. Presente y futuro. A C. de la Mota i G. Puigvert (Eds.), La investigación en humanidades. (pp. 171-82). Madrid: Biblioteca Nueva. Huang, X., i Deng, L. (2010). An overview of modern speech recognition. A N. Adurkhya i F. J. Damerau (Eds.), Handbook of natural language processing (2nd ed.). Boca Raton, FL: CRC Press, Taylor and Francis Group. Consultat a http://research.microsoft.com/pubs/118769/Book-Chap- Guió de la sessió i bibliografia bàsica 2/4 Les tecnologies de la parla Recerca en Psicologia del Llenguatge: Processament i Comunicació Màster Oficial en Psicologia de la Cognició i de la Comunicació 18 de gener de 2011 HuangDeng2010.pdf López-Cózar, R. (2006). Análisis y gestión del diálogo. A J. Llisterri i M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 119-52). Bellaterra - Soria: Universitat Autònoma de Barcelona - Fundación Duques de Soria. Llisterri, J. (2007). El papel de la fonética en las tecnologías del habla. A M. González González, E. Fernández Rei, i B. González Rei (Eds.), Actas do 3o congreso internacional de fonética experimental. (pp. 23-37). Santiago de Compostela: Xunta de Galicia. Consultat a http://liceu.uab.cat/~joaquim/publicacions/ Llisterri_05_Fonetica_Tecnologias_Habla.pdf Llisterri, J. (2009). Les tecnologies de la parla. Llengua, Societat i Comunicació. Revista de Sociolingüística de la Universitat de Barcelona, 7, 11-19. Consultat a http://liceu.uab.cat/~joaquim/publicacions/Llisterri_ 09_Tecnologies_Parla.pdf Llisterri, J. (2009). Las tecnologías del habla en las lenguas románicas ibéricas. Studies in Hispanic and Lusophone Linguistics, 2(1), 133-180. Consultat a http://liceu.uab.cat/~joaquim/publicacions/Llisterri_ 09_Tecnologias_Habla_Lenguas_Romanicas_Ibericas.pdf Llisterri, J., Carbó, C., Machuca, M. J., Mota, C., Riera, M., i Ríos, A. (2003). El papel de la lingüística en el desarrollo de las tecnologías del habla. A M. Casas i C. Varo (Eds.), VII Jornadas de Lingüística. (pp. 137-91). Cádiz: Servicio de Publicaciones de la Universidad de Cádiz. Consultat a http://liceu.uab.cat/~joaquim/ publicacions/Llisterri_Carbo_Machuca_Mota_Riera_Rios_ 03_Linguistica_Tecnologias_Habla.pdf Llisterri, J., Machuca, M. J., Mota, C., Riera, M., i Ríos, A. (2005). Corpus orales para el desarrollo de las tecnologías del habla en español. Oralia. Análisis del Discurso Oral, 8, 289-325. Consultat a http://liceu.uab.cat/ ~joaquim/publicacions/Llisterri_Machuca_Mota_Riera_ Rios_05_Corpus_Orales_Tecnologias_Habla_Espanol.pdf Machuca, M. J. (2006). Corpus para el desarrollo de sistemas de diálogo. A J. Llisterri i M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 61-79). Bellaterra - Soria: Universitat Autònoma de Barcelona - Fundación Duques de Soria. Nusbaum, H. C., i Shintel, H. (2006). Speech synthesis. A K. Brown (Ed.), Encyclopedia of language and linguistics. (pp. 19-31). Amsterdam: Elsevier. doi:10.1016/B008-044854-2/00913-5 Guió de la sessió i bibliografia bàsica 3/4 Les tecnologies de la parla Recerca en Psicologia del Llenguatge: Processament i Comunicació Màster Oficial en Psicologia de la Cognició i de la Comunicació 18 de gener de 2011 Renals, S., i King, S. (2010). Automatic speech recognition. A W. J. Hardcastle, J. Laver, i F. E. Gibbon (Eds.), The handbook of phonetic sciences (2nd ed.). (pp. 804-38). Oxford: Wiley-Blackwell. San Segundo, R. (2009). Avances tecnológicos para romper las barreras de comunicación con las personas sordas. Ciencia Cognitiva, 3(3), 86-89. Consultat a http://medina-psicologia.ugr.es/~cienciacognitiva/ files/2009-31.pdf Taylor, P. (2009). Text-to-speech synthesis. Cambridge: Cambridge University Press. Consultat a http://svr-www.eng.cam.ac.uk/~pat40/ttsbook_ draft_2.pdf Torres, M. I. (2006). El reconocimiento del habla. A J. Llisterri i M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 81-98). Bellaterra - Soria: Universitat Autònoma de Barcelona - Fundación Duques de Soria. Waibel, A., Bernardin, K., i Wölfel, M. (2007). Computer-Supported human-human multilingual communication. A Interspeech 2007. Proceedings of the 8th Annual Conference of the International Speech Communication Association. (pp. 14-21). Antwerp, Belgium, August 27-31, 2007. Consultat a http://isl.ira.uka.de/ ~wolfel/IS072004.pdf Guió de la sessió i bibliografia bàsica 4/4