Les tecnologies de la parla (UAB, 2011)

Anuncio
Les tecnologies de la parla
Recerca en Psicologia del Llenguatge: Processament i Comunicació
Màster Oficial en Psicologia de la Cognició i de la Comunicació
18 de gener de 2011
Les tecnologies de la parla
Joaquim Llisterri
Departament de Filologia Espanyola
Universitat Autònoma de Barcelona
http://liceu.uab.cat/~joaquim
1.
Materials de la sessió
Els materials de la sessió es troben a: http://liceu.uab.cat/
~joaquim/speech_technology/UAB_PCC_11/UAB_PCC_11.
html
2.
2.1.
Continguts
La comunicació persona-ordinador i la comunicació persona-persona mediada per ordinador
Les tecnologies de la parla en el context de la comunicació personaordinador. Els avantatges de l’entrada i de la sortida vocal. Les tecnologies de
la parla en el context de la comunicació persona-persona mediada per ordinador. La conversió entre modalitats.
2.2.
La conversió de text en parla
Els objectius de la conversió de text en parla. Les tècniques de conversió de
text en parla i les unitats de síntesi. Els mòduls lingüístics dels sistemes de conversió de text en parla: tractament previ del text, anàlisi lingüística, transcripció
fonètica automàtica i mòdul prosòdic. Les aplicacions de la conversió de text en
parla.
Guió de la sessió i bibliografia bàsica
1/4
Les tecnologies de la parla
Recerca en Psicologia del Llenguatge: Processament i Comunicació
Màster Oficial en Psicologia de la Cognició i de la Comunicació
18 de gener de 2011
2.3.
El reconeixement automàtic de la parla
Els objectius del reconeixement automàtic de la parla. El disseny dels sistemes de reconeixement automàtic de la parla. Els principals mòduls d’un sistema de reconeixement automàtic de la parla: parametrització del senyal, models
acústics, model de llenguatge i diccionari de pronunciació. Les aplicacions del
reconeixement automàtic de la parla. Tecnologies relacionades amb el reconeixement: identificació i verificació automàtiques del parlant i identificació automàtica de la llengua.
2.4.
Els sistemes de diàleg
Els objectius dels sistemes de diàleg. El disseny dels sistemes de diàleg. Els
principals mòduls d’un sistema de diàleg: reconeixement automàtic de la parla,
comprensió de la parla, gestió del diàleg, generació de parla i conversió de text
en parla. Les aplicacions dels sistemes de diàleg. La traducció automàtica de la
parla.
3.
Bibliografia bàsica
Bonafonte, A., Escudero, D., i Riera, M. (2006). La conversión de texto en habla. A
J. Llisterri i M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 177-208). Bellaterra Soria: Universitat Autònoma de Barcelona - Fundación Duques de Soria.
Carlson, R., i Granström, B. (2010). Speech synthesis. A W. J. Hardcastle, J. Laver,
i F. E. Gibbon (Eds.), The handbook of phonetic sciences (2nd ed.). (pp. 781-803).
Oxford: Wiley-Blackwell.
Furui, S. (2006). Automatic speaker recognition and verification. A K. Brown
(Ed.), Encyclopedia of language and linguistics. (pp. 619-27). Amsterdam: Elsevier.
doi:10.1016/B0-08-044854-2/00919-6
Garrido, J. M. (2009). Estudios humanísticos y tecnologías del habla. Presente y
futuro. A C. de la Mota i G. Puigvert (Eds.), La investigación en humanidades. (pp.
171-82). Madrid: Biblioteca Nueva.
Huang, X., i Deng, L. (2010). An overview of modern speech recognition. A
N. Adurkhya i F. J. Damerau (Eds.), Handbook of natural language processing
(2nd ed.). Boca Raton, FL: CRC Press, Taylor and Francis Group. Consultat a
http://research.microsoft.com/pubs/118769/Book-Chap-
Guió de la sessió i bibliografia bàsica
2/4
Les tecnologies de la parla
Recerca en Psicologia del Llenguatge: Processament i Comunicació
Màster Oficial en Psicologia de la Cognició i de la Comunicació
18 de gener de 2011
HuangDeng2010.pdf
López-Cózar, R. (2006). Análisis y gestión del diálogo. A J. Llisterri i M. J. Machuca
(Eds.), Los sistemas de diálogo. (pp. 119-52). Bellaterra - Soria: Universitat Autònoma
de Barcelona - Fundación Duques de Soria.
Llisterri, J. (2007). El papel de la fonética en las tecnologías del habla. A M.
González González, E. Fernández Rei, i B. González Rei (Eds.), Actas do 3o congreso
internacional de fonética experimental. (pp. 23-37). Santiago de Compostela: Xunta de
Galicia. Consultat a http://liceu.uab.cat/~joaquim/publicacions/
Llisterri_05_Fonetica_Tecnologias_Habla.pdf
Llisterri, J. (2009). Les tecnologies de la parla. Llengua, Societat i Comunicació.
Revista de Sociolingüística de la Universitat de Barcelona, 7, 11-19. Consultat a
http://liceu.uab.cat/~joaquim/publicacions/Llisterri_
09_Tecnologies_Parla.pdf
Llisterri, J. (2009). Las tecnologías del habla en las lenguas románicas ibéricas. Studies in Hispanic and Lusophone Linguistics, 2(1), 133-180. Consultat a
http://liceu.uab.cat/~joaquim/publicacions/Llisterri_
09_Tecnologias_Habla_Lenguas_Romanicas_Ibericas.pdf
Llisterri, J., Carbó, C., Machuca, M. J., Mota, C., Riera, M., i Ríos, A. (2003). El
papel de la lingüística en el desarrollo de las tecnologías del habla. A M. Casas i C. Varo
(Eds.), VII Jornadas de Lingüística. (pp. 137-91). Cádiz: Servicio de Publicaciones de
la Universidad de Cádiz. Consultat a http://liceu.uab.cat/~joaquim/
publicacions/Llisterri_Carbo_Machuca_Mota_Riera_Rios_
03_Linguistica_Tecnologias_Habla.pdf
Llisterri, J., Machuca, M. J., Mota, C., Riera, M., i Ríos, A. (2005). Corpus
orales para el desarrollo de las tecnologías del habla en español. Oralia. Análisis del Discurso Oral, 8, 289-325. Consultat a http://liceu.uab.cat/
~joaquim/publicacions/Llisterri_Machuca_Mota_Riera_
Rios_05_Corpus_Orales_Tecnologias_Habla_Espanol.pdf
Machuca, M. J. (2006). Corpus para el desarrollo de sistemas de diálogo. A J.
Llisterri i M. J. Machuca (Eds.), Los sistemas de diálogo. (pp. 61-79). Bellaterra - Soria:
Universitat Autònoma de Barcelona - Fundación Duques de Soria.
Nusbaum, H. C., i Shintel, H. (2006). Speech synthesis. A K. Brown (Ed.), Encyclopedia of language and linguistics. (pp. 19-31). Amsterdam: Elsevier. doi:10.1016/B008-044854-2/00913-5
Guió de la sessió i bibliografia bàsica
3/4
Les tecnologies de la parla
Recerca en Psicologia del Llenguatge: Processament i Comunicació
Màster Oficial en Psicologia de la Cognició i de la Comunicació
18 de gener de 2011
Renals, S., i King, S. (2010). Automatic speech recognition. A W. J. Hardcastle, J.
Laver, i F. E. Gibbon (Eds.), The handbook of phonetic sciences (2nd ed.). (pp. 804-38).
Oxford: Wiley-Blackwell.
San Segundo, R. (2009). Avances tecnológicos para romper las barreras de
comunicación con las personas sordas. Ciencia Cognitiva, 3(3), 86-89. Consultat a http://medina-psicologia.ugr.es/~cienciacognitiva/
files/2009-31.pdf
Taylor, P. (2009). Text-to-speech synthesis. Cambridge: Cambridge University
Press. Consultat a http://svr-www.eng.cam.ac.uk/~pat40/ttsbook_
draft_2.pdf
Torres, M. I. (2006). El reconocimiento del habla. A J. Llisterri i M. J. Machuca
(Eds.), Los sistemas de diálogo. (pp. 81-98). Bellaterra - Soria: Universitat Autònoma
de Barcelona - Fundación Duques de Soria.
Waibel, A., Bernardin, K., i Wölfel, M. (2007). Computer-Supported human-human
multilingual communication. A Interspeech 2007. Proceedings of the 8th Annual Conference of the International Speech Communication Association. (pp. 14-21). Antwerp, Belgium, August 27-31, 2007. Consultat a http://isl.ira.uka.de/
~wolfel/IS072004.pdf
Guió de la sessió i bibliografia bàsica
4/4
Descargar