Study of a HMM-based text-to-speech system

dc.creatorCarvalho, Sarah Negreiros de, 1985-
dc.date2013
dc.date2017-04-01T16:12:56Z
dc.date2017-07-13T19:52:35Z
dc.date2017-04-01T16:12:56Z
dc.date2017-07-13T19:52:35Z
dc.date.accessioned2018-03-29T03:58:18Z
dc.date.available2018-03-29T03:58:18Z
dc.identifierCARVALHO, Sarah Negreiros de. Estudo de um sistema de conversão texto-fala baseado em HMM. 2013. 94 p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP.
dc.identifierhttp://repositorio.unicamp.br/jspui/handle/REPOSIP/259046
dc.identifier.urihttp://repositorioslatinoamericanos.uchile.cl/handle/2250/1338973
dc.descriptionOrientador: Fábio Violaro
dc.descriptionDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação
dc.descriptionResumo: Com o contínuo desenvolvimento da tecnologia, há uma demanda crescente por sistemas de síntese de fala que sejam capazes de falar como humanos, para integrá-los nas mais diversas aplicações, seja no âmbito da automação robótica, sejam para acessibilidade de pessoas com deficiências, seja em aplicativos destinados a cultura e lazer. A síntese de fala baseada em modelos ocultos de Markov (HMM) mostra-se promissora em suprir esta necessidade tecnológica. A sua natureza estatística e paramétrica a tornam um sistema flexível, capaz de adaptar vozes artificiais, inserir emoções no discurso e obter fala sintética de boa qualidade usando uma base de treinamento limitada. Esta dissertação apresenta o estudo realizado sobre o sistema de síntese de fala baseado em HMM (HTS), descrevendo as etapas que envolvem o treinamento dos modelos HMMs e a geração do sinal de fala. São apresentados os modelos espectrais, de pitch e de duração que constituem estes modelos HMM dos fonemas dependentes de contexto, considerando as diversas técnicas de estruturação deles. Alguns dos problemas encontrados no HTS, tais como a característica abafada e monótona da fala artificial, são analisados juntamente com algumas técnicas propostas para aprimorar a qualidade final do sinal de fala sintetizado
dc.descriptionAbstract: With the continuous development of technology, there is a growing demand for text-to-speech systems that are able to speak like humans, in order to integrate them in the most diverse applications whether in the field of automation and robotics, or for accessibility of people with disabilities, as for culture and leisure activities. Speech synthesis based on hidden Markov models (HMM) shows to be promising in addressing this need. Their statistical and parametric nature make it a flexible system capable of adapting artificial voices, insert emotions in speech and get artificial speech of good quality using a limited amount of speech data for HMM training. This thesis presents the study realized on HMM-based speech synthesis system (HTS), describing the steps that involve the training of HMM models and the artificial speech generation. Spectral, pitch and duration models are presented, which form context-dependent HMM models, and also are considered the various techniques for structuring them. Some of the problems encountered in the HTS, such as the characteristic muffled and monotone of artificial speech, are analyzed along with some of the proposed techniques to improve the final quality of the synthesized speech signal
dc.descriptionMestrado
dc.descriptionTelecomunicações e Telemática
dc.descriptionMestra em Engenharia Elétrica
dc.format94 p. : il.
dc.formatapplication/pdf
dc.languagePortuguês
dc.publisher[s.n.]
dc.subjectSíntese da voz
dc.subjectSistemas de processamento da fala
dc.subjectVoice synthesis
dc.subjectHidden Markov models (HMM)
dc.subjectSpeech processing systems
dc.titleEstudo de um sistema de conversão texto-fala baseado em HMM
dc.titleStudy of a HMM-based text-to-speech system
dc.typeTesis


Este ítem pertenece a la siguiente institución