dc.contributorSeara, Rui
dc.contributorUniversidade Federal de Santa Catarina
dc.creatorHentz, Augusto Henrique
dc.date2012-10-24T09:05:52Z
dc.date2012-10-24T09:05:52Z
dc.date
dc.date.accessioned2017-04-03T20:53:29Z
dc.date.available2017-04-03T20:53:29Z
dc.identifier275012
dc.identifierhttp://repositorio.ufsc.br/xmlui/handle/123456789/92460
dc.identifier.urihttp://repositorioslatinoamericanos.uchile.cl/handle/2250/709587
dc.descriptionDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2009.
dc.descriptionSistemas de conversão texto-fala baseados na técnica de síntese concatenativa com seleção de unidades são capazes de produzir fala sintética de muito boa qualidade, com inteligibilidade e naturalidade próximas às da fala humana. Para conseguir tal feito, é necessário o uso de bancos de fala contendo exemplos de diversos contextos fonéticos e prosódicos. Freqüentemente, os bancos utilizados em sintetizadores de muito boa quali- dade têm duração de dezenas de horas, tornando sua ocupação de memória muito elevada. Além dos bancos de gravações, sistemas de síntese concatenativa utilizam um conjunto de informações para o cálculo de custos no processo de seleção de unidades, contribuindo para a ocupação de memória. O presente trabalho apresenta técnicas para reduzir a ocupa- ção de memória de sistemas de síntese concatenativa de fala, considerando o sintetizador desenvolvido no LINSE (Laboratório de Circuitos e Processamento de Sinais do Departa- mento de Engenharia Elétrica da UFSC). O banco de gravações do sistema considerado é compactado utilizando o codec iLBC, que proporciona a capacidade de acesso aleatório aos dados codificados, fundamental para a aplicações em síntese de fala concatenativa. O banco de parâmetros, por sua vez, é compactado usando quantização vetorial dos co- eficientes espectrais no processo de seleção de unidades. As técnicas propostas permitem reduzir a ocupação de memória do sistema considerado em até 79 %, sem grandes perdas na qualidade da fala sintética.
dc.formatx, 52 f.| il., grafs., tabs.
dc.languagepor
dc.subjectEngenharia eletrica
dc.subjectFala -
dc.subjectInteligibilidade
dc.subjectReconhecimento automatico da voz
dc.subjectSintese da voz
dc.subjectSistemas de processamento da fala
dc.titleCompressão de bancos de fala para sistemas de síntese concatenativa de alta qualidade
dc.typeTesis


Este ítem pertenece a la siguiente institución