Compressão de bancos de fala para sistemas de síntese concatenativa de alta qualidade

Hentz, Augusto Henrique

dc.contributor	Seara, Rui
dc.contributor	Universidade Federal de Santa Catarina
dc.creator	Hentz, Augusto Henrique
dc.date	2012-10-24T09:05:52Z
dc.date	2012-10-24T09:05:52Z
dc.date
dc.date.accessioned	2017-04-03T20:53:29Z
dc.date.available	2017-04-03T20:53:29Z
dc.identifier	275012
dc.identifier	http://repositorio.ufsc.br/xmlui/handle/123456789/92460
dc.identifier.uri	http://repositorioslatinoamericanos.uchile.cl/handle/2250/709587
dc.description	Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2009.
dc.description	Sistemas de conversão texto-fala baseados na técnica de síntese concatenativa com seleção de unidades são capazes de produzir fala sintética de muito boa qualidade, com inteligibilidade e naturalidade próximas às da fala humana. Para conseguir tal feito, é necessário o uso de bancos de fala contendo exemplos de diversos contextos fonéticos e prosódicos. Freqüentemente, os bancos utilizados em sintetizadores de muito boa quali- dade têm duração de dezenas de horas, tornando sua ocupação de memória muito elevada. Além dos bancos de gravações, sistemas de síntese concatenativa utilizam um conjunto de informações para o cálculo de custos no processo de seleção de unidades, contribuindo para a ocupação de memória. O presente trabalho apresenta técnicas para reduzir a ocupa- ção de memória de sistemas de síntese concatenativa de fala, considerando o sintetizador desenvolvido no LINSE (Laboratório de Circuitos e Processamento de Sinais do Departa- mento de Engenharia Elétrica da UFSC). O banco de gravações do sistema considerado é compactado utilizando o codec iLBC, que proporciona a capacidade de acesso aleatório aos dados codificados, fundamental para a aplicações em síntese de fala concatenativa. O banco de parâmetros, por sua vez, é compactado usando quantização vetorial dos co- eficientes espectrais no processo de seleção de unidades. As técnicas propostas permitem reduzir a ocupação de memória do sistema considerado em até 79 %, sem grandes perdas na qualidade da fala sintética.
dc.format	x, 52 f.\| il., grafs., tabs.
dc.language	por
dc.subject	Engenharia eletrica
dc.subject	Fala -
dc.subject	Inteligibilidade
dc.subject	Reconhecimento automatico da voz
dc.subject	Sintese da voz
dc.subject	Sistemas de processamento da fala
dc.title	Compressão de bancos de fala para sistemas de síntese concatenativa de alta qualidade
dc.type	Tesis

Este ítem pertenece a la siguiente institución

Universidade Federal de Santa Catarina (Brasil)