Reconhecimento automatico de palavras isoladas : estudo e aplicação dos metodos deterministico e estocastico

Becerra Yoma, Nestor Jorge

Tesis

Registro en:

BECERRA YOMA, Nestor Jorge. Reconhecimento automatico de palavras isoladas: estudo e aplicação dos metodos deterministico e estocastico. 1993. 1v. (varias paginações). Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica, Campinas, [SP. Disponível em: <http://libdigi.unicamp.br/document/?code=vtls000076089>. Acesso em: 15 mar. 2017.

http://repositorio.unicamp.br/jspui/handle/REPOSIP/261458

http://repositorioslatinoamericanos.uchile.cl/handle/2250/1336730

Autor

Becerra Yoma, Nestor Jorge

Institución

Universidade Estadual de Campinas (Brasil)

Resumen

Orientador: João Marcos Travassos Romano

Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica

Resumo: Esta dissertação objetiva o estudo e implementação das técnicas mais comumente utilizadas em reconhecimento de palavras isoladas, numa abordagem analítica e crítica. Neste sentido, os dois primeiros capítulos foram dedicados à apresentação dos métodos de parametrização e de reconhecimento de padrões acústicos, utilizando um certo rigor matemático, tendo sempre em vista as aplicações. A seguir, foram comparadas três técnicas de parametrização (coeficientes LPC, LPC-cepstral e Mel-cepstral) no que diz respeito à capacidade de assimilar características intra-locutor e inter-locutor, e quanto à robustez em relação ao ruído interferente. Para implementar estes testes comparativos foi sugerido o algoritmo DTW (método determinístico) que compara diretamente duas elocuções eliminando as diferenças temporais entre elas. Por último, foi descrita a implementação de um reconhecedor automático de dígitos independente do locutor empregando a técnica HMM (método estocástico) com modelamento por palavra e parametrização Mel-cepstral

Abstract: In this work, the most commonly used techniques employed in speech recognition for isolated words were studied and implemented. Initially the parametrization and acoustic pattern recognition methods were discussed. In the discussion, we not only maintained the mathematical formalism as suggested in the literature but also sought the easy way for the practical implementation of these techniques. Three parametrization techniques, namely LPC,LPC-cepstral and Mel cepstral coefficients, were compared with respect to the assimilation capability of speaker-dependent and independent features, and noise robustness. Particularly, the DTW technique (deterministic analysis) was used for these comparative tests, which is capable of eliminating the time difference between two elocutions. A speaker independent digit recognizer was implemented employing the HMM techniques (stochastic analysis) with word modelling and Mel-cepstral coefficients

Mestrado

Mestre em Engenharia Eletrica

Materias

Reconhecimento automático da voz

Sistemas de reconhecimento de padrões

Mostrar el registro completo del ítem