Otro
Reconhecimento de voz para aplicações em automação implementado em FPGA
Registro en:
MULATINHO, Gustavo Moscardo. Reconhecimento de voz para aplicações em automação implementado em FPGA. 2011. 1 CD-ROM. Trabalho de conclusão de curso - (bacharelado - Engenharia Elétrica) – Universidade Estadual Paulista, Faculdade de Engenharia de Guaratinguetá, 2011.
mulatinho_gm_tcc_guara.pdf
000686916
Autor
Mulatinho, Gustavo Moscardo
Resumen
In many movies of scientific fiction, machines were capable of speaking with humans. However mankind is still far away of getting those types of machines, like the famous character C3PO of Star Wars. During the last six decades the automatic speech recognition systems have been the target of many studies. Throughout these years many technics were developed to be used in applications of both software and hardware. There are many types of automatic speech recognition system, among which the one used in this work were the isolated word and independent of the speaker system, using Hidden Markov Models as the recognition system. The goals of this work is to project and synthesize the first two steps of the speech recognition system, the steps are: the speech signal acquisition and the pre-processing of the signal. Both steps were developed in a reprogrammable component named FPGA, using the VHDL hardware description language, owing to the high performance of this component and the flexibility of the language. In this work it is presented all the theory of digital signal processing, as Fast Fourier Transforms and digital filters and also all the theory of speech recognition using Hidden Markov Models and LPC processor. It is also presented all the results obtained for each one of the blocks synthesized e verified in hardware Muitos são os filmes de ficção científica em que são utilizadas máquinas capazes de dialogar com os seres humanos. Porém, o homem ainda está longe de chegar em tais máquinas, como o personagem C3PO do filme Star Wars. Durante as últimas seis décadas muito se têm investido nos estudos de reconhecimento automático de voz, surgindo ao longo desses anos diversas técnicas que podem ser utilizadas por ambas as aplicações de software e hardware. Diversos são os tipos de sistemas de reconhecimento automático de voz, dentre os quais o utilizado para este trabalho é o sistema de palavras isoladas independentes do locutor, utilizando Modelos Escondidos de Markov como técnica de reconhecimento da palavra. Este trabalho tem por finalidade projetar e sintetizar as duas primeiras etapas de um sistema de reconhecimento de voz, sendo tais etapas: a aquisição do sinal de voz e o pré-processamento do mesmo. Sendo estas etapas desenvolvidas em um componente reprogramável denominado FPGA, utilizando linguagem de programação de hardware VHDL, tendo em vista o alto desempenho que este componente pode proporcionar e a flexibilidade da linguagem. Neste trabalho é apresentado todo o conteúdo teórico de processamento digital de sinais, como a teoria de Transformadas Rápidas de Fourier e filtros digitais e também toda a teoria de reconhecimento de voz utilizando Modelos Escondidos de Markov e processador LPC. Também são apresentados todos os resultados obtidos por cada um dos blocos sintetizados e verificados em hardware