Dissertação
Estimação cega do tempo de reverberação através de redes neurais
Autor
Prates, Rodrigo Leite
Institución
Resumen
In this dissertation we investigate the performances of the main techniques for blind estimation of the reverberation time of an environment, that is, without the a priori knowledge of the impulse response of the room. These techniques model the reverberant signal to estimate the decay of the ambient impulse response in order to obtain the time that the sound takes to decay by 60 db after the interruption of the sound source, termed RT60. Among them, we highlight the method based on neural networks, which realizes the prediction of the RT60 from a stretch of the reverberant signal. This distinction is due to its ability to estimate the RT60 robustly to noise and abrupt signal variations over time. Calculations are made in the frequency domain, with the features of the training samples generated on the mel scale, before being used by the network. Results of the RT60 estimation are presented for different environments, comparing the average absolute errors obtained with different techniques. It can be concluded that the estimation errors obtained by the methods that use neural networks are similar to those obtained by the other techniques, being these errors lower in some environment configurations.Também disponível on-line. Nesta dissertação são investigados os desempenhos das principais técnicas de estimação do tempo de reverberação de um ambiente de forma cega, ou seja, sem o conhecimento a priori da resposta ao impulso da sala. Essas técnicas modelam o sinal reverberante para estimar o decaimento da resposta ao impulso do ambiente, de forma a obter o tempo que o som leva para decair 60 db após a interrupção da fonte sonora, denominado RT60. Entre elas, destaca-se o método baseado em redes neurais, que realiza a predição do RT60 a partir de um trecho do sinal reverberante. Esse destaque se deve à sua capacidade de estimação robusta a ruído e a variações abruptas do sinal ao longo do tempo. Os cálculos são feitos no domínio da frequência, onde as características das amostras de treinamento são geradas na escala mel, antes de serem utilizadas pela rede. São apresentados resultados de estimação do RT60 para diferentes ambientes, comparando-se os erros médios absolutos obtidos com diferentes técnicas. Pode-se concluir que os erros de estimação obtidos pelos métodos que utilizam redes neurais são semelhantes aos obtidos pelas demais técnicas, sendo esses erros inferiores em algumas configurações de ambiente.