Buscar

Mostrando ítems 1-10 de 424

Noisy Speech Recognition Based on Combined Audio-Visual Classifiers

Terissi, Lucas Daniel; Sad, Gonzalo Daniel; Gomez, Juan Carlos; Parodi, Marianela (Springer, 2015-01)

An isolated word speech recognition system based on audio-visual features is proposed in this paper. To enhance the recognition over different noisy conditions, this system combines three classifiers based on audio, visual ...

Audio-Visual Automatic Speech Recognition Using PZM, MFCC and Statistical Analysis

Debnath, Saswati; Roy, Pinki

Audio-Visual Automatic Speech Recognition (AV-ASR) has become the most promising research area when the audio signal gets corrupted by noise. The main objective of this paper is to select the important and discriminative ...

Faces and Voices Processing in Human and Primate Brains: Rhythmic and Multimodal Mechanisms Underlying the Evolution and Development of Speech

Michon, Maëva; Zamorano-Abramson, José; Aboitiz, Francisco (2022)

While influential works since the 1970s have widely assumed that imitation is an innate skill in both human and non-human primate neonates, recent empirical studies and meta-analyses have challenged this view, indicating ...

Combination of Standard and Complementary Models for Audio-Visual Speech Recognition

Sad, Gonzalo D.; Terissi, Lucas D.; Gómez, Juan Carlos (2015)

Robust front-end for audio, visual and audio–visual speech classification

Terissi, Lucas Daniel; Sad, Gonzalo Daniel; Gómez, Juan Carlos (Springer, 2018-06)

This paper proposes a robust front-end for speech classification which can be employed with acoustic, visual or audio–visual information, indistinctly. Wavelet multiresolution analysis is employed to represent temporal ...

Disambiguating Conflicting Classification Results in AVSR

Sad, Gonzalo Daniel; Terissi, Lucas Daniel; Gómez, Juan Carlos (Elsevier, 2019)

A novel scheme for disambiguating conflicting classification results in Audio-Visual Speech Recognition (AVSR) applications is proposed in this paper. The classification scheme can be implemented with both generative and ...

A method for lexical tone classification in audio-visual speech

João Vítor Possamai de Menezes; Maria Mendes Cantoni; Denis Burnham; Adriano Vilela Barbosa (Universidade Federal de Minas GeraisBrasilFALE - FACULDADE DE LETRASUFMG, 2020)

Audio-Visual Automatic Speech Recognition Towards Education for Disabilities

Debnath, Saswati; Roy, Pinki; Namasudra, Suyel; González-Crespo, Rubén

Education is a fundamental right that enriches everyone’s life. However, physically challenged people often debar from the general and advanced education system. Audio-Visual Automatic Speech Recognition (AV-ASR) based ...

Audiovisual teaching tools in creating a developing speech environment in the native languages of the indigenous peoples of the north, Siberia, and the far east of the Russian FederationHerramientas de enseñanza audiovisual para crear un entorno de habla en desarrollo en las lenguas nativas de los pueblos indígenas del norte, Siberia y el lejano oriente de la Federación de RusiaFerramentas de ensino audiovisual na criação de um ambiente de fala em desenvolvimento nas línguas nativas dos povos indígenas do norte, Sibéria e extremo oriente da Federação Russa

Lekhanov, Spartak (Universidade Estadual Paulista, 2021)

A comprehensive system for facial animation of generic 3D head models driven by speech

Terissi, Lucas Daniel; Cerda, Mauricio; Gómez, Juan Carlos; Hitschfeld-kahler, Nancy; Girau, Bernard (Springer, 2013-02)

A comprehensive system for facial animation of generic 3D head models driven by speech is presented in this article. In the training stage, audio-visual information is extracted from audio-visual training data, and then ...

1
2
3
4
. . .
43