Evaluación del efecto de visual servoing en speech enhancement con arreglo de micrófonos lineal en interacción humano-robot móvil

Díaz Albornoz, Alejandro Patricio

dc.contributor	Becerra Yoma, Néstor
dc.contributor	Azurdia Meza, César
dc.contributor	Carrasco Zambrano, Miguel
dc.creator	Díaz Albornoz, Alejandro Patricio
dc.date.accessioned	2022-06-23T14:56:32Z
dc.date.accessioned	2022-10-17T15:35:15Z
dc.date.available	2022-06-23T14:56:32Z
dc.date.available	2022-10-17T15:35:15Z
dc.date.created	2022-06-23T14:56:32Z
dc.date.issued	2022
dc.identifier	https://repositorio.uchile.cl/handle/2250/186197
dc.identifier.uri	https://repositorioslatinoamericanos.uchile.cl/handle/2250/4420153
dc.description.abstract	Este trabajo de tesis estudia la comunicación por voz entre humano y robot en ambientes acústicos desafiantes en contexto de interacción humano robot. En un primer capítulo se estudia el efecto de usar visual servoing con beamforming para mejorar el reconocimiento de voz en un sistema de reconocimiento automático de voz. Se grabaron señales de audio con una plataforma robótica en un escenario real con diferentes condiciones de ruido adicional y de movimiento del robot para simular una interacción real. Mediante el uso de informa- ción visual, se controló parte de los movimientos de la plataforma robótica para obtener un filtrado espacial mejorado, usando beamforming. Esto se logró manteniendo un arreglo de micrófonos lineal cercano a la posición donde se obtiene la mejor respuesta. Luego en un siguiente capítulo, se implementó una red neuronal convolucional para enfrentar el problema de speech enhancement para obtener una estimación limpia de la voz a partir de señales voz ruidosas y reverberantes. Este capítulo está basado en el escenario del capítulo anterior donde se considera la plataforma robótica en un ambiente acústico dinámico, ruidoso y reverberan- te. En este capítulo se realizaron simulaciones y se crearon bases de datos representativas del problema. Utilizando una mezcla de señales obtenidas a través de beamforming se realizó speech enhancement a las señales para obtener una versión limpia de la señales reverberantes.
dc.language	es
dc.publisher	Universidad de Chile
dc.rights	http://creativecommons.org/licenses/by-nc-nd/3.0/us/
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 United States
dc.subject	Robótica
dc.subject	Reconocimiento automático de la voz
dc.subject	Aprendizaje profundo
dc.subject	Deep learning
dc.subject	Beamforming
dc.subject	Interacción humano robot
dc.title	Evaluación del efecto de visual servoing en speech enhancement con arreglo de micrófonos lineal en interacción humano-robot móvil
dc.type	Tesis

Este ítem pertenece a la siguiente institución

Universidad de Chile