dc.contributor | Becerra Yoma, Néstor | |
dc.contributor | Azurdia Meza, César | |
dc.contributor | Carrasco Zambrano, Miguel | |
dc.creator | Díaz Albornoz, Alejandro Patricio | |
dc.date.accessioned | 2022-06-23T14:56:32Z | |
dc.date.accessioned | 2022-10-17T15:35:15Z | |
dc.date.available | 2022-06-23T14:56:32Z | |
dc.date.available | 2022-10-17T15:35:15Z | |
dc.date.created | 2022-06-23T14:56:32Z | |
dc.date.issued | 2022 | |
dc.identifier | https://repositorio.uchile.cl/handle/2250/186197 | |
dc.identifier.uri | https://repositorioslatinoamericanos.uchile.cl/handle/2250/4420153 | |
dc.description.abstract | Este trabajo de tesis estudia la comunicación por voz entre humano y robot en ambientes
acústicos desafiantes en contexto de interacción humano robot. En un primer capítulo se
estudia el efecto de usar visual servoing con beamforming para mejorar el reconocimiento de
voz en un sistema de reconocimiento automático de voz. Se grabaron señales de audio con
una plataforma robótica en un escenario real con diferentes condiciones de ruido adicional
y de movimiento del robot para simular una interacción real. Mediante el uso de informa-
ción visual, se controló parte de los movimientos de la plataforma robótica para obtener un
filtrado espacial mejorado, usando beamforming. Esto se logró manteniendo un arreglo de
micrófonos lineal cercano a la posición donde se obtiene la mejor respuesta. Luego en un
siguiente capítulo, se implementó una red neuronal convolucional para enfrentar el problema
de speech enhancement para obtener una estimación limpia de la voz a partir de señales voz
ruidosas y reverberantes. Este capítulo está basado en el escenario del capítulo anterior donde
se considera la plataforma robótica en un ambiente acústico dinámico, ruidoso y reverberan-
te. En este capítulo se realizaron simulaciones y se crearon bases de datos representativas
del problema. Utilizando una mezcla de señales obtenidas a través de beamforming se realizó
speech enhancement a las señales para obtener una versión limpia de la señales reverberantes. | |
dc.language | es | |
dc.publisher | Universidad de Chile | |
dc.rights | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | |
dc.subject | Robótica | |
dc.subject | Reconocimiento automático de la voz | |
dc.subject | Aprendizaje profundo | |
dc.subject | Deep learning | |
dc.subject | Beamforming | |
dc.subject | Interacción humano robot | |
dc.title | Evaluación del efecto de visual servoing en speech enhancement con arreglo de micrófonos lineal en interacción humano-robot móvil | |
dc.type | Tesis | |