dc.contributorBecerra Yoma, Néstor
dc.contributorAzurdia Meza, César
dc.contributorCarrasco Zambrano, Miguel
dc.creatorDíaz Albornoz, Alejandro Patricio
dc.date.accessioned2022-06-23T14:56:32Z
dc.date.accessioned2022-10-17T15:35:15Z
dc.date.available2022-06-23T14:56:32Z
dc.date.available2022-10-17T15:35:15Z
dc.date.created2022-06-23T14:56:32Z
dc.date.issued2022
dc.identifierhttps://repositorio.uchile.cl/handle/2250/186197
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/4420153
dc.description.abstractEste trabajo de tesis estudia la comunicación por voz entre humano y robot en ambientes acústicos desafiantes en contexto de interacción humano robot. En un primer capítulo se estudia el efecto de usar visual servoing con beamforming para mejorar el reconocimiento de voz en un sistema de reconocimiento automático de voz. Se grabaron señales de audio con una plataforma robótica en un escenario real con diferentes condiciones de ruido adicional y de movimiento del robot para simular una interacción real. Mediante el uso de informa- ción visual, se controló parte de los movimientos de la plataforma robótica para obtener un filtrado espacial mejorado, usando beamforming. Esto se logró manteniendo un arreglo de micrófonos lineal cercano a la posición donde se obtiene la mejor respuesta. Luego en un siguiente capítulo, se implementó una red neuronal convolucional para enfrentar el problema de speech enhancement para obtener una estimación limpia de la voz a partir de señales voz ruidosas y reverberantes. Este capítulo está basado en el escenario del capítulo anterior donde se considera la plataforma robótica en un ambiente acústico dinámico, ruidoso y reverberan- te. En este capítulo se realizaron simulaciones y se crearon bases de datos representativas del problema. Utilizando una mezcla de señales obtenidas a través de beamforming se realizó speech enhancement a las señales para obtener una versión limpia de la señales reverberantes.
dc.languagees
dc.publisherUniversidad de Chile
dc.rightshttp://creativecommons.org/licenses/by-nc-nd/3.0/us/
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States
dc.subjectRobótica
dc.subjectReconocimiento automático de la voz
dc.subjectAprendizaje profundo
dc.subjectDeep learning
dc.subjectBeamforming
dc.subjectInteracción humano robot
dc.titleEvaluación del efecto de visual servoing en speech enhancement con arreglo de micrófonos lineal en interacción humano-robot móvil
dc.typeTesis


Este ítem pertenece a la siguiente institución