Objeto de conferencia
Detección de palabras claves en lenguajes sin datos de entrenamiento
Registro en:
Autor
Brusco, Pablo
Ferrer, Luciana
Gravano, Agustín
Institución
Resumen
Estudiamos el problema de detección de palabras claves (<i>key-word-spotting</i>) para idiomas que no disponen de corpus de datos con grabaciones y transcripciones fonéticas. Este problema es de central importancia para poder realizar búsquedas en bases de datos de grabaciones de habla. Usando el Boston University Radio Speech Corpus como corpus de referencia, analizamos diversas topologías y parametrizaciones de Modelos Ocultos de Markov para la detección de palabras sobre habla continua. Los modelos se basan en el uso de "fillers" para palabras no buscadas, y empleamos fonemas como unidades mínimas de detección. Para las pruebas, utilizamos un conjunto de 20 keywords entrenadas con 14 minutos de datos transcriptos y fillers entrenados con 7 horas sin transcripciones. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1% y 3.95 falsas alarmas por hora por keyword. XI Workshop Bases de Datos y Minería de Datos Red de Universidades con Carreras de Informática (RedUNCI)