Trabajo de grado - Pregrado
Creación de una herramienta de voz a texto utilizando un motor de software libre para facilitar la inclución digital en educacion telepresencial a la comunidad no oyente de la Universidad ECCI
Autor
Duarte Cortes, Luis Alberto
Institución
Resumen
The purpose of this project is to develop a free software prototype tool for assisting hearing-impaired students that struggle with virtual academic environments.
This comes from direct experience of the needs of this community using this platform during the Covid-19 restrictions where captions were unavailable during classes so hearing-impaired students required a full-time sign interpreter during classes to communicate accurately with the teacher.
The main motivation for this development is to achieve easier adoption of new virtuality use cases, and solve the evident absence of this service since it is not provided by the university. This proposal is born from the Free Software Research hotbed from the ECCI University to dig deeply into voice-to-text technologies as a primary source to conduct a state-of-the-art analysis using different voice-to-text engines in search of the one most suitable for developing a functional prototype of a voice-to-text based web application that allows students and the university free access to a subtitle generation service that can be provided during conferences, speeches, and extracurricular activities.
In this document, you will be able to visualize the different proposed phases: analysis, design, implementation, execution, and testing made to the web application in the last part of the document. The conclusions and contributions on further implementation will be reviewed, as well as recommendations for upgrading and scaling up this platform to be widely used by the community. En este documento se muestra el desarrollo de un prototipo de Software Libre para asistir a los estudiantes de la comunidad de discapacidad auditiva en ambientes virtuales, esto a partir de la observación directa de las necesidades especiales de esta población en estas plataformas durante las restricciones de COVID-19 donde los subtítulos de apoyo no estaban disponibles para ellos ya que dependen de un intérprete de lengua de señas para comunicarse adecuadamente con un docente. La motivación principal para desarrollarlo es lograr que los estudiantes sordos se adapten fácilmente a los nuevos usos de la virtualidad, y solucionar la evidente ausencia de este servicio por parte de la Universidad, Para esto se realizó desde el semillero de Software Libre de la Universidad ECCI una investigación a fondo sobre estas tecnologías de reconocimiento de voz como una investigación primaria a partir de la cual se elaboró un estado del arte analizando los diferentes motores de voz en busca del motor más adecuado para desarrollar un prototipo funcional de una herramienta de voz a texto basada en una aplicación web que le permita a los estudiantes y a la Universidad acceder a este servicio como apoyo visual de subtítulos en conferencias charlas y actividades académicas extracurriculares. En este documento se visualizan las diferentes fases planteadas: análisis, diseño, implementación, ejecución y pruebas realizadas a la aplicación web y en la parte final del documento, se evidencian las conclusiones y aportes sobre la investigación, así como recomendaciones para actualizar y escalar esta plataforma, para que sea ampliamente utilizada por la comunidad. 1. Título de la Investigación 15
2. Problema de la Investigación 16
2.1 Descripción del Problema 16
2.2 Formulación del Problema 20
3. Objetivos de la Investigación 21
3.1 Objetivo General 21
3.2 Objetivos Específicos 21
4. Justificación y Delimitaciones de la Investigación 22
4.1 Justificación 22
4.2 Delimitaciones 22
5. Marco de referencia 23
5.1 Marco Teórico 23
5.1.1 Reconocimiento de voz a texto. 23
5.1.2 Ambientes de ejecución 51
5.1.3 Infraestructura TI web 53
5.2 Marco Conceptual 60
5.2.1 Reconocimiento automático de voz 60
5.2.2 ASR 60
5.2.3 Plataforma 61
5.2.4 Web Socket 61
5.2.5 API 61
5.2.6 Bit-Rate 62
5.2.7 Características de voz 62
5.2.8 Características del lenguaje 64
Marco Legal 66
5.2.9 Leyes 66
5.2.10 Decretos 66
5.2.11 Circulares 67
5.2.12 Licencias de Software Libre 67
6. Ingeniería de Requerimientos 68
6.1 Acta Inicio del Proyecto 68
6.2 Fases de implementación 68
6.2.1 Metodología 68
6.3 Identificación de necesidades 73
6.4 Investigación Preliminar estado del arte 75
6.4.1 Modelo gavilán 75
6.4.2 Problema de investigación 78
6.4.3 Búsqueda y recolección de información 79
6.4.4 Análisis de la información obtenida 92
6.5 Selección del motor de Software 93
6.6 Especificación de requisitos de la infraestructura 96
6.6.1 Sistema Operativo 96
6.7 Especificación de requisitos del servicio 96
6.7.1 Servidores 96
6.7.2 Navegadores WEB 97
6.8 Diseño y elaboración de la propuesta 98
6.8.1 Diagramas y diseño 98
6.8.2 Infraestructura 105
6.8.3 Planimetría de Red 105
6.8.4 Descripción de servicio 108
7. Solución propuesta 109
7.1 Descripción de la propuesta 109
7.2 Desarrollo de la propuesta 110
7.3 Instalación de Software principal 110
7.4 Pruebas Realizadas a la propuesta 111
7.4.1 Entorno de pruebas locales 111
7.4.2 Entorno de despliegue 113
7.4.3 Pruebas 115
7.5 Análisis de Resultados Obtenidos 119
7.6 Acta Cierre del Proyecto 119
8. Recursos 120
8.1 Recursos Humanos 120
8.1.1 Líder de proyecto 120
8.1.2 Director de proyecto (Universidad ECCI) 120
8.1.3 Asesor de proyecto (Universidad ECCI) 120
8.2 Recursos Físicos 120
8.3 Recursos Tecnológicos 120
8.3.1 Servidor de pruebas 120
8.3.2 Servidor de despliegue 121
9. Cronograma de Actividades 121
10. Conclusiones 121
11. Bibliografía 123 Modelo Gavilán se incluye documentacion configuracion y ejecucion de la plataforma en el ANEXO 10 junto con la plataforma y el producto de desarollo en el ANEXO 11 Pregrado Ingeniero en Sistemas Ingeniería de Sistemas Software Libre - Desarollo