Trabajo de grado - Doctorado
A Question answering model for requirements elicitation in the context of software development
Fecha
2022-04-04Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
Calle Gallego, Johnathan Mauricio
Institución
Resumen
Requirements Elicitation (RE) is focused on identifying and characterizing the stakeholders and their requirements. Such an activity may be challenging as the scope of the software product domain grows, generating errors and delays. Natural Language Processing (NLP) deals with automatically analyzing, understanding, and generating natural language. Software analysts use NLP-based approaches for improving RE, making it more efficient and reliable. However, domain scope and limitation for understanding the writing styles of requirements documents generate significant drawbacks for such approaches. In this Ph.D. Thesis we propose SQUARE (Scalable QUestion Answering for Requirements Elicitation), a novel approach for improving the NLP-based approaches for RE based on Question Answering Systems (QASs), comprising a meta-restricted domain for RE and a rule-based approach for generating RE-related questions and answers. QASs are used for extracting precise and concise answers to natural language questions. The SQUARE model represents a contribution for the NLP-based approaches for RE, allowing software analysts for identifying, extracting, and structuring key abstractions from requirements documents such as actors, actions, and concepts in a more natural way due to its proximity to a real-life RE domain. We validate our proposal by using an experimental process. The SQUARE model is included as a new work product for eliciting requirements. Therefore, the SQUARE model is intended to be an NLP-based approach to RE for software analysts. La Educción de Requisitos (ER) se enfoca en identificar y caracterizar a los interesados y sus requisitos. Esta actividad puede ser desafiante a medida que el alcance del dominio del producto de software crece, generando errores y retrasos. El Procesamiento de Lenguaje Natural (PLN) se usa para analizar, entender y generar lenguaje natural automáticamente. Los analistas de software usan enfoques basados en PLN para mejorar la ER, haciéndola más eficiente y confiable. Sin embargo, el alcance del dominio y la limitación para comprender los estilos de escritura de los documentos de requisitos generan inconvenientes importantes para estos enfoques. En esta Tesis Doctoral se presenta SQUARE (Scalable QUestion Answering for Requirements Elicitation por sus siglas en inglés), un enfoque novedoso para mejorar los enfoques basados en PLN para ER basado en Sistemas Pregunta-Respuesta (SPR), que comprende un dominio meta-restringido para ER y un enfoque basado en reglas para generar preguntas y respuestas relacionadas con la ER. Los SPR se usan para extraer respuestas precisas y concisas a preguntas en lenguaje natural. El modelo SQUARE representa una contribución a los enfoques basados en PLN para ER, permitiendo a los analistas de software identificar, extraer y estructurar abstracciones clave a partir de documentos de requisitos tales como actores, acciones y conceptos de una manera más natural debido a su proximidad con un dominio real de ER. Esta propuesta se valida usando un proceso experimental. El modelo SQUARE se incluye como un nuevo producto de trabajo para educir requisitos. Por lo tanto, el modelo SQUARE se espera que sea un enfoque de ER basado en PLN para analistas de software. (texto tomado de la fuente)