Models for estimating issue resolution time on GitHub using textual and temporal features

dc.contributorComarela, Giovanni Ventorim
dc.contributorhttp://lattes.cnpq.br/9336171799583090
dc.contributorSilva, Gláucia Braga e
dc.creatorCoelho Neto, Luiz Eugênio
dc.date2022-08-17T11:48:09Z
dc.date2022-08-17T11:48:09Z
dc.date2021-06-25
dc.date.accessioned2023-09-27T21:55:06Z
dc.date.available2023-09-27T21:55:06Z
dc.identifierCOELHO NETO, Luiz Eugênio. Modelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais. 2021. 64 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2021.
dc.identifierhttps://locus.ufv.br//handle/123456789/29685
dc.identifierhttps://doi.org/10.47328/ufvbbt.2021.028
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/8968083
dc.descriptionEstimar o tempo de resolução de issues tem relevância comprovada no contexto dos proces- sos de manutenção de software. No entanto, dentre os modelos de estimativa encontrados na literatura, poucos se referem ao ambiente de issue tracking do GitHub. Apesar da popularidade dessa plataforma, especialmente no contexto Open Source, seu sistema de issue tracking é pouco burocrático e as issues são definidas de forma simplificada, o que torna o processo de construção de modelos preditivos ainda mais desafiador. O objetivo deste trabalho é desenvolver modelos de aprendizado de máquina para estimar o tempo de resolução de issues no GitHub, com intuito de auxiliar tarefas como definição de prazos. A fim de suprir a escassez de dados, são propostos atributos textuais, responsáveis por capturar características sobre o texto das issues; e temporais, responsáveis por fornecer informações sobre o momento em que ocorreram eventos relacionados a elas. Redes neu- rais (MLP) também são aplicadas para classificação e provam serem mais adequadas para resolução do problema. Para fins de validação, os modelos propostos são comparados com uma referência encontrada na literatura, revelando resultados positivos por meio de diver- sas métricas, destacando-se uma melhora significativa na acurácia. Por fim, são realizados testes após a adição das categorias de atributos propostas (textuais e temporais) a fim de avaliar o impacto causado por elas na qualidade das estimativas. Palavras-chave: Rastreamento de problemas. Estimativa do tempo de resolução. Apren- dizado de máquina. Redes neurais. GitHub.
dc.descriptionEstimating issues resolution time is one of the most important step in software main- tenance processes. However, although the subject is covered in the literature, there are few specific models for GitHub. This platform is very popular mainly in the open source context but its issue tracking system is not bureaucratic and issues are registered in a very simple way, which makes the process of building predictive models even more chal- lenging. This work aims to develop machine learning models to estimate the resolution time of issues from GitHub. To handle with the data scarcity, we propose textual at- tributes to capture issues characteristics; and temporal attributes to provide information about the time of issue events. Neural networks were used in classification algorithms and proved to be more suitable for solving this problem. To validade the proposed models we compared them with a reference from literature through different metrics and the results were positive with a significant improvement in accuracy. Finally, to validate the new attributes we conduct comparative tests in order to assess the impact of their inclusion on the estimations quality. Keywords: Issue tracking. Issue lifetime prediction. Machine Learning Model. Neural networks GitHub.
dc.formatapplication/pdf
dc.languagepor
dc.publisherUniversidade Federal de Viçosa
dc.publisherCiência da Computação
dc.rightsAcesso Aberto
dc.subjectAprendizado do computador
dc.subjectRedes neurais (Computação)
dc.subjectGitHub (Programa de computador)
dc.subjectCiência da Computação
dc.titleModelos para estimativa do tempo de resolução de issues no GitHub utilizando atributos textuais e temporais
dc.titleModels for estimating issue resolution time on GitHub using textual and temporal features
dc.typeDissertação


Este ítem pertenece a la siguiente institución