Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.creator.ID | CARNEIRO, G. M. | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/4271071140769809 | pt_BR |
dc.contributor.advisor1 | RAMALHO, Franklin de Souza. | - |
dc.contributor.advisor1ID | RAMALHO, F. S. | pt_BR |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/2469816352786812 | pt_BR |
dc.contributor.referee1 | OLIVEIRA, Maxwell Guimarães de. | - |
dc.contributor.referee1ID | OLIVEIRA, M. G. | pt_BR |
dc.contributor.referee2 | MASSONI, Tiago Lima. | - |
dc.contributor.referee2ID | MASSONI, T. L. | pt_BR |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/3563923906851611 | pt_BR |
dc.description.resumo | No contexto de projetos de software de grande porte, há demanda crescente por correções de erros em sua concepção, que ultrapassam os iltros de testes e qualidade da equipe de Quality Assurance e impactam os clientes inais do produto. A im de documentar estes comportamentos para que sejam posteriormente analisados e corrigidos, a engenharia de software faz uso de documentos chamados Bug Reports (BR). Como apontado por Anvik et. al [2], a frequência de novos BRs sendo abertos em grandes projetos é elevada, exempliicado pela ferramenta Eclipse, que, ainda em 2005, já contava com aproximadamente 190 novos BRs sendo abertos diariamente. Motivado por essa problemática, o presente estudo propõe e avalia um sistema de recomendação de BRs baseado em similaridade textual, com o diferencial de utilizar o modelo estadoda- arte de compreensão textual BERT [3] como um dos fatores no cálculo de similaridade. Este tem como objetivo aprimorar as sugestões de BRs de contexto próximo ao fornecido pelo mantenedor, o que supostamente aumentaria sua produtividade, e por consequência, a quantidade de BRs resolvidos. Como resultados obtidos, atestou-se ganhos de aproximadamente 14% na frequência de BRs relevantes para as 20 primeiras recomendações, quando comparado à técnica que utilizou apenas TF-IDF como modelo de vetorização textual. Por im, o modelo BERT agregou melhoras às métricas avaliadas (precisão, feedback e likelihood) quando utilizado de maneira complementar ao TF-IDF, não desempenhando positivamente de maneira isolada. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Centro de Engenharia Elétrica e Informática - CEEI | pt_BR |
dc.publisher.initials | UFCG | pt_BR |
dc.subject.cnpq | Ciência da Computação. | pt_BR |
dc.title | Sistema de recomendação de bug reports similares utilizando o BERT. | pt_BR |
dc.date.issued | 2023-02-14 | - |
dc.description.abstract | In the context of large-scale software projects, there is an increasing demand for fixes in their conception process that surpass the tests and quality filters of the Quality Assurance team and impact the end customers of the product. In order to document these behaviors so that they can be later analyzed and corrected, software engineering makes use of documents called Bug Reports (BR). As pointed out by Anvik et al [2], the frequency of new BRs being opened in large projects is high, exemplified by the Eclipse tool, which already had approximately 190 new BRs being opened daily in 2005. Motivated by this problem, this study proposes and evaluates a BR recommendation system based on textual similarity, with the differential use of the state-of-the-art text comprehension model BERT [3] as one of the factors in the similarity calculation. Its objective is to improve suggestions for BRs with a context close to that provided by the maintainer, which would supposedly increase their productivity and consequently the number of resolved BRs. As the results obtained attest, there were gains of approximately 14% in the frequency of relevant BRs for the first 20 recommendations, when compared to the technique that used only TF-IDF as a textual vectorization model. Finally, the BERT model added improvements to the evaluated metrics (precision, feedback, and likelihood) when used in a complementary manner to TF-IDF, but did not perform positively in an isolated manner. | pt_BR |
dc.identifier.uri | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319 | - |
dc.date.accessioned | 2023-04-10T21:24:02Z | - |
dc.date.available | 2023-04-10 | - |
dc.date.available | 2023-04-10T21:24:02Z | - |
dc.type | Trabalho de Conclusão de Curso | pt_BR |
dc.subject | Projetos de software | pt_BR |
dc.subject | Quality assurance | pt_BR |
dc.subject | Engenharia de software | pt_BR |
dc.subject | Bug reports | pt_BR |
dc.subject | Sistema de recomendação de bug reports | pt_BR |
dc.subject | Similaridade textual | pt_BR |
dc.subject | Modelo estado-da-arte de compreensão textual | pt_BR |
dc.subject | Cálculo de similaridade | pt_BR |
dc.subject | Vetorização textual - modelo TF-IDF | pt_BR |
dc.subject | Processamento de linguagem natural | pt_BR |
dc.subject | Bidirectional Encoder Representations from Transformers - BERT | pt_BR |
dc.subject | BERT - Bidirectional Encoder Representations from Transformers | pt_BR |
dc.subject | Modelo de vetorização textual - BERT | pt_BR |
dc.subject | Software projects | pt_BR |
dc.subject | Software Engineering | pt_BR |
dc.subject | Bug report recommendation system | pt_BR |
dc.subject | Textual similarity | pt_BR |
dc.subject | State-of-the-art text comprehension model | pt_BR |
dc.subject | Similarity calculation | pt_BR |
dc.subject | Text vectorization - TF-IDF model | pt_BR |
dc.subject | Natural language processing | pt_BR |
dc.subject | Text vectorization model - BERT | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.creator | CARNEIRO, Guilherme de Melo. | - |
dc.publisher | Universidade Federal de Campina Grande | pt_BR |
dc.language | por | pt_BR |
dc.title.alternative | Recommendation system for similar bug reports using BERT. | pt_BR |
dc.identifier.citation | CARNEIRO, Guilherme de Melo. Sistema de recomendação de bug reports similares utilizando o BERT. 2023. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319 | pt_BR |
Appears in Collections: | Trabalho de Conclusão de Curso - Artigo - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
GUILHERME DE MELO CARNEIRO - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdf | Guilherme de Melo Carneiro - TCC Artigo Ciência da Computação CEEI 2023 | 405.44 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.