Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319
Full metadata record
DC FieldValueLanguage
dc.creator.IDCARNEIRO, G. M.pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/4271071140769809pt_BR
dc.contributor.advisor1RAMALHO, Franklin de Souza.-
dc.contributor.advisor1IDRAMALHO, F. S.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2469816352786812pt_BR
dc.contributor.referee1OLIVEIRA, Maxwell Guimarães de.-
dc.contributor.referee1IDOLIVEIRA, M. G.pt_BR
dc.contributor.referee2MASSONI, Tiago Lima.-
dc.contributor.referee2IDMASSONI, T. L.pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/3563923906851611pt_BR
dc.description.resumoNo contexto de projetos de software de grande porte, há demanda crescente por correções de erros em sua concepção, que ultrapassam os iltros de testes e qualidade da equipe de Quality Assurance e impactam os clientes inais do produto. A im de documentar estes comportamentos para que sejam posteriormente analisados e corrigidos, a engenharia de software faz uso de documentos chamados Bug Reports (BR). Como apontado por Anvik et. al [2], a frequência de novos BRs sendo abertos em grandes projetos é elevada, exempliicado pela ferramenta Eclipse, que, ainda em 2005, já contava com aproximadamente 190 novos BRs sendo abertos diariamente. Motivado por essa problemática, o presente estudo propõe e avalia um sistema de recomendação de BRs baseado em similaridade textual, com o diferencial de utilizar o modelo estadoda- arte de compreensão textual BERT [3] como um dos fatores no cálculo de similaridade. Este tem como objetivo aprimorar as sugestões de BRs de contexto próximo ao fornecido pelo mantenedor, o que supostamente aumentaria sua produtividade, e por consequência, a quantidade de BRs resolvidos. Como resultados obtidos, atestou-se ganhos de aproximadamente 14% na frequência de BRs relevantes para as 20 primeiras recomendações, quando comparado à técnica que utilizou apenas TF-IDF como modelo de vetorização textual. Por im, o modelo BERT agregou melhoras às métricas avaliadas (precisão, feedback e likelihood) quando utilizado de maneira complementar ao TF-IDF, não desempenhando positivamente de maneira isolada.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCentro de Engenharia Elétrica e Informática - CEEIpt_BR
dc.publisher.initialsUFCGpt_BR
dc.subject.cnpqCiência da Computação.pt_BR
dc.titleSistema de recomendação de bug reports similares utilizando o BERT.pt_BR
dc.date.issued2023-02-14-
dc.description.abstractIn the context of large-scale software projects, there is an increasing demand for fixes in their conception process that surpass the tests and quality filters of the Quality Assurance team and impact the end customers of the product. In order to document these behaviors so that they can be later analyzed and corrected, software engineering makes use of documents called Bug Reports (BR). As pointed out by Anvik et al [2], the frequency of new BRs being opened in large projects is high, exemplified by the Eclipse tool, which already had approximately 190 new BRs being opened daily in 2005. Motivated by this problem, this study proposes and evaluates a BR recommendation system based on textual similarity, with the differential use of the state-of-the-art text comprehension model BERT [3] as one of the factors in the similarity calculation. Its objective is to improve suggestions for BRs with a context close to that provided by the maintainer, which would supposedly increase their productivity and consequently the number of resolved BRs. As the results obtained attest, there were gains of approximately 14% in the frequency of relevant BRs for the first 20 recommendations, when compared to the technique that used only TF-IDF as a textual vectorization model. Finally, the BERT model added improvements to the evaluated metrics (precision, feedback, and likelihood) when used in a complementary manner to TF-IDF, but did not perform positively in an isolated manner.pt_BR
dc.identifier.urihttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319-
dc.date.accessioned2023-04-10T21:24:02Z-
dc.date.available2023-04-10-
dc.date.available2023-04-10T21:24:02Z-
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.subjectProjetos de softwarept_BR
dc.subjectQuality assurancept_BR
dc.subjectEngenharia de softwarept_BR
dc.subjectBug reportspt_BR
dc.subjectSistema de recomendação de bug reportspt_BR
dc.subjectSimilaridade textualpt_BR
dc.subjectModelo estado-da-arte de compreensão textualpt_BR
dc.subjectCálculo de similaridadept_BR
dc.subjectVetorização textual - modelo TF-IDFpt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectBidirectional Encoder Representations from Transformers - BERTpt_BR
dc.subjectBERT - Bidirectional Encoder Representations from Transformerspt_BR
dc.subjectModelo de vetorização textual - BERTpt_BR
dc.subjectSoftware projectspt_BR
dc.subjectSoftware Engineeringpt_BR
dc.subjectBug report recommendation systempt_BR
dc.subjectTextual similaritypt_BR
dc.subjectState-of-the-art text comprehension modelpt_BR
dc.subjectSimilarity calculationpt_BR
dc.subjectText vectorization - TF-IDF modelpt_BR
dc.subjectNatural language processingpt_BR
dc.subjectText vectorization model - BERTpt_BR
dc.rightsAcesso Abertopt_BR
dc.creatorCARNEIRO, Guilherme de Melo.-
dc.publisherUniversidade Federal de Campina Grandept_BR
dc.languageporpt_BR
dc.title.alternativeRecommendation system for similar bug reports using BERT.pt_BR
dc.identifier.citationCARNEIRO, Guilherme de Melo. Sistema de recomendação de bug reports similares utilizando o BERT. 2023. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29319pt_BR
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
GUILHERME DE MELO CARNEIRO - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdfGuilherme de Melo Carneiro - TCC Artigo Ciência da Computação CEEI 2023405.44 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.