Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/38005
Title: Classifying code smell reviews with semantic search.
Other Titles: Classificando avaliações de code smell com pesquisa semântica.
???metadata.dc.creator???: RIBEIRO, Carlos Henrique Gonçalves.
???metadata.dc.contributor.advisor1???: BRUNET, João Arthur Monteiro.
Keywords: Code Smells;Code Review;Semantic Search;Classiication - Code Smell Reviews;Busca Semântica;Classificação - Avaliações de Code Smell
Issue Date: 2024
Publisher: Universidade Federal de Campina Grande
Citation: RIBEIRO, Carlos Henrique Gonçalves. Classifying code smell reviews with semantic search. 2024. 06 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024.
???metadata.dc.description.resumo???: Contexto: Code smells referem-se a padrões no código-fonte que desviam dos princípios de design estabelecidos. Durante a revisão do código, os desenvolvedores têm a oportunidade de identificar e corrigir esses smells, assim melhorando a qualidade geral da base de código. Um exame mais aprofundado das discussões dentro das revisões de código pode revelar insights valiosos sobre como os code smells são discutidos. Objetivo: para permitir que pesquisas futuras entendam melhor o comportamento dos desenvolvedores em relação aos code smells, nos propusemos a construir um conjunto de dados de discussões relacionadas a code smells. Na prática, queremos classificar os comentários em duas categorias: comentários com code smell e comentários sem code smell. Método: Para fazer isso, conduzimos um experimento que alavancou a busca semântica como uma técnica de classificação. Os dados de treinamento foram extraídos de três repositórios populares do GitHub de código aberto e consistiram em mais de 100.000 entradas. Resultados: como resultado, classificamos automaticamente 4.058 comentários de revisão como relacionados a code smells. Embora empregando uma nova técnica e dispondo de recursos limitados, conseguimos atingir uma precisão de 0,41 para a tarefa de classificação.
Abstract: Background: Code smells refer to patterns in source code that deviate from established design principles. During code review, developers have the opportunity to identify and correct these smells, thereby enhancing the overall quality of the codebase. Further examination of the discussions within code reviews can reveal valuable insights about how code smells are discussed. Aim: In order to enable future research to better understand developers behavior regarding code smells, we set out to build a dataset of code-smell related discussions. In practice, we want to classify comments in two categories: code smell comments and non code smell comments. Method: To do so, we conducted an experiment that leveraged semantic search as a classiication technique. The training data was scraped from three popular open source GitHub repositories and consisted of over 100,000 entries. Results: As a result, we have automatically classiied 4,058 review comments as being code smell related. Although employing a novel technique and disposing of limited resources we could achieve a precision of 0.41 for the task of classiication.
Keywords: Code Smells
Code Review
Semantic Search
Classiication - Code Smell Reviews
Busca Semântica
Classificação - Avaliações de Code Smell
???metadata.dc.subject.cnpq???: Ciência da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/38005
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
CARLOS HENRIQUE GONCALVES RIBEIRO-ARTIGO-CIÊNCIA DA COMPUTAÇÃO-CEEI (2024).pdf261.47 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.