Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/33359
Full metadata record
DC FieldValueLanguage
dc.creator.IDSANTOS, M. L. O.pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1426948852953123pt_BR
dc.contributor.advisor1CAMPELO, Cláudio Elízio Calazans.-
dc.contributor.advisor1IDCAMPELO, C. E. C.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2042247762832979pt_BR
dc.contributor.referee1BAPTISTA, Cláudio de Souza.-
dc.contributor.referee1IDBAPTISTA, C. S.pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/0104124422364023pt_BR
dc.contributor.referee2BRASILEIRO, Francisco Vilar.-
dc.contributor.referee2IDBRASILEIRO, F. V.pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5957855817378897pt_BR
dc.description.resumoEmbora os grandes modelos de linguagem (LLMs) representem uma revolução na forma como interagimos com computadores, permitindo a construção de perguntas complexas e a capacidade de raciocinar sobre uma sequência de declarações, seu uso é restrito devido à necessidade de hardware dedicado para a execução. Neste estudo, avaliamos o desempenho de LLMs baseados nos modelos LLaMA de 7 e 13 bilhões, submetidos a um processo de quantização e executados em hardware doméstico. Os modelos considerados foram alpaca, koala e vicuna. Para avaliar a eficácia desses modelos, desenvolvemos um banco de dados contendo 1006 perguntas do ENEM (Exame Nacional do Ensino Médio). Nossa análise revelou que o modelo de melhor desempenho alcançou uma acurácia de aproximadamente 40% tanto para os textos originais das perguntas em português quanto para suas traduções em inglês. Além disso, avaliamos a eficiência computacional dos modelos medindo o tempo necessário para a execução. Em média, os LLMs de 7 e 13 bilhões levaram aproximadamente 20 e 50 segundos, respectivamente, para processar as consultas em uma máquina equipada com um processador AMD Ryzen 5 3600x.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCentro de Engenharia Elétrica e Informática - CEEIpt_BR
dc.publisher.initialsUFCGpt_BR
dc.subject.cnpqCiência da Computação.pt_BR
dc.titleAvaliação de grandes modelos de linguagem quantizados na resolução de questões do ENEM.pt_BR
dc.date.issued2023-06-28-
dc.description.abstractAlthough large language models (LLMs) represent a revolution in the way we interact with computers allowing the construction of complex questions and the ability to reason over a sequence of statements, their use is restricted due to the need for dedicated hardware for execution. In this study we evaluate the performance of LLMs based on the 7 and 13 billion LLaMA models, subjected to a quantization process and run on home hardware. The models considered were alpaca, koala, and vicuna. To evaluate the effectiveness of these models, we developed a database containing 1006 questions from the ENEM (National High School Exam). Our analysis revealed that the best performing model achieved an accuracy of approximately 40% for both the original texts of the Portuguese questions and their English translations. In addition, we evaluated the computational efficiency of the models by measuring the time required for execution. On average, the 7 and 13 billion LLMs took approximately 20 and 50 seconds, respectively, to process the queries on a machine equipped with an AMD Ryzen 5 3600x processor.pt_BR
dc.identifier.urihttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/33359-
dc.date.accessioned2023-12-04T20:21:15Z-
dc.date.available2023-12-04-
dc.date.available2023-12-04T20:21:15Z-
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.subjectGrande modelos de linguagempt_BR
dc.subjectLLMspt_BR
dc.subjectENEMpt_BR
dc.subjectLLaMA - modelo de linguagempt_BR
dc.subjectQuantizaçãopt_BR
dc.subjectQuestões do ENEMpt_BR
dc.subjectGreat language modelspt_BR
dc.subjectAND EITHERpt_BR
dc.subjectLLaMA - language modelpt_BR
dc.subjectQuantizationpt_BR
dc.subjectENEM questionspt_BR
dc.rightsAcesso Abertopt_BR
dc.creatorSANTOS, Matheus Lisboa Oliveira dos.-
dc.publisherUniversidade Federal de Campina Grandept_BR
dc.languageporpt_BR
dc.title.alternativeBenchmarking quantized LLaMa-based models on the Brazilian Secondary School Exam - ENEM.pt_BR
dc.identifier.citationSANTOS, Matheus Lisboa Oliveira dos. Avaliação de grandes modelos de linguagem quantizados na resolução de questões do ENEM. 2023. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/33359pt_BR
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
MATHEUS LISBOA OLIVEIRA DOS SANTOS - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdfMatheus Lisboa Oliveira dos Santos - TCC Artigo Ciência da Computação CEEI 2023.826.79 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.