Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37761
Full metadata record
DC FieldValueLanguage
dc.creator.IDFARIAS, M. C.pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/1287907028022615pt_BR
dc.contributor.advisor1MARINHO, Leandro Balby.-
dc.contributor.advisor1IDMARINHO, L. B.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3728312501032061pt_BR
dc.contributor.referee1ALMEIDA, Hyggo Oliveira de.-
dc.contributor.referee1IDALMEIDA, H. O.pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4993914550234923pt_BR
dc.contributor.referee2MASSONI, Tiago Lima.-
dc.contributor.referee2IDMASSONI, T. L.pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/3563923906851611pt_BR
dc.description.resumoModelos de aprendizagem de máquina precisam de grandes conjuntos de dados para serem bem treinados. Porém, a criação desses dados rotulados ainda é um grande desafio para a aprendizagem de máquina supervisionada, já que muitas vezes é um processo manual bastante demorado e custoso. Por isso, usualmente são utilizadas bases de dados já existentes, no entanto, em muitos casos esses dados não refletem perfeitamente o contexto em que o modelo irá atuar. Como alternativa a essa abordagem tradicional, surgiu o paradigma data programming, utilizado para a criação programática de conjuntos de treinamento, nesse paradigma os usuários expressam estratégias de weak supervision para criar funções de rotulagem, as quais eventualmente são ruidosas. A fim de criar um modelo robusto aos ruídos produzidos por essas funções, pesquisadores da Universidade de Stanford criaram o sistema Snorkel, o qual se beneficia do acordo entre essas funções para a criação do seu modelo. Nesta pesquisa, o Snorkel é utilizado com o objetivo de rotular pessoas em imagens, uma tarefa diferente da qual o Snorkel vem sendo utilizado, pois as aplicações que fazem seu uso são geralmente no contexto de processamento de linguagem natural, pois é mais simples criar heurísticas que atuam em textos. O ambiente em que as imagens foram extraídas foi um laboratório no bloco CN, localizado na UFCG. Com o propósito de comparar o desempenho do modelo treinado com os dados do ambiente específico (gerados pelo Snorkel) e uma base de dados já existente (genérica), um modelo mais sofisticado foi treinado com os diferentes conjuntos de dados. A acurácia final do modelo treinado com os dados gerados pelo Snorkel foi de 84,94%, enquanto que o treinado com imagens genéricas foi de apenas 30%, indicando que o desempenho de um algoritmo de aprendizagem de máquina especializado em um ambiente específico é bastante superior a um treinado com dados genéricos.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCentro de Engenharia Elétrica e Informática - CEEIpt_BR
dc.publisher.initialsUFCGpt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
dc.titleClassificação de imagens usando weak supervision.pt_BR
dc.date.issued2019-11-21-
dc.description.abstractMachine learning models need large datasets to be well trained. However, creating this labeled data is still a major challenge for supervised learning, as it is often a very time consuming and costly manual process. Therefore, existing databases are usually used, however, in many cases this data does not perfectly reflect the context in which the model will act. As an alternative to this traditional approach, the data programming paradigm arose, used for the programmatic creation of training sets, in this paradigm users express weak supervision strategies to create labeling functions, which eventually are noisy. In order to create a robust model to the noise produced by these functions, researchers at Stanford University created the Snorkel system, which benefits from the agreement of these functions to create their model. In this research, Snorkel is used for the purpose of labeling people in images, a different task from which Snorkel has been used, since the applications that make use of it are generally in the context of natural language processing, because it is simpler to create heuristics that act in texts. The environment in which the images were extracted was a laboratory in the CN block, located at UFCG. In order to compare the performance of the trained model with the specific environment data (generated by Snorkel) and an existing (generic) database, a more sophisticated model was trained with the different datasets. The final accuracy of the model trained with the data generated by Snorkel was 84.94%, while the one trained with generic images was only 30%, indicating that the performance of a specialized machine learning algorithm in a specific environment is far superior to one trained with generic data.pt_BR
dc.identifier.urihttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37761-
dc.date.accessioned2024-09-17T16:37:37Z-
dc.date.available2024-06-17-
dc.date.available2024-09-17T16:37:37Z-
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.subjectAprendizagem de Máquinapt_BR
dc.subjectRotulagem de Dadospt_BR
dc.subjectSistema Snorkelpt_BR
dc.subjectWeak Supervisionpt_BR
dc.subjectMachine Learningpt_BR
dc.subjectData Labelingpt_BR
dc.subjectSnorkel Systempt_BR
dc.rightsAcesso Abertopt_BR
dc.creatorFARIAS, Mainara Cavalcanti de.-
dc.publisherUniversidade Federal de Campina Grandept_BR
dc.languageporpt_BR
dc.title.alternativeImage classification using weak.pt_BR
dc.identifier.citationFARIAS, Mainara Cavalcanti de. Classificação de imagens usando weak supervision. 2019. 13 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2019.pt_BR
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
MAINARA CAVALCANTI DE FARIAS-ARTIGO-CIÊNCIA DA COMPUTAÇÃO-CEEI (2019).pdf1.06 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.