Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29273
Full metadata record
DC FieldValueLanguage
dc.creator.IDRAMALHO, R. E. C.pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/7686727918516258pt_BR
dc.contributor.advisor1BAPTISTA, Cláudio de Souza.-
dc.contributor.advisor1IDBAPTISTA, C. S.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0104124422364023pt_BR
dc.contributor.advisor2FIGUEIRÊDO, Hugo Feitosa de.-
dc.contributor.advisor2IDFIGUEIRÊDO, H. F.pt_BR
dc.contributor.advisor2Latteshttp://lattes.cnpq.br/9466135849011391pt_BR
dc.contributor.referee1OLIVEIRA, Maswell Guimarães de.-
dc.contributor.referee1IDOLIVEIRA, M. G.pt_BR
dc.contributor.referee2BRASILEIRO, Francisco Vilar.-
dc.contributor.referee2IDBRASILEIRO, F. V.pt_BR
dc.description.resumoSistemas de Extração de Informação auxiliam humanos na busca de informação específica em documentos. No entanto, a maioria destes sistemas não dão suporte a documentos no formato Portable Document Format (PDF), que é largamente utilizado. Em um documento PDF, o conteúdo do texto é misturado com metadados ou dados semi-estruturados, que dificultam os algoritmos de Processamento de Linguagem Natural (PLN) na extração da informação requerida. O Tribunal de Contas do Estado do Acre (TCE-AC) é o órgão fiscalizador e controlador do uso do dinheiro público e da administração orçamentária e financeira do estado do Acre, responsável por analisar e julgar as contas públicas dos jurisdicionados. Os jurisdicionados devem publicar informações relacionadas às licitações tanto no sistema de gerenciamento de licitações do TCE-AC como também no Diário Oficial do Estado do Acre (DOE), que usa o formato PDF. É de responsabilidade do TCE-AC verificar se as informações da licitação estão nos dois lugares, gerando assim, um grande trabalho manual. Neste trabalho, apresentamos uma solução de PLN com objetivo de extrair os atos do DOE, categorizar automaticamente os atos como licitação ou não, em caso afirmativo, serão utilizadas técnicas avançadas de PLN para processar e extrair as entidades e informações da licitação para que seja possível auxiliar o TCE-AC a verificar se a licitaçãopt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCentro de Engenharia Elétrica e Informática - CEEIpt_BR
dc.publisher.initialsUFCGpt_BR
dc.subject.cnpqCiência da Computação.pt_BR
dc.titleUtilizando técnicas de aprendizagem de máquina e NLP para extração de informações em licitações do Diário Oficial do Estado do Acre.pt_BR
dc.date.issued2022-09-02-
dc.description.abstractInformation Extraction Systems assist humans in searching for specific information in documents. However, most of these systems do not support documents in the Portable Document Format (PDF), which is widely used. In a PDF document, the text content is mixed with metadata or semi-structured data, which makes it difficult for Natural Language Processing (NLP) algorithms to extract the required information. The Court of Auditors of the State of Acre (TCE-AC) is the supervisory and controlling body of the use of public money and the budget and financial administration of the state of Acre, responsible for analyzing and judging the public accounts of the jurisdictions. Jurisdictions must publish information related to bids both in the TCE-AC bid management system and in the Official Gazette of the State of Acre (DOE), which uses the PDF format. It is the responsibility of the TCE-AC to verify that the bidding information is in both places, thus generating a lot of manual work. In this work, we present a PLN solution with the objective of extracting the DOE acts, automatically categorizing the acts as bidding or not, if so, advanced PLN techniques will be used to process and extract the entities and information from the bidding so that it is possible assist the TCE-AC to verify that the bid is also in the bid management system.pt_BR
dc.identifier.urihttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29273-
dc.date.accessioned2023-04-05T17:43:06Z-
dc.date.available2023-04-05-
dc.date.available2023-04-05T17:43:06Z-
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.subjectAprendizagem de máquinapt_BR
dc.subjectExtração de informaçõespt_BR
dc.subjectDiário Oficial do Estado do Acre - Licitaçõespt_BR
dc.subjectLicitações - Diário Oficial do Estado do Acrept_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectTribunal de Contas do Estado do Acre - TCE-ACpt_BR
dc.subjectExtração de dadospt_BR
dc.subjectMachine learningpt_BR
dc.subjectInformation extractionpt_BR
dc.subjectOfficial Gazette of the State of Acre - Bidspt_BR
dc.subjectBids - Official Gazette of the State of Acrept_BR
dc.subjectNatural language processingpt_BR
dc.subjectCourt of Auditors of the State of Acre - TCE-ACpt_BR
dc.subjectData extractionpt_BR
dc.rightsAcesso Abertopt_BR
dc.creatorRAMALHO, Rich Elton Carvalho.-
dc.publisherUniversidade Federal de Campina Grandept_BR
dc.languageporpt_BR
dc.title.alternativeUsing machine learning and NLP techniques to extract information on bids from the Official Gazette of the State of Acre.pt_BR
dc.identifier.citationRAMALHO, Rich Elton Carvalho. Utilizando técnicas de aprendizagem de máquina e NLP para extração de informações em licitações do Diário Oficial do Estado do Acre. 2022. 12f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29273pt_BR
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
RICH ELTON CARVALHO RAMALHO - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdfRich Elton Carvalho Ramalho - TCC Artigo Ciência da Computação CEEI 2022702.73 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.