Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/41569
Full metadata record
DC FieldValueLanguage
dc.creator.IDALVES, André Luiz Firminopt_BR
dc.creator.Latteshttp://lattes.cnpq.br/5729800124276465pt_BR
dc.contributor.advisor1BAPTISTA, Cláudio de Souza-
dc.contributor.advisor1IDBAPTISTA, C. S.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0104124422364023pt_BR
dc.contributor.referee1PIRES, Carlos Eduardo Santos.-
dc.contributor.referee2VALADARES, Dalton Cézane Gomes.-
dc.contributor.referee3BRAZ JUNIOR, Geraldo.-
dc.contributor.referee4BARBOSA, Luciano de Andrade.-
dc.contributor.referee5ANDRADE, Fabio Gomes de.-
dc.description.resumoO processo decisório nas organizações depende cada vez mais de dados. Contudo, problemas relacionados à qualidade desses dados, como informações incompletas, inconsistentes e redundantes, representam desafios significativos. A integração de dados surge como uma área de pesquisa fundamental para combinar e unificar informações provenientes de diferentes fontes e formatos, mesmo em ambientes heterogêneos e autônomos, de modo a proporcionar uma visão abrangente e consistente das informações. No contexto de transações comerciais de compra e venda, as empresas emitem notas fiscais para comprovar as transações realizadas. Entretanto, os dados dos produtos presentes nessas notas fiscais não possuem padronização, podendo apresentar descrições curtas, variadas e inconsistências. Esta pesquisa aborda os desafios técnicos de integração de dados e Product Matching em cenários com dados limitados ou incompletos, como os presentes em notas fiscais. A abordagem proposta, denominada STEPMatch, utiliza técnicas de Recuperação da Informação e Processamento de Linguagem Natural para realizar a correspondência entre textos curtos, como as descrições de produtos encontradas nas notas fiscais. Os resultados obtidos demonstram a eficácia do STEPMatch na correspondência entre produtos, alcançando uma acurácia de 98,11% em um cenário de teste. Técnicas de Cross-Lingual Learning também foram exploradas de forma inovadora na área de Product Matching, aprimorando a generalização dos modelos de aprendizado de máquina em contextos com escassez de dados anotados, com resultados promissores na adaptação entre idiomas e domínios.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCentro de Engenharia Elétrica e Informática - CEEIpt_BR
dc.publisher.programPÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.publisher.initialsUFCGpt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
dc.titleIdentificação de correspondências entre produtos a partir de descrições textuais curtaspt_BR
dc.date.issued2025-04-10-
dc.description.abstractDecision-making processes in organizations increasingly depend on data. Therefore, issues related to data quality, such as incomplete, inconsistent, and redundant information, represent significant challenges. Data integration emerges as a critical research area, focused on combining and unifying information from different sources and formats, even in heterogeneous and autonomous environments, aiming to provide a comprehensive and consistent data view. For commercial transactions, companies issue invoices to document sales and purchases. However, the product data within these invoices often lack standardization, potentially presenting short, varied, and inconsistent descriptions. This research addresses the technical challenges of data integration and Product Matching in scenarios with limited or incomplete data, such as those in invoices. Our proposed approach, STEPMatch, leverages Information Retrieval and Natural Language Processing techniques to match short texts, such as invoice product descriptions. The results demonstrated the effectiveness of STEPMatch, achieving an accuracy of 98.11% in a test scenario. Additionally, we present a novel approach by adopting cross-lingual learning techniques within the Product Matching field, enhancing the generalization of machine learning models in contexts with limited labeled data and yielding promising results in cross-lingual and cross-domain adaptation. Our primary contribution lies in adopting machine learning techniques for product-matching, training in scenarios targeting low-resource language data, and demonstrating the feasibility of improving product-matching quality in large volumes of data from distinct languagespt_BR
dc.identifier.urihttp://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/41569-
dc.date.accessioned2025-04-10T12:55:02Z-
dc.date.available2025-04-10-
dc.date.available2025-04-10T12:55:02Z-
dc.typeTesept_BR
dc.subjectRecuperação da Informaçãopt_BR
dc.subjectCross-Lingual Learningpt_BR
dc.subjectProcessamento de Linguagem Naturalpt_BR
dc.subjectIntegração de Dadospt_BR
dc.subjectProduct Matchingpt_BR
dc.subjectInformation Retrievalpt_BR
dc.subjectCross Lingual Learningpt_BR
dc.subjectNatural Language Processingpt_BR
dc.subjectData Integrationpt_BR
dc.subjectProduct Matchingpt_BR
dc.rightsAcesso Abertopt_BR
dc.creatorALVES, André Luiz Firmino.-
dc.publisherUniversidade Federal de Campina Grandept_BR
dc.languageporpt_BR
dc.title.alternativeIdentifying product matches from short textual descriptionspt_BR
dc.identifier.citationALVES, André Luiz Firmino. Identificação de correspondências entre produtos a partir de descrições textuais curtas. 2024. 145 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.pt_BR
Appears in Collections:Doutorado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
ANDRÉ LUIZ FIRMINO ALVES - TESE- (PPCC) 2024.pdf3.43 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.