Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37311
Title: | Geração de embeddings de tipos de POI com base em feições geográficas. |
Other Titles: | Generation of POI type embeddings based on geographic features. |
???metadata.dc.creator???: | SILVA, Salatiel Dantas. |
???metadata.dc.contributor.advisor1???: | CAMPELO, Cláudio Elízio Calazans. |
???metadata.dc.contributor.referee1???: | PEREIRA, Eanes Torres. |
???metadata.dc.contributor.referee2???: | NASCIMENTO FILHO, Dimas Cassimiro do. |
???metadata.dc.contributor.referee3???: | FILETO, Renato. |
???metadata.dc.contributor.referee4???: | VIEIRA, Thales Miranda de Almeida. |
Keywords: | Engenharia de software;Pontos de interesse (POIs) – embeddings;Processamento de linguagem natural (PLN);Geosemântica;Software engineering;Points of interest (POIs) – embeddings;Natural language processing (NLP);Geosemantics |
Issue Date: | 20-May-2024 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | SILVA, Salatiel Dantas. Geração de embeddings de tipos de POI com base em feições geográficas. 2024. 159 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024. |
???metadata.dc.description.resumo???: | Pontos de Interesse (POIs) são locais específicos, como restaurantes, shoppings e parques, considerados relevantes para os usuários. Representar seus tipos por meio de mecanismos computacionais é crucial para desenvolver soluções que auxiliam em tarefas como planeja mento urbano, clusterização e recomendação de POIs. Abordagens recentes têm utilizado vetores de alta dimensão (vector embeddings) para representar os tipos de POI com base nas relações contextuais de vizinhança ou palavras associadas aos POIs. Tais representações têm deixado de lado as feições geográficas presentes nas imediações como ruas, edifícios, rios e parques. No entanto, essas feições podem contribuir significativamente para uma melhor representação dos tipos de POI. Nesse contexto, esta pesquisa propõe uma abordagem para gerar embeddings de tipos de POI utilizando as feições geográficas presentes no contexto dos POIs. Na abordagem proposta, foi desenvolvido e utilizado o algoritmo GeoContext2Vec, que considera os tipos de POI e as feições geográficas presentes em seu contexto para gerar um conjunto de treinamento, preservando os padrões espaciais de espaço e ocorrência das feições. Tal conjunto é utilizado para treinar os modelos Word2Vec e DistilBert, da área de Processamento de Linguagem Natural (PLN), capazes de gerar os embeddings dos tipos. Como principais resultados obtidos, constatou-se que os embeddings produzidos com o Geo Context2Vec refletem a similaridade dos tipos de POI conforme estruturas hierárquicas e a opinião de pessoas, com valores de matching de aproximadamente 98%, superando estraté gias do estado-da-arte. Além disso, os resultados apontam a superioridade dos embeddings em uma tarefa de classificação de zonas urbanas, alcançando um valor de F-Score de 90%. Tal resultado demonstra que as feições geográficas são informações relevantes na represen tação de tipos de POI. |
Abstract: | Points of Interest (POIs) are specific locations, such as restaurants, shopping centers, and parks, considered relevant to users. Representing their types through computational mech anisms is crucial for developing solutions that assist in tasks such as urban planning, clus tering, and POI recommendation. Recent approaches have used high-dimensional vectors (vector embeddings) to represent POI types based on contextual neighborhood relationships or words associated with POIs. Such representations have overlooked the geographical fea tures present in the vicinity, such as streets, buildings, rivers, and parks. However, these fea tures can significantly contribute to a better representation of POI types. In this context, this research proposes an approach to generate embeddings of POI types using the geographic features present in the context of POIs. In the proposed approach, the GeoContext2Vec al gorithm has been developed and employed, which considers POI types and the geographical features present in their context to generate a training set, preserving spatial patterns and occurrences of the features. This set is used to train the Word2Vec and DistilBert models, from the Natural Language Processing (NLP) area, capable of generating the embeddings of types. As the main results obtained, it was found that the embeddings produced with GeoContext2Vec reflect the similarity of POI types according to hierarchical structures and people’s opinions, with matching values of approximately 98%, surpassing state-of-the-art strategies. Furthermore, the results indicate the superiority of these embeddings in an urban zone classification task, achieving an F-Score value of 90%. This result demonstrates that geographical features are relevant information in the representation of POI types. |
Keywords: | Engenharia de software Pontos de interesse (POIs) – embeddings Processamento de linguagem natural (PLN) Geosemântica Software engineering Points of interest (POIs) – embeddings Natural language processing (NLP) Geosemantics |
???metadata.dc.subject.cnpq???: | Ciência da Computação. |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37311 |
Appears in Collections: | Doutorado em Ciência da Computação. |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
SALATIEL DANTAS SILVA - DISSERTAÇÃO (PPGCC) 2024.pdf | 6.36 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.