Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
Title: | Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. |
Other Titles: | Exploring dimensionality reduction techniques in DNA analysis of jewish and other ethnic groups: a comparison of PCA, T-SNE, AND UMAP. |
???metadata.dc.creator???: | RODRIGUES, Matheus Andrade. |
???metadata.dc.contributor.advisor1???: | MASSONI, Tiago Lima. |
???metadata.dc.contributor.referee1???: | MACHADO, Patrícia Duarte de Lima. |
???metadata.dc.contributor.referee2???: | BRASILEIRO, Francisco Vilar. |
Keywords: | Etnias;Judeus;DNA;t-SNE;UMAP;Redução de dimensionalidade;Calculadoras de interpretação genética;Grupos étnicos;Software R.;Microbanchmark;PCA;Ethnicities;Jews;Dimensionality reduction;Genetic Interpretation Calculators;Ethnic groups;R software.;Microbankmark |
Issue Date: | 28-Jun-2023 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
???metadata.dc.description.resumo???: | Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente. |
Abstract: | We applied PCA, t-SNE, and UMAP to datasets from genetic interpretation calculators containing data of Jewish ethnic groups, various non-Jewish neighbors, and correlated ethnicities, using the R software. We conducted a visual comparison of the generated results and used microbenchmarking to measure the execution time of the methods. t-SNE and UMAP are efficient for working with local aspects of visualization, while PCA is suitable when the number of samples is small. t-SNE and UMAP are capable of forming clusters that would not be seen using PCA alone. However, they are slower than PCA, and the visualizations generated by them change when the algorithm is run again. |
Keywords: | Etnias Judeus DNA t-SNE UMAP Redução de dimensionalidade Calculadoras de interpretação genética Grupos étnicos Software R. Microbanchmark PCA Ethnicities Jews Dimensionality reduction Genetic Interpretation Calculators Ethnic groups R software. Microbankmark |
???metadata.dc.subject.cnpq???: | Ciência da Computação. |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521 |
Appears in Collections: | Trabalho de Conclusão de Curso - Artigo - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
MATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdf | Matheus Andrade Rodrigues - TCC Artigo Ciência da Computação CEEI 2023. | 1.08 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.