Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234
Title: | Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. |
Other Titles: | Investigations of the use of deepfake audio with a data augmentation technique used in the training of automatic transcribers. |
???metadata.dc.creator???: | FERREIRA, Alexandre Ribeiro. |
???metadata.dc.contributor.advisor1???: | CAMPELO, Cláudio Elízio Calazans. |
???metadata.dc.contributor.referee1???: | PIRES, Carlos Eduardo Santos. |
???metadata.dc.contributor.referee2???: | BRASILEIRO, Francisco Vilar. |
Keywords: | Deep fake audio;Transcritores automáticos;Clonagem de voz;Aumento de dados;Clonadores de audio;Deep fake audio;Automatic transcribers;Voice cloning;Data augmentation;Audio cloners |
Issue Date: | 2-Sep-2022 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | FERREIRA, Alexandre Ribeiro. Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. 2022. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234 |
???metadata.dc.description.resumo???: | Para o treinamento de modelos transcritores que produzam resultados robustos, são necessários dados rotulados em grande quantidade e diversificados. Encontrar tais dados com as características necessárias é uma tarefa difícil, principalmente em idiomas menos populares do que o inglês. Além disso, produzir tais dados requer bastante esforço, tempo e, quase sempre, dinheiro. Logo, uma estratégia para mitigar esse problema é a utilização de técnicas de aumento de dados. Nesse trabalho, foi investigada a utilização de deepfake audio para o aumento de dados, utilizando um clonador de voz capaz de gerar novos áudios mantendo características da voz do falante original, como, por exemplo, o sotaque. Para tanto, foi selecionado um pequeno conjunto de dados produzido por indianos no idioma inglês, garantindo a presença de apenas um sotaque no conjunto. Para a realização das investigações, experimentos foram conduzidos utilizando o clonador para o aumento de dados. Em seguida, os dados aumentados foram utilizados no treinamento dos transcritores, em diversos cenários. Surpreendentemente, a estratégia não teve um impacto positivo após a realização dos treinamentos, tendo como possível causa a qualidade dos áudios gerados pelos clonadores atuais. |
Keywords: | Deep fake audio Transcritores automáticos Clonagem de voz Aumento de dados Clonadores de audio Deep fake audio Automatic transcribers Voice cloning Data augmentation Audio cloners |
???metadata.dc.subject.cnpq???: | Ciência da Computação. |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234 |
Appears in Collections: | Trabalho de Conclusão de Curso - Artigo - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ALEXANDRE RIBEIRO FERREIRA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdf | Alexandre Ribeiro Ferreira - TCC Artigo Ciência da Computação CEEI 2022. | 475.67 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.