Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.creator.ID | FERREIRA, A. R. | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/1680458957826582 | pt_BR |
dc.contributor.advisor1 | CAMPELO, Cláudio Elízio Calazans. | |
dc.contributor.advisor1ID | CAMPELO, C. E. C. | pt_BR |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/2042247762832979 | pt_BR |
dc.contributor.referee1 | PIRES, Carlos Eduardo Santos. | |
dc.contributor.referee2 | BRASILEIRO, Francisco Vilar. | |
dc.description.resumo | Para o treinamento de modelos transcritores que produzam resultados robustos, são necessários dados rotulados em grande quantidade e diversificados. Encontrar tais dados com as características necessárias é uma tarefa difícil, principalmente em idiomas menos populares do que o inglês. Além disso, produzir tais dados requer bastante esforço, tempo e, quase sempre, dinheiro. Logo, uma estratégia para mitigar esse problema é a utilização de técnicas de aumento de dados. Nesse trabalho, foi investigada a utilização de deepfake audio para o aumento de dados, utilizando um clonador de voz capaz de gerar novos áudios mantendo características da voz do falante original, como, por exemplo, o sotaque. Para tanto, foi selecionado um pequeno conjunto de dados produzido por indianos no idioma inglês, garantindo a presença de apenas um sotaque no conjunto. Para a realização das investigações, experimentos foram conduzidos utilizando o clonador para o aumento de dados. Em seguida, os dados aumentados foram utilizados no treinamento dos transcritores, em diversos cenários. Surpreendentemente, a estratégia não teve um impacto positivo após a realização dos treinamentos, tendo como possível causa a qualidade dos áudios gerados pelos clonadores atuais. | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Centro de Engenharia Elétrica e Informática - CEEI | pt_BR |
dc.publisher.initials | UFCG | pt_BR |
dc.subject.cnpq | Ciência da Computação. | pt_BR |
dc.title | Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. | pt_BR |
dc.date.issued | 2022-09-02 | |
dc.identifier.uri | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234 | |
dc.date.accessioned | 2023-04-04T18:43:34Z | |
dc.date.available | 2023-04-04 | |
dc.date.available | 2023-04-04T18:43:34Z | |
dc.type | Trabalho de Conclusão de Curso | pt_BR |
dc.subject | Deep fake audio | pt_BR |
dc.subject | Transcritores automáticos | pt_BR |
dc.subject | Clonagem de voz | pt_BR |
dc.subject | Aumento de dados | pt_BR |
dc.subject | Clonadores de audio | pt_BR |
dc.subject | Deep fake audio | pt_BR |
dc.subject | Automatic transcribers | pt_BR |
dc.subject | Voice cloning | pt_BR |
dc.subject | Data augmentation | pt_BR |
dc.subject | Audio cloners | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.creator | FERREIRA, Alexandre Ribeiro. | |
dc.publisher | Universidade Federal de Campina Grande | pt_BR |
dc.language | por | pt_BR |
dc.title.alternative | Investigations of the use of deepfake audio with a data augmentation technique used in the training of automatic transcribers. | pt_BR |
dc.identifier.citation | FERREIRA, Alexandre Ribeiro. Investigações do uso de deepfake audio com uma técnica de aumento de dados utilizados no treinamento de transcritores automáticos. 2022. 14f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática , Universidade Federal de Campina Grande – Paraíba - Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29234 | pt_BR |
Appears in Collections: | Trabalho de Conclusão de Curso - Artigo - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ALEXANDRE RIBEIRO FERREIRA - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2022.pdf | Alexandre Ribeiro Ferreira - TCC Artigo Ciência da Computação CEEI 2022. | 475.67 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.