Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/19780
Title: | Controle de acesso a ambiente restrito, a partir da identidade vocal, utilizando coeficientes MFCC e classificador K-means. |
Other Titles: | Access control to restricted environment, from vocal identity, using MFCC coefficients and K-means classifier. |
???metadata.dc.creator???: | AZEVEDO, Gabriel Almeida. |
???metadata.dc.contributor.advisor1???: | ARAÚJO, Joseana Macêdo Fechine Régis de. |
???metadata.dc.contributor.referee1???: | BAPTISTA, Cláudio de Souza. |
???metadata.dc.contributor.referee2???: | MASSONI , Tiago Lima. |
Keywords: | Identidade vocal;Vocal identity;Identité vocale;Identidad vocal;Processamento digital de sinais de voz;Procesamiento digital de señales de voz;Traitement numérique des signaux vocaux;Digital processing of voice signals;Reconhecimento de voz;Voice recognition;Reconnaissance vocale;Reconocimiento de voz;Coeficientes MFCC;Coefficients MFCC;Clusterização K-Means;K-Means Clustering;Agrupación en clústeres K-Means;Verificação automática de identidade vocal;Automatic scanning of vocal identity;Analyse automatique de l’identité vocale;Análisis automático de identidad vocal;Coeficientes mel-cepstrais;Coefficients de Mel-ceptis;Mel-ceptis coefficients;Controle de acesso a ambientes;Environment access control;Contrôle d’accès à l’environnement;Control de acceso al entorno;Aprendizagem de máquina;Aprendiendo de máquina;Learning from machine;Tirer les leçons de machine;Locutores – identificação automática da voz;Annonceurs - identification vocale automatique;Announcers - automatic voice identification;Locutores - identificación automática de voz;Mel-Frequency Cepstral Coefficients – MFCC |
Issue Date: | 25-May-2021 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | AZEVEDO, G. A. Controle de acesso a ambiente restrito, a partir da identidade vocal, utilizando coeficientes MFCC e classificador K-means. 2021. 12 f. Trabalho de Conclusão de Curso - Artigo (Curso de Bacharelado em Ciência da Computação) Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2021. |
???metadata.dc.description.resumo???: | A área de aprendizagem de máquina é uma grande aliada para garantir privacidade e segurança, pois promove avanços nos métodos empregados para controle de acesso. O uso de técnicas para Reconhecimento Automático da Identidade Vocal de Locutores, para fins de autenticação, representa um desses avanços. Diante do exposto, este artigo objetiva apresentar um sistema para verificação automática da identidade vocal de locutores, buscando aplicá-lo para autenticação e liberação de acesso a ambiente restrito. O sistema baseia-se numa tarefa de reconhecimento de padrões, dividida em duas etapas: treinamento e verificação. No treinamento, foram aplicadas técnicas para pré-processamento do sinal (pré-ênfase, divisão em frames e janelamento), extração de características (Mel-Frequency Cepstral Coefficients - MFCC) e construção de um padrão representativo da identidade vocal de cada locutor (clusterização). Na verificação, ocorreram o pré-processamento do sinal, extração de características e autenticação, esta última a partir da comparação entre as características de teste e o padrão previamente armazenado do locutor. Na lógica de decisão, foram utilizados limiares para autenticação de um locutor (aceitação, rejeição e indeterminação). Os resultados obtidos demonstram uma autenticação correta do locutor em 81% dos casos e uma taxa de 94,89% de rejeição de impostores, comprovando a eficiência da abordagem proposta. |
Abstract: | The machine learning area is a great ally to ensure privacy and security, as it promotes advances in the methods used for access control. The use of techniques for Automatic Recognition of the Voice Identity of Speakers, for authentication purposes, represents one of these advances. Given the above, this article aims to present a system for automatic verification of the vocal identity of speakers, seeking to apply it for authentication and release of access to a restricted environment. The system is based on a pattern recognition task, divided into two stages: training and verification. In the training, techniques were applied for pre-processing the signal (pre-emphasis, division into frames and windowing), extraction of characteristics (Mel-Frequency Cepstral Coefficients - MFCC) and construction of a representative pattern of the vocal identity of each speaker (clustering). In the verification, pre-processing of the signal, extraction of characteristics and authentication occurred, the latter based on the comparison between the test characteristics and the previously stored pattern of the speaker. In the logic decision, thresholds were used for the authentication of an announcer (acceptance, rejection and indeterminacy). The results obtained demonstrate a correct authentication of the speaker in 81% of the cases and a rate of 94.89% of rejection of imposters, proving the efficiency of the proposed approach. |
Keywords: | Identidade vocal Vocal identity Identité vocale Identidad vocal Processamento digital de sinais de voz Procesamiento digital de señales de voz Traitement numérique des signaux vocaux Digital processing of voice signals Reconhecimento de voz Voice recognition Reconnaissance vocale Reconocimiento de voz Coeficientes MFCC Coefficients MFCC Clusterização K-Means K-Means Clustering Agrupación en clústeres K-Means Verificação automática de identidade vocal Automatic scanning of vocal identity Analyse automatique de l’identité vocale Análisis automático de identidad vocal Coeficientes mel-cepstrais Coefficients de Mel-ceptis Mel-ceptis coefficients Controle de acesso a ambientes Environment access control Contrôle d’accès à l’environnement Control de acceso al entorno Aprendizagem de máquina Aprendiendo de máquina Learning from machine Tirer les leçons de machine Locutores – identificação automática da voz Annonceurs - identification vocale automatique Announcers - automatic voice identification Locutores - identificación automática de voz Mel-Frequency Cepstral Coefficients – MFCC |
???metadata.dc.subject.cnpq???: | Ciência da Computação |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/19780 |
Appears in Collections: | Trabalho de Conclusão de Curso - Artigo - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
GABRIEL ALMEIDA AZEVEDO - - TCC CIÊNCIA DA COMPUTAÇÃO 2021.pdf | 852.82 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.