Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/27138
Title: Análise de variações acústicas não estacionárias e seu efeito na detecção de múltiplas emoções e condições de estresse.
Other Titles: Analysis of non-stationary acoustic variations and their effect on the detection of multiple emotions and stress conditions.
???metadata.dc.creator???: VIEIRA, Vinícius Jefferson Dias.
???metadata.dc.contributor.advisor1???: ASSIS, Francisco Marcos de.
???metadata.dc.contributor.advisor2???: COELHO, Rosângela Fernandes.
???metadata.dc.contributor.referee1???: KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha.
???metadata.dc.contributor.referee2???: ALBERT, Bruno Barbosa.
???metadata.dc.contributor.referee3???: SANTOS, Wellington Pinheiro dos.
Keywords: Atributo acústico;Decomposição empírica de modos;Índice de não estacionariedade;Reconhecimento de emoções;Acoustic attribute;Empirical decomposition of modes;Index of no stationarity;Emotion recognition
Issue Date: 2-Mar-2018
Publisher: Universidade Federal de Campina Grande
Citation: VIEIRA, Vinícius Jefferson Dias. Análise de variações acústicas não estacionárias e seu efeito na detecção de múltiplas emoções e condições de estresse. 2018. 97 fl. Tese (Doutorado em Engenharia Elétrica), Programa de Pós-Graduação em Engenharia Elétrica, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande - Paraíba - Brasil, 2018.
???metadata.dc.description.resumo???: Nesta Tese, são estudados os efeitos das variações acústicas não estacionárias provocadas por estados emocionais e condições de estresse em sinais de voz. Ainda não há na literatura um atributo acústico puro para reconhecimento de emoções e estresse. Por meio do índice de não estacionariedade (Index of Non-Stationarity – INS), é observado que diferentes estados afetivos apresentam diferentes graus de não estacionariedade. Como forma de detectar tais variações, é empregada a decomposição empírica de modos (Empirical Mode Decomposition – EMD), que é uma técnica não linear adequada para sinais não estacionários. Com isso, a principal contribuição deste trabalho é a proposta do vetor HHHC (Hilbert-Huang-Hurst Coefficients) como um novo atributo acústico não linear para classificação multiestilo de estados emocionais e condições de estresse. O HHHC é um atributo da fonte de excitação que é baseado em decomposição adaptativa (EMD que enfatiza as variações acústicas afetivas) e estimação dos coeficientes de Hurst (que estão relacionados com a fonte de excitação glotal) em cada um dos modos da decomposição. Outra contribuição é a utilização do INS como informação adicional ao vetor HHHC (HHHC+INS). Para comprovar a robustez do atributo proposto em diferentes línguas e contextos de fala, são analisadas cinco bases de dados, sendo quatro delas no contexto de emoções e uma no contexto de condições de estresse. Como atributos acústicos comparativos ao HHHC, são utilizados o vetor de coeficientes de Hurst (pH), os coeficientes mel-cepstrais (Mel-Frequency Cepstral Coefficients – MFCC) e o atributo baseado no operador TEO (Teager-Energy-Operator). Outra importante contribuição desta Tese é a proposta dos modelos de misturas Gaussianas com integração α (α-integrated Gaussian Mixture Models – α- GMM) para representação e classificação dos estados afetivos. Seu desempenho é comparado com os seguintes métodos clássicos: Modelos de misturas Gaussianas (GMM), Modelos de Markov escondidos (Hidden Markov Models – HMM) e Máquinas de vetor de suporte (Support Vector Machines – SVM). Os resultados obtidos demonstram que o atributo proposto HHHC e sua fusão com o INS promovem taxas de acerto significativas em relação aos atributos comparativos. Além disso, o classificador α-GMM apresenta performance superior às técnicas comparativas em todos os cenários de bases acústicas.
Abstract: The goal of this work is to study the effects of non-stationary acoustic variations caused by emotional states and stress conditions. In the literature, there is still no pure acoustic attribute for emotion and stress recognition. By using the index of non-stationarity (INS), it is observed that different affective states have different degrees of non-stationarity. As for the detection of such variations, it is employed the empirical mode decomposition (EMD), which is a nonlinear technique that is suitable for non-stationary signals. Thus, the main contribution of this work is the proposal of the HHHC vector (Hilbert-Huang-Hurst Coefficients) as a new non- linear acoustic feature for the multistyle classification of emotional states and stress conditions. The HHHC is a vocal source feature that is based on adaptive decomposition (EMD, which emphasizes affective acoustic variations) and Hurst coefficients estimation (which are related to the glottal source excitation) in each decomposition mode. Another contribution is the use of INS as additional information to the HHHC vector (HHHC+INS). In order to analyze the robustness of the proposed acoustic feature in different languages and speaking contexts, it is considered five databases. Four of them in the context of emotions and one in the context of stress conditions. As baseline acoustic features to comparing with HHHC, it is used the vector of Hurst coefficients (pH), the Mel-Frequency Cepstral Coefficients (MFCC) and TEO (Teager- Energy-Operator)-based feature. Another important contribution of this Thesis is the proposal of α-integrated Gaussian Mixture Models (α-GMM) for the affective states representation and classification. Its performance is compared to competing classifiers: GMM, Hidden Markov Models (HMM) and Support Vector Machines (SVM). Results demonstrate that the proposed HHHC acoustic feature leads to significant classification improvement when compared to the baseline acoustic features. Also, the results show that α-GMM outperforms the competing classification methods in all acoustic databases scenarios.
Keywords: Atributo acústico
Decomposição empírica de modos
Índice de não estacionariedade
Reconhecimento de emoções
Acoustic attribute
Empirical decomposition of modes
Index of no stationarity
Emotion recognition
???metadata.dc.subject.cnpq???: Engenharia Elétrica
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/27138
Appears in Collections:Doutorado em Engenharia Elétrica.

Files in This Item:
File Description SizeFormat 
VINÍCIUS JEFFERSON DIAS VIEIRA - TESE (PPGEE) 2018 (1).pdfVinícius Jefferson Dias Vieira - Tese (PPGEE) 2018.2.22 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.