???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.inatel.br:8080/tede/handle/tede/23
???metadata.dc.type???: Dissertação
Title: Análise comparativa entre os métodos HMM e GMM-UBM na busca pelo a-ótimo dos locutores crianças utilizando a técnica VTLN
???metadata.dc.creator???: Martins, Ramon Mayor 
???metadata.dc.contributor.advisor1???: Ynoguti, Carlos Alberto
???metadata.dc.contributor.referee1???: Ynoguti, Carlos Alberto
???metadata.dc.contributor.referee2???: Guimarães, Dayan Adionel
???metadata.dc.contributor.referee3???: Minami, Mário
???metadata.dc.description.resumo???: Nesta dissertação são abordadas formas de minimizar a alta taxa de erros em sistemas de reconhecimento de fala treinados com locutores adultos e testado com locutores crianças. Propõe-se a utilização do método GMM-UBM como alternativa ao método HMM na busca pelo fator ótimo de escalonamento (α-ótimo) para locutores crianças quando utilizada a técnica de normalização de locutor. A técnica de normalização adotada é a VTLN, que normaliza o trato vocal dos diferentes locutores crianças através do escalonamento de frequências do banco de filtros mel. Na avaliação desta técnica, procurou-se também a quantidade de misturas ótimas que melhoram o desempenho do sistema. Desse modo, reduziu-se a taxa de erro no sistema treinado com adultos e testado com crianças de 4,95% para 1,88% quando utilizado a VTLN com os α-ótimos encontrados pelo HMM e 1,92 % quando utilizado a VTLN com os α-ótimos encontrados pelo GMM-UBM. Observou-se que a aplicação da técnica VTLN utilizando os α-ótimos pelo método GMM-UBM obteve desempenho similar ao HMM nos experimentos. Nos experimentos realizados concluiu-se que a escolha do método GMM-UBM se torna mais adequada em virtude da simplicidade de implementação e necessidade de menor custo computacional, sendo assim uma alternativa ao HMM para realizar VTLN em sistemas de reconhecimento de fala para usuários crianças.
Abstract: The aim of this work is to find means to minimize the high error rate found in speech recognition systems which are trained on adult speakers and tested on children speakers. In this regard, we propose the use of the GMM-UBM method as an alternative to the HMM method to find the optimal warping factor (α-optimal) for children speakers when the speaker normalization technique is used. The adopted normalization technique was VTLN, which normalizes the vocal tract of different children speakers through the use of mel filterbank frequency warping. The assessment of this technique also aimed to find the optimal mixture quantity that improves the system performance. Thus, the error rate in the system trained with adults and tested on children was reduced from 4,95% to 1,88% when VTLN was used with α-optimals found by HMM and to 1,92% when VTLN was used with α-optimals found by GMM. It was noticed that the application of VTLN technique using α-optimals found by GMM-UBM method achieved a similar performance to HMM in the experiments. From the experiments it was observed that choosing GMM-UBM method turns to be more suitable due to its implementation simplicity and to the need of lower computational cost, being thus an alternative to HMM in the use of VTLN in Speech Recognition Systems for children speakers.
Keywords: Normalização de locutor; sistema de reconhecimento de fala; Modelos Ocultos de Markov; Modelos de Mistura Gaussiana; VTLN
???metadata.dc.subject.cnpq???: Engenharia - Telecomunicações
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Instituto Nacional de Telecomunicações
???metadata.dc.publisher.initials???: INATEL
???metadata.dc.publisher.department???: Instituto Nacional de Telecomunicações
???metadata.dc.publisher.program???: Mestrado em Engenharia de Telecomunicações
Citation: Martins, Ramon Mayor. Análise comparativa entre os métodos HMM e GMM-UBM na busca pelo a-ótimo dos locutores crianças utilizando a técnica VTLN. 2014. [60]. Disserta????o( Programa 1) - Instituto Nacional de Telecomunicacoes, [Santa Rita do Sapucaí] .
???metadata.dc.rights???: Acesso Aberto
???metadata.dc.rights.uri???: http://creativecommons.org/licenses/by-nd/4.0/
URI: http://tede.inatel.br:8080/tede/handle/tede/23
Issue Date: 9-Oct-2014
Appears in Collections:Mestrado em Engenharia de Telecomunicações

Files in This Item:
File Description SizeFormat 
Dissertação V.Final Ramon Mayor Martins.pdfAnálise comparativa entre os métodos HMM e GMM-UBM na busca pelo a-ótimo dos locutores crianças utilizando a técnica VTLN1.91 MBAdobe PDFThumbnail

Download/Open Preview


This item is licensed under a Creative Commons License Creative Commons