???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.inatel.br:8080/tede/handle/tede/23
Full metadata record
DC FieldValueLanguage
dc.creatorMartins, Ramon Mayor-
dc.creator.Latteshttp://lattes.cnpq.br/6289204315531991por
dc.contributor.advisor1Ynoguti, Carlos Alberto-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5678667205895840por
dc.contributor.referee1Ynoguti, Carlos Alberto-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/5678667205895840por
dc.contributor.referee2Guimarães, Dayan Adionel-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2503439503631682por
dc.contributor.referee3Minami, Mário-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/5882877274227409por
dc.date.accessioned2016-06-27T18:30:31Z-
dc.date.issued2014-10-09-
dc.identifier.citationMartins, Ramon Mayor. Análise comparativa entre os métodos HMM e GMM-UBM na busca pelo a-ótimo dos locutores crianças utilizando a técnica VTLN. 2014. [60]. Disserta????o( Programa 1) - Instituto Nacional de Telecomunicacoes, [Santa Rita do Sapucaí] .por
dc.identifier.urihttp://tede.inatel.br:8080/tede/handle/tede/23-
dc.description.resumoNesta dissertação são abordadas formas de minimizar a alta taxa de erros em sistemas de reconhecimento de fala treinados com locutores adultos e testado com locutores crianças. Propõe-se a utilização do método GMM-UBM como alternativa ao método HMM na busca pelo fator ótimo de escalonamento (α-ótimo) para locutores crianças quando utilizada a técnica de normalização de locutor. A técnica de normalização adotada é a VTLN, que normaliza o trato vocal dos diferentes locutores crianças através do escalonamento de frequências do banco de filtros mel. Na avaliação desta técnica, procurou-se também a quantidade de misturas ótimas que melhoram o desempenho do sistema. Desse modo, reduziu-se a taxa de erro no sistema treinado com adultos e testado com crianças de 4,95% para 1,88% quando utilizado a VTLN com os α-ótimos encontrados pelo HMM e 1,92 % quando utilizado a VTLN com os α-ótimos encontrados pelo GMM-UBM. Observou-se que a aplicação da técnica VTLN utilizando os α-ótimos pelo método GMM-UBM obteve desempenho similar ao HMM nos experimentos. Nos experimentos realizados concluiu-se que a escolha do método GMM-UBM se torna mais adequada em virtude da simplicidade de implementação e necessidade de menor custo computacional, sendo assim uma alternativa ao HMM para realizar VTLN em sistemas de reconhecimento de fala para usuários crianças.por
dc.description.abstractThe aim of this work is to find means to minimize the high error rate found in speech recognition systems which are trained on adult speakers and tested on children speakers. In this regard, we propose the use of the GMM-UBM method as an alternative to the HMM method to find the optimal warping factor (α-optimal) for children speakers when the speaker normalization technique is used. The adopted normalization technique was VTLN, which normalizes the vocal tract of different children speakers through the use of mel filterbank frequency warping. The assessment of this technique also aimed to find the optimal mixture quantity that improves the system performance. Thus, the error rate in the system trained with adults and tested on children was reduced from 4,95% to 1,88% when VTLN was used with α-optimals found by HMM and to 1,92% when VTLN was used with α-optimals found by GMM. It was noticed that the application of VTLN technique using α-optimals found by GMM-UBM method achieved a similar performance to HMM in the experiments. From the experiments it was observed that choosing GMM-UBM method turns to be more suitable due to its implementation simplicity and to the need of lower computational cost, being thus an alternative to HMM in the use of VTLN in Speech Recognition Systems for children speakers.eng
dc.description.provenanceSubmitted by Tede Dspace (tede@inatel.br) on 2016-06-27T18:30:31Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação V.Final Ramon Mayor Martins.pdf: 1957448 bytes, checksum: e21cd6acb902d52fc69d00903b5b1b33 (MD5)eng
dc.description.provenanceMade available in DSpace on 2016-06-27T18:30:31Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação V.Final Ramon Mayor Martins.pdf: 1957448 bytes, checksum: e21cd6acb902d52fc69d00903b5b1b33 (MD5) Previous issue date: 2014-10-09eng
dc.formatapplication/pdf*
dc.thumbnail.urlhttp://tede.inatel.br:8080/jspui/retrieve/303/Dissertac%cc%a7a%cc%83o%20V.Final%20Ramon%20Mayor%20Martins.pdf.jpg*
dc.languageporpor
dc.publisherInstituto Nacional de Telecomunicaçõespor
dc.publisher.departmentInstituto Nacional de Telecomunicaçõespor
dc.publisher.countryBrasilpor
dc.publisher.initialsINATELpor
dc.publisher.programMestrado em Engenharia de Telecomunicaçõespor
dc.rightsAcesso Abertopor
dc.rights.urihttp://creativecommons.org/licenses/by-nd/4.0/-
dc.subjectNormalização de locutor; sistema de reconhecimento de fala; Modelos Ocultos de Markov; Modelos de Mistura Gaussiana; VTLNpor
dc.subject.cnpqEngenharia - Telecomunicaçõespor
dc.titleAnálise comparativa entre os métodos HMM e GMM-UBM na busca pelo a-ótimo dos locutores crianças utilizando a técnica VTLNpor
dc.typeDissertaçãopor
Appears in Collections:Mestrado em Engenharia de Telecomunicações

Files in This Item:
File Description SizeFormat 
Dissertação V.Final Ramon Mayor Martins.pdfAnálise comparativa entre os métodos HMM e GMM-UBM na busca pelo a-ótimo dos locutores crianças utilizando a técnica VTLN1.91 MBAdobe PDFThumbnail

Download/Open Preview


This item is licensed under a Creative Commons License Creative Commons