???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://tede.inatel.br:8080/tede/handle/tede/113
???metadata.dc.type???: Dissertação
Title: Adaptação ao locutor usando a técnica MLLR
???metadata.dc.creator???: Fernandes, Daniela Barude 
???metadata.dc.contributor.advisor1???: Ynoguti, Carlos Alberto
???metadata.dc.contributor.referee1???: Ynoguti, Carlos Alberto
???metadata.dc.contributor.referee2???: Violara, Fábio
???metadata.dc.contributor.referee3???: Ramírez, Miguel Arjona
???metadata.dc.description.resumo???: Neste trabalho realizou-se um estudo da técnica de adaptação ao locutor chamada MLLR, Regressão Linear de Máxima Verossimilhança. Os testes foram realizados utilizando fala contínua e somente as médias das componentes gaussianas dos Modelos Ocultos de Markov (HMMs) foram adaptadas. O ponto fundamental da técnica é a partição dessas médias em classes de regressão para a geração da matriz de transformação. Além disso, a quantidade de material para adaptação de um sistema independente de locutor é muito importante. Sendo assim, diversas alternativas para a formação das classes de regressão foram exploradas. Foram testados métodos baseados em classificação fonética e em medidas de distância, variando-se também o número de classes de regressão. Após a realização dos testes, com um número variado de locuções de adaptação, verificou-se que o melhor resultado foi obtido utilizando-se quatro locuções de adaptação e três classes de regressão, mas pesquisas ainda devem ser feitas na área.
Abstract: In this work a study of the technique of speaker adaptation called MLLR, Maximum Likelihood Linear Regression was made. The tests have been done using continuous speech applications and only the means of continuous hidden Markov models (HMM) have been adapted. The basic point of the technique is the partition of these means in regression classes for the generation of the transformation matrix. Moreover, the amount of material for adaptation of a speaker independet system is very important. Being thus, some alternatives for regression classes construction have been explored. Methods based on phonetic classification and based on distance metrics have been tested, varying also the number of regression classes. After tests, with a varied number of adaptation sentences, was verified that the better approach is to use only three regression classes with four adaptation sentences, but research still must be made in the area.
Keywords: Sistemas de reconhecimento de fala; adaptação ao locutor; técnica MLLR, classes de regressão
???metadata.dc.subject.cnpq???: Engenharia - Telecomunicações
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Instituto Nacional de Telecomunicações
???metadata.dc.publisher.initials???: INATEL
???metadata.dc.publisher.department???: Instituto Nacional de Telecomunicações
???metadata.dc.publisher.program???: Mestrado em Engenharia de Telecomunicações
Citation: Fernandes, Daniela Barude. Adaptação ao locutor usando a técnica MLLR. 2011. [71]. dissertação( Mestrado em Engenharia de Telecomunicações) - Instituto Nacional de Telecomunicações, [Santa Rita do Sapucaí] .
???metadata.dc.rights???: Acesso Aberto
???metadata.dc.rights.uri???: http://creativecommons.org/licenses/by-nd/4.0/
URI: http://tede.inatel.br:8080/tede/handle/tede/113
Issue Date: 16-Nov-2011
Appears in Collections:Mestrado em Engenharia de Telecomunicações

Files in This Item:
File Description SizeFormat 
Dissertação V.Final Daniela Barude.pdfAdaptação ao locutor usando a técnica MLLR739.39 kBAdobe PDFThumbnail

Download/Open Preview


This item is licensed under a Creative Commons License Creative Commons