???jsp.display-item.social.title??? |
|
Please use this identifier to cite or link to this item:
https://tede.inatel.br:8080/tede/handle/tede/32
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.creator | Vital, Tatiane Melo | - |
dc.creator.Lattes | http://lattes.cnpq.br/7640884895085844 | por |
dc.contributor.advisor1 | Ynoguti, Carlos Alberto | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/5678667205895840 | por |
dc.contributor.referee1 | Ynoguti, Carlos Alberto | - |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/5678667205895840 | por |
dc.contributor.referee2 | Silva, Francisco Jos¶e Fraga da | - |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/6574409043436708 | por |
dc.contributor.referee3 | Nakano, Alberto Yoshihiro | - |
dc.contributor.referee3Lattes | http://lattes.cnpq.br/7663994105896731 | por |
dc.date.accessioned | 2016-07-05T21:00:52Z | - |
dc.date.issued | 2013-09-30 | - |
dc.identifier.citation | Vital, Tatiane Melo. Modelamento de coeficientes de adaptação pra sistemas de reconhecimento automátifco de fala. 2013. [90]. Disserta????o( Programa 1) - Instituto Nacional de Telecomunicacoes, [Santa Rita do Sapucaí] . | por |
dc.identifier.uri | http://tede.inatel.br:8080/tede/handle/tede/32 | - |
dc.description.resumo | O descasamento entre as condições acústicas das locuções utilizadas no treinamento e aquelas vivenciadas pelos sistemas de reconhecimento automático de fala é um dos fatores responsáveis pela degradação de seu desempenho quando operam em ambientes ruidosos. Esta é uma questão relevante na realidade atual, com o aumento do uso destes sistemas em dispositivos móveis. Dentre as várias técnicas propostas na literatura para minimizar este problema, destaca-se a adaptação baseada no critério do Máximo a Posteriori (MAP), onde os modelos acústicos gerados na etapa de treinamento podem ser adaptados para a condição de ruído (tipo e intensidade) experimentada pelo sistema. Nesta abordagem, amostras do ruído são utilizadas para modificar os parâmetros dos modelos acústicos de modo a maximizar a taxa de acertos. A intensidade desta modificação depende de um coeficiente de adaptação, que em geral é calculado de forma empírica, através um processo de varredura. Nesta dissertação é realizado um modelamento de como os valores ótimos deste coeficiente se comportam com o tipo e a intensidade do ruído e, a partir deste resultado, propõe-se um algoritmo para determinar um valor adequado para o mesmo. Este baseia-se no ajuste paramétrico através da aplicação da curva logística minimizando tempo de processamento. Não se consegue com este algoritmo determinar o coeficiente de adaptação que retorne a máxima taxa de acertos em todos os casos, mas a um coeficiente que proporcione um aumento desta taxa. Nos testes realizados, obteve-se um ganho médio de 3% na taxa de acertos. | por |
dc.description.abstract | The mismatch between the acoustic conditions of the training utterances and those experienced by automatic speech recognition systems is one of the responsible factors for its performance degradation when operating in noisy environments. This is a relevant issue in the current reality with increasing use of these systems on mobile devices. Among the various techniques proposed in the literature to minimize this challenge, the adaptation based on Maximum a Posteriori criteria (MAP) stands out where the acoustic models from training stage can be adapted to the noise condition (type and level) experienced by the system. In this approach, noise samples are used to modify the parameters of the acoustics models to maximize the word accuracy. The intensity of this modi¯cation depends on an adaptation coeficient which is usually calculated empirically through a grid search. In this dissertation, a modeling of how the great values of these coe±cients behave according the type and level of noise is performed. From this result, an algorithm to determine an appropriate value for it is proposed. It is based on the parametric adjustment by application of logistic curve minimizing the processing time. The adaptation coe±cient provided by this algorithm does not lead the maximum word accuracy for all cases, but it always provides gain. The experimental results show an gain of 3% on word accuracy. | eng |
dc.description.provenance | Submitted by Tede Dspace (tede@inatel.br) on 2016-07-05T21:00:52Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação V.Final Tatiane Vital.pdf: 719718 bytes, checksum: 46830da6d95b346332b41987c4e63a73 (MD5) | eng |
dc.description.provenance | Made available in DSpace on 2016-07-05T21:00:52Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação V.Final Tatiane Vital.pdf: 719718 bytes, checksum: 46830da6d95b346332b41987c4e63a73 (MD5) Previous issue date: 2013-09-30 | eng |
dc.format | application/pdf | * |
dc.thumbnail.url | http://tede.inatel.br:8080/jspui/retrieve/335/Disserta%c3%a7%c3%a3o%20V.Final%20Tatiane%20Vital.pdf.jpg | * |
dc.language | por | por |
dc.publisher | Instituto Nacional de Telecomunicações | por |
dc.publisher.department | Instituto Nacional de Telecomunicações | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | INATEL | por |
dc.publisher.program | Mestrado em Engenharia de Telecomunicações | por |
dc.rights | Acesso Aberto | por |
dc.rights.uri | http://creativecommons.org/licenses/by-nd/4.0/ | - |
dc.subject | Reconhecimento de Fala Robusto; MAP; Coeficiente de Adaptação | por |
dc.subject.cnpq | Engenharia - Telecomunicações | por |
dc.title | Modelamento de coeficientes de adaptação pra sistemas de reconhecimento automátifco de fala | por |
dc.type | Dissertação | por |
Appears in Collections: | Mestrado em Engenharia de Telecomunicações |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Dissertação V.Final Tatiane Vital.pdf | Modelamento de coeficientes de adaptação para sistemas de reconhecimento automático de fala | 702.85 kB | Adobe PDF | Download/Open Preview |
This item is licensed under a Creative Commons License