该研究得到了国家重点研发计划项目(2018YFE0122900)、国家自然基金项目(61773224,62066033),内蒙古自然科学基金项(2018MS06006),内蒙古自治区成果转化项目(CGZH2018125)、内蒙古自治区应用技术研究与开发资金项目(2019GG372,2020GG0046)等项目的大力支持。
韵律建模问题是影响语音合成自然度和可懂度的重要因素。随着深度学习技术的发展,在海量文本和语音数据的支撑下,韵律建模的效果可以取得令人满意的效果。但是,在面对蒙古语这样的低资源语言时,韵律建模往往充满很多挑战。第一,蒙古文韵律建模的数据规模有限,没有海量的文本和语音数据用于模型的充分训练;第二,蒙古文独特的黏着语特性导致蒙古文单词具有复杂的构词特点,现有韵律建模方法并没有充分挖掘与韵律表达相关的构词特点以用于蒙古文韵律模型的训练。为了解决以上问题,研究团队提出了一种蒙古文单词表示特征强化方法,并融合自注意力机制进行韵律标签的预测。该团队利用了蒙古文单词的形态学构词知识和音系学构词知识来增强文本编码器的特征表达能力。研究团队考虑到自注意力模型可以充分学习输入文本的全局上下文相关性,将自注意力模型作为韵律模型的解码器进行韵律标签的预测,最后通过实验结果证明该团队提出的方法可以有效提升蒙古文韵律建模的精度,并且最终提升蒙古语语音合成系统合成语音的整体表现。
论文链接:https://ieeexplore.ieee.org/document/9271923
免责声明:本网转载自其它媒体的文章,目的在于弘扬科技创新精神,传递更多科技创新信息,并不代表本网赞同其观点和对其真实性负责,在此我们谨向原作者和原媒体致以敬意。如果您认为本站文章侵犯了您的版权,请与我们联系,我们将第一时间删除。