科技是第一生产力、人才是第一资源、创新是第一动力 加快建设科技强国,实现高水平科技自立自强
氢能科技 沙蓬绿色种养产业模式 联源科技 超联科技 园区 园区 园区 园区 园区

我区蒙古语语音合成基础研究取得最新研究成果

   2020-12-11 内蒙古自治区科技厅
37
核心提示:近日,内蒙古大学计算机学院蒙古文智能信息处理团队与新加坡国立大学李海洲教授团队合作在国际信号处理领
    近日,内蒙古大学计算机学院蒙古文智能信息处理团队与新加坡国立大学李海洲教授团队合作在国际信号处理领域国际顶级期刊《IEEE/ACM Transactions on Audio, Speech, and Language Processing》上刊发了最新成果“利用形态学和音位学特征改善蒙古语语音合成的韵律分词”(Exploiting Morphological and Phonological Features to Improve Prosodic Phrasing for Mongolian Speech Synthesis)。该成果针对蒙古语语音合成的韵律建模问题开展研究,提出了一种融合形态学和音系学的蒙古文韵律建模方法。
    该研究得到了国家重点研发计划项目(2018YFE0122900)、国家自然基金项目(61773224,62066033),内蒙古自然科学基金项(2018MS06006),内蒙古自治区成果转化项目(CGZH2018125)、内蒙古自治区应用技术研究与开发资金项目(2019GG372,2020GG0046)等项目的大力支持。
    韵律建模问题是影响语音合成自然度和可懂度的重要因素。随着深度学习技术的发展,在海量文本和语音数据的支撑下,韵律建模的效果可以取得令人满意的效果。但是,在面对蒙古语这样的低资源语言时,韵律建模往往充满很多挑战。第一,蒙古文韵律建模的数据规模有限,没有海量的文本和语音数据用于模型的充分训练;第二,蒙古文独特的黏着语特性导致蒙古文单词具有复杂的构词特点,现有韵律建模方法并没有充分挖掘与韵律表达相关的构词特点以用于蒙古文韵律模型的训练。为了解决以上问题,研究团队提出了一种蒙古文单词表示特征强化方法,并融合自注意力机制进行韵律标签的预测。该团队利用了蒙古文单词的形态学构词知识和音系学构词知识来增强文本编码器的特征表达能力。研究团队考虑到自注意力模型可以充分学习输入文本的全局上下文相关性,将自注意力模型作为韵律模型的解码器进行韵律标签的预测,最后通过实验结果证明该团队提出的方法可以有效提升蒙古文韵律建模的精度,并且最终提升蒙古语语音合成系统合成语音的整体表现。
    论文链接:https://ieeexplore.ieee.org/document/9271923
免责声明:本网转载自其它媒体的文章,目的在于弘扬科技创新精神,传递更多科技创新信息,并不代表本网赞同其观点和对其真实性负责,在此我们谨向原作者和原媒体致以敬意。如果您认为本站文章侵犯了您的版权,请与我们联系,我们将第一时间删除。
 
 
更多>同类资讯
推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用说明  |  隐私政策  |  免责声明  |  网站地图  |   |  粤ICP备05102027号

粤公网安备 44040202001358号