(相关资料图)
记者23日从内蒙古大学计算机学院获悉,该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作,在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理会刊》发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”的最新研究成果。
据介绍,情感语音转换(VC)旨在将中性语音转换为情感声音,同时保留语言信息和说话者的身份。科研团队注意到,将情感特征与其他语音信息(例如内容、说话者身份等)解耦是实现高质量转换效果的关键。由于情感语音中声学特征的解耦更加复杂,面向中性语音的特征解耦一直无法得到很好的处理。
科研团队针对情感语音转换的声学特征解耦问题开展研究,提出了一种基于“源—滤波器”模型的情感语音转换系统,具体来说,是为了解决情感语音转换的特征解耦问题而提出一种新颖的基于“源—滤波器”模型的情感VC模型(简称SFEVC),以从音色和音调特征中准确过滤说话人独立的情感线索。SFEVC模型由多通道编码器、情感独立编码器、预训练的说话人相关编码器和相应的解码器组成。所有编码器模块都采用信息瓶颈自动编码器。
为了进一步提高各种情绪的转化质量,研究团队还提出了基于二维VA(激活度—效价)空间的训练策略。实验结果表明,SFEVC模型以及VA训练策略的表现均优于所有基线系统,并基于非平行数据在说话人无关的情感VC场景下实现了最优性能。

天富龙、锦江电子上交所IPO已问询
石榴快播丨推动国资国企高质量发展迈上新台阶 自治区区属国有企业座谈会今日召开
终极斗罗15:家丑不可外扬,传灵塔却反其道而行之
武汉地铁几点开班收班(武汉地铁几点开班)
河北启动干旱防御Ⅳ级应急响应 多措并举保障农业生产
新化:洋溪镇撬动行业协会力量,助推农村建筑安全、耕地保护和控违拆违工作良性开展
邓伦犯了什么事 邓伦被强制执行 基本情况讲解
华谊兄弟:《非诚勿扰3》已于6月开机制作
嘉峪关酒泉机场工程顺利通过行业验收 计划9月7日复航
马自达3昂克赛拉配置推荐,买2.0L入门版足够!
国产小爆款《火山的女儿》销量60万!Steam好评如潮
基金研究周报
禹洲集团上半年合约销售额约117亿元
GGII:6月全国备案154个储能项目 总规模达15.4GW/34.9GWh
3连板大连热电(600719.SH):拟筹划的资产重组事项存在不确定性