未来智能语音技术如何变革,产业怎样发展?4月27日上午,在安徽创新馆内举办的“中国声谷”语音产业发展高峰论坛,来自高校、科研院所和企业的代表对此进行了深入研讨。
谈起智能语音,另一个关键词就是“人工智能”(AI)技术,正是AI技术的发展,给语音技术和产业发展插上了智能翅膀。
论坛上,东南大学首席教授曹进德提出了关于“群智系统”的相关概念。他在《群智系统与网络》的主旨报告中提出,群智系统与网络的理论和技术是AI2.0时代的重要研究课题。
“比如‘树上有100只鸟,打了一枪后还有几只鸟?’群智系统研究的是四散的鸟儿从无序到有序逃离的问题,也就是群体从局部的、无序的相互影响,到全局的、协调的动力学行为。”曹进德用一个例子形象地说明群智系统要研究的对象。
机器做决策、处理问题时,可能会面对各种随机性和复杂环境,AI的科学决策离不开群智系统的参与。曹进德认为,从鸟儿的成群逃离,到狼群的协同捕食,群集智能其实是一种生物启发的智能,通过向动物学习智能,再运用各种精密的算法,可让人工智能有效应对复杂环境下的不确定性因素,做到科学正确的决策与运行。
当前,群智系统在智能电网、智能交通、无人机集群协同等方面应用广泛,有着良好的产业前景。
除了专业的学术分析,还有企业家关于新科技、新成果的生动阐释。科大讯飞总裁吴晓如介绍了讯飞最新的语音技术和成果。
吴晓如介绍,目前,科大讯飞在语音识别、语音合成、机器翻译等方面取得了很大进展。比如通过讯飞语音合成技术,可以让机器人模拟母亲的声音给孩子讲故事;机器口译技术助力无障碍沟通与阅读,讯飞翻译机可翻译60多种语言,讯飞扫描词典笔可以实现多语言无障碍阅读等。
给智能汽车下达命令,告诉机器人你想让它做什么……人机交互不再是以往的“按按钮”,而是“说说话”。“语音交互成为万物互联的重要入口,是核心技术的必争之地。重要的技术要把握在自己人手上,才能防止技术被‘卡脖子’。”吴晓如说,随着5G技术的应用,科大讯飞正致力于语音交互的技术研发与攻坚,相信未来会有更多更智能的新技术新产品诞生。
语音技术不仅能给机器下命令,是否还能合成语音?我们的声音能不能被克隆?中国科大电子工程与信息科学系教授、博导凌震华在论坛上分析了语音合成方面的新进展和新技术。
凌震华表示,语音生成是一种感知智能,最初级的就是输入文本转化为流畅的语音,而高级的就是通过大量的声音数据库,制作出模仿他人的合成语音。凌震华现场播放了一段模仿一位网络红人的合成语音音频,足以“以假乱真”。
凌震华表示,假音检测技术不断发展的同时,新的合成技术也在同步形成。可以说,语音合成技术既有机遇,也面临挑战。
讲台上,一轮轮精彩演讲轮番进行;台下听众聚精会神聆听。
值得关注的是,现场大屏幕边缘有两块屏幕显示的“同步字幕”,是演讲者1秒前刚刚说出的话。语音识别技术的准确性之高、识别之快,令人惊叹!(记者 王弘毅)