当我们日渐习惯通过键盘+鼠标或触屏进行信息输入和交互的时,智能语音技术正逐渐深入和改变我们生活,也刷新着中国科创的速度。
语音识别,让生活更轻松有趣
当你不方便或不想动手在屏幕打字时,语音输入便成了不错的选择。借助语音的交互,不仅可以解放双手让生活更便捷,还能够让生活充满科技感、更加有趣。此前诸如Siri、Cortana等国外产品和灵犀等国内语音助手的诞生已经在用户群体中掀起了语音交互的热潮。
伴随全球人工智能大潮的兴起,智能语音技术的进一步发展更是增加了语音的应用形式,丰富的应用产品和交互场景正不断拓展语音技术的边界。 “阿尔法蛋”、“讯飞翻译机”等新产品又再次引领了大众对于人工智能技术的新一轮体验。越来越多的家庭和家庭有了阿尔法蛋的陪伴,这款科大讯飞儿童智能机器人总能在听懂你声音之后给出惊喜的回复。
在国际交流中,越多越多的中外人士手持翻译机彼此沟通。今年“双十一”的数据统计显示,智能翻译硬件销量增长迅猛,其中讯飞翻译机2.0销售榜冠军,占据了70%的品类销售额,是其他产品总和的两倍,这款机器现不仅可实现中文与50种语言即时互译,还能识别四种方言、并实现翻译。
在万物互联的时代,语音作为人类最自然、最便捷的沟通方式,将会作为所有设备和产品至关重要的入口。业内人士预测:“未来,我们将迎来以语音为主、键盘和触摸为辅的人机交互全新时代。”
领跑核心技术,语音识别用效果说话
无论是语音输入法,还是翻译硬件、儿童机器人,语音识别无疑是一道“门槛”,“我说的它能听清听懂么?”消费者采购时,这也成为必问问题。
什么是语音识别技术呢?简而言之,就是让机器自动将人的语音转化为文字的技术。经过数十年的发展,语音识别技术取得了空前的进步,目前在多个场景下已经达到了实用水平,这项技术也成为了人工智能中技术落地最早、用户范围最广的技术。
虽语音技术的应用已经并不新鲜,但越来越“明白”的消费者对体验感也越来越在意:无论包装的多么精美,语音产品的核心竞争力依然是语音识别效果,识别的效果直接影响着用户体验。
究竟如何判断语音识别能力的强弱?此前业界为了检测语音识别技术的能力,相继推出了SwitchBoard、CHiME和LibriSpeech、Aurora等测试,其中CHiME因其数据难度大、覆盖技术面广,成为了公认的世界语音识别领域的顶尖赛事。
在今年举行的CHiME-5中,赛事组委会以20个家庭的真实晚餐录音作为样本开展测试,“这样的测试考验了噪音环境、说话人口音、距离远近等不同的指标,这些都是影响语音识别精准度的因素。”最后,最大程度排除所有干扰获得冠军的是科大讯飞,这也是该公司继CHiME-4后再度获得所有分项的冠军,同时大幅刷新了各项目的历史最好成绩。
如此成绩不仅彰显了科大讯飞在语音识别等人工智能领域的技术积累与优势,在比赛中成功PK国际巨头更展示了中国人工智能技术在全球范围内的领跑地位。
紧抓新一轮产业变革的机遇
在“科技是第一生产力”的口号下,诞生了科大讯飞等一批投身于核心技术源头创新的企业,中国也在参与全球科技创新浪潮中获得社会经济的巨大发展。
当前,面对人工智能的浪潮,中国政府正加快人工智能的布局。
去年7月,国务院印发《新一代人工智能发展规划》,首次将人工智能上升为国家战略。同年11月,科技部召开新一代人工智能发展规划暨重大科技项目启动会,会上公布了首批国家新一代人工智能开放创新平台名单,明确表示依托科大讯飞建设智能语音国家新一代人工智能开放创新平台。
在人工智能核心技术上,科大讯飞还依托自身领先的语音识别技术所积累的模型和算法优势,在面向机器翻译的IWSLT国际口语机器翻译评测比赛、面向图像识别的MTWI图文识别挑战赛、面向医学影像的IDRiD眼底图分析竞赛和面向自动驾驶Cityscapes评测中,都取得了冠军的好成绩。
与此同时,作为引领新一轮科技革命和产业变革的战略性技术,人工智能具有溢出带动性很强的“头雁”效应。为此,在实现人工技术产业落地的同时,科大讯飞也营造了“产业生态”,而今,90万的开发者团队在开放平台上可迅速应用核心技术进行应用开发。
像水和电一样深入社会生活的人工智能,正在中国大地加速发展;基于源头核心技术突破和产业化应用的“顶天立地”式发展,中国的人工智能也正从技术和产业两个维度向科技之巅迈进,成为经济社会发展的重要引擎。(记者:刘辉)