本报讯 从“懂方言”到“懂更多方言”、从“会翻译”到“支持多语种翻译”、从无到有上线文字扫描功能……科大讯飞正在为“讯飞输入法”加码更多人工智能(AI)能力。6月12日,科大讯飞在京举办主题为“AI输入 更懂你”媒体见面会,披露了讯飞输入法的一系列升级与更新。其中,赶在世界杯之前及时上线的“面对面翻译”及方言识别增至23种等功能成为焦点。
“面对面翻译”是本次讯飞输入法升级的新增功能。记者通过下载体验发现,该功能支持中英、中俄、中日、中韩四种对话翻译模式,并配备有真人发音,中文用户通过它可以直接与外国友人面对面交流。这对于世界杯期间赴俄看球的球迷而言无疑是一大福利。
文字扫描识别是讯飞输入法新上线的又一功能。顾名思义,文字扫描识别即通过扫描,便捷地提取图上的文字。该功能可通过拍照和上传已有图片实现。记者在体验中发现其对某彩页上的文字识别准确率并不理想,对此讯飞输入法的负责人翟吉博回应记者称,受限于文字特别是艺术字体文字的颜色及阴影等变量的干扰,该功能目前尚不能实现较高的识别率。不过他表示随着广大用户的使用、迭代,该功能的“聪明度”会得到极大提高。
方言识别一直以来都是科大讯飞在AI能力开发上独具特色的“卖点”。记者了解到,目前讯飞输入法支持22种方言,其中粤语、四川话、东北话、河南话等方言的识别率均已超过90%。本月底,讯飞输入法还将新增苏州话识别,将方言识别语种扩充至23种。
科大讯飞多语种高级研究员祖漪清介绍说,口音和方言是语音识别中的难点,不仅学习模型技术门槛高,识别对建模、音素、声学相似性等方面的研究水平也有着极高的要求。换言之,要针对性地提高某种方言的识别率,需要对该方言文化、语素等有深厚的造诣。
目前世界上的语言有6000~10000多种,而据语言学家预测,大部分语言将于本世纪末消失。祖漪清告诉记者,当前,濒危语言保护(简称“语保”)已成为一项重要而迫切的工作。为最大程度利用人工智能保护濒危语言,会上科大讯飞还启动了“方言发音人招募”公益活动,以助力利用AI技术实现对濒危语言、方言的“复制”。
此外,针对多样化的场景,科大讯飞还分别推出了长文本输入、可在嘈杂环境下使用的耳语输入等工具;针对用户习惯和个性化,推出了个性化的训练模型、中英文混合输入等方案。值得一提的是,科大讯飞董事长刘庆峰曾在多个场合表态,讯飞输入法将长期坚持“免费获取”“暂不考虑盈利”的原则,但每年的投入均在8位数量级。
另据科大讯飞官方给出的数据,讯飞输入法用户数已经突破6亿。(记者 赵广立)