语音是人类交流的重要方式,但说话者的健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别。研究人员一直在改进通用语音识别和交互技术,这些技术可以很好地处理细微的声音或嘈杂的环境。多通道声波传感器可以提高声音识别的精度,但因体积较大而无法佩戴。近期,清华大学的研究团队开发了一种基于石墨烯的智能可穿戴人工喉(AT),可以实现语音感知和发声。研究成果发表在《Nature Machine Intelligence》期刊,论文的标题“Mixed-modality speech recognition and interaction using a wearable artificial throat”。
该研究团队通过激光直写技术在超薄聚酰亚胺薄膜上转化出基于石墨烯的智能可穿戴人工喉(AT),实现了对声音信号和机械运动的混合模态的感知,使AT能够获得低基频信号,同时具有抗噪声的语音感知能力。实验结果表明,混合模态AT能够检测基本语音元素(音素、声调和单词),平均准确率达到99.05%。此外,通过集成AI模型,AT识别出了喉切除术患者含糊说出的日常词汇,准确率超过90%。同时,AT还可以通过热声效应实现声音的播放功能,以恢复患者的发声能力。
该研究提出的AT具有制作工艺简单、性能稳定、抗噪性强、可集成发声等特点,使其成为下一代语音识别和交互系统的有力工具。
注:此研究成果摘自《Nature Machine Intelligence》杂志,文章内容不代表本网站观点和立场,仅供参考。