近日, 中科院合肥研究智能所先进制造研究中心王红强研究员团队与中启人工智能联合实验室提出利用有效视野域理论强化表征AI学习模型,并证实该模型能够显著提高目标检测性能。
深度学习是当前人工智能的核心,在基于DCNN的深度学习模型中,网络视野域发挥重要作用,但一直以来鲜有对其深入研究应用。团队研究人员提出一种有效感受野(eRF)强化思路,并设计了有效视野域强化表征学习模块,通过应用于现有的目标检测器,证实该模型显著提高了目标检测性能,尤其是在小目标识别方面。
对于传统的目标检测器而言,在训练过程中存在难以收敛和训练不充分不平衡等问题,科研人员注意到,在人类视觉系统中,物体只有落在视野范围内才可见,且当眼睛注意到某物时,视野中会出现同心对抗现象:激发中心区域但抑制外围区域。鉴于此,科研人员提出模仿人眼有效感受野区域来增强表征学习。研究过程中,研究人员发现目标检测器的骨干网络卷积层深度是有效感受野重要影响因素之一。通过卷积层深度拟合目标的有效感受野半径,并将中心点落在有效感受野区域内的锚框中,所提出的模型提高了目标检测细微特征的强化学习能力。
该工作先期已申请国家发明专利,并发表了一系列学术论文。团队构建的Pest24大规模小样本深度学习基准点,填补了当前大规模农业害虫小目标机器学习数据集缺失空白,被同行认为有很大潜力成为深度学习的标准数据。下一步团队将继续深入开展eRF理论与模型方法研究,并在医疗健康、安防、农业虫害监测等领域进行产业化应用。(记者 汪永安)