Fully Cascade Consistency Learning for One-Stage Object Detection

Hao Wang, Tong Jia, Bowen Ma, Qilong Wang, Wangmeng Zuo

Abstract

目标检测通常通过部署一个包含分类和定位分支的单一预测头来获得最终结果。最近提出的一些工作采用多预测头的级联学习方式来提高检测性能。尽管这些方法取得了较好的性能表现,但现有的级联学习方法仍然存在两个不一致性问题。首先,大多数方法仅依赖定位精度(如IoU)来在不同的预测头中优化边界框,而忽略了分类置信度和定位精度之间的不一致性。此外,简单地通过经验增加IoU阈值来选择正样本会使不一致性问题更加严重。其次,对于来自不同预测头的检测特定特征和来自骨干模型的检测通用特征之间的特征不一致问题,现有方法很少考虑。骨干模型提取的特征包含整个图像的通用表示,而预测头需要精心设计,以具有更具判别性的表达能力,专注于分类和回归这两个子任务。这两部分输出特征的不同上下文表示导致级联学习架构中骨干模型与预测头之间的特征不一致性。为了解决这两个不一致性问题,本文提出了一种新的用于单阶段检测器的级联一致性学习方法。具体而言,首先开发了一种特征适应模块,用于校准来自不同预测头和骨干模型的特征,解决特征不一致问题。然后,我们设计了一种自动正样本阈值选择策略,进一步解决分类和定位预测之间的不一致性。此外,我们通过同时考虑分类置信度和定位精度来评估级联学习方式中边界框的质量。在MS COCO数据集上的实验表明,我们提出的级联一致性学习方法(称为C2L)在多个不同的单阶段检测器的基础上取得了明显的提升,同时相较于最先进的方法表现出色


Method