ForkNet: Overlapping Image Disentanglement for Accurate Prohibited Item Detection

Tong Jia, Bowen Ma, Hao Wang, Mingyuan Li, Shuyang Lin, Dongyue Chen

Abstract

准确识别行李中的潜在威胁对于公共安全至关重要。在X射线扫描中,物品通常随机堆叠并呈现半透明状态。这使得违禁品的出现被大量背景杂物重叠,导致严重的类不可知特征纠缠,削弱了它们的判别性。现有的框架通过直接应用前景注意力图或背景去注意力图来处理这一挑战。然而,这种设置存在两个限制:1)在纠缠的潜在空间中精确区分前景或背景非常困难;2)它们忽略了重叠和遮挡对特征学习带来的内在差异。为了克服这些限制,我们贡献了一种新的前景-背景特定特征学习框架(称为ForkNet)用于重叠禁品检测。具体来说,ForkNet首先使用两个独立的主干模型来提取前景特征和背景特征,并在它们末尾插入特定任务的头。之后,设计了一个特征解缠模块,通过分析特征在通道和空间轴上的相似性,主动去除隐藏在前景特征中的冗余背景信息。最后,将精炼的前景特征输入到常规预测头进行目标检测。对五个具有挑战性的数据集(SIXray、OPIXray、PIXray、PIDray和CLCXray)的广泛实验表明,所提出的框架显著优于现有技术(分别达到90.0% mAP、90.9% mAP、73.8% mAP、66.8% mAP和62.0% mAP),同时运行速度高达 6.4 FPS


Method