Towards Dual-view X-ray Baggage Inspection: A Large-scale Benchmark and Adaptive Hierarchical Cross Refinement for Prohibited Item Discovery

Bowen Ma, Tong Jia, Mingyuan Li, Songsheng Wu, Hao Wang, Dongyue Chen

Abstract

双视图行李检查已广泛应用于现实场景,其中采用正交视角来捕获多样互补的信息。与单视图相比,当旋转和遮挡妨碍物体的可视性时,它可以有效地提高识别性能。然而,由于缺乏数据集,该主题尚未得到深入研究。为了克服这一限制,我们贡献了首个完全公开的大规模双视图 X 光数据集。我们的数据集名为 DvXray,包含 16,000 对、32,000 张 X 光图像,其中 15 个常见类别中的 5,496 个违禁物品被手动标记。此外,我们提出了一种名为自适应层次交叉细化 (AHCR) 的方法,为双视图 X 光图像中的违禁物品识别建立了一个强大的基准线。AHCR 假设每个输入对都从一个混合分布中采样,因此沿着共享轴收集非重叠和位置感知的线索,并以分层结构互补地传递给另一个,以丰富目标物体的特征可区分性,使其从背景重叠中脱颖而出。在此结构上,我们提出了一种自适应控制策略和一个置信度加权视图融合项,使其对困难样本具有鲁棒性。DvXray 上的大量实验表明,AHCR 不仅在各种骨干(例如最近的 Swin Transformer 和 ConvNeXt)上带来了显着的分类收益,而且还展示了令人印象深刻的物体定位能力。此外,AHCR 与同行和一些最近的多视图学习方法相比表现良好,朝着潜在的实际应用迈进了一步。数据集和代码可以在 https://github.com/Mbwslib/DvXray 获得


Method