ECCV 2020,提升目标检测的新型中间监督方法


“15分钟看顶会”是旷视研究院全新推出的论文快速解读专栏,聚焦旷视在全球各大顶会、期刊等平台所发表的工作,覆盖深度学习、计算机视觉、视觉导航与控制、计算摄影学、大规模机器学习系统、机器人学等方向。

与传统论文视频解读动辄30min时长不同,本专栏尽可能将时间控制在15分钟左右,以方便读者在日常通勤、等待、出行等时间受限的场景下高效利用碎片化时间进行学习、交流。

欢迎大家和我们一起“深度学习”,也欢迎对这种论文解读方式提出您的宝贵建议。

本期是“15分钟看顶会”专栏 ECCV 2020 论文解读系列的第五篇,旷视研究院提出一种新型的中间监督方法——LableEnc,以提升物体检测系统的训练效果。该方案的关键创新点是引入了一个全新的标签编码函数,将ground-truth标签映射到潜在嵌入空间上,作为辅助backbone训练的中间监督信息。

  • 论文题目:
    LabelEnc: A New Intermediate Supervision Method for Object Detection

  • 论文链接:
    https://arxiv.org/abs/2007.03282

  • 论文代码:
    https://github.com/megvii-model/LabelEnc

  • 关键词:
    物体检测、辅助监督、自编码器

本文方法主要涉及2阶段训练步骤。首先,通过一个在标签空间上定义的自编码器来优化标签编码函数,来获得物体检测器的理想中间表征。然后,利用优化后的标签编码函数,研究人员引入了一个新设计的辅助损失,连接在检测backbone上,可以提升后面检测器的性能。


在COCO的实验结果显示,本文方法具有很强的通用性,它在多种检测系统上都实现了约2%的性能提升,无论该系统是单阶段还是双阶段架构。另外,本文的辅助结构仅仅在训练过程中存在,也就是说,它完全不会影响推理阶段的开销。

同学们还可以点击阅读原文,浏览《ECCV 2020 旷视研究院15篇成果总览》,了解更多顶会论文内容。

入群交流

 

传送门 

实习简历请投递至:ur@megvii.com

欢迎大家关注如下 旷视 官方微信号????