【技术】地平线-中科院提出CIRKD,一种新颖的跨图像关系型KD方法用于语义分割任务
语义分割任务作为计算机视觉中的基础任务之一,其目的是对图像中的每一个像素进行分类。该任务也被广泛应用于实践,例如自动驾驶和医学图像分割。现有流行的用于语义分割任务的模型,例如DeepLab和PSPNet系列,虽然获得了很好的分割精度,但是所需的算力成本较高。本文考虑使用知识蒸馏(Knowledge Distillation,KD)算法来缓解这个问题。KD作为模型压缩里的一项重要技术,其核心思想是将教师模型中学习的知识作为监督信号来训练学生模型,使得学生模型得到更好的性能。虽然现有的语义分割知识蒸馏方法能够对学生网络的性能进行提升,但是这些方法通常是从单张图像中提取知识,忽略了跨图像之间的关系信息也是一种有价值的知识。最近,地平线-中科院提出了一种新颖的跨图像关系型KD方法用于语义分割任务-CIRKD。该方法尝试在语义分割任务中建模pixel-to-pixel和pixel-to-region这两种对比关系作为KD的监督信号。本文主要从方法介绍以及实验结果对提出的CIRKD进行讲解。
核心思想
KD作为一种思想已被广泛应用,尤其是图像分类任务。但是先前的工作[1]表明直接将图像分类KD方法直接迁移到语义分割任务是不可行的,因为它们没有考虑到语义分割的结构化信息。一些经典的语义分割KD工作于是去尝试捕捉到一些上下文信息来建模结构化知识,比如pixel相似度[1],pixel与region向量的相似度关系[2],但是这些方法通常在单张图像内部进行信息提取,难以捕捉到更加广泛的上下文依赖。
于是,提出一种跨图像的知识蒸馏方法来建模图像间的依赖,从而使得网络能够捕捉到更加丰富的结构化信息。具体地,本工作建模数据集中的全部图像之间建模pixel-to-pixel以及pixel-to-region的对比关系作为知识。动机在于一个好的教师模型可以产生更好的全局pixel依赖以及特征空间。CIRKD引导学生模型去模仿教师网络产生的更好的结构化语义关系,因此提升了语义分割表现。
具体方法
本方法分别从mini-batch和memory的角度对结构化关系进行建模。
1. 基于mini-batch的pixel-to-pixel蒸馏
首先是在batch中建模关系,将图像产生的特征图在spatial维度上进行分离,产生pixel-wise的特征向量。针对某一个pixel点的特征向量作为锚样本,其他pixel点特征向量(包括当前图像和其他图像)作为对比样本,可以得到相似度矩阵。基于此方法,在教师端和学生端都可以产生对应的相似度矩阵,然后通过KL散度进行逼近,使得学生可以学到教师的相似度矩阵:
一个batch内的图像进行两两之间的关系矩阵求取和迁移:
整个过程的示意图如下所示:
2. 基于memory的pixel-to-pixel蒸馏
相对于基于mini-batch的对比性关系求取,这里采用一个memory bank来存储对比向量,使得每一个锚样本都可以得到充足的对比样本。针对某一个pixel点的特征向量作为锚样本,每次训练随机从memory bank中采样大量的pixel特征向量来构造对比样本,通过相乘分别得到教师和学生的相似度矩阵:
使用KL散度的误差形式将教师和学生的pixel-to-pixel相似度矩阵进行对齐:
3. 基于memory的pixel-to-region蒸馏
离散化的pixel特征向量不能充分在捕捉到图像内容,因此本方法利用memory对region向量进行存储。region向量产生自对来自相同类别的pixel向量做一个平均。针对某一个pixel点的特征向量作为锚样本,每次训练随机从memory bank中采样大量的region特征向量来构造对比样本,通过相乘分别得到教师和学生的相似度矩阵:
实验结果
- |
- +1 赞 0
- 收藏
- 评论 0
本文由提灯破云转载自地平线,原文标题为:CVPR 2022 | 用于语义分割任务的跨图像关系型知识蒸馏,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
相关推荐
地平线主动安全产品获国内首个ASIL B产品级功能安全认证
近日,地平线主动安全产品Horizon Matrix Mono获得国内首个ISO 26262功能安全ASIL B产品级功能安全认证。这意味着地平线主动安全产品在产品层面获得了国际标准认可,为中国智能汽车“出海”提供更全面、更符合当地要求的安全助力。
原厂动态 发布时间 : 2024-04-25
世界模型:地平线眼中的「认知大脑」
在8月28日举办的地平线高阶智驾技术开放日上,地平线创始人兼CEO余凯博士就当下火热的端到端,智能驾驶未来发展趋势、地平线软硬结合的王炸产品Horion SuperDrive™(HSD™),与参会嘉宾进行了真诚的分享。其中,余凯博士提到,“端到端是每家公司都能掌握的,魔鬼在细节中。” 本篇文章即从端到端讲起 ,并为大家剖析何为地平线的“驾驶世界观”。
技术探讨 发布时间 : 2024-10-23
地平线(Horizon Robotics)新一代AIoT智能芯片选型表
描述- 旭日®3 是地平线针对 AIoT 场景,推出的新一代低功耗、高性能的智能芯片;集成了地平线最先进的伯努利2.0 架构引擎( BPU® ),可提供 5TOPS 的算力。新的 BPU 架构极大提升了对先进 CNN 网络架构的支持效果,并极大降低了运算对 DDR 带宽的占用率。辅以地平线天工开物® 软件开发平台,大幅简化算法开发与部署过程,降低产品的落地成本。
型号- X3M,X3E
【经验】地平线ISP工具Control tool的使用方法介绍
Control tool是isp-tuning时tuning ISP参数的图形界面工具,对于刚接触地平线的开发者来说,会比较陌生,下面详细介绍Control tool的使用方法。
设计经验 发布时间 : 2022-09-10
一组数字读懂地平线高阶智驾技术开放日!
地平线在北京举办的高阶智驾技术开放日上,展示了其Horizon SuperDrive™(HSD™)系统的最新进展。该系统旨在2025年实现高阶智驾的规模化发展,提供全场景智驾模式和安全保障。地平线的技术在多个算法挑战赛中获奖,并计划通过World Model和交互博弈模型实现性能和体验的优化。征程6芯片将支持这一全场景智驾解决方案,以实现高效、拟人化的驾驶体验。
原厂动态 发布时间 : 2024-10-17
地平线算法工具链新进展! GANet在征程®5上实现高效部署
地平线征程5是专为高阶智能驾驶打造的智能计算方案,搭载地平线第三代架构BPU--贝叶斯(Bayes),算力可达128TOPS,是率先实现前装量产的国产百TOPS级智能计算方案。基于征程5开发的高等级自动驾驶方案可实现ADAS功能、高速导航智能驾驶、城区导航智能驾驶和智慧泊车的全场景覆盖。
原厂动态 发布时间 : 2024-02-23
【经验】地平线X3M SDB开发板烧录ubuntu镜像实操和注意事项
地平线X3M SDB开发板,地平线论坛已经支持yocto linux和ubuntu两种SDK包,本文实操烧录ubuntu镜像以及说明注意事项。
设计经验 发布时间 : 2022-06-24
再创新高,地平线征程家族出货量正式突破600万!
地平线车载智能计算方案出货量突破600万套,自2020年起持续快速增长。征程家族计算方案适应多级别智驾市场,合作车型超30家,累计量产车型270款。新推出的征程®6系列和SuperDrive全场景智能驾驶解决方案致力于提升城区NOA领域的智驾体验,预计2024年第四季度推出标准版量产方案。地平线以其技术成熟度和量产合作模式,稳居智驾科技供应商领先地位。
原厂动态 发布时间 : 2024-09-19
地平线发布具有4核ARMA53处理能力的X3派AI开发平台,支持H.264/H.265编解码和5Tops端侧推理|视频
地平线旭日®️X3派是一款面向生态开发者的嵌入式AI开发板,接口兼容树莓派,具有5Tops端侧推理与4核ARMA53处理能力。可同时多路CameraSensor的输入并支持H.264/H.265编解码。
新产品 发布时间 : 2022-06-16
【经验】地平线X3M芯片通过软件调节降低功耗的三种方法
地平线X3M SoC芯片包含4个53核,主频1.2Ghz,还有2个BPU核,主频1GHz,算力最高5Tops,在处理负责图像逻辑的情况下,需要对功耗进行必要的控制,保证芯片能正常工作。下面是三种通过软件调节降低芯片功耗的三种方法。
设计经验 发布时间 : 2023-05-18
全程零接管!地平线高阶智驾系统SuperDrive畅通闹市区雨天晚高峰
大众汽车集团(中国)CEO贝瑞德与地平线CEO余凯共同试乘地平线高阶智驾系统SuperDrive,在北京闹市区雨天晚高峰挑战中,SuperDrive以零接管、高效拟人驾驶完成50分钟复杂城区行程,展现卓越通过能力和丝滑驾驶体验,二人共赞其为理想智驾产品。
原厂动态 发布时间 : 2024-08-15
【经验】地平线X3M SoC芯片烧录efuse的方法
地平线X3M SoC的efuse的主要目的是自动识别不同厂商的DDR以及DDR类型。现在的DDR频率默认是3200,有些DDR的最高频率为2666,不烧写efuse,频率变为3200会影响启动。
设计经验 发布时间 : 2023-03-03
【IC】地平线新品发布,硬件模组RDK,高达96TOPS算力的RDK Ultra系列 ∣ 视频
地平线官宣系列重要发布:全新地平线RDK系列机器人开发者套件正式上线,机器人操作系统 TogetheROS™.Bot 2.0版发布,应用中心NodeHub首发亮相。
新产品 发布时间 : 2023-07-29
地平线基于矢量表征和概率规划的端到端自动驾驶,推出「你好,开发者」自动驾驶技术专场
端到端自动驾驶正成为高阶智驾跨越体验拐点的必选项。实现真正的自动驾驶所面临的一大挑战是无法穷尽的Corner Case。为了让大家进一步了解VADv2以及地平线在端到端自动驾驶领域的相关研发工作,地平线推出地平线「你好,开发者」自动驾驶技术专场,主题为《基于矢量表征和概率规划的端到端自动驾驶》。
原厂动态 发布时间 : 2024-08-10
电子商城
现货市场
登录 | 立即注册
提交评论