地平线算法工具链新进展! GANet在征程®5上实现高效部署

2024-02-23 地平线HorizonRobotics公众号
智能计算方案,征程®5,地平线 智能计算方案,征程®5,地平线 智能计算方案,征程®5,地平线 智能计算方案,征程®5,地平线

地平线征程®5

地平线征程5是专为高阶智能驾驶打造的智能计算方案,搭载地平线第三代架构BPU--贝叶斯(Bayes),算力可达128TOPS,是率先实现前装量产的国产百TOPS级智能计算方案。基于征程5开发的高等级自动驾驶方案可实现ADAS功能、高速导航智能驾驶、城区导航智能驾驶和智慧泊车的全场景覆盖。针对自动驾驶实际工况,Bayes结合突破性的AI加速计算技术,通过灵活配置的访存计算,极大的优化内存占用及访存,将并行计算发挥到极致!

方案介绍


公版模型

上图展示了GANet的整体框架。输入前视相机图片,依次经过主干网络(backbone)、自注意力模块(SA)、FPN模块提取图片的多尺度特征后,GANet利用一个关键点头(keypoint head)和一个偏移量头(offset head)来分别预测关键点的置信度图(confidence map)和关键点到车道线起始点的偏移量图(offset map),在推理过程中通过对这二者进行采样和组合,可以将关键点分配到所属的车道线,得到最终的车道线预测结果。LFA作为一个特征增强模块,插入在关键点头之前以帮助关键点预测。接下来的几部分我们将对这两部分展开详细的介绍。


可以分为以下几个部分:

Backbone:公版使用ResX系列对输入的图像做特征提取;

SA:自注意力层(Self-Attention, SA ),以获得丰富的上下文信息;

FPN:采用FPN来提取输入图像的多级视觉表示;

LFA:车道感知特征聚合器(LFA)模块,自适应地从车道上的相邻点收集信息,从而增强每个关键点的局部特征表示;

GANetHead: 利用三个头来预测每个点的置信度,偏移量以及误差补偿;

GANetDecoder: 根据GANetHead的输出,对关键点做筛选和聚类,得到最终的车道线信息;


部署分析与优化


模型部署前,需要对公版模型做分析,分为性能和精度的分析。接下来将从这两个方面来做部署分析以及地平线对各个模块的优化。


性能上


Backbone

公版backbone使用的ResNet系列,地平线发布了针对征程5的硬件特性研发的MixVarGENet模型,其性能表现优异,出于性能的考虑,因此地平线方案中替换ResNet为MixVarGENet,下图为征程5上不同backbone的性能对比。

MixVarGENet主要由MixVarGEBlock结构单元构成。下图为MixVarGEBlock的结构图:

MixVarGEBlock由 head op ,stack ops,downsample layers,fusion layers四个基本模块组成。

head_op和stack_op都是由BasicMixVarGEBlock(如GANet中的mixvarge_f2,mixvarge_f4,mixvarge_f2_gb16)这样的基本单元构成。


BasicMixVarGEBlock结构示意图如下所示:

MixVarGENet高度秉承了“软硬结合”的设计理念,针对征程5的算力特性做了一些定制化设计,其设计思路可以总结为:

1. 小channel时使用normal conv,发挥征程5算力优势;

2. 大channel时引入group conv,缓解带宽压力;

3. Block内部扩大channel,提升网络算法性能;

4. 缩短feature复用时间间隔,减少SRAM到DDR访存。


Self-Attention

公版的SA模块其实就是一个self-attention,用于增强特征的全局关联能力。其计算公式为

地平线征程5最早针对的是以CNN为基础的图像处理,但在实践过程中,逐渐衍生出支持语音,Transformer等类型的模型。不过以CNN为基础的模型仍然是效率最高的模型,这一点在编译器内部的体现就是4d-Tensor仍然是最高效的支持方式。因此我们将该模块从传统的三维计算等价修改为四维计算已达到高效支持,同时减少多个reshape和permute操作,保证精度的同时提升推理性能。同时,我们将attention里面的hidden_dim从64降低到16,模块个数从2个减少到1个,经实验对比,对性能提升较大且精度影响较小。

LFA

增强车道线的局部连续性,公版模型中使用了一个车道线感知的特征增强模块(LFA),将其插入关键点头之前,从而更好的利用车道线上周边点的特征来增强当前点的特征。

LFA模块的实现由可形变卷积构成,由于征程5上对可形变卷积的支持不太友好,且从论文中看出来,去掉后对精度的影响在可接受的范围内(见下表),因此在我们的方案中,LFA模块被去掉了。

GANetHead

GANetHead利用三个头来预测每个点的置信度,偏移量以及误差补偿,这三个预测头都是由卷积层组成。

其中置信度图预测某个点是否是车道线的关键点,偏移量是预测某个点到起点的偏移量,误差补偿是用来补偿下采样取整后带来的误差。


地平线版本对该部分参考公版实现,无其他改动。


GANetDecoder

GANetDecoder的作用是基于GANetHead输出的置信度图、偏移量和误差补偿来构建车道线。如下图所示:

地平线版本对该部分参考公版实现,无其他改动。


基于以上对对公版模型的改进后,GANet模型在征程5上最终的性能达到双核2431FPS,符合实时性的要求。


精度上


GANet的量化训练,主要是采用horizon_plugin_pytorch的Calibration方式来实现的,通过插入伪量化节点对多个batch的校准数据基于数据分布特征来计算量化系数,从而达到模型的量化。GANet模型无需QAT训练就可以达到和浮点相当的精度。除了量化方式上的优化,地平线对量化不友好的算子支持上也做了优化,下面以SA模块为例,说明地平线如何保障模型的量化精度。


Self-Attention

SA(self-attention)模块中,其操作主要由softmax、matmul、permute、view等算子构成。其中softmax底层为多个算子拼凑实现的(cast、exp、sum、mul等),此类算子对量化是不友好的。为了保证量化的精度,因此SoftMax除了在输入输出端使用int8量化之外,中间的结果均采用int16的量化方法。

在使用方式上,参考目前地平线提供的QAT量化工具,浮点算子到QAT算子的自动映射。用户只需要定义浮点模型,由QAT工具自动实现浮点和量化算子的映射。因此大部分量化算子的实现方式,用户是不需要感知的,尤其像LayerNorm和SoftMax这种算子的量化方式,工具本身默认提供int16的量化方式,用户只需要正常使用社区的浮点算子即可,而不需要再手动设置QAT相关的配置。


通过对算子支持和量化方式上的优化,GANet模型在征程5上的精度表现最终达到浮点的99%以上(0.7949/0.7872)。


实验结果


1. 实验数据


GANet模型基于CULane数据集训练和验证,模型配置如下:

其性能和精度表现为:

2. 车道线检测模型部署通用性建议


• 目前车道线检测算法主流的方法大致分为四种类型,基于分割,基于检测,基于关键点和基于参数曲线。基于分割的方法一般在遮挡情况下效果较差,且需要复杂的后处理聚类;基于检测的方法难以适配形状的多样性,比如曲线;基于参数曲线的方法可以学习整体的车道表示,但精度相对不高;基于关键点的方法兼具灵活性和实时性,构建较好的全局信息情况下可以得到较高的精度,在征程5上建议采用这种方法来做车道线检测模型的部署。

• 选用BPU高效支持的算子替换不支持的算子,例如动态卷积等。

• 尽量避免厚重的后处理(例如复杂的聚类方式),复杂的后处理会导致cpu资源紧张,影响模型整体运行效率。

• backbone可以考虑替换为硬件支持友好的模型,例如EfficientNet、MixVarGENet等。


总结


本文通过对GANet在地平线征程5上量化部署的优化,使得模型在该计算方案上用低于1%的量化精度损失,得到latency为1.099ms的部署性能,同时,通过GANet的部署经验,可以推广到其他模型部署优化,例如包含自注意力的车道线检测模型的部署。




授权代理商:世强先进(深圳)科技股份有限公司
技术资料,数据手册,3D模型库,原理图,PCB封装文件,选型指南来源平台:世强硬创平台www.sekorm.com
现货商城,价格查询,交期查询,订货,现货采购,在线购买,样品申请渠道:世强硬创平台电子商城www.sekorm.com/supply/
概念,方案,设计,选型,BOM优化,FAE技术支持,样品,加工定制,测试,量产供应服务提供:世强硬创平台www.sekorm.com
集成电路,电子元件,电子材料,电气自动化,电机,仪器全品类供应:世强硬创平台www.sekorm.com
  • +1 赞 0
  • 收藏
  • 评论 20

本文由咪猫转载自地平线HorizonRobotics公众号,原文标题为:地平线算法工具链新进展! GANet在征程®5上实现高效部署,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

评论

   |   

提交评论

全部评论(20

  • 用户34169263 Lv7. 资深专家 2024-11-06
    学习下
  • Timm Lv9. 科学家 2024-04-06
    学习
  • 周鑫 Lv8. 研究员 2024-04-01
    学习学习
  • qinge2010 Lv4. 资深工程师 2024-03-26
    学习
  • 用户71904310 Lv9. 科学家 2024-03-25
    学习
  • xuepiaomengfei Lv7. 资深专家 2024-03-17
    学习
  • 一闪一闪亮眼睛 Lv7. 资深专家 2024-03-15
    学习
  • 崇乾 Lv8. 研究员 2024-03-11
    学习
  • Gavinzhang Lv6. 高级专家 2024-03-01
    学习
  • Timm Lv9. 科学家 2024-02-29
    学习
展开更多评论

相关推荐

地瓜创客孵化营 | 让每一块 RDK X5,都成为你手中的机器人!

地瓜机器人开发者日就要来啦!面向智能计算与机器人解决方案的通用型开发板新品RDK X5,接口丰富,极具性价比,具有10T算力,与强大的图像处理能力,助力开发者轻松实现多种智能应用。加入“地瓜创客孵化营”你将和一群“地瓜创客”一起找到将你的开发板转变为智能机器人的最佳路径。

原厂动态    发布时间 : 2024-09-13

地平线与大众汽车集团旗下软件公司CARIAD合资公司正式成立,强大智能驾驶计算方案驱动出行变革

行业领先的智能驾驶计算方案提供商地平线与大众汽车集团旗下软件公司CARIAD正式宣布合资公司酷睿程(CARIZON)成立。新合资公司将整合地平线强大的软硬结合技术能力以及CARIAD在智能车身和软件系统整合方面的专业经验,开发行业领先的、高度优化的全栈式高级驾驶辅助系统和自动驾驶解决方案。酷睿程将基于地平线征程家族计算方案开展研发工作,落地智驾方案将搭载于大众汽车集团在中国市场的纯电动车型。

原厂动态    发布时间 : 2023-12-14

多维优化Centerpoint模型成果显著!基于3D点云的多任务模型在板端实现高效部署

本文通过对基于3D点云的多任务模型在地平线征程5上量化部署的优化,使得模型以低于1%的量化精度损失,得到latency为23.79ms 的部署性能。在点云处理方面,通过针对性的优化方法,灵活支持了不同点云输入并大幅提高点云处理的速度;在特征提取方面,选用了征程5高效结构 MixVarGENet+UNET;在输出设置上,采用多任务输出设计,能够同时得到 3D 目标检测结果和可行驶区域的分割结果。

原厂动态    发布时间 : 2024-01-16

四维图新发布基于地平线征程6系列的智驾产品矩阵,加速行业高质量发展

征程 6 系列是地平线在今年 4 月正式推出的全新车载智能计算方案,可覆盖从主动安全到全场景智驾的全阶应用。作为一款系列化的车载智能计算方案,征程 6 拥有统一的硬件架构、统一的工具链以及统一的软件栈,以及配套一致、完整成熟的智能驾驶量产开发平台,将助力四维图新等合作伙伴实现“快人一步”的量产效率,从而赋能车企决胜汽车智能化时代。

应用方案    发布时间 : 2024-11-13

再创新高,地平线征程家族出货量正式突破600万!

地平线车载智能计算方案出货量突破600万套,自2020年起持续快速增长。征程家族计算方案适应多级别智驾市场,合作车型超30家,累计量产车型270款。新推出的征程®6系列和SuperDrive全场景智能驾驶解决方案致力于提升城区NOA领域的智驾体验,预计2024年第四季度推出标准版量产方案。地平线以其技术成熟度和量产合作模式,稳居智驾科技供应商领先地位。

原厂动态    发布时间 : 2024-09-19

比亚迪汉EV荣耀版搭载征程®5上市!地平线助力比亚迪加速智驾全面普及

比亚迪汉EV荣耀版正式上市,推出天神之眼四驱智驾型,成为比亚迪王朝首个搭载“天神之眼”DiPilot 100 平台的车型。采用国内首款百TOPS级算力,高阶智驾专用计算方案地平线征程®5,在L2+级智能驾驶辅助功能基础上,可进一步升级涵盖高速和城市快速路的高快领航NOA、AVP代客泊车功能......

原厂动态    发布时间 : 2024-04-11

好算法更要配好用的芯片——基于LSS范式的BEV感知算法优化部署详解

本文通过对LSS范式的BEV多任务模型在地平线征程5上量化部署的优化,使得模型在该计算方案上用远低于1%的量化精度损失,得到latency为8.21ms的部署性能,同时,通过LSS范式的BEV模型的部署经验,可以推广到基于该范式的BEV模型的优化中,以便更好的在端侧部署。

技术探讨    发布时间 : 2024-03-01

基于地平线征程6E的中阶智驾方案已正式启动量产交付开发

智能驾驶系统供应商鉴智机器人基于地平线征程6E打造的多款中阶方案获得头部车企与Tier-1定点,并已正式启动量产交付开发。鉴智机器人作为地平线征程6首批算法合作伙伴,在征程6于今年4月发布同期,便推出基于征程6E的全栈解决方案,仅用3天完成感知算法迁移部署,15天内完成高速NOA方案上车,3个月内斩获定点合作,开发效率大幅提升。

原厂动态    发布时间 : 2024-08-10

【IC】地平线发布征程6和高阶城区智驾样板间,以顶级的软硬结合全栈技术加速智驾平权

2024年4月24日,地平线举办“征程所向,向高而行”——2024智驾科技产品发布会。立足于智能驾驶时代,地平线凭借对软硬结合全栈技术理念的前瞻预判和深厚积累,重磅发布新一代车载智能计算方案征程®6系列以及Horizon SuperDrive™全场景智能驾驶解决方案,全面开启智能驾驶的范式级创新,加速智驾平权时代的到来。

产品    发布时间 : 2024-04-26

搭载地平线征程®系列车规级智能芯片,佑驾创新推出高性能行泊一体域控与高性价比智驾前视一体机

智能驾驶解决方案研发商佑驾创新宣布推出两款搭载地平线征程®芯片的智能驾驶产品:搭载征程®5的高性能行泊一体智能驾驶域控制器D3t和搭载征程®3的高性价比智能驾驶前视一体机D2。

原厂动态    发布时间 : 2023-01-11

「老司机」首秀后,关于Horizon SuperDrive™的十问十答

4月24日,地平线发布了全新一代车载智能计算方案征程®6系列和Horizon SuperDrive™全场景智能驾驶解决方案。这两款产品的发布标志着地平线作为下一代全场景高阶智驾的行业标杆,为行业提供了全场景、全天候的高阶城区智能驾驶功能。围绕SuperDrive的拟人体验、端到端算法实践、原生软硬结合等优势,筛选了10个热门典型问题,带来了系统且更具针对性的解读。

原厂动态    发布时间 : 2024-06-27

如何打造“好用”的算法工具链?地平线「你好,开发者」工具链技术专场

地平线作为国内自动驾驶智能计算方案领域的领头羊,基于征程系列芯片打造了天工开物算法工具链。天工开物为开发者提供了一套灵活、高效、开放的软件工具,能够满足其在模型训练、量化、优化、编译、仿真和部署、调试等各个环节的开发需要。

原厂动态    发布时间 : 2023-11-18

基于地平线双征程5的TADC-D52域控制器首获Matrix标准硬件设计认证,加速推进高阶智能驾驶规模化落地

4月21日,地平线向官方授权IDH硬件合作伙伴苏州天准科技股份有限公司(以下简称“天准”),正式颁发「Horizon Matrix® 平台」认证证书,天准TADC-D52也成为首个通过Matrix 5认证的智能驾驶域控制器方案。此项认证也代表着,基于双征程®5的计算平台已达到量产成熟水平,将加速推进高阶智能驾驶规模化落地进程。

原厂动态    发布时间 : 2023-04-27

国产汽车零部件“奥斯卡”出炉,地平线征程®5斩获量产双奖项

第七届铃轩奖盛典上,地平线斩获“量产集成电路类·金奖”及量产类别唯一“全场大奖”。自2019年起,地平线已连续4年荣获铃轩奖,与该奖项共同见证了国产智能汽车的量产成长之路。

原厂动态    发布时间 : 2024-06-24

展开更多

电子商城

查看更多

品牌:地平线

品类:电源管理IC

价格:¥20.0000

现货: 890

品牌:地平线

品类:软件包

价格:¥20.0000

现货: 730

品牌:地平线

品类:SOC

价格:¥144.8208

现货: 673

品牌:地平线

品类:SOC

价格:¥128.7296

现货: 409

品牌:地平线

品类:软件包

价格:¥21.2494

现货: 378

品牌:地平线

品类:AIOT RDK MODULE

价格:¥319.0000

现货: 321

品牌:地平线

品类:AIOT RDK MODULE

价格:¥429.0000

现货: 269

品牌:地平线

品类:摄像头模组

价格:¥150.0000

现货: 91

品牌:地平线

品类:天线

价格:¥3.0000

现货: 80

品牌:地平线

品类:AIOT RDK MODULE

价格:¥359.0000

现货: 67

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

现货市场

查看更多

品牌:地平线

品类:SOC

价格:¥40.9328

现货:1,804

品牌:地平线

品类:软件包

价格:¥4.8667

现货:1,517

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

服务

查看更多

FloTHERM热仿真

提供稳态、瞬态、热传导、对流散热、热辐射、热接触、和液冷等热仿真分析,通过FloTHERM软件帮助工程师在产品设计初期创建虚拟模型,对多种系统设计方案进行评估,识别潜在散热风险。

实验室地址: 深圳 提交需求>

散热方案设计

使用FloTHERM和Smart CFD软件,提供前期热仿真模拟、结构设计调整建议、中期样品测试和后期生产供应的一站式服务,热仿真技术团队专业指导。

实验室地址: 深圳 提交需求>

查看更多

授权代理品牌:接插件及结构件

查看更多

授权代理品牌:部件、组件及配件

查看更多

授权代理品牌:电源及模块

查看更多

授权代理品牌:电子材料

查看更多

授权代理品牌:仪器仪表及测试配组件

查看更多

授权代理品牌:电工工具及材料

查看更多

授权代理品牌:机械电子元件

查看更多

授权代理品牌:加工与定制

世强和原厂的技术专家将在一个工作日内解答,帮助您快速完成研发及采购。
我要提问

954668/400-830-1766(工作日 9:00-18:00)

service@sekorm.com

研发客服
商务客服
服务热线

联系我们

954668/400-830-1766(工作日 9:00-18:00)

service@sekorm.com

投诉与建议

E-mail:claim@sekorm.com

商务合作

E-mail:contact@sekorm.com

收藏
收藏当前页面