浪潮信息获CVPR2024自动驾驶挑战赛“Occupancy& Flow”冠军

人文 2025-05-30 16:16:16 967

近来,在全球威望的CVPR 2024自动驾驭世界应战赛(Autonomous Grand Challenge)中,浪潮信息AI团队所提交的“F-OCC”算法模型以48.9%的超卓成果斩获占有栅格和运动估量(Occupancy & Flow)赛道第一名。继22、23年在纯视觉和多模态等自动驾驭感知方向,屡次登顶nuSences 3D方针检测榜单后,该AI团队面向Occupancy技能再一次完成打破,完成了对高度动态及不规则的驾驭场景更精准的3D感知及运动猜测。

CVPR 2024自动驾驭世界应战赛是世界计算机视觉与模式辨认会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition)的一个重要组成部分,专心于自动驾驭范畴的技能立异和运用研究。2024年CVPR自动驾驭世界应战赛,包括感知、猜测、规划三大方向七个赛道,旨在深化探究自动驾驭范畴的前沿课题。

三维感知和猜测是自动驾驭范畴的新式使命,要求对车辆行进场景进行细粒度建模,关于提高自动驾驭的环境感知才能有着重要意义。此次浪潮信息AI团队所登顶的占有栅格和运动估量(Occupancy & Flow)赛道,是CVPR 2024自动驾驭世界应战赛最受重视的赛道,聚集感知使命,招引了全球17个国家和地区,90余支顶尖AI团队参加应战。竞赛供给了根据 nuScenes 数据集的大规模占用栅格数据与评测规范, 要求参赛部队运用相机图画信息对栅格化三维空间的占有状况(Occupancy)和运动(Flow)进行猜测,以此来评价感知体系对高度动态及不规则驾驭场景的表明才能。

占有栅格 Occupancy:应战更精密的环境感知与猜测。

路途布局的杂乱性、交通工具的多样性以及行人流量的密布性,是当时城市路途交通的现状,也是自动驾驭范畴面对的实践应战。为了应对这一应战,有用的障碍物辨认和避障战略,以及对三维环境的感知和了解就变得至关重要。传统的三维物体检测办法一般运用鸿沟框来表明物体的方位和巨细,但关于几许形状杂乱的物体,这种办法往往无法精确描绘其形状特征,一起也会疏忽对布景元素的感知。因而,根据三维鸿沟框的传统感知办法现已无法满意杂乱路途环境下的精准感知和猜测需求。

图2 - 针对挖车中的力臂,3D方针检测算法只能给出挖车全体的概括框(左),但占有栅格网络却可以更精准地描绘挖车详细的几许形状这类细节信息(右)。

Occupancy Networks(占有栅格网络) 作为一种全新的自动驾驭感知算法,经过获取立体的栅格占有信息,使体系可以在三维空间中确认物体的方位和形状,从而有用辨认和处理那些未被清晰标示或形状杂乱的障碍物,如异形车、路上的石头、散落的纸箱等。这种占有栅格网络使得自动驾驭体系可以更精确地了解周围的环境,不仅能辨认物体,还能区别静态和动态物体。并以较高的分辨率和精度表明三维环境,对提高自动驾驭体系在杂乱场景下的安全性、精度和可靠性至关重要。

全面提高!48.9%的绝佳功能体现,创本赛道最高成果。

在占有栅格和运动估量(Occupancy & Flow)赛道中,该AI团队所提交的“F-OCC”算法模型,凭仗先进的模型结构设计、数据处理才能和算子优化才能,完成了该赛道最强模型功能,在RayIoU(根据投射光线的办法评价栅格的占用状况)及mAVE(平均速度差错)两个评测目标中均取得最高成果。

■ 更简练高效的模型架构,完成运算功率与检测功能双打破。

首要,模型全体挑选根据前向投影的感知架构,并选用高效且功能杰出的FlashInternImage模型。一起,经过对全体流程进行超参调优、算子加快等优化,在占有栅格(Occupancy)和运动估量(Flow)均取得最高分的一起,提高了模型的运算功率,加快了模型迭代与推理速度。在实践运用场景中,这种改善使得模型可以更快速、高效地处理大规模3D体素数据,使得自动驾驭车辆能更好地了解环境,从而提高决议计划的精确度和实时性。

■ 更强壮完善的数据处理,全面提高模型检测才能。

在数据处理方面,竞赛供给的体素(Voxel)标签包括了很多在图画中无法观测到的点,例如被物体遮挡的体素和物体内部不行见的体素,这些标签在练习过程中会对根据图画数据的猜测网络练习发生搅扰。在练习数据中,该AI团队经过模仿LiDAR光束的办法,生成可视化掩码,提高了模型的猜测精度;另一方面,经过引进感知规模边际的体素点参加练习,有用处理出现在感知边际区域的误检问题,将模型的全体检测功能提高11%。

■ 更精密的3D体素编码,模型占有猜测才能提高超5%。

在3D体素特征编码模块中,该算法团队将具有较大感知规模和编码才能的可形变卷积操作运用于3D体素数据,以提高3D特征的表明才能。经过运用CUDA对可形变3D卷积(DCN3D)进行完成与优化,大幅提高了模型的运算速度,并有用降低了显存耗费。经过DCN3D代替传统3D卷积,模型全体占有猜测才能提高超5%。

根据OCC 3D空间感知算法的立异, “F-OCC”算法模型成功登顶占有栅格和运动估量使命(Occupancy & Flow)榜单,以48.9%的超卓成果发明了本赛道的最高成果,为探究更高等级的自动驾驭技能供给了有力的支撑与经历。未来,浪潮信息AI团队将饯别多角度切入,发挥算法、算力交融的AI全栈优化才能,推进自动驾驭范畴的技能立异开展。

内容来源:https://sh.tanphatexpress.com.vn/app-1/tỷ lệ bóng đá 88,http://chatbotjud-teste.saude.mg.gov.br/app-1/quina-concurso-6092

本文地址:http://w.21nx.com/article/35484184-0d97099029.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。