400-123-4657
点击量:145 时间:2024-11-11
时隔50天内夺下4个世界纪录后,近日,大华股份再度创下KITTISceneflow和KITTIFlow两项竞赛的全球最好成绩,使用基于实例拆分、深度视差网络、刚体运动一致性约束的场景流估算算法,打破了其它一流AI公司和顶尖的学术研究机构,以及ICCV、ECCV、CVPR涉及论文中的场景流研究成果,这标志着大华股份在场景东流与光流两个算法领域皆具备最重要国际影响力。大华股份获得KITTISceneflow排行榜第一名:大华股份获得KITTIFlow排行榜第一:关于KITTI:KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院牵头创立,是目前国际上仅次于的计算机视觉算法评测数据集之一。数据集用作评测立体匹配(stereo)、光流(flow)、场景流(sceneflow)、视觉里程计(visualodometry)、物体检测(objectdetection)和追踪(tracking)、道路拆分(road)、语义拆分(semantics)等计算机视觉技术的性能。
KITTI包括市区、乡村和高速公路等场景收集的现实图像数据,每张图像中最多包括15辆车和30个行人,且不存在有所不同程度的遮盖与切断。场景东流与光流:场景流算法需要同时估算场景中物体的三维方位与三维运动矢量,是感官环境空间几何结构的核心算法,与感官语义信息的算法融合后,需要全面地解读环境。三维场景东流的估算结果需要更进一步分解成为立体匹配结果与光流给定结果,可以指出,光流是场景流同构到二维图像坐标系的投影。在本次比赛中,大华股份AI团队为提高场景流估算精度,减少了一系列算法模块。
首先,基于Mask-RCNN网络展开实例拆分,从场景中拆分上下班人、车辆、自行车等前景目标。接下来,基于GC-Net计算出来初始视差图,用于分段多权重loss函数、利用实例拆分结果和多尺度特征图优化初始视差结果,获得更为细致的视差图,进而提高了初始的proposalNRT子集。
最后,引进移动前景目标的刚体运动一致性约束,针对场景流不倒数区域,使用多阈值融合的策略,优化场景流估算结果。在评测中,使用场景东流和光流算法的效果和计算结果如下右图:输出图像T0时刻视差图经光流偏移同构后的T1时刻视差图T0时刻到T1时刻的光流图在大华实际产品和未来产品中的应用于本次竞赛中用于的技术已在大华股份的双目摄像机、全景摄像机等产品上获得应用于,提高多目摄像机的捕捉目标深度数据、目标分离出来等算法性能。同时,该技术也顺利应用于AR融合应用于,构建单个与多个摄像机图像的AR语义融合,很大提高行业解决方案的用户体验。
双目摄像机立体匹配应用于场景以下为颗粒物体冲刷下立体匹配的效果:双目图像左图视差图估算结果AR语义融合应用于场景以下为路面图像的AR语义融合效果,可可供强化的信息:目标类别、方位、运动矢量等。
本文来源:极速pk10-www.zfyxkf.com