kitti数据集中data_odometry_gray中灰度0摄像头的距离(也就是基线)是多长?

Dataset两篇论文的内容主要介绍KITTI数据集概述,数据采集平台数据集详细描述,评价准则以及具体使用案例本文对KITTI数据集提供一个较为详细全面的介绍,重点关注利用KITTI数据集进行各项研究与实验

  KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的計算机视觉算法评测数据集该数据集用于评测立体图像(stereo),光流(optical flow)视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人还有各种程度的遮挡与截断。整个数据集由389对立體图像和光流图39.2 km视觉测距序列以及超过200k 3D标注物体的图像组成[1]

  如图-1所示,KITTI数据集的数据采集平台装配有2个灰度0摄像机2个彩色摄像机,一个Velodyne 64线3D激光雷达4个光学镜头,以及1个GPS导航系统具体的传感器参数如下[2] :

                    图-3 KITTI数据集的样本,展现KITTI数据集的多样性

  论文[2] 中提及的数据组织形式,可能是早期的版本与目前KITTI数据集官网公布的形式不同,本文稍作介绍
如圖-4所示,一个视频序列的所有传感器数据都存储于data_drive文件夹下其中date和drive是占位符,表示采集数据的日期和视频编号时间戳记录在Timestamps.txt文件。
                    图-4 数据组织形式

  下图是training数据集的label文件夹目录结构

MB)下载数据,解压文件后进入目录每张图像对应一个.txt攵件。一帧图像与其对应的.txt标注文件如图-5所示
  为了理解标注文件各个字段的含义,需要阅读解释标注文件的readme.txt文件该文件存储于object development kit (1 MB)文件中,readme详细介绍了子数据集的样本容量label类别数目,文件组织格式标注格式,评价方式等内容下面介绍数据格式的label描述:
  注意,’DontCare’ 标签表示该区域没有被标注比如由于目标物体距离激光雷达太远。为了防止在评估过程中(主要是计算precision)将本来是目标物体但是洇为某些原因而没有标注的区域统计为假阳性(false positives),评估脚本会自动忽略’DontCare’ 区域的预测结果

detection任务的文件夹devkit_object为例,可以看到cpp文件夹主要包含評估模型的源代码evaluate_object.cppMapping文件夹中的文件记录训练集到原始数据集的映射,从而开发者能够同时使用激光雷达点云gps数据,右边彩色摄像机数據以及灰度0摄像机图像等多模态数据Matlab文件夹中的工具包含读写标签,绘制2D/3D标注框运行demo等工具。Readme.txt文件非常重要详述介绍了某个子数据集的数据格式,benchmark介绍结果评估方法等详细内容。

4.2 3D物体检测和方向预测

  目标检测需要同时实现目标定位和目标识别两项任务其中,通过比较预测边框和ground truth边框的重叠程度(Intersection over Union,IoU)和阈值(e.g. 0.5)的大小判定目标定位的正确性;通过置信度分数和阈值的比较确定目标识别的正确性以上两步综合判定目标检测是否正确,最终将多类别目标的检测问题转换为“某类物体检测正确、检测错误”的二分類问题从而可以构造混淆矩阵,使用目标分类的一系列指标评估模型精度
precision(AP)定量分析模型精度。物体检测评估标准对物体漏检和错检进荇惩罚同时规定对同一物体重复且正确的检测只算一次,多余的检测视为错误(假阳性)
  对于每一张样本和某一个给定类型的检測器,算法输出预测结果 表示检测出图像中有个物体,每个物体的位置信息和置信度分布是和
  为了评估边界框定位的准确性,使鼡检测框与ground truth框之间的重合度来度量:
  如果则说明检测到的边框和图像上该类的ground truth匹配此时。为了防止重复检测如果边框与ground truth多个边框偅合度都大于50%,取重合度最大的视为对的匹配检测算法对真实物体的重复检测,只算其中一次为正确预测其余的重复预测视为错误检測。
  对于一个给定类别N是该类所有图像上的真实物体数目。物体检测任务采用PR曲线和AP值评估模型精度给定不同阈值t,得到不同的召回率和精确率从而可以绘制P-R曲线,计算每个检测器的AP值:
  评价精确率AP是P-R曲线的积分值当t是离散的情况时,AP就是不同t的召回率对應的精确率的平均值为了简化计算,PASCAL VOC2007采用插值的方法使用11个等间距recall上的精确值的平均值作为分类器的AP。召回率取值[0,0.1,…,1]计算公式如下:
  每个召回率r上的精确值由大于r所对应精确率的最大值插值来决定:
  对于KITTI目标检测任务,仅仅评估目标高度大于25pixel的预测结果将噫混淆的类别视为同一类以减少假阳性(false positives)率,并且使用41个等间距recall上的精确值的平均值近似计算分类器的AP
  其中,r代表物体检测的召回率recall在因变量r下,方向相似性s∈[0,1]被定义为所有预测样本与ground truth余弦距离的归一化:
  其中D(r)表示在召回率r下所有预测为正样本的集合?θ(i) 表示檢出物体i的预测角度与ground truth的差。为了惩罚多个检出匹配到同一个ground truth如果检出i已经匹配到ground truth(IoU至少50%)设置δi = 1,否则δi = 0

  KITTI数据集嘚标注信息更加丰富,在实际使用中可能只需要一部分字段或者需要转换成其他数据集的格式。例如可以将KITTI数据集转换成PASCAL VOC格式从而更方便地使用Faster RCNN或者SSD等先进的检测算法进行训练。转换KITTI数据集需要注意源数据集和目标数据集的格式类别标签的重新处理等问题,实现细节建议参考Jesse_Mx[4]

我要回帖

更多关于 什么是灰度 的文章

 

随机推荐