北斗全球卫星导航系统平均精度(北斗全球卫星导航系统平均精度2到3米)

arxiv202210月论文论文题目:Dimensionalityofdatasetsinobjectdetectionnetworks论文地址:摘要近年来,卷积神经网络(cnn)被大量应用于计算机视觉的任务中,其中之一是自动驾驶的目标检测,尽管cnn被广泛应用于许多领域,但网络内部发生的事情

北斗全球卫星导航系统平均精度(北斗全球卫星导航系统平均精度2到3米)

arxiv 2022 10月论文

论文题目:

Dimensionality of datasets in object detection networks

论文地址:

https://arxiv.org/abs/2210.07049

摘要

近年来,卷积神经网络(cnn)广泛应用于计算机视觉自动驾驶的目标检测是任务之一。虽然cnn在许多领域得到了广泛的应用,但在许多层面上仍然无法解释网络中发生的事情。我们的目标是确定不同层次的内维数(即数据所需的最小参数)对扩大数据集目标检测网络精度的影响,根据我们的研究,正常数据和增强数据的表示在特征提取过程中存在差异。

1 .介绍及相关工作

自动驾驶是计算机视觉研究的热点领域,神经网络自动驾驶系统不可分割的部分通过神经网络处理图像和激光雷达点击预测目标,例如,2016年,天气变化导致自动驾驶汽车灾难性后果的事件已经见证,特斯拉自动驾驶汽车无法区分白色拖拉机和明亮的天空。我们的目标是估计在正常数据上训练的目标检测网络中增强数据集的本征维数(ID),观察噪声或仿射变换引起的数据表示的变化。我们的目标是估计在正常数据上训练的目标检测网络中增强数据集的本征维数(ID),观察噪声或仿射变换引起的数据表示的变化。Bac指出,ID估计在选择机器学习方法及其应用程序(包括验证、部署和可解释性)时非常重要。从内存需求和计算时间的角度来看,内部空间中的标签识别是有效的,在输入中添加噪声会增加ID。在我们的研究中,使用Twonn算法(图1)来估计ID,它基于两个最近邻居之间的距离比,这使得它具有很高的计算效率,克服了数据位于弯曲流形中的问题。即使有少量的点,也使用Twonn算法从现有的局部和全局ID估计器中进行ID估计。

北斗全球卫星导航系统平均精度(北斗全球卫星导航系统平均精度2到3米)

本文的目的是首先验证类似的特征形状在增强数据集时是否明显。其次,分类层ID提供了网络性能的想法。第三,如果ID因不相关特征而增加,第四,增强数据是否表现为未经训练的网络?研究不同数据对增强的影响,使用三个数据集。ID在KITTI , MS FasterCOCO和VOC数据集 R-VGG-16用于CNN, VGG-19[骨干分析。观察到KITI数据垂直位移增强引起的ID增加。对于所有数据集,旋转图像的行为与未经训练的网络中的数据相似。COCO数据在分类层的维度行为与KITI和VOC相反。

2内在维度

表示数据在神经网络中的几何特征之一是内禀维,即表示数据而不丢失信息所需的最小坐标数。局部ID估计器计算数据表示局部子空间,全局ID估计器计算整个数据点表示全局和局部ID估计器可以用来替代数据邻域的估计。我们的目标是估计目标检测网络中不同层次的ID,并确定数据的平均精度与估计ID之间的关系。ID特征可以区分局部空间中正常生成的样本和对抗生成的样本。

这促使我们在整体空间中进行ID估计实验,本文采用Twonn算法进行ID估计。

?计算数据集中每个点的成对距离。

?对于每一点,我找到两个最短距离R1和R2,并计算它们μi = (r1/r2)。

?通过排列σ将μ按升序排序,然后定义积累F的经验 emp(μσ(i)) .= i/N。

?用直线拟合坐标穿过原点{log(μi),?log(1?Femp(μi))}平面上给出的点。

即使是从不均匀概率分布的数据中采样,直线的斜率也给出了ID的估计值。

3实验

本文在Faster中计算了VGG骨干网各池化层上的ID(标记为pool1…pool5) R-在CNN中,经过特征提取层后,建议在区域内分类网络(rpn c)和包围盒层(rpn b)上计算ID,然后是ROI池层(ROI),FC层的第二层(FC),最后是分类层(cls p)和包围框层(box p),在Retinanet中,ID在VGG骨干的每个池化层中计算。接下来计算ID的层是分类头卷积(cls h)块,分类(cls l)层,回到头卷积(框h)块和包围框(框r)层,ID之所以在一个层后计算,而不是每个单层,是因为在VOC数据训练中计算需求的Faster R-CNN模型估计MS IDCOCO数据集,或者在COCO数据训练模型上估计VOCID(图3b)的数据集。表2中的其他增强是水平移动,图像向左或向右移动取决于-0.7到0.7之间产生的随机数和垂直移动,类似于水平移动,除非平移发生在图像的顶部或底部。

北斗全球卫星导航系统平均精度(北斗全球卫星导航系统平均精度2到3米)

在区域推荐网络的ID估计中,由于我们的ID估计算法的限制,即每个图像在网络层上表示一个点,导致RPN后各层的ID没有变化,因此使用得分最高的包围框作为ROI池层的输入。

当区域建议网络的ID估计时,由于我们的ID估计算法的限制,即每个图像在网络层上表示一个点,导致RPN后各层的ID没有变化,因此使用得分最高的包围框作为ROI池层的输入。当使用得分最低的边界框时发生了什么?我们的结果没有影响,因为平均精度取决于网络预测的所有对象。另一个原因是,如果边界框没有预测,图像将从我们的估计过程中删除,因为在这种情况下,ROI池层将不用于表示数据点。计算高维张量(4000)1200像素的正方形图像 x 2304000时的内存要求为33.8G。因此,为了减少计算量和节省时间,ID估计使用400张图像。为了检查结果的稳定性,估计了小尺寸和大尺寸的ID。当图像较大时,ID值较高,但当绘制用于估计ID的层时,ID遵循类似的结构,可以在我们的知识库里(https://github.com/ajaychawda58/ID_CNN)找到相关图片。

4 结果

北斗全球卫星导航系统平均精度(北斗全球卫星导航系统平均精度2到3米)

根据分类任务,在训练网络中,驼背形状明显,在未经训练的网络中,网络显示平面轮廓,在我们的实验中,观察旋转图像轨迹更平坦(图2),表明旋转图像在流形有较差的表示,从对旋转图像的评估来看,平均精度(表1)低于所有数据集中的其他增强。

北斗全球卫星导航系统平均精度(北斗全球卫星导航系统平均精度2到3米)

如图2所示,其他在不同层次上有不同ID的增强数据集的驼背轮廓,因此它们在网络中表现得比旋转图像更好。KIITI垂直位移(图2a)具有较高的ID ~ pol1层有ID的正常数据 ~ 84.这可能是因为一些不相关的特征,比如用插值填充调整大小的图像来增加ID,也可能是因为KITI的原始图像大小是1200 x 当图像垂直移位,通过插值填充空像素时,350左右,对于网络来说,增加的像素是一个无关的特征。与COCO和VOC(图2b和2c)相比,垂直位移与正常数据没有太大区别。因此,由于COCO和VOC的长宽比接近1:1.KITI图像的长宽比为3:ID增加可以确认。如果位移的增加只是由于移位图像的填充,这种情况也会发生在水平移位图像中,但水平移动的ID没有添加到初始池化层中,这支持我们的说法。

分类层ID无法预测目标检测性能。在我们的例子中,最后一个隐藏层(FC层)ID也与AP无关(表1)。因此,无法确认ID和AP在数据集中的依赖性,但ID的差异可以在特征提取层面上观察到。这促使我们以后用不同的方法来研究我们的假设。对比图2a、图2b和图2c,我们观察到KITTI和VOC数据中分类层的ID低于包围盒层,而COCO数据相反,分类层的ID高于包围盒层,这可能是由于大量类别(n=91)分类层网络泛化不良。在VOC数据培训模型中评估COCO数据,反之亦然。我们的目标是研究在另一个数据集中培训的网络中不同数据集的行为。在两个数据集中,Pool3层的ID减少,这可以归因于网络中影响这个特定层ID类数量的变化,因为网络中的其他超参数在两个数据集中是相同的。

结论及未来工作根据目标检测网络中估计ID的数据,将结果与分类任务进行比较,观察其在特征提取水平上的可比性,但在区域建议网络之外没有。由于ID估计器的选择,该方法受到限制,但在主要水平上仍然观察到有趣的行为,促使人们继续使用不同的估计器进行研究。进一步的研究将继续比较当前的结果和不推荐的增强和在线培训模型YOLO,并使用现有的方法来消除ID估计的瓶颈。我们的工作从基本层面开始,通过估计Faster R-CNN上的数据集ID显示了该方法的新颖性,并希望在未来找到更多关于目标检测网络的解释。进一步的研究将继续比较当前的结果和不推荐的增强和在线培训模型YOLO,并使用现有的方法来消除ID估计的瓶颈。我们的工作从基本层面开始,通过估计Faster R-CNN上的数据集ID显示了该方法的新颖性,并希望在未来找到更多关于目标检测网络的解释。

顶级复刻,货到付款,质量保证,对版发货,售后五年,添加 微信:AFZF66  备注:时间圈

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 1032933037@qq.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.dayunb.com/5056.html