技术控

    今日:55| 主题:49157
收藏本版 (1)
最新软件应用技术尽在掌握

[其他] 黄畅博士:基于DenesBox的目标检测在自动驾驶中的应用|大牛讲堂 ...

[复制链接]
梦里见! 发表于 7 天前
62 4

立即注册CoLaBug.com会员,免费获得投稿人的专业资料,享用更多功能,玩转个人品牌!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
雷锋网 (公众号:雷锋网) 按:作者黄畅博士,地平线机器人技术联合创始人&算法副总裁,深度学习专家、前百度主任架构师(T10),长期从事计算机视觉、机器学习、模式识别和信息检索方面的研究。本科、硕士以及博士毕业于清华大学计算机科学与技术系,曾经在美国南加州大学和 NEC 美国研究院担任研究员。2012年加入百度美国研发中心,2013年参与组建百度深度学习研究院(IDL),任高级科学家、主任研发架构师。

   黄畅博士在继山世光教授以及他的博士生邬书哲的演讲之后,又补充介绍了DenseBox系列物体检测算法。大家可能对这个方法不是特别熟悉,其实早在2014年的时候地平线就已经开始围绕这个方法做了各种各样的工作,不断迭代并产生了许多新的改进,这些改进在后来的一些公开的算法中,也能看到不少影子。DenseBox已经在地平线的ADAS系统中得到了广泛引用。
  1.ADAS辅助驾驶系统中的具体问题

  黄畅博士围绕一个具体的应用——ADAS即高级辅助驾驶系统来讲目标检测。在ADAS的应用场景中,物体检测面临的问题更加困难,这个问题并不仅仅来自于对检测精度更高的要求,也来自于检测问题本身更加复杂。不仅要识别是什么东西,还需要要做精准的定位。精确的定位能够帮助人们知道物体的距离, 这对ADAS系统中的前向碰撞预警是十分重要的。
  计算机视觉当中有很多的问题,比如说检测、跟踪、识别、分割,如果在这里面选一个最重要的问题,恐怕绝大部分的同学都会选择物体检测。物体检测在各种各样的应用系统当中,往往是第一步,也是最重要一步。物体检测相对于图像识别,它的难度更大,因为检测还需要对物体进行精确的定位,还是个搜索问题。在ADAS 产品当中,车辆检测是一个非常重要的问题,同时也面临巨大的挑战。以KITTI车辆检测数据集为例,比如说这个车辆,在画面当中只出现一部分,这个是truncation导致的问题;然后车辆大小差距很大,这是scale variation导致的问题;然后车辆因为视角的原因,会被很多车辆遮挡,这是occlusion导致的问题;这些都是物体检测面临的挑战。
  那么如果直接尝试用Faster R-CNN或者YOLO,会出现什么样的问题呢? 首先不能很好地处理面积非常小的物体,因为这些方法,尤其是YOLO,最终在分类的时候是基于低分辨率的特征图像,这导致原图像中面积很小的物体在经过多次的卷积之后,其信息很难在低分辨率的特征图中进行保存。
  2.地平线的解决方案

  地平线提出的方法叫做DenseBox(V2)。相比起YOLO以及SSD,最明显的不同在于DenseBox(V2)输出预测图的分辨率很高。用DenseBox(V2)的方法,输出大小为原始图像的八分之一, 即在原图中每移动8个像素,输出中就有一个对应的检测框,这就保证能够在结果中保留小的物体以及严重遮挡的物体。
  

黄畅博士:基于DenesBox的目标检测在自动驾驶中的应用|大牛讲堂 ...-1 (清华大学,计算机科学,加入百度,模式识别,机器人)

  2.1 标注生成与模型设计
   要训练一个检测物体的神经网络,首先要用结构化的信息去描述图像。对于那些关注的物体,地平线会在合适的尺度和合适的位置进行像素分类,即判断物体中心是否在这个像素附近。其实有点像把物体检测问题,变成一个图像分割问题来看待。对于很可能包含物体的图像区域,还需要知道物体的检测框在哪里。针对检测框,地平线用两个点来描述,即框的左上角和右下角。
  地平线设计的网络还有一个特点,就是对于不同的尺度输出有不同的分支。网络底层的卷积被所有分支共享,用来学习低层的图像特征,到了中间以后,会逐步分出三个分支, 去描述三个尺度上物体的分布。以左边的图为例,一大一小的两辆车,都可以在网络中找到合适的尺度去定位。除了产生正样本的区域, 即左图中红色的区域外, 还会产生灰色的区域(gray zone) 或者是说模糊的区间。这些灰色地带被判别为正样本或者负样本都是不合理的, 训练的时候模型不应该对这些区域的预测正确与否产生惩罚。
  


黄畅博士:基于DenesBox的目标检测在自动驾驶中的应用|大牛讲堂 ...-2 (清华大学,计算机科学,加入百度,模式识别,机器人)

  正如前面所提到,除了产生正负样本区域以外,还需要回归物体框的位置。地平线用相对距离去描述框的位置,相对于当前这个物体的中心,框的两个角点水平和垂直方向距离是多少。在实际应用中,地平线发现一个很重要的小技巧,可以提升检测框的定位精度。不仅仅要对正样本做回归,对于灰度区域(gray zone)也需要做回归。这么做的目的是希望检测器即使把灰度区域当成正样本,那么还要求检测框的位置是准确的。
  

123下一页
友荐云推荐




上一篇:Ubuntu与Win10周年版Ubuntu Bash性能对比
下一篇:利用封装、继承对Java代码进行优化
酷辣虫提示酷辣虫禁止发表任何与中华人民共和国法律有抵触的内容!所有内容由用户发布,并不代表酷辣虫的观点,酷辣虫无法对用户发布内容真实性提供任何的保证,请自行验证并承担风险与后果。如您有版权、违规等问题,请通过"联系我们"或"违规举报"告知我们处理。

各种累 发表于 7 天前
有钱任性
回复 支持 反对

使用道具 举报

gotodies 发表于 7 天前
幸好爱情不是一切,幸好一切都不是爱情。
回复 支持 反对

使用道具 举报

关系不明不白 发表于 5 天前
你说吧,你是想死呢还是不想活了?
回复 支持 反对

使用道具 举报

__淡忘_de一切 发表于 4 天前
和你擦肩而过你却不知道是我,因为我把头扭过去了。 
回复 支持 反对

使用道具 举报

*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

我要投稿

推荐阅读

扫码访问 @iTTTTT瑞翔 的微博
回页顶回复上一篇下一篇回列表手机版
手机版/CoLaBug.com ( 粤ICP备05003221号 | 文网文[2010]257号 )|网站地图 酷辣虫

© 2001-2016 Comsenz Inc. Design: Dean. DiscuzFans.

返回顶部 返回列表