「智能化」数据集开放,自动驾驶“共享时代”

 行业动态     |      2020-04-10 09:20

疫情期间,自动驾驶相关新闻频频登上头条。疫情催动了自动驾驶的市场需求,自动驾驶产业迎来了新的发展窗口期。“数据”在自动驾驶产业中,是教会汽车认知驾驶环境、正确决策的重要基础。海量、高质的真实数据是自动驾驶开放测试中不可或缺的“原料”。

众所周知,自动驾驶技术相当复杂,想要实现商用,花费的时间和成本对于任何一家车企或者科技公司来说都是巨大的,这些投资想要得到回报则需要更长的时间。为了打破各家企业各自为战的局面,一些企业彼此开始尝试开放有价值的自动驾驶数据集,以加快自动驾驶技术的提升,从而推动自动驾驶行业的发展。

“一直以来,自动驾驶技术的源头来自学术界”。Aptiv Automated Mobility总裁兼nuTonomy创始人Karl Iagnemma表示。“美国学术界一直推崇开源社区模式,并通过分享来带动技术进步”。

2019年8月,Waymo首次公开Waymo Open Dataset数据集,称其是全球最大的自动驾驶多模态语料库。

Waymo开放的数据集是它们自动驾驶汽车在菲尼克斯、柯克兰、芒廷维尤和旧金山等地收集的数据,包括白天、夜晚、雨天、黄昏等多种天气环境。

Waymo在其官网上表示,“该数据集并不能反映他们传感器系统的全部功能,并且这些只是Waymo自驱动系统训练数据的一小部分,但我们认为,出于研究目的,这个大型、多样化和高质量的数据集非常有价值。”

2019年4月,安波福宣布完全打开其自动驾驶汽车开源数据集nuScenes,称其为第一家向公众开放此类安全数据的公司。

福特旗下自动驾驶技术公司Argo AI,2019年6月宣布开放自动驾驶精选数据和高精度地图,供研究人员免费使用。

发布于2014年,是在牛津大学校园内路测,总长度1010.64公里,历时一年半所采集的数据集。在各种天气条件下进行收集,包括大雨,夜间,阳光直射和积雪,也包含施工路段行驶场景,具有非常复杂的天气场景,尤其适合评测计算机视觉算法。

发布于2016年,这是由奔驰采集的面向城市道路街景语义理解的数据集。Cityscapes包含50个城市在春夏秋三个季节不同时间段不同场景、背景的街景图,提供5000张精细标注的图像、20000张粗略标注的图像、30类标注物体。用PASCAL VOC标准的 intersection-over-union(IoU)得分来对算法性能进行评价。

发布于2016年,这是一段高速公路的视频数据集,包括10个可变大小的视频片段,以20Hz的频率记录。数据除了图像之外,还记录了一些测量值,如汽车速度,加速度,转向角,GPS坐标,陀螺仪角度。

国内的百度“Apollo”自动驾驶平台,也是通过开源代码,联合诸多车企达成合作。此外,小马智行和华为等中国公司,也在快速抢占自动驾驶市场的份额。2019年自动驾驶汽车脱离数据报告中,排名前十的企业中有四家来自于中国。由此可见,中外企业均在抢占自动驾驶各层面技术的标准制定和话语权。

共享数据应成为自动驾驶行业中的普遍做法,这样才能让自动驾驶更早商业化。期待有更多国内自动驾驶企业加入数据共享的行列,推动产业发展,最终让自己的产品推向市场从而盈利。