Cruise出行计划继续推迟,CTO 首度承认特斯拉数据规模的优势

  • 小编 发布于 2019-11-22 01:39:08
  • 栏目:科技
  • 来源:智车科技
  • 9574 人围观
Cruise出行计划继续推迟,CTO 首度承认特斯拉数据规模的优势

今年6月,通用汽车(GM)自动驾驶子公司 Cruise 宣布将推迟推出无人驾驶出租车服务。而此前,Cruise曾表示将于2019年推出无人驾驶出租车服务,19年马上就要结束,可以说Cruise的出行计划将继续推迟了。Cruise曾被认为与Waymo的技术不分伯仲,Waymo已上路,Cruise为何迟迟没有大动作?

近日,Cruise CTO Kyle Vogt在MIT上发表主题报告,叙述了Cruise在发展中的关键因素,他首度承认了数据规模的重要性,从中或许可以找到Cruise慢下来的原因。

Cruise出行计划继续推迟,CTO 首度承认特斯拉数据规模的优势

自动驾驶很烧钱

在讨论关键技术之前,Kyle Vogt表示“自动驾驶研发真的很烧钱”。Cruise的团队在GM,Honda,Softbank 共有1500余人,去年共筹集到75亿美元。这对于小型公司或者初创公司来说,真的很难实现。

Cruise出行计划继续推迟,CTO 首度承认特斯拉数据规模的优势

“移动出行”就像是吃饭和呼吸一样,无时无刻的发生在我们身边,所以这其中蕴含着巨大的商业机会。数据显示,在美国每年有超过100人死于汽车事故。汽车事故已经成为青少年的头号杀手。

cruise 在旧金山有大量的自动驾驶测试车辆,他们希望这些车都能上路,让这些车成为比人类开车更安全的存在。

机器学习是无人驾驶的关键推动力

传统的造车流程,需要大量的资金和人力。诸如像GM一样有完整供应链的汽车公司,造出一辆新车也需要至少2000名工程师共同努力数十年,花上十几亿美金才可以完成。如今,可以说机器学习以及相应的计算机技术几乎驱动了完全自动驾驶。众所周知,自动驾驶汽车在真正的路上会遇到各种各样的问题,需要系统判断成千上万的场景下,自动驾驶系统如何决策,这是非常复杂的系统,并不是一个简单的按照道路标志线规定的系统。

另外,自动驾驶系统还需要在不同的情况下感知外界环境和其他交通参与者,如举着STOP标志牌的人。而如今,机器学习和相应的计算机技术使这些问题得到了最大程度上的解决。

Cruise出行计划继续推迟,CTO 首度承认特斯拉数据规模的优势

大规模数据的重要性

Kyle Vogt提到我们需要大量数据和大量驾驶的原因是,试图将拥有的数据集的熵和多样性最大化,以此来驱动复杂的自动驾驶程序。

Cruise出行计划继续推迟,CTO 首度承认特斯拉数据规模的优势

目前,如果想要一个数百万英里行驶数据的标记数据集,花费大约要数十亿美元。所以Kyle Vogt认为自动标记是十分重要的。自动标记即在拥有大量数据的情况下,将手动标记的步骤从循环中剔除,然后从车辆的行驶方式判断其数据标记的正确性。

熵(Entropy)和自动标注(Auto-labeling)成为本次演讲Kyle Vogt传达出的两个关键词。在这里熵其实可以理解为那些不可预测的数据点,表示数据集既要多样性,也要有一些难以预料的数据。而相比于人工标注,他对自动标注是认可的。

Kyle Vogt的说法似乎从一个方面证实了特斯拉数据的有效性,对于特斯拉在真实世界积累的数据而言,有人提出如果不付费人工标注的话,如此庞大的数据集并没有太大用处,而一些研究证实了通过自动标注数据集的有效性。比如通过深度学习查询安装在车后的自行车,新颖性测试(novelty detection),不确定性估计(uncertainty estimation)等。


Cruise出行计划继续推迟,CTO 首度承认特斯拉数据规模的优势


换句话说,使用手工标注和机器标注的组合来触发上传,更高数量的数据将得到更高质量的数据集。

借助自动标记,特斯拉可以利用大量数据来进行以下操作:1)用于计算机视觉的弱监督学习,2)自我监督(或无监督)学习以进行预测,以及3)模仿学习(可能还有强化学习)等。

总之,Kyle Vogt从侧面表达了特斯拉数据集的有效性。

【欢迎大家提供行业新闻热点,商业合作请联系:18562613430】

转载请说明出处:五号时光网 ©