原来特斯拉造的不是车是机器人

飞兔中文网 11 0

  如今,距离2019年特斯拉「自动驾驶日」已经过去了两年的时间。

  在当年活动上,特斯拉CEO埃隆·马斯克对自动驾驶技术未来做出了无数美好的预测。其中最著名的,莫过于那句,在2020年中期,将有100万辆特斯拉自动驾驶车辆上路,人们驾车时甚至「可以在车上睡觉」。

  一晃眼,两年多过去了,特斯拉完全重写的FSD系统依然在美国内测。在8月19日举办的「特斯拉人工智能日(以下简称特斯拉AI日)」上,马斯克也已决口不提当年的雄心壮志,而是把目光投向了一项更具科幻色彩的目标:造人。

  这就是特斯拉AI日上最精彩一幕:在介绍完各种令人昏昏欲睡的FSD开发和Dojo超级计算机芯片数据名词后,马斯克话锋一转:「有了如此强大的传感器和数据处理芯片,因此,我们在明年可能会研发出这样一个原型产品。」

  随后,一位身穿黑白紧身衣的演员走上前台,疯狂旋转、尬舞。站在一旁的马斯克则打趣道:「这个跳舞的家伙显然不是真正的机器人,但是特斯拉机器人(TeslaBot)将是真实的。」

  对这样一个以日本特片形式首先展示在人们面前的机器人,马斯克本人也没有更详细的介绍,只用几页PPT的寥寥数语,勾勒了大致的轮廓:

  「体能」上,TeslaBot身高约1.73米,体重约56.7公斤,能搬动最多20公斤的重物,单只胳膊的最大承重为4.5公斤,能以时速8公里/小时的速度奔跑。

  「外观造型」上,大家一眼便知,这台机器人拥有和人类一样的四肢,全身使用轻量化材料和40个电子机械传动装置。它的头部,还有张「脸」——一块显示信息的面部显示屏。

  把TeslaBot拆开,隐藏在躯体下的,是特斯拉各项技术的加持:Autopilot像头组成「双眼」、FSD芯片构建起「大脑」、神经网络算法+数据模拟系统+Dojo超级算力组成其「灵魂」。

  马斯克表示,最快大约在明年就会推出TeslaBot的原型产品。

  至于为什么能做、为什么要做,马斯克的解释是「因为特斯拉已经几乎拥有制造类人机器人所需的部件和技术,特斯拉车辆本身就类似带轮子的机器人」,而打造TeslaBot的目标是「为人服务,对人友好,希望把人从危险、重复、无聊的工作中解放出来。」

  「最起码,它应该能胜任去超市买个菜这种简单的工作。」马斯克这样说到。

  TeslaBot一经发布,媒体报道中就又传出了「马斯克坐实当代钢铁侠」的标题,但是相信大家内心都隐藏着一丝疑惑:这玩意明年真能造出来?马斯克怕不是又在「放卫星」?

  对此,在发布会上马斯克的只言片语之中也能找出一点端倪。他自己很诚实地说「这可能不会实现」(probablywon'twork),并紧接着说,更希望TeslaBot能激起大家的热情,选择加入特斯拉。

  要知道,特斯拉AI日其实是在美国加州举办的一系列技术讲座,其更重要的目的是招聘机器学习人才。

  好吧,特斯拉在造人之前,可能更重要的工作是招人。

  正如文章开头提到的,TeslaBot堪称是整场特斯拉AI日最提神醒脑的环节,但在两个半小时的活动中,它实际仅占了不到20分钟的时间。

  发布会最重磅内容,还是围绕特斯拉FSD自动驾驶技术研发、神经网络学习系统实践、Dojo超级计算机芯片算力等硬核AI技术展开。

  而之所以把最抓眼球的TeslaBot放在最开头介绍的原因嘛……

  于是,本着说人话、让大家能明白的原则,在此就从本次发布会最核心的D1芯片入手,尝试为大家多聊聊这句苍白乏力的赞叹背后,特斯拉到底有多「牛X」。

  对于Dojo超级计算机,熟悉特斯拉和自动驾驶技术的朋友相信都有所耳闻,而对更多不关心技术的消费者们来说可能非常陌生。

  Dojo来源于日语「道场」,这是一台用来训练特斯拉自动驾驶能力的超级计算机。全球超100万辆特斯拉行驶的数据,汇聚到这个「道场」里,帮助特斯拉FSD自动驾驶技术不断完善。

  还是觉得一头雾水?我们不妨用三个东西来做类比:

  第一个,是电影《黑客帝国》中,当主角Neo初次回到现实世界,在脑后插管「一插一拔」之后,醒来对Morpheus说出的那句著名的:「Iknowkongfu(我学会了功夫)」

  第二个,是英剧《福尔摩斯》中,「卷福」在遇到问题时,开启的「记忆宫殿」。

  第三个,则让我们回到现实,当AlphaGo在战胜所有人类顶尖围棋高手后,实现了「自我学习」——自己和自己下棋,到另一个维度不断精进棋艺。

  特斯拉要做Dojo超级计算机的逻辑,和上面三个案例的类似,就是把海量特斯拉车辆搜集到的路面数据集中到一个AI大脑里面,让计算机自己在「头脑」中模拟各种交通路况,锻炼、优化自动驾驶能力。

  这也是马斯克在自动驾驶研发上坚持「视觉识别」而非「激光雷达+高精地图」路线的底层逻辑:自动驾驶,是要让车辆「自己学会开车」,而非遵循地图路线和雷达的反馈来「自动行驶」。

  即通过另一个洋气的名词:「神经网络计算」来实现车辆的自动驾驶。

  好嘛,还没有正式进入D1芯片的介绍,我们又遇到了一个老大难,「神经网络计算」到底是个啥?

  本着说人话的原则,我们把一台特斯拉车辆上的8颗像头类比成车辆的眼睛,能「看到」车辆周围交通状况的视频和图片数据。

  但随后的问题是,「眼睛」看到了,「智商」可能不到位,车辆弄不明白看到的是雪糕筒还是工程车,因此还需要有神经、有大脑。

  这又要引出人工智能领域的另一个名词:「监督学习」——数据在给到算法训练前,需要先经过人工标注。

  最基础的部分,就是在各种自动驾驶视频中常见的物体上的框框,需要人手工将图片上的机动车、非机动车、行人、红绿灯等用不同形状的框标注出来。

  说句题外话,新华社曾经报道,仅北京一座城市就有100多家专门从事数据标注的公司,而全国有超过1000万人在从事数据标注工作。这也是一向头顶高精尖光环的人工智能技术却又被揶揄「数字富士康」、「劳动密集型产业」的主要原因。

  特斯拉的方式,可以说是把人工标注和机器标注,做一个结合。一方面,开发了HydraNets(九头蛇网络)多任务学习神经网络,可以同时处理目标检测、交通标志识别、车道预测等等任务。同时,该公司组建了超过1000人的数据标签团队,进行数据标签和分析性基础工作。

  这项工作目前也取得了不错的成效:标注的准确性大大提高,同时从2D图像标签,进化到了如今的4D空间+时间的标签。甚至能够在做一次标签之后,一个像头内的标签化图像,就能迁移到其他像头。

  目前全球有近100万辆特斯拉汽车在公路上行驶,每个月大约会产生超过2亿小时的视频数据。有了如此多的数据积累,特斯拉甚至已经能做到在系统中实现「仿真」——将真实世界的事实动态,在系统中重建。

  于是,就有了上面这张看上去很像电子游戏的场景图片,不过这个游戏不是给人玩的,而是模拟不同交通驾驶状况,让特斯拉车辆来「锻炼车技」的。

  特斯拉表示,现在标注和仿真系统,可以模拟数量高达3.71亿的数据及场景。

  那么,既然有了如此多的数据,特斯拉的系统也能够在云端「仿真」不同的交通路况,靠什么来处理这些数据、使用这个仿真世界、锻炼特斯拉自动驾驶系统呢?

  对,就是Dojo超级计算机。

  准确地说,此次AI日的最重磅消息并不是Dojo计算机正式投入使用(马斯克说得等到明年,谁知道会不会跳票),而是展示了Dojo超强算力的基础——D1芯片。

  然后,如果像其他文章中那样介绍D1的话,咱们就不得不面对一大堆枯燥乏味的数据和参数……

  绕过参数,让我们看看Dojo的核心算力是怎么构成的,于是就出现了下面这张曾让我误以为是电池包的「训练模块」。

  Dojo的核心算力组成和电动车电池模组的构成颇为类似,最基础的是D1芯片。真想了解参数的硬核读者可以看下面这张图,不愿意费脑子的话,就记住这块芯片算力很牛X。

  然后,25片D1芯片组成一个小巧的训练模块,带来更牛X的9PFLOPS(0.9亿亿次/秒算力,注意不是多打了一个「亿」字。)

  最后,把120个训练模块,相互联结,放到几个机柜里,用3000多个D1芯片就组成了算力最牛X的DojoExaPOD。(超过100亿亿次/秒算力。)

  而如此大的算力之下,特斯拉表示其每单位能耗下的性能比当今最强超级计算机高1.3倍,但碳排放仅为1/5。

  这也是符合特斯拉「最佳AI训练性能、更大更复杂神经网络、能耗成本优化」的设计思路。

  于是特斯拉很自豪地明确表示:Dojo就是全球最快的AI训练计算机,并且这仅仅只是开始,下一代Dojo还将得到10倍的性能提升。

  问题是,一直写到最后的时候,我依然有些疑惑,在马斯克亲手将数字货币价格在全球炒上了天、消费级显卡尚一卡难求的当前,如此强大的超级计算机芯片,技术上能实现,产能上真能在明年完成吗?

  行吧,还是用这张李安的图片来作为特斯拉AI日的结尾吧。

  要知道,相比特斯拉超级计算机和马斯克的机器人,其实更让我在意的是前几天一条互联网新闻:「腾讯再投500亿助力共同富裕。」

标签: 机器人

抱歉,评论功能暂时关闭!