如果你是一名科技爱好者,或许不会对“富岳”这个名字感到陌生。 

“富岳”是什么?它是一台算力高达44.201 TFlops(万亿次运算每秒)的超级计算机。算力相当于IBM旗下Summit超算的三倍,相当于我国“神威·太湖之光”超算的近五倍。 

那么“富岳”是目前全球最快的超算吗?昨天还是,但今天(2021年8月20日)它就已经丢掉了这个名号。 

因为就在今早,大家熟悉的新能源车企特斯拉,正式发布了他们的自研AI超算ExaPOD,其算力达到了1.1EFlops(百亿亿次运算每秒),相当于“富岳”的近两万五千倍。与此同时,与此前计划中的全球首台E级超算相比,突然登场的它更是比对手足足早了两年。 

最为重要的是,其处理器使用的也是特斯拉的自研方案。也就是今天与ExaPOD同台亮相的AI训练芯片——D1。 

造车的特斯拉,做出了当前最强的AI加速方案

对于AI行业的从业者来说,NVIDIA的RTX A6000可能是目前能买到性能最强的AI加速卡。其基本上可以被视作一块“增强版”的RTX3090,在628mm²的芯片面积上实现了高达31.29TFlops的半精度浮点算力。 

然而即便是最强AI加速卡,在今天发布的特斯拉D1面前也成为了“弟弟”。因为D1在相近的芯片面积(645mm²)上,塞进了500亿颗晶体管,实现了高达362TFlops的半精度算力。 

也就是说,特斯拉的自研AI服务器芯片一“出世”,就达到了竞争对手10倍以上的单芯片性能。 

正因为特斯拉的这款自研芯片本身单个性能就非常恐怖,所以只需要使用3000颗D1芯片互联,特斯拉就轻松地端出了当前全球算力最高的超级计算机,同时也是性能最强的AI训练设备——ExaPOD。 

特斯拉的超算为何很强?架构和用途是关键因素

那么问题就来了,为什么特斯拉的D1以及基于D1的ExaPOD超算,性能会这么强呢? 

一方面,从特斯拉方面在此次活动中公布的信息不难看出,D1这颗芯片从最初研发的时候,就已经是以“用于组成超算”为前提,其“边缘”其实都是一个速度高达40TB/s的互联连接器。 

这就是Training Tile 

所以D1芯片可以不需要依靠主板进行特殊设计,直接以“边对边”的形式就能紧凑地被连接在一起,形成一个由25颗D1芯片组成的模块式AI计算机“Training Tile”。而将多个模块再进行互联,就是AI计算矩阵“Training Matrix”。再将矩阵相互连接,就会构成一个规模上比ExaPOD要小一些的AI超算“DOJO”。 

可以说,这种“四边连接”的设计使得D1芯片和基于它的计算设备,几乎可以“无脑”扩张规模,再加上其本身的单芯片性能就很高,所以堆出恐怖的总算力自然也就并不困难了。 

但另一方面也必须要看到,特斯拉D1芯片的功能非常非常单一,它从一开始就是为AI计算而生,而且也只能用于AI计算,做不了别的事。 

在这背后,其实涉及到了一个关于“超级计算机”的冷知识。那就是对于许多超级计算机来说,制造它们的团队其实未必需要超算,而是通过对外“出租”算力牟利。也就是说,A团队今天造了台超算,但它可能其实是要同时租给B、C、D、F……等等许多研究机构或企业使用。 

因此大多数超算不只是性能高,而且还必须具备一定的通用性,它们要有传统的CPU、要有传统的GPU、也要有AI加速卡。这样一来,超算才能兼容各种不同的计算需求,例如今天渲染个3D模型,明天虚拟一下地块运动,后天推算一下蛋白质的形状等等。 

但是特斯拉的D1芯片以及由它所组成的ExaPOD超算,是需要不对外出租算力的。其所有的算力,全部都将被特斯拉“内部消化”,用于特斯拉的各种AI算法培养和迭代。所以特斯拉的AI芯片和AI超算,从一开始就可以摒除那些他们不需要的计算单元和架构,专心只为“AI计算”这一个目的服务。因此,它的算力很容易就比那些需要照顾到兼容性,拥有各种各样不同计算架构的超算,要高得多。 

世界最强的AI算力,特斯拉要用它让车“认知世界”

自主研发了全球算力最高的AI计算芯片,并基于它实现了自研自用的超强AI计算单元。所以当特斯拉获得了可能是全球最快、而且比第二名快了几万倍,甚至是独家使用的AI算力后,一个最为关键的问题就产生了,特斯拉要用这么强的AI算力干什么呢? 

通俗一点来说,特斯拉做AI的目的,最终还是用来实现马斯克梦想中的“全自动驾驶”。但是与其他车企或自动驾驶企业相比,特斯拉的方式,确实又显得格外特殊一些。 

首先大家要知道,在目前特斯拉旗下的车型上,其实已经搭载了其自主设计的一套“仿生视觉大脑”系统,它拥有8颗摄像头、一套复杂的仿生神经网络、一颗算力极高的FSD自研AI主控,以及诸多专门针对车载摄像头进行的优化设计。 

接下来,想要充分发挥这套8摄像头“视觉大脑”的潜力,就得靠特斯拉自研AI超算所培养的算法了。 

根据特斯拉方面今天公布的信息显示,他们将会利用自研的这套超级AI计算单元对特斯拉车内搭载的AI算法进行快速训练、迭代、升级。并且在升级后,未来的特斯拉仿生视觉大脑首先将能够具备“标注和仿真”能力。 

这什么意思呢?简单来说就是,就每一辆特斯拉车上所搭载的摄像头,将不仅可以拍下车身周围的环境,还能够同时将环境图像转换为虚拟的空间建模。同时周围的每一辆车、每一个行人、甚至每一颗树,以及道路的长度、宽度、形状等信息,全部都会被“投射”到这个虚拟空间中。 

这样一来,对于特斯拉的自动驾驶AI来说,它要做的事情就不再是枯燥地去识别“前方车辆大概距离还有多远”,而是更像一个游戏AI,指挥着虚拟世界里的自己进行精确行驶,并最终将这些动作指令反馈到现实中的车辆上来。 

怎么样,是不是想到了最近很火的“元宇宙”(metaverse)? 

这种“将现实实时测算并进行虚拟化,再将虚拟世界里的推导结果应用于现实”的自动驾驶逻辑还有一个好处,就是它不再需要事先输入地图进行导航辅助。事实上,这也正是特斯拉AI超算目前正在做的第二件事,就是将每一辆特斯拉都变成一个地图测量节点,最终通过AI超算的算力,形成特斯拉自己的一套“高精度地图”。 

很显然,这将使得特斯拉不再需要依赖第三方地图供应商。同时实时测算式的地图绘制,也意味着特斯拉未来的AI导航系统,或将可以迅速地对道路上的变化做出反应。例如,今天某地的道路有施工,那么很快所有特斯拉车内的导航地图可能就会有“施工”的标记,而不是像现在这样,还需要被动地等地图供应商的更新。 

当然,AI芯片的发布,并不等于AI超算立刻就能投入使用,更不等于所有的特斯拉车型很快就会变成高智能终端。但至少特斯拉让我们看到,他们又做了一些远远领先于同行的实事,而不是仅仅是在用买来的芯片、用“合作”的算法来“讲故事”。 

从这一点来说,特斯拉确实还是和他的竞争对手很不一样的。 

文图片来自网络

本文来自微信公众号 “三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。

文章来源于互联网:自研全球第一超算,特斯拉看到了自动驾驶的未来

相关推荐: 电信运营商 移动互联网

2021年8月11日,三星电子正式推出三星Galaxy Z Fold3 5G 和三星Galaxy Z Flip3 5G两款新机。其中,三星Galaxy Z Fold3 5G搭载的7.6英寸(直角)沉浸式屏下摄像折叠屏,是三星首次支持S Pen大屏书写的可折叠屏…

互联网改变了哪些行业
3g与移动互联网

Leave a Comment

Your email address will not be published. Required fields are marked *