抛开马斯克自我造神,是时候重新认识特斯拉了。
特斯拉官网宣称是电动车、太阳能和清洁能源公司,在某些人眼中,因备受争议但持续进化的自动驾驶技术,特斯拉是人工智能公司。不久前特斯拉首次AI Day,因酷似人形的机器人Tesla Bot发表,不少人开始认为特斯拉是机器人公司。马斯克经常说的话是:特斯拉是众多新创公司的集合。
(Source:影片截图)
然而AI Day特斯拉透露的真正讯息是:运算公司。
“运算公司”(Computing Company)看起来是个大而不当的概念──尤其遍地都是“算法”的网络世界。然而算法更是软件概念,基于一定结构的数据输入产生新结果。除了数据和算法,构成“运算”的更核心部分是“算力”,也就是运算装置──无论超级电脑、智能手机还是智慧网联车──的数据处理能力。很大程度是硬件能力,也就是芯片和运算模组能力,这才是“运算”的本质。
从这意义说,某些充分掌握人工智能“算法”而未掌握核心“算力”的公司,并不能称做“运算公司”,如开发今日头条、抖音和TikTok的字节跳动,就还不能算运算公司。中国华为是当之无愧的运算公司,阿里巴巴和百度也逐渐成为运算公司;美国英特尔、AMD和辉达都是称得上老牌运算公司,苹果和Google是新晋运算公司;抱歉,亚马逊和Facebook还不是运算公司。
现在“运算公司”的名单还多了特斯拉。
比起神乎其技的机器人Tesla Bot,特斯拉AI Day发表的“D1”芯片和超级电脑平台“Dojo”才是重头戏:意味特斯拉像苹果,具备整个生态从上游到下游,都握在手里的基础能力。
“D1”是AI训练芯片,当然也是运算芯片。采用7奈米制程,单片FP32达算力22.6TOPs,BF16算力达262TOPs。据特斯拉展示,单颗D1芯片的神经网络算力超过一块显卡,也就是说特斯拉D1比辉达GPU和Google的TPU性能都强。
特斯拉自动驾驶硬件高级总监、Dojo计划负责人Ganesh Venkataramanan说,D1“完全是由特斯拉团队设计的芯片,从架构到封装。芯片就像GPU,但又有CPU等级的灵活性和两倍网络芯片的上传/下载带宽”。所以D1芯片既不是CPU也不是GPU,而直接称为“Pure Learning Machine”(纯学习机器)。
一颗颗D1芯片无缝连接,构成25颗D1芯片组成的机器学习模组,再把多个模组整合,就构成一台特斯拉自研的超级电脑Dojo。Dojo是日文英翻,为“道场”之意,也就是修练场所。“修练”意象正符合超级电脑最核心的功能:数据模型无休止的机器学习和神经网络训练,练成超级大脑。
Dojo有超过50万个训练节点,每个节点算力为9千兆浮点运算(fetaflops)。基于Dojo架构,特斯拉又发表ExaPOD──整合120个训练模组,包含3,000颗D1芯片,超过100万个训练节点,算力超过1,100千兆浮点运算。特斯拉说:这就是全球最快的AI训练计算机。身为非常喜欢用“概念替换”无限放大自身优势的公司,特斯拉甚至想宣称:这是全球性能最强的超级电脑。
然而神经网络训练为主要功能的电脑,特斯拉的“千兆浮点运算”指的其实是低精度算力,而非超级电脑性能的通常参考值双精度浮点算力。照后者性能运算,特斯拉Dojo排名约世界第七,落后日本富岳(Fugaku)、美国IBM Summit、美国Sierra、中国神威太湖之光、美国Selene和中国天河2-A。特斯拉说,Dojo性能下一代会有10倍提升──据这家公司的历史,很难排除“吹牛”成分,但特斯拉优势在于,比起人工智能领域遍地的“吹牛不上税”玩家,总能做得更到位。
Dojo号称世界最强的神经网络训练电脑,将专注做一件事──训练特斯拉完全基于纯视觉而非光学雷达的自动驾驶。特斯拉全球有几百万辆开上高速公路的汽车,这是有大量数据支撑的实验。特斯拉AI技术负责人Andrej Karpathy解释Dojo超级电脑对纯视觉自动驾驶的意义:一辆特斯拉车的8个镜头,能检测够多图像数据和预期目标,但背后神经网络向量空间不够。特斯拉基于Dojo运算平台重新设计神经网络系统,当成自动驾驶系统的决策依据。
也就是说,过去特斯拉自动驾驶眼睛好,但脑子不够用(不知道是不是自动驾驶刹车系统常出bug的原因),现在特斯拉重新给每辆车新大脑。这是“算力”力量,只有“运算公司”才能做到这点,让特斯拉基于纯视觉方案、自动驾驶系统看成眼睛、神经和大脑结合体的解决方案,在一票“镜头+光学雷达”的车企包围下,孤注一掷走下去。
Dojo超级电脑能否真正练出比光学雷达厉害的“超级大脑”,虽有待时间检验,但背后芯片到模组再到超级电脑,硬件到软件的整套围绕“运算”投入的巨大成本,让特斯拉本质从“电动车和太阳能公司”跳了出来。
一直看好并加码投资特斯拉的基金管理公司ARK,分析师Frank Downing认为,特斯拉Dojo类似“复合大脑”(Synthetic Brain),锻造由超级算力驱动、基于大量数据的神经网络训练的超级大脑。它或许可类比Google“Google Brain”,差别在Google大脑更常用于内容、广告和资讯“通用人工智能”(AGI, Artificial General Intelligence)训练,特斯拉Dojo当然优先给自动驾驶系统训练,且从芯片到运算模组再到超级电脑算力,Google TPU确实逊色很多。
Frank Downing还提出一个有意思的观点:不要盯着特斯拉能说会跳、身高172公分的机器人不放,特斯拉当然有可能做出机器人,但更重要的是,Dojo为特斯拉带来的运算能力和大脑,将推著特斯拉走向“通用人工智能”(AGI)。
马斯克说,Tesla Bot能帮人类从事危险重复的体力劳动,不过长得太像人类不免更像噱头──真正能取代人类从事危险重复体力劳动的机器人不需像人,过度“拟人化”只会束缚而不会解放机器人的生产力。但背后逻辑却很清处:特斯拉认为自动驾驶的优势在大部分人其实不擅长驾驶,自驾电动车又何尝不是代替大多数人类从事危险重复的体力活呢?
“代替人类劳动”这件事,是“通用人工智能”的必要性,真正掌握从算力到数据再到算法的“运算公司”而非简单的“人工智能公司”,无疑更有发言权。
(本文由 品玩 授权转载;首图来源:达志影像)
延伸阅读:
- 马斯克想做的人形机器人很惊艳,最终可能难以顺利实现