过去几年来,资料中心市场崛起,高性能运算的前景带动了半导体业的发展,也让 Nvidia 从一家做游戏显卡的小虾米一跃成为当今芯片业的大鲸鱼,且看“黄氏定律”(Huang’s Law)到底是否真能接续摩尔定律的野心。
Nvidia 创办人黄仁勋出生于台北,9 岁就随家人迁往美国,而后在史丹佛大学取得电机工程硕士学位。值得一提的是,他的童年并没有大家想像中的优渥,虽然在美国定居,但家里经济并不好,从小是在肯塔基州的一所乡村学校长大,在那里黄仁勋学会了抽烟、爬墙、打架,许多同学身上甚至都还带刀,在这样的学习环境下成长,也令他有着较粗犷的性格。
不过尽管如此,黄仁勋在擅长体能运动之余,学习成绩仍相当优异。他从来不认为,他小时候的环境是一种阻碍,反而让他能更加坚强,更有活力。他甚至在 Nvidia 股价涨破 100 美元时,跑去在手臂上刺青,并引以为傲。他可能是世界上少数会在身上刺青的知名 CEO,也令其有着不同的魄力,最终创造出了如今半导体业的巨头。
▲ 黄仁勋在 2014 年 NVIDIA Gaming Festival 上大秀他的刺青。(Source:NVIDIA Facebook)
比起如今的 AMD 及英特尔,Nvidia 其实非常年轻,黄仁勋最早在硅谷落脚就是担任 AMD 的芯片设计师,后就职于 LSI Logic,这是首个推出 ASIC 芯片,并实现系统单芯片解决方案的半导体厂。不过黄仁勋早立志要自己创业,于 30 岁时,也就是 1993 年创办了 Nvidia,投入当时竞争非常激烈的绘图芯片产业中。
5 年后,Nvidia 发表的第四代显卡效能开始在市场上占据上风,但可说是历经 10 年血战才真正奠定了在这个产业中的地位,击败诸多知名的竞争对手,要不是 ATI 被 AMD 收购,可能也无法继续与 Nvidia 竞争。2006 年,独立显卡开始迎来了两强争霸的时代。
GPGPU
但从一开始,这本就不是一个很有利可图的行业,黄仁勋在创业前后受到相关专家朋友的劝阻,事实上,创业过程也非常艰难,Nvidia 也曾因太过执著于对性能的追求,忽视商业环境的需求而差点夭折,不过他很快就学到教训,并适应了由英特尔制定的产业规则,x86 已是半导体的王者,但黄仁勋很早就发现了 GPU 的利基所在。
最初其实也没有 GPU 这个称呼,是由 Nvidia 而起。1999 年,黄仁勋推出全球最早被称之为 GPU 的显卡──GeForce 256,并不断强化可程式设计的能力。图形处理器通用计算就是黄仁勋想要抓住的趋势,早在 2002 年,黄仁勋就做着将 GPU 应用在 AI 运算的梦,Nvidia 今日的成功是有着极其漫长的伏笔,而非偶然。
2003 年左右,各界专家开始注意到图形处理器通用计算(GPGPU)的潜力,尤其是大批量的小数点下浮点运算。尽管 CPU 核心的计算能力仍在 GPU 之上,但简易多核设计,令 GPU 在处理浮点运算具有优势,如今更逐渐拉开距离,成为重要的计算单元。而透过将才刚起步的营收大把投入研发后,2007 年,Nvidia 发布了初版的统一计算架构(Compute Unified Device Architecture,CUDA),奠定了平行计算的里程碑,也是 Nvidia 在高性能运算(HPC;High Performance Computing)上的基础。
当然 Nvidia 并不是没有对手,AMD 同样迅速地意会了趋势的到来。不过曾有“ 核武狂魔 ”之称的黄仁勋在站稳脚跟后,当然仍一路在性能路上奔驰,最早可以拿来煎蛋的显卡可不是 AMD 的。
▲ 黄仁勋在加州厨房中端出了新一代 AI 基础通用架构系统 DGX A100,对应 8 颗 Tesla A100 GPU。(Source:NVIDIA)
野心不止于资料中心
而自有 CUDA 之后,Nvidia 马上就发表了以 Tesla 为名的资料中心解决方案。虽然众所周知,资料中心将会越来越普及,市场越来越大,尽管握有 GPU 的技术优势,但 Nvidia 在此领域还称不上什么先驱,不过善于缠斗的黄仁勋已瞄准了在大趋势进展中,市场的空白。
未来随着半导体技术进展,资料中心不再需要那么大的机房,将越来越商业化,资料科学也会越来越普及,所需要的不同等级产品将越来越多,但市面上还没有这些解决方案。从超级电脑(Supercomputing)、超大规模资料中心(Hyperscale data center)、企业资料中心到个人服务器之间,都还有极大的空白。
▲ 未来的资料中心不仅是建在陆地上,还有水下。(Source:微软)
“且若没有空白,就创造空白”,这就是黄仁勋的的策略思想,他善于填补未来的空白。除不遗余力对资料科学及人工智能的推动外,还有如多媒体的应用需求,光线追踪(Ray Tracing)技术也是如此。虽然也颇受质疑,在市场开口之前就提出解决方案,成为 Nvidia 的风格。但为实践这样的策略,Nvidia 的产品就必须具备更大的广度。
处理器上,GPU 能有效减轻 CPU 在资料运算的负担,但若在大规模层面,服务器芯片厂 Mellanox 才是一流企业。高性能运算架构不仅再停留于资料中心内的节点,而将扩展到整个网络,且在与 Mellanox 合作下都将连结至 Nvidia 的 GPU。
黄仁勋认为未来资料中心将会是新的计算单元,全球会出现以资料中心为基础的超大型运算网络。且如今的 HPC,包括云端计算及边缘计算的发展,需要的都将不只是硬件加速,网络加速将会成为关键,在宏观或微观层面上都有其必要性。所以他强调,Nvidia 之所以高价收购 Mellanox,是价值取向而非成本问题。
早看好系统构装
无论是 Nvidia、英特尔及 AMD,其分歧更多还是对于技术发展的理念的不同,如 Nvidia 首席科学家 William Dally 在 2013 年就曾表示,不明白 AMD 为什么会想要做共享快取内存,因为这种方式只会为一些界面增加更多流量甚至形成瓶颈。
当时 Nvidia 是把目标锁定在芯片堆叠,研究系统构装(SiP)。Nvidia 认为当摩尔定律放缓后,CPU 将成为一种有限的计算资源,所以发展重点必须尽可能转移到架构上。Nvidia 致力于权衡芯片堆叠及 SoC 在各系列产品上的发展及应用,也一直都是台积电 3D 封装的大客户,如今 AMD 同样走向小芯片。
▲ Nvidia 下一代 HPC 芯片也将继续采用台积电 CoWoS 封装。(Source:Nvidia)
但事实上,较年轻的 Nvidia 比起英特尔抑或是 AMD 的底蕴都稍显薄弱,尽管如今市值逼人,但更多来自于前景的看好。其竞争对手不会对 Nvidia 的动作视而不见,尤其如英特尔才是真正的资料中心巨头,AMD 也正在后面虎视眈眈。
若技术方向确立,靠着资本及研发能力,在半导体业要晚半步后来居上也并非是不可能的事,毕竟掌握资料中心等 HPC 领域重要技术的还有赛灵思、Arm 等公司,如今能够三分天下,Nvidia 当然也已是拼尽全力,若要进一步打破局面,靠的可能要是没人能想到的奇兵。
先不谈到底能不能成功,Nvidia 并购 Arm 对很多业内人士来讲的确是够奇了,甚至黄仁勋自己还曾否认过这件事。有批评指出,并购 Arm 只是 Nvidia 的资本狂欢而已,没有技术上的意义。
非 Arm 不可?
非要 Arm 不可?是许多人质疑的问题,虽然 Arm 拥有非常广泛的生态系及客户群但其本身实在是称不上获利丰厚,原因就在于廉价的授权费。这也意味着 Nvidia 若要取得其技术协助成本其实并不高,商业上没有必要非并购不可的理由。且与 Mellanox 不同,取得 Arm 得罪的可不只是英特尔,将成为许多业者的竞敌。但若出身并不富裕的黄仁勋没有冲动购物的习惯,那么并购 Arm 应该也是出于价值取向。
借鉴高通并购恩智浦一案,应已很明显地彰显出,在如今情势下,Nvidia 要并购 Arm 是有多困难。虽然美国的民主党上台后,此交易成功概率开始变高。但这并非失败后,跟股东说一句对不起就可以没事,Nvidia 将为此付出不小的交易成本,甚至可以合理的猜测,黄仁勋自己也曾怀疑过此事能不能成。
▲ 黄仁勋与持有 Arm 股权的软银董事长孙正义对谈 AI 的未来。(Source:NVIDIA)
就商业策略来看,两家公司也不全是互补,还是有不少重复的竞品及技术,例如 Nvidia 也使用了 Arm 的竞争对手 RISC-V 来设计其 GPU 内的小型嵌入式单片机,且黄仁勋表示,以后也并不会改变这个设计习惯。事实上,目前他所回答的疑问,他都保证不会有改变,那么既然都不改变,当初为何要并购?
所以这些可能都不是他所在意的问题。黄仁勋再三强调,Nvidia 买下 Arm 之后的唯一影响,是在 Arm 生态上增加 Nvidia 的技术,只会增加,不会改变,并继续确保 Arm 的成功,两家公司将共同发展技术蓝图。若套用他在买 Mellanox 时的说法,与 Arm 的合作将令每个生态系的客户连接至 Nvidia 的 GPU,只不过从资料中心的连结,换成了物联网的连结,Arm 才是嵌入式系统的一流企业。
听起来好像也很合理,既然有了 Mellanox 来填补其想像中超大型资料中心网络的空白,那么 Arm 做为填补边缘计算与物联网空白的重要角色,对于完善策略布局,似乎也是可以理解。但其实还是无法解释,为何急于并购的问题,所以这些话中,唯一能着墨的大概只剩“技术蓝图”。
风险取向
若从目前已知的消息来看,Nvidia 或许是担心 Arm 的技术蓝图走向无法配合,就如黄仁勋此前强调的,Nvidia 已转型成软件公司,软件堆栈与编译器的重要性不比芯片本身差。若要成为未来 HPC 翘楚,自己掌握 ISA 的发展会是关键,就如当年的英特尔一样。
如今 RISC 与 CSIC 的界线已开始渐趋模糊,Arm 为了能有更好的应用,其实也在发展更多复杂指令来迎合各家需求,但这可能引起了黄仁勋的警觉。他早在 2011 年就看上了 Arm 架构,其 Project Denver 发表时,就几乎钦定了这就是“ Nvidia CPU”,后续的许多产品也都建立在这样的基础上。
然而反过来讲,若哪天有其他公司控制了 Arm 也就等同于限制了 Nvidia 软件堆栈的发展,在各系列产品架构都与 Arm 核心有着紧密结合的现在,可能就成了风险。
▲ 2014 年,黄仁勋发表了用于进军行动运算系统的 Arm 核心处理器 Tegra K1,并号称性能比 PS3 的 Cell 处理器更高。(Source:NVIDIA)
所以软银的急于出售,以及近年暴露出来的 Arm 管理混乱问题,或许才是迫使黄仁勋出手的原因。一个过于复杂,甚至发展方向有问题的 Arm 架构,不是他所乐见的。过去的 Nvidia 可能对此无能为力,但如今市值大涨的情况下,就有了筹码去避险,或许孙正义也是用这个方法来说服黄仁勋,毕竟 Nvidia 似乎已是唯一肯出高价买下 Arm 的厂商。
迎战 FPGA
且为应对摩尔定律的障壁,除了制程及架构外,如何从 ISA 中榨出效能也是选项。虽然在理论上采用何种 ISA 对于最终芯片的能耗及性能没有决定性的影响,微架构的设计更重要。但 Nvidia 原先在 Arm 身上投入的成本已经相当高,且如今看来的确也很有潜力,苹果最新的 Arm 核心 M1 芯片就是个例子。
虽然不少人看好 Arm 能突破 x86 的软件生态,也认为这是 Nvidia 拿下 Arm 的原因,但这可能真不是重点,进军智能手机或笔电等此类消费电子产品,并非目前 Nvidia 发展的主要方向,也多少违背榨出更多性能的 HPC 策略,Tegra 早已失利过一次。且就如同舆论所预测的,恐怕会引来更多反垄断官司。
Nvidia 想成为提供 HPC 解决方案的软件商,并不需要与苹果及三星等为敌,但也不能令这些业者来主导 Arm 的发展,反过来说,并掉 Arm 还有机会将 Nvidia 技术带入到他们的资料中心及行动装置,在降低风险且有机会拓展市场的机会下,似乎就不显得多昂贵,反正大多也是用市值换来的。但若能并购成功,那么 Nvidia 就笃定能成为向 Arm 生态中所有客户,提供最好的 GPU 加速方案的厂商。
甚至为未来发展 SoC 也铺平了道路,仅靠芯片堆叠可能还不够。与 Arm 紧密结合的技术蓝图,将能大幅降低 Nvidia 设计 SoC 及验证的成本。未来芯片的 I/O 性能也将成焦点,Nvidia 真正要面对的敌人是 FPGA。若要面对已拿下市面上数一数二 FPGA 大厂的英特尔及 AMD,与 Arm 的紧密合作必不可少,GPU 必须要准备更多的筹码,才能真的实现黄氏定律。
- NVIDIA Announces “Project Denver" to Build Custom CPU Cores Based on ARM Architecture, Targeting Personal Computers to Supercomputers
- 10 Devices that Define 30 Years of Arm
(首图来源:科技新报)
延伸阅读:
- 半导体风云录》从 PPT 厂到 AMD YES,苏姿丰催生异构计算的未来
- 半导体风云录》33 年发展登晶圆代工龙头,台积电改变全球半导体生态
- 半导体风云录》台积电 5 奈米利多加持,高通、NVIDIA、英特尔大单归队
- 半导体风云录》7 奈米考虑委外代工,英特尔真没牙膏可挤了或另有盘算?