相对前两年辉达举办的 GTC(GPU Technology Conference)来说,今年 GTC 在 GPU 技术架构和硬件创新的进展并不明显。Keynote 环节,辉达创始人兼 CEO 黄仁勋发表了一款定价 99 美元的 Jetson Nano──除此之外,并没有之前预想的新架构或“大核弹”。
尽管如此,在现场见证了 Keynote 之后,依然感受到黄仁勋的激情,以及他在打造基于现有 GPU 技术应用生态方面的努力。无论是基于图灵架构和 RTX 技术的 Nvidia Omniverse 和 NVIDIA RTX Servers 服务器,还是 7 家世界级的厂商将推出基于 NVIDIA T4 GPU 和 NVIDIA CUDA-X AI 加速库的服务器,都让人体会到辉达在技术应用生态方面的努力。
黄仁勋依旧强调这句话:买的(GPU)越多,省的(Money)越多。
GTC 大会第二天,黄仁勋出现在媒体参与的 Q&A 环节,他首先重点强调本次 GTC 的两个核心关键词──Ray-Tracing 和 Data Science,随后回答众多外界关注的关键问题,比如说未来的 GPU 技术路线、收购以色列公司 Mellanox、资料中心的未来、摩尔定律的终结等。
以下是本次 Q&A 关键内容摘要。
一、关于辉达收购 Mellanox
本次 GTC 开幕前一周,辉达宣布收购以色列科技公司 Mellanox,这是辉达史上最大笔收购。对此,黄仁勋提到以下几点:
- 摩尔定律放缓时期,网络软件堆叠必须尽可能转移到架构,为 CPU 减轻负担;现在 CPU 是一种有限资源,所以必须尽可能减轻 CPU 负担。Mellanox 是 CPU 减轻负担领域的一流企业。
- 资料中心的计算架构不再停留在节点,而将扩展到网络,整个网络都涉及辉达的 GPU。辉达有能力与第一大互联技术公司 Mellanox 紧密合作,整个行业都很欢迎。
- 辉达收购 Mellanox 一案获得监管部门的批准表示乐观,这将使辉达加速创新并推进技术发展,以服务客户。因为我们缺乏网络技术,而我们的目标是推进网络技术,为资料中心节省成本。而辉达的客户普遍表示支持并乐见其成。
- 辉达并不经常收购公司,因为喜欢与别人合作,辉达也是一个开放平台(比如 CUDA、DGX),同时辉达的业务模式必须是开放的。但之所以收购 Mellanox,是因双方长达 10 年的合作,辉达认为 Mellanox 在高速、高性能计算和网络设计方面非常擅长。
- 辉达为什么愿意以如此高价收购?因 Mellanox 值这个价钱──这不是成本问题,而是价值问题。
二、关于 3D 和堆叠技术、7 奈米技术
本次 GTC,辉达没有推出之前广泛预测的 7 奈米 GPU 架构,这也引起外界质疑:处理技术放缓的情况下,辉达将如何看待 3D 和堆叠技术?面对 AMD 推出的 7 奈米 CPU,辉达会否在 7 奈米有所动作?
黄仁勋表示:
- Tesla V100 已是处理量最大的 3D 封装硅片,而辉达也是台积电最大的芯片堆叠客户。事实上,3D 堆叠已有 5 年历史,有些人甚至用它堆叠手机芯片,这样可降低封装高度。这技术存在一段时间了,不是新东西。
- 但对辉达来说,不仅需要 3D 堆叠,也需要 2D 堆叠。辉达达成 2D 堆叠的方法就是 NVLink。辉达也需要一定规模的资料中心,这不再是为了 2D 堆叠,而是为了提升处理量。为此,辉达需要透过 Mellanox 达成,将多个 GPU 与大型计算引擎相连。
- 未来,资料中心将成为巨大的计算引擎,且体积要不断缩小,计算效果却非常惊人──这需要具备高性能技术专长,也是 Mellanox 擅长的。
针对外界关注的 7 奈米技术和下一代 GPU 发展,黄仁勋表示:
实际上 7 奈米技术已公开发售,台积电也希望能卖给我们;我要买它也非常容易。但对辉达来说,我要考虑的问题是,购买 7 奈米的要义和益处是什么?对 NVIDIA 来说,从台积电购买 7 奈米处理器技术,并不会让我们成为一家好公司,只会让台积电更好。而辉达的与众不同之处在于,我们任何时候都能开发最具能效的 GPU,且利用的是最具成本效益的技术。实际上,我们的工程师也是架构师,他们必须开发最具能效的 GPU,比如 Turing;我们的贡献是兼顾效率与最佳架构──我们为 Turing 选择了最佳技术,即 12 奈米。
三、关于软硬件关系、RTX 的技术应用
对本次 GTC 来说,最新发表的 CUDA-X 加速库成为亮点,同时资料中心和 RTX 技术成为重中之重,GPU 硬件提及的次数明显少了很多。当被问及为什么硬件在 GTC 2019 的角色相对弱化,黄仁勋表示:
你之所以听到很多关于软件的内容,是因为:如果我们不为硬件开发软件,那么硬件将没有用武之地;(正是因为有相应的)软件存在,才使硬件出色。如果我们不自己开发软件,那么市场将只有适用 CPU 的软件。辉达的业务是向新市场销售电脑平台,如果我们想这样做,我们必须打造新的软件架构(比如 CUDA-X)。这方面没人会帮我们,我必须亲力亲为。
面对外界对基于图灵架构的 RTX 市场销售和技术应用情况的质疑,黄仁勋回应:
RTX 最初 8 周的增长几乎比 Pascal 快 50%。然而,人们为什么会觉得 RTX 的应用放缓?这是因为当我们首次向市场推出产品时,我们有加密产品库存,我们不能推出整个系列──我想这样做,但是不能。现在,我们已推出整个系列,它们都表现得很出色。
另外,伴随 RTX 服务器推出,外界也开始关心 RTX 技术何时能纳入 Geforce Now(简称为 GFN)并开放,对此,黄仁勋回应以下要点:
- 目前新制造的 GFN 服务器都采用光线追踪技术。
- 目前 GFN 等待名单有 30 万玩家和 100 万用户。首要挑战是要确保能大规模、高品质地提供这项服务,其次就是必须降低成本,以便减低客户成本,让他们去玩免费的游戏。另外,第三个挑战就是确保 GFN 能涵盖全球更多国家,而不仅是西方国家。
- 预计光线追踪将在 2019 年第三、第四季开放。
四、关于摩尔定律的终结和资料中心的未来
本次 GTC,以资料中心为载体的资料科学(Date Science)也是黄仁勋谈到的重点内容。当被问及对英特尔最新架构的看法时,黄仁勋表示:
首先我认为英特尔也认识到加速计算是未来的发展方向。整个行业不再认为 CPU 和 GPU 互斥,这当然是好事,因为那条路已经走不通了。我们要承认,需要新方法引领产业向前发展。其次,我们仅占全球 HPC 总量的一小部分,在全球超级电脑企业(500 强企业)中,英特尔有充分理由占非常大的市占率。英特尔是一家竞争力很强的公司。我期待他们奋勇向前,我们也将积极面对挑战,最后受益的将是全世界用户和研究人员。第三,我不太确定,英特尔最新架构是设计本身的成功,还是原有技术的延展。但我认为非常好的是,英特尔的声明基本是在讨论加速计算;是在说:“来点真格的吧,加速我们的堆叠。”
关于目前资料中心发展所受的限制,黄仁勋最后表示:
其实很简单,目前对资料中心的唯一限制就是:摩尔定律的终结。我们深知,未来计算负荷呈指数趋势增长。如果摩尔定律已经终结了,唯一的方式将是构建更多的资料中心。我相信,将来的趋势是增加资料中心的工作负荷,这样,资料中心的计算能力将会以 10 倍的速度提升,结果是:软件创新将会突飞猛涨,计算能力将进一步增强,而这会推动更多创新。
(本文由 雷锋网 授权转载)
延伸阅读:
- GTC 2019:没有新架构与惊人新技术,NVIDIA 这次的重点在协力厂商
- NVIDIA 将斥资 70 亿美元收购 Mellanox,创该公司史上最高收购纪录