NVIDIA 针对超大规模资料中心(Hyperscale data center)需求,推出 AI 推论平台 NVIDIA TensorRT。
攻资料中心市占,推新 GPU Tesla T4
NVIDIA 指出,资料中心每天需要处理数十亿的语音搜寻、翻译、图像、影像、推荐服务以及社群媒体互动等,上述的每一个应用皆需透过服务器内部不同类型的神经网络来处理。为了最佳化资料中心的最大吞吐量以及服务器使用率,NVIDIA TensorRT 包含即时推论软件以及 Tesla T4 GPU,其处理搜寻结果的速度较单独使用 CPU 快 40 倍。
而微软与 Google 等资料中心服务商与 Dell、HPE 等资料中心服务器厂商也都将导入。NVIDIA 还预估 AI 推论产业将于未来 5 年内成长至 200 亿美元。
NVIDIA 正努力在资料中心开疆辟土,全球资料中心大多采用 NVIDIA GPU,而资料中心业务虽然营收总额还不到游戏业务的一半,却是 NVIDIA 各部门中成长最快的、同时也是影响股价的重要因素。
资料中心是营收成长火车头,连两季 YoY 成长至少 70%
根据 NVIDIA 2018 年第二季财报,NVIDIA 第二季营收为 31.23 亿美元,其中游戏业务第二季营收为 18 亿美元,YoY 增加 52%。资料中心业务营收则是来到 7.6 亿美元,YoY 增长高达 83%。而在第一季资料中心营收 7.01 亿美元,YoY 成长也高达 71%,可说是 NVIDIA 的营收成长火车头。
短期内,NVIDIA 仍能稳坐资料中心宝座,竞争对手 AMD 与 Intel 目前与 NVIDIA 还有明显差距。
AMD 甫推出 7 奈米 Radeon GPU,虽然比 NVIDIA 的 7 奈米产品提前半年至一年推出,制程上领先,但在下游应用端要取代 NVIDIA 并非易事,而 Intel 的资料中心 GPU 产品也才刚起步。
短期内,NVIDIA 资料中心业务保持成长火车头没有大太问题,但若把时间拉长到 3-5 年以上,则 NVIDIA 隐忧浮现。因为全球前七大资料中心其实都正在研发自家芯片。
垂直整合,全球前七大资料中心都有“异心”
以三大云端厂商的 Google、微软与 Amazon 的资料中心来说,目前都采用 NVIDIA GPU,但也都有“异心”,各自研发“非”GPU 芯片,彼此保持竞争又合作的诡谲关系。而且对这些云端大厂来说,自研芯片不会仅是尝试,而是一种趋势,“垂直整合态势”明显,半导体芯片将从一般通用走向“Domain Specific(特定领域)”用途,IC 设计不做标准化产品,而是跟着应用需求做产品。而这也是为什么这些科技大厂开始自行研发芯片的主因。
黄仁勋与 Google 的口水战
其中又以 Google 的态度最为明显,2016 首次亮相的 ASIC 芯片 Cloud TPU,供云端运算的机器学习训练和推论使用,短短两年已经演进到第三代,而且在 2017 年 Google 还透过论文《In-Datacenter Performance Analysis of a Tensor Processing Unit》发表、大肆宣传,更有趣的是,论文中还拿出 NVIDIA 多年前旧产品 Tesla K80 GPU 和最新 TPU 的效能做比较,结果显示 TPU 的速度快 Tesla K80 GPU 15 至 30 倍,此举引发 NVIDIA 创办人黄仁勋不满,特地跳出来反驳。
今年 Google 则延伸至终端,推出 Edge TPU,供边缘运算的推论使用。虽然目前仍为 Google 自家用途为大宗,但 Google 也在测试对外贩售以“变现”的可能性(如 Google 在 2018 年 2 月公布开放开发者使用,Cloud TPU 服务以秒计费,每小时收费 6.5 美元),什么时候完全对企业开放收费,业界都在关注。
而微软 Azure 则和 Intel 合作,在深度学习云端平台 Project Brainwave 服务中也提供以 Intel FPGA 为基础架构的硬件加速服务。Amazon 则也找上全球最大 FPGA 芯片商赛灵思(Xillinx),在 Amazon Elastic Compute Cloud(Amazon EC2)中使用 Virtex UltraScale+ 系列芯片。
中美贸易战下,若微软中国当真采用华为芯片,代表什么?
另一个隐忧,则是中国的华为。不过华为和 Google 的威胁不同,华为继寒武纪 IP 麒麟 980 芯片,成为全球焦点后,近日美国媒体《The information》指出,微软和华为正商谈,让微软中国资料中心采用华为 AI 芯片。
先不论消息是否属实,这若是纯商业面的消息到还好,但若牵涉到政策面,那可就严重了。
美国禁止政府机构及与官方合作单位采用华为与中兴相关设备与产品,那有无可能中国也以此反制,外资大厂在中国地区的资料中心业务,要采用中国 AI 芯片,如同苹果 iCloud 在中国必须由中国厂商营运。由于中美贸易战火持续,此时传出此消息,不能不往政策面方向思索。
(本文由 数位时代 授权转载;首图来源:NVIDIA)
延伸阅读:
- 难与苹果竞争台积电产能, AMD 与 NVIDIA 延到 2019 年推 7 奈米产品