19 日在美国加州圣荷西的圣荷西大学活动中心,一年一度的辉达 GTC(GPU Technology Conference)大会迎来本年度最重要的 Keynote,就是辉达创始人兼 CEO 黄仁勋的演讲。这是辉达第十届 GTC 大会。
这是辉达展示技术实力和产品进展的最重要舞台,GTC 2019 涵盖 AI/深度学习、资料中心加速、自动驾驶、影像处理与模拟、高效能计算、机器人等多个领域。
那么,Keynote 辉达这次有放出哪些“核弹”吗?
利用 RTX 技术,发展 3D 工业
2018 年 SIGGRAPH 会议,辉达发表全新图灵架构,惊艳电脑图形业;基于此架构,辉达发表了 RTX (即时光线追踪)技术和基于此的 Quadro 系列 GPU。
不过对辉达来说,想推动 RTX 走向市场,自然离不开合作伙伴的支持。
本次 GTC,辉达宣布,众多全球顶级 3D 应用提供商支援 NVIDIA RTX 技术,相关产品将在 2019 年发表;应用商包括 Adobe、Unity、Unreal Engine、Pixer 等。照辉达的说法,RTX 技术将在 2019 年到达 900 万 3D 创作者手中。
黄仁勋发表了 NVIDIA OMNIVERSE,是让创作者利用 RTX 技术创作的 3D 开放协作平台。
辉达与 PIxar、Digital Domain 等众多平台合作,支援最新的设计协作产业标准。比如说,支援 Pixar 的 Scene Description 技术,在算图、模型、动画、光效、阴影等方面交换资讯,同时也支援 NVIDIA 的 Material Definition Language,能让创作者在多个工作间变换表面材料。
同时,创作者也可利用辉达的 OMNIVERSE Viewer 即时检视自订条件下的 3D 效果。当然,OMNIVERSE Viewer 也利用 RTX 技术和 CUDA 核心、支援 Tensor Core 的 AI 技术。
基于 RTX 技术,黄仁勋还发表了资料中心等级的影像服务器 NVIDIA RTX Servers,支援算图、OMNIVERSE 和 Geforce Now 云端游戏服务。其中一个最新规格令人震惊,是在 32 个 RTX blade Server(每个 blade Server 有 40 个 GPU)部署 1,280 个图灵架构 GPU,云端渲染、效率和规模都大大跃进。
包括戴尔、HPE、联想、ASUS、Supermicro 不少服务器厂商已推出通过认证的 NVIDIA RTX 服务器,提供资料中心等级的高度可定义、按需规格的内容计算和虚拟工作站解决方案。
值得一提的是,基于两块 Quadro RTX 8000 GPU(Quadro RTX 系列除了支援即时光线追踪,AI 也有极佳表现),辉达也发表专门针对资料科学家的工作站,有 96GB 内存,预装 CUDA-X AI 库,支援 RAPIDS、TensorFlow、Pytorch、Caffe、Anaconda Dsitribution,资料处理速度可达 10 倍。
发表 CUDA X AI,加速资料科学
Kyenote 中黄仁勋发表了全新的 AI 加速库──CUDA X AI SDK 库。
CUDA X AI SDK 可用于资料分析、机器学习、深度学习等多领域加速;可释放 Tensor Core GPU 的弹性,达成以下方面加速:
- 资料科学的资料取得、ETL、模型训练和部署。
- 机器学习算法压缩、分类等。
- 深度学习的训练框架,针对 NVIDIA Tensor Core GPU 自动最佳化。
- 云端推理和大规模 Kubernetes 部署。
- PC、工作站、超电脑、企业数位中心的资料科学。
- AWS、Google Cloud 和微软 Azure 云端计算的 AI 服务。
辉达方面表示,CUDA-X AI 可做到机器学习和资料科学最高 50 倍的负载加速,包含十几个特徴的加速库。比如说,它可透过 cuDF 加速资料分析,透过 cnDNN 加速深度学习,透过 cuML 加速机器学习算法,透过 DALI 加速资料处理。
CUDA-X AI 已被 Charter、微软、Paypal、SAS 和沃尔玛等公司采用,同时也支援 TensorFLow、PyTorch 和 MXNet 等主流深度学习框架。
黄仁勋宣布,已有 7 家世界级厂商将推出基于 NVIDIA T4 GPU 和 NVIDIA CUDA-X AI 加速库的服务器,都已针对 CUDA-X AI 特殊最佳化。7 家厂商分别是思科、戴尔 EMC、富士通、惠普企业、浪潮、联想、曙光。
辉达同时宣布,厂商上述服务器均为 NVIDIA NGC-Ready 认证通过。2018 年 11 月,辉达发表 NGC-Ready 计划,让采用基于辉达 GPU 系统的用户能在更广范围内放心部署 GPU 加速软件。通过认证的服务器型号如下:
- Cisco UCS C240 M5
- Dell EMC PowerEdge R740/R740xd
- Fujitsu PRIMERGY RX2540 M5
- HPE ProLiant DL380 Gen10
- Inspur NF5280M5
- Lenovo ThinkSystem SR670
- Sugon W760-G30
对 NGC-Ready 项目,辉达也宣布一项全新企业级支援──NVIDIA NGC Support Services,支援所有 NGC-Ready T4 系统和诸多之前已通过认证基于 NVLink 和 Tesla V100 的服务器,以及基于 NVIDIA 的工作站。
谈到这时,Mellanox Technologies(辉达前不久宣布以 69 亿美元收购该公司 )CEO Eyal Waldman 也来到现场,与黄仁勋同台亮相,两人简单分享了辉达对加速计算的未来愿景。
另外,黄仁勋与站台的亚马逊 AWS 副总裁 Matt Garman 联合宣布,与亚马逊 EMC 达成合作关系;最新 EC2 G4 服务器采用辉达 T4 Tencor Core GPU,将在未来数周启用。
全新 99 美元 Jetson Nano 可执行所有 AI 模型
大篇幅介绍 RTX 和 CUDA-X AI 后,黄仁勋表示,机器人无处不在,辉达非常重视机器人市场,为此开发了一整套软硬件产品。GTC 2019 推出全新机器人产品是 Jetson Nano。借助 CUDA-X 提供 472 GFLOPS 的 AI 效能,功率低至 5W。Jetson Nano 分两版,开发者套件对开发者、发烧友开放,售价 99 美元;对边缘装置系统公司的模组售价 129 美元。
黄仁勋现场只介绍 99 美元版,不过展示了基于 Jetson Nano 的小型机器人 Kaya,整合多个感测器。这说明 Jetson Nano 支援高分辨率感测器,可处理多感测器的资料,并支援主流 AI 框架。
Jetson Nano 关键特徴包括:
- GPU:基于 NVIDIA Maxwell 架构 128 核 GPU
- CPU:四核 ARM A57
- 影片:4K @30fps(H.264 / H.265)/ 4K @60fps(H.264 / H.265)编解码
- 镜头:MIPI CSI-2 DPHY 通道,12x(模组)和 1x(开发者套件)
- 内存:4GB,64 位元 LPDDR4,25.6 Gigabit 位元/秒
- 网络:Gigabit 以太网路
- 操作系统支援:Linux for Tegra
- 模组大小:70×45mm
- 开发者套件大小:100×80mm
DRIVE Constellation 正式上市
最后介绍的是自动驾驶。黄仁勋认为,未来自动驾驶系统将是软件定义。他宣布推出 DRIVE AP2X 9.0,并展示系统的工作原理及如何构建地图。
辉达还推出加强版 NVIDIA DRIVE AV 自驾车软件套件,主要组成部分软件是 Safety Force Field(SFF),SFF 透过取得感测器资料分析和预测周围环境的动态,确定车辆和其他道路使用者的安全。
据悉,SFF 可使车辆达到安全碰撞验证,并不是透过有限的统计资料分析实际情景,尝试模拟高复杂性,SFF 使用真实资料和位元级精确模拟验证,包括高速公路和城市驾驶场景,因这些场景太危险,难以在真实世界进行。
黄仁勋还宣布 NVIDIA DRIVE Constellation 正式上市,这是可延伸的模拟平台,支援大型虚拟车队自驾车,效率更高、成本更低、安全性超过现实世界可能有的效率。
汽车安全性至关重要,但很多情景难以在现实测试。黄仁勋展示的影片模拟汽车在不同自然环境(白天或晚上)、不同交通情况下的 12 种自动驾驶情景。
Drive Constellation 自动驾驶模拟系统首次亮相是在 GTC 2018,基于两种不同服务器的计算平台:一台服务器执行 NVIDIA DRIVE Sim 软件,模拟自驾车辆的感测器,如相机、光学雷达和雷达。另一台 DRIVE Constellation Vehicle 服务器包含 NVIDIA PegasusTM AI 车用电脑,处理模拟感测资料。DRIVE Constellation Vehicle 的驾驶决策将回馈到 DRIVE Constellation 模拟器,做到定位精确、定时精确的硬件回路测试。
简单来说,DRIVE Constellation 生态系统的合作伙伴可整合开放平台环境模型、车辆模型、感测器模型和交通场景。透过整合更广泛的模拟生态系统资料,平台就能生成全面、多样化和复杂的测试环境。
最后,辉达还宣布与丰田的新合作,建立在辉达 DRIVE AGX Xavier AV 平台与日本丰田 TRI-AD 团队和美国丰田研究所(TRI)的持续合作基础上。
辉达和丰田的协定包括开发跨多个延伸的架构车型和类别,加速开发缩短生产时间,以及在有挑战性的场景模拟相当于数十亿英里的驾驶。
总结
与往年相比,本次 GTC 既没有发表新 GPU 架构,也没有抛出什么重磅 GPU 硬件新技术和新品;然而,一向控制时间的黄仁勋却严重超时了──原定 2 小时的 Keynote,最终花了 2 小时 40 分才结束。
从 Keynote 内容来看,辉达想传达的讯息有两点:一是利用现有 GPU 技术做到基于 AI 加速计算,以此应付 AI 时代资料科学面临的挑战;二是在现有 GPU 能力的基础上,努力延伸 3D 视觉、自动驾驶等领域产业,进而构建更广泛的 GPU 应用生态──这对提升辉达未来的价值,毫无疑问非常必要。
(本文由 雷锋网 授权转载;首图来源:辉达)