欢迎光临GGAMen游戏资讯

更多关注 收藏本站

nVidia 新 GPU 架构 Volta 发表，为人工智能注入一针强心剂

2025-05-06 209

今年的 GTC 2017（GPU Technology Conference 2017）中，Nvidia CEO 黄仁勋带来了全新的 GPU 架构 Volta。1.5 倍的双精度浮点数计算效能提升，以及采用特化架构所带来的 12 倍人工智能计算效能提升，为计算市场带来震撼的消息。

Nvidia 在 2016 年的 GTC 中，便发表了新的 GPU 架构 Pascal。其中，让人印象最深刻的，莫过采用 8 张 Tesla P100 的人工智能训练机 DGX-1。一台机器便带来以往需要数台服务器才能达到的效能，为人工智能发展带来新气象。

然而，短短的一年间，Nvidia 又带来新消息──新的 GPU 架构 Volta。强悍的 R&D 团队，将其主要竞争对手远远抛在后头。同时，也让世人见识到，在后莫尔定律的年代，GPU 将承接 CPU 的发展速度，推进电脑的计算效能。

新技术突破，奠定 Volta 于人工智能的王者之姿

这次 Volta 架构带来数个新技术。其中，最重要的莫过 Tenser Core。其他还有细部硬件架构调整、第 2 代 NVLink 以及新软件支援，让 Nvidia 在人工智能领域扮演领导者。

首先，从硬件架构来看，这次 GPU 架构和前一代 P100 相比，V100 将整数计算单元和浮点数计算单元独立出来，让整数计算和浮点数计算可同时运行，物尽其用。此外，每个 SM（Streaming Multiprocessor）中新增 8 个 Tensor Core，让 Volta 带来 12 倍的训练提升以及 6 倍的决策加速。

究竟 Tensor Core 是如何运作的呢？首先，假设我们要求解两个 4×4 矩阵相乘再加上一个 4×4 矩阵，如下图，那将会产生 4×4×4 个乘法计算需求。在采用 Tensor Core 之前，需要执行 4 次 4×4 矩阵相乘并相加，相当花时间。

在新 Tensor Core 中，由于一个 Tensor Core 是 4×4×4 的特化计算元件，让 GPU 可同时执行 4×4×4 个矩阵相乘并相加，如下图所示。借此达到更多计算加速。这就是 Nvidia 对人工智能所发展的杀手锏。

新旧架构比一比，效能三级跳

那么 Volta 和 Pascal 究竟有什么差异呢，就让我们摊开所有细节来比一比吧！

从上表中可轻易了解更多 CUDA Core 让 Volta 在纯计算效能上，带来将近 50% 的效能提升。新 HBM2 带来更多内存带宽，尽可能满足平行计算的资料需求。更重要的是，Volta 采用新的台积电 12 奈米制程，让 Volta 的 TDP 维持在和 P100 一样的 300W。

此外，在人工智能领域中，借由 Tensor Processor，Volta 的计算能力更一举突破每秒百兆次运算的门槛。新 Volta GPU 的发表，让逐渐捉襟见肘的计算效能获得缓和。

（首图来源：Nvidia）

AI人工智能新知管道

如何深入了解 AI 趋势？快速收到第一手 A.I. 学习资讯与相关新闻？欢迎加入脸书社团“AI人工智能基地”

2019-03-26 02:30:00

标签: 游戏头条资讯头条 ggamen科技资讯 ggamen科技 ggamen科技资讯头条科技资讯头条 ggamen游戏财经新闻网科技新闻网科技新闻 ggamen ggamen游戏新闻网科技新闻科技新闻网新闻网科技资讯头条 ggamen科技资讯头条 ggamen科技 ggamen科技资讯资讯头条 ggamen游戏新闻网科技新闻新闻网 ggamen游戏财经科技资讯头条 ggamen科技资讯头条 ggamen科技 ggamen科技资讯资讯头条游戏头条

热门推荐

最新内容

关于我们

新闻资讯

意见反馈

网站地图

扫码关注我们