欢迎光临GGAMen游戏资讯




nVidia 新 GPU 架构 Volta 发表,为人工智能注入一针强心剂

2025-05-06 209

今年的 GTC 2017(GPU Technology Conference 2017)中,Nvidia CEO 黄仁勋带来了全新的 GPU 架构 Volta。1.5 倍的双精度浮点数计算效能提升,以及采用特化架构所带来的 12 倍人工智能计算效能提升,为计算市场带来震撼的消息。

Nvidia 在 2016 年的 GTC 中,便发表了新的 GPU 架构 Pascal。其中,让人印象最深刻的,莫过采用 8 张 Tesla P100 的人工智能训练机 DGX-1。一台机器便带来以往需要数台服务器才能达到的效能,为人工智能发展带来新气象。

然而,短短的一年间,Nvidia 又带来新消息──新的 GPU 架构 Volta。强悍的 R&D 团队,将其主要竞争对手远远抛在后头。同时,也让世人见识到,在后莫尔定律的年代,GPU 将承接 CPU 的发展速度,推进电脑的计算效能。

新技术突破,奠定 Volta 于人工智能的王者之姿

这次 Volta 架构带来数个新技术。 其中,最重要的莫过 Tenser Core。其他还有细部硬件架构调整、第 2 代 NVLink 以及新软件支援,让 Nvidia 在人工智能领域扮演领导者。

首先,从硬件架构来看,这次 GPU 架构和前一代 P100 相比,V100 将整数计算单元和浮点数计算单元独立出来,让整数计算和浮点数计算可同时运行,物尽其用。此外,每个 SM(Streaming Multiprocessor)中新增 8 个 Tensor Core,让 Volta 带来 12 倍的训练提升以及 6 倍的决策加速。

究竟 Tensor Core 是如何运作的呢?首先,假设我们要求解两个 4×4 矩阵相乘再加上一个 4×4 矩阵,如下图,那将会产生 4×4×4 个乘法计算需求。在采用 Tensor Core 之前,需要执行 4 次 4×4 矩阵相乘并相加,相当花时间。

在新 Tensor Core 中,由于一个 Tensor Core 是 4×4×4 的特化计算元件,让 GPU 可同时执行 4×4×4 个矩阵相乘并相加,如下图所示。借此达到更多计算加速。这就是 Nvidia 对人工智能所发展的杀手锏。

新旧架构比一比,效能三级跳

那么 Volta 和 Pascal 究竟有什么差异呢,就让我们摊开所有细节来比一比吧!

从上表中可轻易了解更多 CUDA Core 让 Volta 在纯计算效能上,带来将近 50% 的效能提升。新 HBM2 带来更多内存带宽,尽可能满足平行计算的资料需求。更重要的是,Volta 采用新的台积电 12 奈米制程,让 Volta 的 TDP 维持在和 P100 一样的 300W。

此外,在人工智能领域中,借由 Tensor Processor,Volta 的计算能力更一举突破每秒百兆次运算的门槛。新 Volta GPU 的发表,让逐渐捉襟见肘的计算效能获得缓和。

(首图来源:Nvidia)

AI人工智能新知管道

如何深入了解 AI 趋势?快速收到第一手 A.I. 学习资讯与相关新闻?欢迎加入脸书社团“AI人工智能基地”

2019-03-26 02:30:00

标签:   游戏头条 资讯头条 ggamen科技资讯 ggamen科技 ggamen科技资讯头条 科技资讯头条 ggamen游戏财经 新闻网 科技新闻网 科技新闻 ggamen ggamen游戏新闻网 科技新闻 科技新闻网 新闻网 科技资讯头条 ggamen科技资讯头条 ggamen科技 ggamen科技资讯 资讯头条 ggamen游戏新闻网 科技新闻 新闻网 ggamen游戏财经 科技资讯头条 ggamen科技资讯头条 ggamen科技 ggamen科技资讯 资讯头条 游戏头条
210