在今年的超级电脑排行榜 Top500,台湾的高速科学计算中心的新超级电脑──台湾杉 2 号,采用和第一名 Summit 一样的 CPU+GPU 的异质计算架构,以 9 PetaFLOPS 获得第 20 名,为台湾的基础科学研究添增助力。然而除了 CPU+GPU 的异质计算架构外,还有哪些不同的计算架构呢?不妨以过往世界第一的超级电脑说起吧。
如果有读者还不认识 Top500 排行榜,以及他们排名的衡量标准可以先看这篇文章。
在过去十年里,美中日世界前三大经济体,都曾拥有世界第一超级电脑的头衔。此外,这三国的世界第一超级电脑,都曾采用该国开发的处理器以及系统。证明各自的芯片系统设计能力,也象征着国家科学研究技术的能力。
那么,这 3 个国家的处理器有什么差异?不妨从 2011 年,日本以自主的系统夺得世界超级电脑第一开始说起。
曾经的世界第一超级电脑──京
▲ Fujitsu SPARC64 VIIIfx 中,CPU 核心的架构图。
2011 年,日本的超级电脑──京。采用 Fujitsu 的 SPARC64 VIIIfx。此 CPU 采用 45nm 制程,每一颗 CPU 内有 8 颗核心,并可带来 128 GFLOPS 的双精度浮点数计算效能。
从图中可以发现每一颗核心有 4 个浮点数计算单元,也就是 FLA、FLB、FLC、FLD。借由这一个方法,可以带来更多的计算效能。
由于每一颗 CPU 的大小都一样,没有大小 Core 之分,这台超级电脑就像是将数万颗 Intel CPU 组合起来一样,清晰明了。
去年世界第一的超级电脑──神威太湖之光
2016 年,中国的神威太湖之光发表,为整个超级电脑社群投下一颗震撼弹。做为中国第一台自主发展的超级电脑,他接替了中国的天河二号从 2013 年写下的世界第一纪录,同时也宣告中国终于有办法发展自己的超级电脑。
下图便是神威太湖之光的处理器 SW26010 的架构图。在一颗 SW26010 中,它的核心设计概念比较像是 GPGPU 以及 big.LITTLE 技术的结合,由一个较大的 Master core 完成较复杂的功能。小的核心则处理单纯负责计算的功能,为简单的计算核心。
▲ 神威太湖之光一颗 CPU 内,CPU 核心以及连结方式。
借由工作的区分,一颗 CPU 便可以带来 3.0642 TFLOPS,和当年的主流计算 GPU Tesla K80 相比,没有太大的差距。不过由于此 CPU 为计算特化的 CPU,在日常应用中不会有更佳的使用体验。
由于小的计算核心功能较简单,为了让小核心可以跟大核心协同运算,它采用 OpenACC 这一套开源软件的标准,让 master core 可以将工作分配给 slave cores。借由 MPI、OpenMP 以及 OpenACC,让开发者可以轻易地撰写程式并在神威太湖之光内执行。
新的世界第一──Summit
今年,美国终于发表了他们新的超级电脑 Summit,从中国手中夺回超级电脑的榜首,结束从 2013 年至 2017 年由中国称霸的日子。此外,台湾杉 2 号的运行架构跟 Summit 一样,采用CPU+GPU异质计算的方式,带来庞大的计算效能。
Summit 和神威太湖之光不同的地方在于 SW26010 的异质计算核心是结合在 CPU 内部,Summit 的 CPU-GPU 异质计算则是以 CPU 将独立 GPU 连结在一起运算,经由额外的传输界面将资料做交换。如图所示。借由 CUDA 以及 MPI,让开发者得以撰写平行程式。
3 台超级电脑,3 种架构
美中日的自主开发超级电脑,分别代表了 3 种不同超级电脑的解决方案。从京的以一颗 CPU 到太湖之光的异质整合 CPU,至 Summit 的 CPU+GPU 异质计算的模式。这 3 种不同的技术皆曾占据过榜首,也因此没办法明确判断不同技术的优胜劣败。
但是在 Machine Learning 领域中,由于大部分的计算都是矩阵运算且运算的工作也是高度独立的,CPU+GPU 的异质模式可以满足其需求。然而,当使用其他相对不好平行的算法时,京的运行架构较为通用,较不会被应用领域局限住。至于太湖之光则处于京以及 Summit 中间,拥有两者的优点,但一般使用者无法使用,为客制化芯片,研发成本较高。
近期,美中日三国也都提出了 Exascale 超级电脑的计划,欲将现在的超级电脑往 1,000 PetaFLOPS 推进。在近几年 ,我们将看到精采的超级电脑榜首争霸战。
- System Configuration of the K computer
- SPARC64 VIIIfx: CPU for the K computer
- Report on the Sunway TaihuLight System
(首图为 Summit;来源:ORNL)
延伸阅读:
- 超级电脑的速度如何计算?从超级电脑竞争白热化看 TOP500 效能指标
- 台湾自制 AI 电脑,计算能量世界 20 名创新高
- 全球超级电脑 500 强出炉,美国击败中国重夺最强宝座