总部位于英国的 AI 芯片公司 Graphcore 15 日发布了第二代 IPU GC200,采用台积电 7 奈米制程,晶体管数量高达 594 亿个,裸片面积达到 823 平方毫米。这比 2 个月前辉达(NVIDIA)最新发布的安培架构 GPU A100 的 540 亿个晶体管增加了 10%,黄仁勋当时说 A100 是全球最大的 7 奈米芯片,裸片面积为 826 平方毫米。
IPU 是一种全新的大规模并行处理器,先前已经推出了基于台积电 16 奈米制程整合 236 亿个晶体管的 GC2 IPU,120 瓦的功耗下有 125TFlops 的混合精度、300M 的 SRAM 能够把完整的模型放在芯片内。
(Source:Graphcore)
第二代 IPU GC2000(MK2)与第一代 IPU(MK1)相比,实际性能提高了 8 倍。Graphcore 联合创始人兼 CEO Nigel Toon 表示,GC200 是目前世界上最复杂的处理器,可使创新者实现 AI 的革命性突破。
▲ Mk1 IPU 产品与 Mk2 IPU 产品性能对比。(Source:Graphcore,下同)
据悉,GC2000 芯片内部有 1,472 个独立的处理器核心,能够执行 8,832 个独立的并行线程,所有这些均由 900MB 的 RAM 支援。
Nigel 说:“GC200 在处理器内部具有史无前例的 900MB 超高速 SRAM,在每个处理器内核旁边都设有大量 RAM,以实现每位最低能量的使用。Graphcore 的 Poplar 软件还允许 IPU 透过 Graphcore 独特的 Exchange-Memory 通讯 Streaming Memory。这甚至可以支援具有数千亿个参数的最大模型。每个 IPU-M2000 都可以支援密度高达 450GB 的 Exchange-Memory,以及前所未有的 180TB/秒的带宽。”
▲ Graphcore IPU-Fabric 技术。
除此之外,基于最新 GC200 的一款即插即用的机器智慧刀锋计算结构 IPU-M2000 还整合了 Graphcore 的专用 AI 联网 IPU-Fabric。新的 Graphcore GC4000 IPU-Gateway 芯片可以让每个 IPU-M2000 提供 2.8Tbps。Graphcore 称,在从数十个 IPU 扩展到数以万计个 IPU 的过程中,IPU-Fabric 技术使通讯时延几乎保持恒定。
据悉,1U 大小的 IPU-M2000 可提供 1 个 PetaFlop 的机器智慧计算。利用 IPU-M2000 可构建成 IPU-POD64 的模组化机架规模解决方案。IPU-M2000 的设计使客户可以在 IPU-POD 配置中构建多达 64,000 个 IPU 的资料中心规模系统,提供 16ExaFlops 的机器智慧计算能力。
(Source:影片截图,下同)
Graphcore 也强调,其 Poplar SDK 可以使开发者无论使用单个 IPU 还是要使用数千个 IPU 完成机器智慧工作负载都可以让过程变得简单。
Graphcore 高级副总裁兼中国区总经理卢涛表示,中国很可能成为 Graphcore 最新推出的第二代处理器技术最先实现商业化落地的区域之一。
(本文由 雷锋网 授权转载;首图来源:Graphcore)
延伸阅读:
- 台积电客户 Graphcore AI 芯片获微软等采用,出货数万组