微软发表基于英特尔 FPGA 的低延迟深度学习云平台“Project Brainwave” 04月28日更新

微软 22 日发表 Project Brainwave，一个基于 FPGA 的低延迟深度学习云端平台。微软官方评测显示，当使用英特尔 Stratix 10 FPGA，Brainwave 不需要任何 batching 就能在大型 GRU（gated recurrent unit）达 39.5 Teraflops 的效能。

微软表示，该系统为即时 AI 设计──这意味着，它能以极低的延迟在接收资料后立刻处理要求。由于云端基础设施需要处理即时资料流，不管是搜寻要求、影片、感测器资料流还是用户互动，即时 AI 正在变得越来越重要。

Project Brainwave 的系统可分为三层面：

高效能分散式系统架构。
整合到 FPGA 硬件上的深度神经网络（DNN）引擎。
能 low-friction 部署已训练模型的编译器和 runtime。

第一点，Project Brainwave 利用微软数年建立起来的 FPGA 基础设施。透过把高效能 FPGA 连线到资料中心网络，微软可为 DNN 提供硬件微服务支援──把一个 DNN 加载到远端 FPGA，再由一个 loop 中没有软件的服务器呼叫。这套系统架构既降低延迟，因为 CPU 不需要处理传来的要求；也能达到非常高的吞吐率，FPGA 处理要求的速度能达到网络接受要求的速度。

第二点，Project Brainwave 使用一个非常强大的“软”DNN 处理单元（即 DPU），并整合到可购买的 FPGA 中。

有许多公司，包括大企业和初创公司，正在开发“硬化”的 DPU。虽然很多芯片有很高的峰值效能，它们却必须要在设计时就选择运算子和资料类别，这限制了弹性。Project Brainwave 采取另一条路，提供一个横跨多种资料类别的设计。理想的资料类别可以在合成时间（synthesis-time）选择。该设计整合 FPGA 上的 ASIC 数字信号处理模组与合成逻辑，提供更多、数量上更最佳化的功能单元。该方法在两个层面上利用了 FPGA 的弹性。首先，定义了高度自订、窄精度的资料类别，借此在不牺牲模型精度的情况下提升效能。第二，可把研究创新快速整合到硬件平台设计──通常是几个星期，这在快速发展的领域特别必要。做为结果，实现了不弱于这些硬编码 DPU 芯片的效能。

第三点，Project Brainwave 内建一个支援各种深度学习框架的软件堆。微软已支援 Microsoft Cognitive Toolkit（注：改名后的 CNTK）和 Google 的 Tensorflow，并计划相容更多框架。还定义一个基于图片的中间表达，能转化常见框架上训练的模型，编译到高效能基础设施。

Microsoft unveils Project Brainwave for real-time AI

（本文由雷锋网授权转载；图片来源：微软）

微软发表基于英特尔 FPGA 的低延迟深度学习云平台“Project Brainwave”

热门推荐

《还愿》回来了！有游戏还有童书，台湾限定实体版开放预购

《还愿》游戏从 Steam 下架！开发商赤烛：维护品质进行检测

《还愿》遭中国网友抵制、团队道歉、中国代理商终止合作，销量反冲高

我们的肉眼每秒能够捕捉多少画面？

最新内容

十年后全球锂电池产能高达 1.3TWh，亚太仍是生产重地

小脑其实并不小，研究：只有可丽饼厚，皱褶拉平长达 90 公分

全球最快！荣总团队 7 天就能找出新生儿听损原因

废弃火箭应已撞向月球，NASA 绕月飞行器预计 3 月中进行成像

聚焦电动车散热工程方案，高柏科技推出一条龙散热对策服务

金价触 2,000 美元大关，普丁盟友哈萨克原油也遭回避

303 停电惩处出炉，台电董事长杨伟甫准辞、王美花续留

真实版钢铁擂台！新北、鸿海合办世界级 FRC 机器人区域大赛

心诚镁结盟台耀、台新药！攻全球呼吸治疗药 CDMO 商机

高龄者打疫苗送 500 元内赠品！网传打三剂返台免隔离为假讯息

关于我们

新闻资讯

意见反馈

网站地图