最近几年,随着机器学习加速器的飞速发展,已经涉及到了移动设备领域,其中有高通、海思、联发科和 Samsung LSI 等厂商在研发中。就在日前,ARM 在发布全新的 Cortex-A78、Cortex-X1 CPU、Mali-G78 GPU 三款架构的同时,还揭露了一些最新 Ethos-N78 NPU 的消息。
据悉,ARM 的“Ethos”机器学习针对于客户端推理工作负载,第一款设计为 Ethos-N77,至今已经过去了一年。时至今日,ARM 经过进一步的研发,带来了全新的 Ethos-N78 及其“Scylla”架构。
根据官方的介绍,得知 N78 性能和效率都有非常大的提升,已经可以实现在高达 10TOPs 原始计算吞吐量下的 2倍峰值性能。并且在改进 NPU 设计后,采用新压缩技术,每条推理的外部带宽提升40%。值得注意的是,N78 的强项是在不同配置选项中的性能扩展能力,拥有4个不同的性能点。
“Scylla”架构的改进之处为引擎中处理数据的方式,这样不仅可以采用全新的压缩方式,还能提升 DRAM 带宽,对 NPU 内部的数据进行移动,有效提升能耗比。
对于 ARM 公司的新 Ethos-N78 芯片,据悉已经授权给了客户,进入了设计阶段。第一批采用该芯片的设备有望在2021年推出市场。