最近一段时间,英特尔与辉达在自动驾驶 AI 芯片的竞争已进入白热化状态。双方不但在产品暗暗较劲,还打起了嘴仗。
英特尔 CEO Krzanich(见首图)最近在洛杉矶车展时就宣称,英特尔子公司 Mobileye 设计的 EyeQ5“深度学习执行效率是辉达 Xavier SoC 的两倍以上”。
英特尔 CEO 发表该言论后,辉达汽车部门高级主管 Danny Shapiro 表达了强烈的抗议。
首先,Shapiro 称对两个发表日期和制程(Xavier 为 16 奈米,EyeQ5 为 7 奈米)完全不同的芯片比较有些不合适。
Shapiro 指出,Xavier 已“整装待发”,这款 SoC 在 2019 年就将正式量产。与其相比,EyeQ5 明年才能打样,量产则定在 2020 年,2021 年才会整合进首款车型──BMW iNext。
其次,Shapiro 重点提到了功耗问题。辉达 Xavier 达成每秒 30 万亿次计算(TOPS)功耗为 30W,不过这是整个系统,包括 CPU、GPU 和内储存。EyeQ5 虽然运算速度更快且看起来功耗更低,但英特尔在强调功耗问题时其实只将深度学习核心计算在内。
英特尔过分吗?
这样来看,英特尔 CEO 在公开场合贬低 Xavier 是不是有点过分了?
“当然”,Tirias Research 创始人兼首席分析师 Jim McGregor 回答。不过,在他看来深层问题不在于拿 EyeQ5 与 Xavier 比较,而在于自动驾驶解决方案行业里,“已经没人拿两个不同的平台比较了”。
当然,仅比较两款 SoC 的性能指标现在确实不合适,毕竟它们背后真正厉害之处在于自动驾驶平台,而平台上还有其他芯片。
最近采访英特尔时,这家芯片巨头也透露了下一步计划:英特尔将推出一款专为自动驾驶设计的多芯片平台,该平台不但可使用 EyeQ5,还搭载低功耗的 Atom 芯片,同时还有 I/O 接口和以太网连接能力。不过,英特尔并未透露这款新平台的细节,比如运算能力。
事实上,Xavier 的 AI 引擎比 EyeQ5 强悍得多。
林利集团高级分析师 Mike Demler 同意这说法。“制程完全可以忽略,想要实现 Level 4 或 5,神经网络引擎和 CPU 的运算能力必须强悍。这些问题解决了才需要考虑功率,因为如果没有性能,一切都没有意义。”
不过,如果这话当真,为什么两大巨头还要锱铢必较 SoC 硬件规格?答案很简单,他们都处在自动驾驶大战的初级阶段,性能和功耗等数字依然是宣传利器,因此谁也不愿被对方盖过。
McGregor 指出,英特尔大力为自家产品摇旗呐喊,也显示出对车载芯片市场的专注。
此外,McGregor 还表示,英特尔也曾是福特汽车微控制器的主供应商。1983 到 1994 年间,英特尔的 8061 微控制器及衍生产品几乎成了所有福特产品的标配。
随后,福特改用摩托罗拉的微控制器,英特尔彻底从汽车市场销声匿迹。2005 年,英特尔正式宣布停产所有微控制器芯片。
如今,重金投入 150 多亿美元的英特尔又想藉 Moblieye 重新杀回汽车市场。
Level 4~5 自动驾驶到底需要多强的计算能力?
辉达坚持认为,如果真要比较两款芯片的能效,那么两者的计算能力都必须维持在 24 TOPS 量级,同时制程均为 7 奈米。
Shapiro 经过一番计算后表示:“如果基于 24 TOPS 这一参数,那么 Xavier 深度学习加速器(DLA)+GPU 功耗仅为 12W。如果能将制程从 16 奈米提升到 7 奈米,那么功耗还能再降低 40%,也就是说 Xavier 功耗能低至 7W。”
“EyeQ5 的表现你也知道,同样的参数下其功耗为 10W。”Shapiro 总结。
不过,Demler 认为这样比也有失公平。他认为,这不是两款 SoC 性能规格的对比,因为真正目的是实现 Level 4~5 级别自动驾驶。
一方面,“英特尔/Mobileye 声称 24 TOPS 绝对够用了”。另一方面,辉达却无所不用其极,准备把 Pegasus 平台的计算能力提升到 320 TOPS。因此,现在的问题是,Level 4~5 到底需要多少计算能力?
答案恐怕是没人知道。
不断变化的目标
辉达最初发布 Xavier 芯片时,其计算能力为 20 TOPS,功耗则维持在 20W。不过,现在 Xavier 却摇身一变,性能提升 10 TOPS,功耗也增加了 10W。这中间到底发生了什么?
Shapiro 的解释很简单,辉达将其性能放大了。
▲ 辉达 Xavier 芯片。(Source:NVIDIA)
英特尔方面表示,EyeQ5 的性能指标也发生了变化。
被英特尔收购前,Mobileye 在发表会上将 EyeQ5 计算能力定在 12 TOPS,功耗还不到 5W。不过现在,EyeQ5 计算能力翻倍,功耗也一同翻番(24 TOPS,10 W)。
在被问到何时做出这一修改时,英特尔发言人话锋一转,称公司计划未来推出多个 EyeQ5 系列产品,“其中包括 12 TOPS 和 24 TOPS 版本”。
▲ 2016 年 5 月刚发表时 EyeQ5 的结构图。(Source:Mobileye)
如果是这样,那么 24 TOPS 的 EyeQ5 是不是整合了两个核心?或者说英特尔将两颗芯片塞进了一个系统里?
英特尔发言人不愿详细解释,她只是表示:“这个问题我无法回答,具体的架构和平台细节将在明年 CES 见分晓。”
值得一提的是,Mobileye 方面曾告诉 Demler,要实现 Level 4~5,前者准备用两颗 EyeQ5 芯片。
分析师则普遍认同这样的观点,那就是 Mobileye 的 EyeQ5 芯片性能目标与 Xavier 相比实在太低。Demler 表示,两颗 EyeQ5 和在一起也只不过算是系统的“眼睛”,难道英特尔新平台的“大脑”要靠 Atom SoC 来支撑吗?
“与 Xavier 的定制版 ARMv8 CPU(共搭载 8 颗 ARMv8)相比,EyeQ 还用着相对较弱的 MIPS CPU。”Demler 解释。“辉达的客制芯片能组成强悍的大脑,你不用再装 Atom 或至强处理器。因此,英特尔其实还是在吃 PC 时代的老本。”简而言之,辉达用到深度学习加速器和 GPU,而英特尔靠的则是“特别的计算视觉核心”。
如果说 Xavier 和 EyeQ5 对比是关公战秦琼,那么怎样才能完成更精准的比较?Demler 表示:“将辉达 Drive PX 和同等的英特尔 Go 系统比较。”所谓的 Go 系统是英特尔的自动驾驶开发平台。
▲ 英特尔 Go 自动驾驶开发平台。(Source:Intel)
“只需将英特尔平台里的 FPGA 换成新的 EyeQ 芯片即可,这就是他们帮 BMW 打造的产品。”Demler 猜测。“假设两颗 EyeQ5 搭配 Atom 的功耗约等于 50W,那么其神经网络的计算能力可达 40 TOPS,反观辉达的双 Xavier 配置,则可达 60 TOPS,不过功耗也升到 60 W。这才能算公平的同类比较。”他解释。
芯片效能
VSI 创始人兼首席咨询师 Phil Magney 则认为,英特尔和辉达在效能疯狂比拼其实没什么必要。他表示:“在我看来,未来 Level 4~5 的车辆都会改用电动引擎,因此 SoC 的效能问题是个有待商榷的点。”
特斯拉与 Mobileye 合作关系破裂后转投辉达阵营,但事实上其车辆续航里程并没有发生变化,所以 SoC 那点功耗动力系统应付起来肯定没问题。
Magney 认为,采用 48V 架构的电动车和混动车型应付这点功耗绰绰有余,不过那些采用传统内燃机的车型可能会受到影响,其燃油经济性和排放都会变差。
不过,辉达的 Shapiro 不同意这种看法,他认为功耗非常重要。“如果一辆自驾车每天得工作 9 小时,那么肯定越省电越好,否则车辆的续航能力还是会受影响。”
“当然,全自动驾驶汽车的系统大部分区域都需要预留冗余,因此电动系统还是会承受较大的压力。”Magney 推测道。不过,他对此还是持积极态度。“电池技术和电池管理能力在不断提高,因此续航应该不成问题。”
(本文由 雷锋网 授权转载;首图来源:Flickr/TechCrunch CC BY 2.0)