欢迎光临GGAMen游戏资讯




台湾处理器拾遗》成为威盛电子 x86 处理器技术基础的 Centaur(下)

2025-05-16 210


先不论 Centaur 要怎样支撑威盛那“开辟新战场,延续高成长”的战略大计,光从 2000 年到 2004 年,那让人摸不着头绪的纷乱产品时程表,就够笔者和潜在客户伤透脑筋了。

回顾上篇:台湾处理器拾遗》成为威盛电子 x86 处理器技术基础的 Centaur(上)

2000 年到 2004 年的时程表大风吹

笔者不敢斩钉截铁的确信,当初威盛花大钱,一口气购入 Cyrix 和 Centaur,有没有打算建构“高低档搭配”产品线(高阶 Cyrix,中低阶 Centaur)的野心,或者觉得这两间的文化是互补的。但情势的演变,让 Centaur 不得不面对“追求高效能”的挑战──即使初代超纯量管线的 C5X,死在 Centaur 自己的手里。

砸了超过两亿美元进军 x86 处理器市场的威盛,透过收购 Cyrix 而得到的 Intel P6 总线授权,期限只到 2006 年 5 月,2001 年 3 月 25 日让 VIA C3 取代 Cyrix III,更等于直接把 Cyrix 品牌丢到水里。到头来,手上还有专利可和 Intel 讨价还价的 Centaur,乍看之下,是仅剩的有价值资产。

来自威盛高层的期望,都充分反映在“产品代号充满圣经味”的产品路线图,“双重产品代号(威盛的圣经人名和 Centaur 的 CxX)”也是威盛 x86 处理器的一大特色。更糟的是,这两者还不是“一对一”的,让产品代号与行销名称之间的对应关系,更显得混乱不堪。

眼见为凭,就请各位看倌慢慢欣赏。

2000 年:Centaur 的首要之务是持续改进并缩小 C5 家族,并追逐 1GHz 时脉。此时简报挂出来的品牌还叫做 VIA Cyrix。

此外,威盛在 2000 年 4 月 11 日以 3.23 亿美元的代价,将 S3 绘图芯片部门转移至新成立的 VIA-S3 合资公司,冒出个打包威盛北桥芯片组和 S3 绘图核心的 Matthew,实乃理所当然之事。最起码,在当时威盛高层应认定这是市场渴望的“马太福音”。

但 Centaur 有个更艰钜的任务:在越来越炽烈的效能军备竞赛,不能再像过去一样“装死”。各位可回想一下,2000 年刚好是 Intel 和 AMD 爆发 1GHz 时脉争夺战,并点燃后来长达 20 年 x86 双雄战役的关键时刻。产品时程表出现了 Centaur 史上第一个超纯量管线的 x86 处理器核心 C5X,与全新的 CX,也就是我们所熟知的 Nano。

C5X 不仅是货真价实的超纯量 x86 处理器核心,支援 SSE 指令集,更有着强大的动态分支预测、更深的指令管线与倍增的内部执行单元。当初 Centaur 没写在简报内的是,为了确保可每个时脉周期撷取两个指令,C5X 导入预先指令解码(Pre-Decode)的指令快取内存,提前标定快取内存内的指令边界(x86 指令集的长度并不固定),这让实际所需容量爆增 40%。

这很显然违背 Glenn Henry 的“信念”,也因此,预计 2001 年第三季出货的 C5X,真的能顺利诞生吗?预估的 55 mm² 看似不大,但你怎么猜得到威盛高层或 Glenn Henry 会吝啬到什么程度?更何况当“预算”超支的时候?

2001 年: 浮出调降电压、压低耗电量的 C5C“Ezra”。Cyrix 品牌也默默的消失。

Ezra-T 的那个 T 代表的是末代 Intel Pentium III“Tualatin”使用的改良版 P6 总线(Tualatin Bus,或称为 P3 Bus),AGTL 电压准位从 1.5V 调降到 1.25V,在还造成某些 Intel 芯片组的相容性问题,某些骨灰级电脑玩家应该依稀还有点印象。

C5M 仅用来进行样品测试,真正投入量产的是 C5N。

C5X 则延后到 2002 年,还跑出来衍生款 C5XL 和 C5YL,这并不是什么好兆头。

全新未来架构从 CX 改名成 CZA,意义不明。

C5XL(Nehemiah)是 C5X 的砍半版本,也是 Glenn Henry 最爱的“超级纯量”处理器,符合“简单、迅速、便宜”的大原则。这时公布的 C5X 也与一年前略有出入,至少指令管线深度被缩短了,芯片面积也增肥到 78 mm²,隐隐约约让人感受到这踩到了某个人心中的红线。

“证实 Centaur 对简单微架构的执著是正确的”的 C5XL,牺牲 10% 整数与 20% 多媒体效能,但减少了 30% 晶粒面积,利于提高时脉,降低耗电,而且 C5X“更贵更热”。

2002 年:既然有了便宜的 C5XL,做为“先导研究案”的 C5X 就没存在的必要了,Centaur 首款超纯量管线 x86 处理器,就此胎死腹中。

但 C5XL 并非一团糟,相较于 C5N,在相同制程,C5XL 的面积更小,时脉更高,支援 SSE 指令集。让人眼睛一亮的是,C5XL 具备了多处理器环境必备的先进可程式化中断控制器(APIC),这让 C5XL 可实作双处理器组态,但这张支票到了 C5XL 的下一版 C5P 才兑现。

C5XL 有一点值得大书特书:浮点运算不再只跑一半时脉,真是可喜可贺。

不过,以 C5XL 做为全新起点的演进图,却更让人感到一头雾水。一个 C5X 被腰斩的前车之鉴摆在眼前,谁敢保证产品时程表上的代号,有几个可以苟活?更何况,给客户看因“比晶体管更厉害的谋略”而随时大风吹的产品时程表,对经营事业与开发客户,真的妥当吗?

千万不要改改 roadmap 没什么大不了,对 Intel 和 AMD 来说,一旦爆发这种大事,一堆人都要准备去“找头路”了。

偏偏这又是不少台商甚少意识到的坏习惯,自己关起门来“精雕细琢,近乎苛求”是一回事,改来改去(搞不好还改上瘾了)的“Roadmap”往往是客户规划产品时的大灾难。“先当个简报王,等有客户被骗上钩再开案”确实是常见的业务开发技俩,但这招玩久了,只会让自己彻底信用破产。此类英勇事迹,在业界可谓班班可考。

全新未来微架构又从 CZA 改名成 CN,意义依旧不明。

再跑出来多出 SSE2 指令集、强化动态分支预测的 C5Z。第一时间先问:它活得下去吗?

那个看起来很像“试水温”的 C5Y(疑似系统总线换成 VIA V4 Bus)和 C5XP(C5XL 的低耗电版),似乎也很危险。那颗不存在的 C5XL/Z 的系统单芯片,就假装没看到好了。

2003 年:威盛开始以市场区隔细分品牌:VIA C3 入门桌机、Antaur 笔电、Eden 嵌入式应用,继续大混乱中。

这提到了之前没讲到的 C5XL 的硬件乱数产生器(RNG,Random Number Generator),看来威盛想从资讯安全应用发掘一些独特的利基点。

又跑出来 C5XL 的微幅改良版 C5P,在“例行公事”降低耗电、缩减面积、提升系统总线之外,扩增本来该在 C5XL 就给的双处理器组态(DP)、虚拟化(VME)、分页位址属性表(PAT)、硬件乱数产生器(RNG)、和硬件 AES 解密等。但对 Centaur 和 Glenn Henry,减少 10% 芯片面积才是重中之重,就为了“简单、迅速、便宜”。

双 C5P 处理器看起来很威,但是威盛有信心两颗打得过人家 Intel AMD 的一颗吗?

0.18µm 制程、支援 SSE2 的 C5Z 跑到哪里去了?这个硬件 SHA-1 密码杂凑算法的 C5I 又是从哪边跑出来的?

2004 年:由“幸存者”C5P 为出发点,重新开展的时程表。

但这时候威盛 x86 处理器的时程表,总算有了一贯的逻辑(尽管维持双重核心代号):从 Pentium III “Tualatin”总线移转到相容 Intel Socket 479 脚位,但电器信号改用自家规格以避免侵权,并在通讯协定层面稍做改进(如资料写入效率)的 VIA V4 Bus。

细心的读者一定会留意到:C5P 的规格又被偷偷的小改了。

2004 年 5 月 18 日公开 C5J 产品代号、2004 年 9 月 17 日公布 VIA C7 品牌、到 2005 年 5 月 27 日产品上市,C5J 算是历经 4 年的集大成之作,从制程、时脉、快取、指令集、总线、资安硬件功能到多处理器,在每个环节都有重大的跃进。

靠着 IBM 的 0.09µm 制程,C5J 芯片竟然缩小到 31.7 mm²,仅为 WinChip 2(95 mm²)的三分之一,Glenn Henry 这个人与其领导的 Centaur 团队,对于压低成本的执念之深,让人感到恐怖。也许把产品“cost down”到看起来很玲珑精巧,就是他们工作成就感的来源。

“几乎 Tape Out”的 C5I(被 C5J 取代),和 C5Q(台积电 0.13µm)、C5R(台积电 0.11µm)与 C5W(IBM 0.09µm 改良版),也就默默消逝在简报的尽头。

走过风风雨雨的 4 年,这么多的 Centaur 产品代号,扣除早期的 C5A/B/C,仅 C5N、C5XL、C5P 和 C5J 撑到量产上市的那一天。

很巧的是,这段期间,也正是 Intel 以威盛未得其同意,擅自销售 Pentium 4 处理器相关芯片组为由,对其发动官司诉讼大战,并纠缠了近 3 年。这场法律战的影响,与是否就是产品开发计划东改西改的主因,外人就不得而知了。

但唯一可以肯定的是:威盛和 Centaur 对“降低成本”的坚定信仰,如同信奉宗教般的虔诚。天真的相信,只要东西做得够便宜,就一样会有人愿意买单,又偏偏是不少台湾企业(或许可加上某些美国人)的通病。

最终不得不与魔鬼进行交易

俗语说的好:出来混的,总是要还。多年来死守“成本至上”信条、坚决抗拒高效能处理器主流技术趋势的 Centaur,终究得面对效能竞争力远远不如对手的残酷现实(到了 2005 年,还没有超纯量管线,距离 Intel Pentium 已 12 年),64 位元的普及速度超乎众多 x86 处理器小厂的预期(Transmeta 对此应该很有感),更是需要尽快提供解决方案的重点项目。

在 2004 年 10 月 5 日,跟随着 C5J(VIA C7)一同曝光的“全新下一代微架构”CN,很明确的昭告天下:Centaur 还是得拥抱超纯量管线、“魔鬼的工作”非循序指令执行、预测执行(结合动态分支预测和非循序指令执行),以及 64 位元和更高效率的多媒体应用效能。当然,在任何可以想到的环节,也势必要有足够的进化,才有可能跟得上 x86 双雄的脚步──最起码拉近那巨大的差距。

令人感到好奇的是:“面面俱到”的 CN,其产品开发时程,还能够像过去的 Centaur 产品,一样的神速吗?还有办法在两年之内,也就是在 2006 年就推出产品吗?

笔者只知道:从公司创立以来,微处理器报导(Microprocessor Report)举办的活动,几乎无役不与的 Centuar 与其看板人物 Glenn Henry,从 2005 年到 2007 年,就再也没站上这些活动的演讲台了。

等待了整整 3 年,2008 年 1 月 23 日,威盛公开代号 Isaiah 的新世代 x86 处理器微架构,3 月开始大量提供样品给客户,5 月 29 日正式命名为 Nano(凌珑)处理器系列。其脚位与 C7 相容,因此厂商与客户可用较低的成本升级产品,也同步推出超低电压的低功耗版本。

再来就是一连串事件发生时间与我们越来越近的故事。

2009 年 11 月 3 日,从富士通 65nm 制程转进至台积电 40nm 制程的 Nano 3000 系列,开始支援 SSE4.1 指令集,并修正“残废”的第二个整数运算单元,使其可执行大多数整数运算指令。

2011 年 5 月 5 日,台积电 40nm 制程 Nano X2 迈进原生双核心。

2011 年第三季末,四核心(两颗双核心封装成单一芯片)正式出货。

2014 年夏季,台积电 28nm 制程、时脉 2GHz 的“Isaiah II”样品与测试数据曝光,支援 SSE4.2、AVX 与 AVX2 指令集。

但却也被人发现:在某些 SPEC CPU 的效能测试项目,编译程式时启动 AVX / AVX2 时,效能不增反减,推测跟实作 AVX / AVX2 的手段有关,很可能只是透过修正微码实现相容性,但处理器微架构层面却毫无任何配套措施(Intel 和 AMD 都为此下足功夫),无愧 Centaur 那套“简单、迅速、便宜”的最高指导原则。

有趣的是,那时有人注意到,威盛有份“疑似打造 x86 / ARM 混合架构处理器”的专利,也刚好是 AMD 刚宣布将融合 x86 与 ARM 的系统架构,并研发 K12 处理器的“简报王”时期,让人不联想到威盛想趁机跑去凑热闹的念头。最后,无论是AMD和威盛,这伟大的创举,从来就没有成真。

总之,各位可以回忆一下,在任何威盛推出新品的时间点,Intel 和 AMD 摆在市场上的是哪些产品,又是怎样的制程和规格,又是何等规模的性能与出货。然后威盛与 x86 双雄的差距,就这样越拉越远。基本上,说威盛早就看不到那两家的车尾灯,恐怕也不会有太多人会“胆敢”反对。

至于威盛这间公司为何从叱咤风云的台湾股王,走向极盛而衰,到近几年面临下市危机的惨况,在过去早已是无数财经媒体的封面故事,就不在本文的探讨范围,也没有特别为此大书特书的必要了。笔者只记得十几年前,威盛某高层曾豪情万丈的公开喊话:在嵌入式应用的市场,没有 AMD 的份。

难道威盛和 Centaur 的 x86 处理器,除了低价位的嵌入式应用整合方案外(其实威盛握有的武器是很完备的),就没有其他的出路吗?2019 年 11 月 18 日的新闻稿,倒是提醒了世人,他们并未坐以待毙,寄望从人工智能的推论应用,找出一条生路,甚至还有机会从 5G 时代的多接取边缘运算平台(MEC),切入服务器市场。

目标“人工智能推论服务器”的 CHA

在 2019 年 11 月 18 日亮相的 CHA 系统单芯片,整合了 8 个 CNS 处理器核心、16MB 第三阶快取内存、4 通道 DDR4 内存控制器、44 Lane PCIe Gen3、Ncore 人工智能辅助处理器,并可双处理器组态,2020 年下半年量产,这是自从 Nano 之后,睽违超过十年的全新设计。CNS 采用台积电 16nm 制程,芯片面积是“破天荒”的 195 mm²,标准设计功耗不高于 85W。而此时此刻,Glenn Henry 则已经是半退休状态了。

Centaur 宣称 CNS 是“Intel Haswell”等级的微架构,从环状架构(Ring)处理器内部总线也看得出 Sandy Bridge 到 Broadwell 的影子(之后的 Skylake 就转向更有效率的 Mesh 总线),但 22nm 制程的 Haswell 却早在 2013 年 6 月 4 日就已出现,技术整整落后超过 6 年的 CNS,论处理器核心的效能,根本一点拼面都没有。若无让人眼睛一亮的新兵器,连能否打得过 Intel“瞄准 5G 基地台商机”的 24 核 Atom 处理器,都是天大的问号。

所以除了连 AMD Zen2 都尚未支援的 AVX-512 指令集(虽然内部拆成两个 256 位元运算微指令,实际效能有所疑虑),就是从 5 年前开始热门的“人工智能处理器”下手了。

CHA 的产品定位,很明显的锁定 5G 时代的边缘服务器,如 ETSI NFV 架构的多接取边缘运算(Multi-access Edge Computing,MEC),或工业物联网的网关(Gateway)。较“古老”的 16nm 制程,大概可提高 CHA 对恶劣运作环境的防御力。而根据“人工智能即将无所不在”的教条,这些应用或多或少用得到推论功能(像人脸辨识之类的)。威盛想踏入高获利的服务器市场,意图不言可喻,但 CHA 值多少价格,那又是另一回事了。

由 Glenn Henry 亲自操刀的 Ncore 人工智能辅助处理器,芯片面积 34.4 mm²(恰巧是他非常熟悉的尺寸),采用超宽的 32768 位元 SIMD 架构,借由理论值 20TB/s 的 16MB SRAM 挹注充沛的内存带宽,当执行推论常用的 INT8 短整数时,拥有每秒 20 兆(20T/s)的最高运算能量。Ncore 亦可支援在深度学习开始普及的 Bfloat16 浮点数,但峰值效能会只剩下 INT8 三分之一。

这看起来好像很了不起,但这性能究竟如何,可以参考一下 Google 的第一代 TPU(2016 年):INT8 最高效能约 92T/s。换句话说,Ncore 连其四分之一都不到,大致上跟 Pascal 架构(2016 年)的 nVidia Tesla P4 相去无几(22T/s)。同场加映 Turing 架构(2018 年)的 nVidia Quadro RTX8000 是 261T/s,推论专用的 T4 则是 130T/s。

当然,你也可以认定这个 Ncore 是“免费附赠”的,效能单位成本与“效能 / 功耗比”,可能远优于现有市场上的其他方案,无需外挂运算加速卡也是显而易见的优势。但对于人工智能应用,因为“硬件制造商和软件开发者”之间的鸿沟实在太深(像 Google 这样自产自用 TPU,反而就没这样的困扰),意思就是这票技术先驱者做出来的硬件,不是不好用就是不合用,导致 5 年前吸引众多有志之士一窝蜂涌入的人工智能芯片热潮,正在急速退烧中。

威盛和 Centaur 是否能够提供满足软件开发者的完整解决方案,避免重蹈覆辙,犯下无数“先贤先烈”的过往错误,将决定压宝人工智能这个决定的成败,否则,CHA 将沦为“即不简单,更不迅速,只能便宜”的低价产品。

唯偏执狂得以幸存,但却不会带来成功

“唯偏执狂得以幸存”(Only the Paranoid Survive),是Intel创办人之一的安迪‧葛洛夫(Andy Grove)的传世名言,一语道尽他战战兢兢、戒慎恐惧经营 Intel 的心路历程。但我们也很清楚,Intel 之所以会如此成功,也不是只靠偏执而已。Centaur 偏执于“简单、迅速、便宜”的理想之路,却是另一个极端的反例。

他们的确靠着死守着最低成本的坚持,成为 Intel AMD 之外,唯二还念得出名号的 x86 处理器厂商(另一间是俄罗斯的 Elbrus),但这些产品是否带来商业上的成功,相信各位心中自有定见。也许威盛并未供给 Centaur 足够的经费和人员,也施加极度严苛的成本要求,在 Time To Market 的前提下,难以完成更先进产品的开发。

这些年来,Centaur 也很可能存活得很艰辛,朝不保夕,个中甘苦,不足外人道也。但不幸的是,市场和消费者并不会理会这些“借口”,他们只会在意产品能不能让他们感到满意。

不计代价的把东西做到价格最低廉,就绝对会有人乐意接受?这世界的运作,从来就不是这么的简单,没有永恒不变、放诸四海而阶皆准的准则。或许,这就是坚守“简单、迅速、便宜”的 Centaur 和威盛 x86 处理器发展史,带给我们的教训。

(首图来源:VIA Gallery / CC BY)

2020-05-11 00:27:00

标签:   游戏头条 资讯头条 ggamen科技资讯 ggamen科技 ggamen科技资讯头条 科技资讯头条 ggamen游戏财经 新闻网 科技新闻网 科技新闻 ggamen 科技新闻 科技新闻网 新闻网 ggamen游戏财经 科技资讯头条 ggamen科技资讯头条 ggamen科技 ggamen科技资讯 游戏头条 ggamen ggamen游戏新闻网 科技新闻 科技新闻网 ggamen游戏财经 科技资讯头条 ggamen科技资讯头条 ggamen科技 ggamen科技资讯 游戏头条
211