台湾处理器拾遗》成为威盛电子 x86 处理器技术基础的 Centaur（下） 03月13日更新

先不论 Centaur 要怎样支撑威盛那“开辟新战场，延续高成长”的战略大计，光从 2000 年到 2004 年，那让人摸不着头绪的纷乱产品时程表，就够笔者和潜在客户伤透脑筋了。

回顾上篇：台湾处理器拾遗》成为威盛电子 x86 处理器技术基础的 Centaur（上）

2000 年到 2004 年的时程表大风吹

笔者不敢斩钉截铁的确信，当初威盛花大钱，一口气购入 Cyrix 和 Centaur，有没有打算建构“高低档搭配”产品线（高阶 Cyrix，中低阶 Centaur）的野心，或者觉得这两间的文化是互补的。但情势的演变，让 Centaur 不得不面对“追求高效能”的挑战──即使初代超纯量管线的 C5X，死在 Centaur 自己的手里。

砸了超过两亿美元进军 x86 处理器市场的威盛，透过收购 Cyrix 而得到的 Intel P6 总线授权，期限只到 2006 年 5 月，2001 年 3 月 25 日让 VIA C3 取代 Cyrix III，更等于直接把 Cyrix 品牌丢到水里。到头来，手上还有专利可和 Intel 讨价还价的 Centaur，乍看之下，是仅剩的有价值资产。

来自威盛高层的期望，都充分反映在“产品代号充满圣经味”的产品路线图，“双重产品代号（威盛的圣经人名和 Centaur 的 CxX）”也是威盛 x86 处理器的一大特色。更糟的是，这两者还不是“一对一”的，让产品代号与行销名称之间的对应关系，更显得混乱不堪。

眼见为凭，就请各位看倌慢慢欣赏。

2000 年：Centaur 的首要之务是持续改进并缩小 C5 家族，并追逐 1GHz 时脉。此时简报挂出来的品牌还叫做 VIA Cyrix。

此外，威盛在 2000 年 4 月 11 日以 3.23 亿美元的代价，将 S3 绘图芯片部门转移至新成立的 VIA-S3 合资公司，冒出个打包威盛北桥芯片组和 S3 绘图核心的 Matthew，实乃理所当然之事。最起码，在当时威盛高层应认定这是市场渴望的“马太福音”。

但 Centaur 有个更艰钜的任务：在越来越炽烈的效能军备竞赛，不能再像过去一样“装死”。各位可回想一下，2000 年刚好是 Intel 和 AMD 爆发 1GHz 时脉争夺战，并点燃后来长达 20 年 x86 双雄战役的关键时刻。产品时程表出现了 Centaur 史上第一个超纯量管线的 x86 处理器核心 C5X，与全新的 CX，也就是我们所熟知的 Nano。

C5X 不仅是货真价实的超纯量 x86 处理器核心，支援 SSE 指令集，更有着强大的动态分支预测、更深的指令管线与倍增的内部执行单元。当初 Centaur 没写在简报内的是，为了确保可每个时脉周期撷取两个指令，C5X 导入预先指令解码（Pre-Decode）的指令快取内存，提前标定快取内存内的指令边界（x86 指令集的长度并不固定），这让实际所需容量爆增 40%。

这很显然违背 Glenn Henry 的“信念”，也因此，预计 2001 年第三季出货的 C5X，真的能顺利诞生吗？预估的 55 mm² 看似不大，但你怎么猜得到威盛高层或 Glenn Henry 会吝啬到什么程度？更何况当“预算”超支的时候？

2001 年：浮出调降电压、压低耗电量的 C5C“Ezra”。Cyrix 品牌也默默的消失。

Ezra-T 的那个 T 代表的是末代 Intel Pentium III“Tualatin”使用的改良版 P6 总线（Tualatin Bus，或称为 P3 Bus），AGTL 电压准位从 1.5V 调降到 1.25V，在还造成某些 Intel 芯片组的相容性问题，某些骨灰级电脑玩家应该依稀还有点印象。

C5M 仅用来进行样品测试，真正投入量产的是 C5N。

C5X 则延后到 2002 年，还跑出来衍生款 C5XL 和 C5YL，这并不是什么好兆头。

全新未来架构从 CX 改名成 CZA，意义不明。

C5XL（Nehemiah）是 C5X 的砍半版本，也是 Glenn Henry 最爱的“超级纯量”处理器，符合“简单、迅速、便宜”的大原则。这时公布的 C5X 也与一年前略有出入，至少指令管线深度被缩短了，芯片面积也增肥到 78 mm²，隐隐约约让人感受到这踩到了某个人心中的红线。

“证实 Centaur 对简单微架构的执著是正确的”的 C5XL，牺牲 10% 整数与 20% 多媒体效能，但减少了 30% 晶粒面积，利于提高时脉，降低耗电，而且 C5X“更贵更热”。

2002 年：既然有了便宜的 C5XL，做为“先导研究案”的 C5X 就没存在的必要了，Centaur 首款超纯量管线 x86 处理器，就此胎死腹中。

但 C5XL 并非一团糟，相较于 C5N，在相同制程，C5XL 的面积更小，时脉更高，支援 SSE 指令集。让人眼睛一亮的是，C5XL 具备了多处理器环境必备的先进可程式化中断控制器（APIC），这让 C5XL 可实作双处理器组态，但这张支票到了 C5XL 的下一版 C5P 才兑现。

C5XL 有一点值得大书特书：浮点运算不再只跑一半时脉，真是可喜可贺。

不过，以 C5XL 做为全新起点的演进图，却更让人感到一头雾水。一个 C5X 被腰斩的前车之鉴摆在眼前，谁敢保证产品时程表上的代号，有几个可以苟活？更何况，给客户看因“比晶体管更厉害的谋略”而随时大风吹的产品时程表，对经营事业与开发客户，真的妥当吗？

千万不要改改 roadmap 没什么大不了，对 Intel 和 AMD 来说，一旦爆发这种大事，一堆人都要准备去“找头路”了。

偏偏这又是不少台商甚少意识到的坏习惯，自己关起门来“精雕细琢，近乎苛求”是一回事，改来改去（搞不好还改上瘾了）的“Roadmap”往往是客户规划产品时的大灾难。“先当个简报王，等有客户被骗上钩再开案”确实是常见的业务开发技俩，但这招玩久了，只会让自己彻底信用破产。此类英勇事迹，在业界可谓班班可考。

全新未来微架构又从 CZA 改名成 CN，意义依旧不明。

再跑出来多出 SSE2 指令集、强化动态分支预测的 C5Z。第一时间先问：它活得下去吗？

那个看起来很像“试水温”的 C5Y（疑似系统总线换成 VIA V4 Bus）和 C5XP（C5XL 的低耗电版），似乎也很危险。那颗不存在的 C5XL/Z 的系统单芯片，就假装没看到好了。

2003 年：威盛开始以市场区隔细分品牌：VIA C3 入门桌机、Antaur 笔电、Eden 嵌入式应用，继续大混乱中。

这提到了之前没讲到的 C5XL 的硬件乱数产生器（RNG，Random Number Generator），看来威盛想从资讯安全应用发掘一些独特的利基点。

又跑出来 C5XL 的微幅改良版 C5P，在“例行公事”降低耗电、缩减面积、提升系统总线之外，扩增本来该在 C5XL 就给的双处理器组态（DP）、虚拟化（VME）、分页位址属性表（PAT）、硬件乱数产生器（RNG）、和硬件 AES 解密等。但对 Centaur 和 Glenn Henry，减少 10% 芯片面积才是重中之重，就为了“简单、迅速、便宜”。

双 C5P 处理器看起来很威，但是威盛有信心两颗打得过人家 Intel AMD 的一颗吗？

0.18µm 制程、支援 SSE2 的 C5Z 跑到哪里去了？这个硬件 SHA-1 密码杂凑算法的 C5I 又是从哪边跑出来的？

2004 年：由“幸存者”C5P 为出发点，重新开展的时程表。

但这时候威盛 x86 处理器的时程表，总算有了一贯的逻辑（尽管维持双重核心代号）：从 Pentium III “Tualatin”总线移转到相容 Intel Socket 479 脚位，但电器信号改用自家规格以避免侵权，并在通讯协定层面稍做改进（如资料写入效率）的 VIA V4 Bus。

细心的读者一定会留意到：C5P 的规格又被偷偷的小改了。

2004 年 5 月 18 日公开 C5J 产品代号、2004 年 9 月 17 日公布 VIA C7 品牌、到 2005 年 5 月 27 日产品上市，C5J 算是历经 4 年的集大成之作，从制程、时脉、快取、指令集、总线、资安硬件功能到多处理器，在每个环节都有重大的跃进。

靠着 IBM 的 0.09µm 制程，C5J 芯片竟然缩小到 31.7 mm²，仅为 WinChip 2（95 mm²）的三分之一，Glenn Henry 这个人与其领导的 Centaur 团队，对于压低成本的执念之深，让人感到恐怖。也许把产品“cost down”到看起来很玲珑精巧，就是他们工作成就感的来源。

“几乎 Tape Out”的 C5I（被 C5J 取代），和 C5Q（台积电 0.13µm）、C5R（台积电 0.11µm）与 C5W（IBM 0.09µm 改良版），也就默默消逝在简报的尽头。

走过风风雨雨的 4 年，这么多的 Centaur 产品代号，扣除早期的 C5A/B/C，仅 C5N、C5XL、C5P 和 C5J 撑到量产上市的那一天。

很巧的是，这段期间，也正是 Intel 以威盛未得其同意，擅自销售 Pentium 4 处理器相关芯片组为由，对其发动官司诉讼大战，并纠缠了近 3 年。这场法律战的影响，与是否就是产品开发计划东改西改的主因，外人就不得而知了。

但唯一可以肯定的是：威盛和 Centaur 对“降低成本”的坚定信仰，如同信奉宗教般的虔诚。天真的相信，只要东西做得够便宜，就一样会有人愿意买单，又偏偏是不少台湾企业（或许可加上某些美国人）的通病。

最终不得不与魔鬼进行交易

俗语说的好：出来混的，总是要还。多年来死守“成本至上”信条、坚决抗拒高效能处理器主流技术趋势的 Centaur，终究得面对效能竞争力远远不如对手的残酷现实（到了 2005 年，还没有超纯量管线，距离 Intel Pentium 已 12 年），64 位元的普及速度超乎众多 x86 处理器小厂的预期（Transmeta 对此应该很有感），更是需要尽快提供解决方案的重点项目。

在 2004 年 10 月 5 日，跟随着 C5J（VIA C7）一同曝光的“全新下一代微架构”CN，很明确的昭告天下：Centaur 还是得拥抱超纯量管线、“魔鬼的工作”非循序指令执行、预测执行（结合动态分支预测和非循序指令执行），以及 64 位元和更高效率的多媒体应用效能。当然，在任何可以想到的环节，也势必要有足够的进化，才有可能跟得上 x86 双雄的脚步──最起码拉近那巨大的差距。

令人感到好奇的是：“面面俱到”的 CN，其产品开发时程，还能够像过去的 Centaur 产品，一样的神速吗？还有办法在两年之内，也就是在 2006 年就推出产品吗？

笔者只知道：从公司创立以来，微处理器报导（Microprocessor Report）举办的活动，几乎无役不与的 Centuar 与其看板人物 Glenn Henry，从 2005 年到 2007 年，就再也没站上这些活动的演讲台了。

等待了整整 3 年，2008 年 1 月 23 日，威盛公开代号 Isaiah 的新世代 x86 处理器微架构，3 月开始大量提供样品给客户，5 月 29 日正式命名为 Nano（凌珑）处理器系列。其脚位与 C7 相容，因此厂商与客户可用较低的成本升级产品，也同步推出超低电压的低功耗版本。

再来就是一连串事件发生时间与我们越来越近的故事。

2009 年 11 月 3 日，从富士通 65nm 制程转进至台积电 40nm 制程的 Nano 3000 系列，开始支援 SSE4.1 指令集，并修正“残废”的第二个整数运算单元，使其可执行大多数整数运算指令。

2011 年 5 月 5 日，台积电 40nm 制程 Nano X2 迈进原生双核心。

2011 年第三季末，四核心（两颗双核心封装成单一芯片）正式出货。

2014 年夏季，台积电 28nm 制程、时脉 2GHz 的“Isaiah II”样品与测试数据曝光，支援 SSE4.2、AVX 与 AVX2 指令集。

但却也被人发现：在某些 SPEC CPU 的效能测试项目，编译程式时启动 AVX / AVX2 时，效能不增反减，推测跟实作 AVX / AVX2 的手段有关，很可能只是透过修正微码实现相容性，但处理器微架构层面却毫无任何配套措施（Intel 和 AMD 都为此下足功夫），无愧 Centaur 那套“简单、迅速、便宜”的最高指导原则。

有趣的是，那时有人注意到，威盛有份“疑似打造 x86 / ARM 混合架构处理器”的专利，也刚好是 AMD 刚宣布将融合 x86 与 ARM 的系统架构，并研发 K12 处理器的“简报王”时期，让人不联想到威盛想趁机跑去凑热闹的念头。最后，无论是AMD和威盛，这伟大的创举，从来就没有成真。

总之，各位可以回忆一下，在任何威盛推出新品的时间点，Intel 和 AMD 摆在市场上的是哪些产品，又是怎样的制程和规格，又是何等规模的性能与出货。然后威盛与 x86 双雄的差距，就这样越拉越远。基本上，说威盛早就看不到那两家的车尾灯，恐怕也不会有太多人会“胆敢”反对。

至于威盛这间公司为何从叱咤风云的台湾股王，走向极盛而衰，到近几年面临下市危机的惨况，在过去早已是无数财经媒体的封面故事，就不在本文的探讨范围，也没有特别为此大书特书的必要了。笔者只记得十几年前，威盛某高层曾豪情万丈的公开喊话：在嵌入式应用的市场，没有 AMD 的份。

难道威盛和 Centaur 的 x86 处理器，除了低价位的嵌入式应用整合方案外（其实威盛握有的武器是很完备的），就没有其他的出路吗？2019 年 11 月 18 日的新闻稿，倒是提醒了世人，他们并未坐以待毙，寄望从人工智能的推论应用，找出一条生路，甚至还有机会从 5G 时代的多接取边缘运算平台（MEC），切入服务器市场。

目标“人工智能推论服务器”的 CHA

在 2019 年 11 月 18 日亮相的 CHA 系统单芯片，整合了 8 个 CNS 处理器核心、16MB 第三阶快取内存、4 通道 DDR4 内存控制器、44 Lane PCIe Gen3、Ncore 人工智能辅助处理器，并可双处理器组态，2020 年下半年量产，这是自从 Nano 之后，睽违超过十年的全新设计。CNS 采用台积电 16nm 制程，芯片面积是“破天荒”的 195 mm²，标准设计功耗不高于 85W。而此时此刻，Glenn Henry 则已经是半退休状态了。

Centaur 宣称 CNS 是“Intel Haswell”等级的微架构，从环状架构（Ring）处理器内部总线也看得出 Sandy Bridge 到 Broadwell 的影子（之后的 Skylake 就转向更有效率的 Mesh 总线），但 22nm 制程的 Haswell 却早在 2013 年 6 月 4 日就已出现，技术整整落后超过 6 年的 CNS，论处理器核心的效能，根本一点拼面都没有。若无让人眼睛一亮的新兵器，连能否打得过 Intel“瞄准 5G 基地台商机”的 24 核 Atom 处理器，都是天大的问号。

所以除了连 AMD Zen2 都尚未支援的 AVX-512 指令集（虽然内部拆成两个 256 位元运算微指令，实际效能有所疑虑），就是从 5 年前开始热门的“人工智能处理器”下手了。

CHA 的产品定位，很明显的锁定 5G 时代的边缘服务器，如 ETSI NFV 架构的多接取边缘运算（Multi-access Edge Computing，MEC），或工业物联网的网关（Gateway）。较“古老”的 16nm 制程，大概可提高 CHA 对恶劣运作环境的防御力。而根据“人工智能即将无所不在”的教条，这些应用或多或少用得到推论功能（像人脸辨识之类的）。威盛想踏入高获利的服务器市场，意图不言可喻，但 CHA 值多少价格，那又是另一回事了。

由 Glenn Henry 亲自操刀的 Ncore 人工智能辅助处理器，芯片面积 34.4 mm²（恰巧是他非常熟悉的尺寸），采用超宽的 32768 位元 SIMD 架构，借由理论值 20TB/s 的 16MB SRAM 挹注充沛的内存带宽，当执行推论常用的 INT8 短整数时，拥有每秒 20 兆（20T/s）的最高运算能量。Ncore 亦可支援在深度学习开始普及的 Bfloat16 浮点数，但峰值效能会只剩下 INT8 三分之一。

这看起来好像很了不起，但这性能究竟如何，可以参考一下 Google 的第一代 TPU（2016 年）：INT8 最高效能约 92T/s。换句话说，Ncore 连其四分之一都不到，大致上跟 Pascal 架构（2016 年）的 nVidia Tesla P4 相去无几（22T/s）。同场加映 Turing 架构（2018 年）的 nVidia Quadro RTX8000 是 261T/s，推论专用的 T4 则是 130T/s。

当然，你也可以认定这个 Ncore 是“免费附赠”的，效能单位成本与“效能 / 功耗比”，可能远优于现有市场上的其他方案，无需外挂运算加速卡也是显而易见的优势。但对于人工智能应用，因为“硬件制造商和软件开发者”之间的鸿沟实在太深（像 Google 这样自产自用 TPU，反而就没这样的困扰），意思就是这票技术先驱者做出来的硬件，不是不好用就是不合用，导致 5 年前吸引众多有志之士一窝蜂涌入的人工智能芯片热潮，正在急速退烧中。

威盛和 Centaur 是否能够提供满足软件开发者的完整解决方案，避免重蹈覆辙，犯下无数“先贤先烈”的过往错误，将决定压宝人工智能这个决定的成败，否则，CHA 将沦为“即不简单，更不迅速，只能便宜”的低价产品。

唯偏执狂得以幸存，但却不会带来成功

“唯偏执狂得以幸存”（Only the Paranoid Survive），是Intel创办人之一的安迪‧葛洛夫（Andy Grove）的传世名言，一语道尽他战战兢兢、戒慎恐惧经营 Intel 的心路历程。但我们也很清楚，Intel 之所以会如此成功，也不是只靠偏执而已。Centaur 偏执于“简单、迅速、便宜”的理想之路，却是另一个极端的反例。

他们的确靠着死守着最低成本的坚持，成为 Intel AMD 之外，唯二还念得出名号的 x86 处理器厂商（另一间是俄罗斯的 Elbrus），但这些产品是否带来商业上的成功，相信各位心中自有定见。也许威盛并未供给 Centaur 足够的经费和人员，也施加极度严苛的成本要求，在 Time To Market 的前提下，难以完成更先进产品的开发。

这些年来，Centaur 也很可能存活得很艰辛，朝不保夕，个中甘苦，不足外人道也。但不幸的是，市场和消费者并不会理会这些“借口”，他们只会在意产品能不能让他们感到满意。

不计代价的把东西做到价格最低廉，就绝对会有人乐意接受？这世界的运作，从来就不是这么的简单，没有永恒不变、放诸四海而阶皆准的准则。或许，这就是坚守“简单、迅速、便宜”的 Centaur 和威盛 x86 处理器发展史，带给我们的教训。

（首图来源：VIA Gallery / CC BY）

台湾处理器拾遗》成为威盛电子 x86 处理器技术基础的 Centaur（下）

回顾上篇：台湾处理器拾遗》成为威盛电子 x86 处理器技术基础的 Centaur（上）

2000 年到 2004 年的时程表大风吹

最终不得不与魔鬼进行交易

目标“人工智能推论服务器”的 CHA

唯偏执狂得以幸存，但却不会带来成功

热门推荐

和平精英每个赛季时间表一览

云顶之弈幻境龙迭嘉出装迭嘉主C阵容搭配推荐

我们的肉眼每秒能够捕捉多少画面？

ElpakaiPhone8/8Plus磁吸与玻璃金属保护壳开箱推荐相容7/7Plus、iPhoneX即将登场

最新内容

LPL第一阶段淘汰赛JDG vs TES 第五局战报（2026-02-24，JDG胜）

LPL第一阶段淘汰赛JDG vs TES 第四局战报（2026-02-24，JDG胜）

LPL第一阶段淘汰赛JDG vs TES 第三局战报（2026-02-24，TES胜）

LPL第一阶段淘汰赛JDG vs TES 第二局战报（2026-02-24，JDG胜）

LPL第一阶段淘汰赛JDG vs TES 第一局战报（2026-02-24，TES胜）

为何选里昂而非克里斯？《生化危机 9：安魂曲》总监揭秘：当“战力天花板”遇上恐怖回归

75GB 准备就绪！《仁王 3》PS5 预载信息曝光：2 月 6 日开启硬核“落命”新篇章

《真三国无双：起源》或将发展为“三部曲”！庄知彦：赤壁到五丈原内容体量巨大

索尼真开窍了？《马拉松》Steam预购开启：国区168元全球最低价，Bungie诚意拉满

《刺客信条：Hexe》官宣首席编剧！《幻景》主笔加盟，2026年发售彻底悬了？

关于我们

新闻资讯

意见反馈

网站地图

台湾处理器拾遗》成为威盛电子 x86 处理器技术基础的 Centaur（下）

回顾上篇：台湾处理器拾遗》成为威盛电子 x86 处理器技术基础的 Centaur（上）

2000 年到 2004 年的时程表大风吹

最终不得不与魔鬼进行交易

目标“人工智能推论服务器”的 CHA

唯偏执狂得以幸存，但却不会带来成功

热门推荐

和平精英每个赛季时间表一览

云顶之弈幻境龙迭嘉出装 迭嘉主C阵容搭配推荐

我们的肉眼每秒能够捕捉多少画面？

ElpakaiPhone8/8Plus磁吸与玻璃金属保护壳开箱推荐相容7/7Plus、iPhoneX即将登场

最新内容

云顶之弈幻境龙迭嘉出装迭嘉主C阵容搭配推荐