砺石商业评论
2026-05-11 17:44
从"卖图纸"到"盖房子",ARM有着什么样的思考?
来源:砺石商业评论
作者:王剑
您可能不知道,无论您使用苹果还是安卓手机,也无论其芯片来自高通还是联发科,几乎都绕不开要向同一家公司缴纳专利授权费。
这家总部设在英国剑桥的公司,不造手机,也不卖芯片,甚至很多人都未必听过它的名字,但全球已出货超过3500亿枚基于其架构设计的芯片,是地球人口的近50倍。
公司的名字叫ARM控股有限公司,中文名叫“安谋国际科技股份有限公司”,一年营收约40亿美元。
虽然这个数字放在整个芯片行业并不惊人,却几乎支撑起手机时代所有芯片的底层运转。
ARM的生意逻辑也极其简单,就是“卖图纸,收版税”,但毛利率高达95%,并且不承担行业的任何周期风险。
可就在前不久,ARM突然推出自研的AGI CPU,一款面向人工智能数据中心的芯片。
一家卖了几十年“图纸”的公司,为何突然选择要自己“盖房子”?
要回答这个问题,得把时间拨回到40年前。
精简指令的诞生
1978年,美国的英特尔发布了著名的x86(8086处理器)。
它定义了一套名为x86的指令集架构,并确立了严格的向下兼容规则,使得此后数十年的英特尔处理器都能无缝运行旧的软件。
正是凭借这套无与伦比的兼容性壁垒,英特尔在整个PC时代构筑了最坚固的护城河。从奔腾到酷睿,其内核始终沿袭与x86一脉相承的指令集。
但x86有一个与生俱来的问题:耗电实在太高。
x86架构的设计初衷是“一专多能”,希望用单条复杂指令完成复合操作。然而,这种设计目标使得解码器的电路图变得极其复杂。而这种复杂性带来的直接代价,就是功耗难以降低,散热瓶颈日益凸显。
就在英特尔凭借x86架构高歌猛进之际,1985年,大洋彼岸的英国,一家名为Acorn的电脑公司,却选择了一条截然不同的路。
他们未选择英特尔推崇的复杂指令集道路,而是押注于当时非主流的精简指令集。这与x86的“复杂”哲学背道而驰,其“化繁为简”的核心,旨在通过精简高效的指令来提升整体执行效率。
其设计逻辑在于,将复杂任务拆解为多条简单指令,交由处理器快速、流水线式地执行。这使得CPU最核心的解码器设计得以大幅简化,最终在性能与功耗间找到了更优的平衡。
基于这一理念,Acorn成功设计并流片了其首款处理器,并将其命名为ARM。
这颗芯片在达成性能目标的同时,功耗远低于同期的复杂指令集芯片,因而在学界与业界收获了不小的关注。
然而,搭载它的Acorn电脑销售却始终不够理想。根本原因在于其软件生态极为薄弱,无法吸引用户买单。
1990年,面对自家电脑业务的失败,Acorn决定将芯片设计团队剥离,联合苹果与芯片制造商VLSI共同出资,成立了一家完全独立的公司。
新公司保留了ARM之名,将其含义更新为Advanced RISC Machines(一家专注于设计先进、高效的精简指令集处理器架构的技术公司)。
独立之初,ARM便为苹果寄予厚望的Newton个人数字助理设备研发了专用处理器,但依然未能成为预想中的爆款。
事实再次证明,ARM想靠自研自销芯片打开市场的道路根本走不通。公司也因此陷入生存危机,站在了必须彻底转型的悬崖边缘。
生死关头,ARM做出了改变命运的抉择:彻底转型为IP授权商,不再自己制造芯片,而是向其他公司出售CPU设计“图纸”,并按芯片出货量收取版税。
如此一来,ARM无需承担制造成本,也不必维护销售渠道,只要技术被人采用,收入就会持续流入。
这个模式,在当时的半导体行业几乎闻所未闻,更像是ARM身处绝境下的权宜之计。
可没人想到,正是这个ARM被逼无奈的选择,却在接下来的三十年里,演变为整个移动互联网时代不可或缺的底层基础设施。
意外赢得的时代机遇
从历史角度来说,ARM真正起飞,靠的不是战略远见,而是运气。
再精确点说,是一次意外的历史吻合。
1990年代末,功能手机正逐步向“智能”进化,一个根本性的瓶颈已无法回避:手机完全依赖电池供电,而当时的电池技术远远跟不上激增的功耗需求。
传统电脑芯片,比如英特尔的x86架构,虽然性能强大,但也是个“电老虎”,发热也厉害。想移植到空间紧凑、电池有限的手机里,这套方案根本行不通。
事实上,英特尔为此试验过多次,均告失败。根本原因在于,x86架构始终无法在“性能”和“耗电”之间找到平衡。
ARM的转机,由此到来。其架构天生的精简与高效,恰好契合了移动设备对低功耗、高能效的绝对需求。
于是,从早期的个人数字助理(PDA),到第一批真正意义上的智能手机,厂商们几乎不约而同地选择了ARM设计的架构。
凭借低功耗这张无可替代的“王牌”,ARM几乎在一夜之间,成为了移动芯片领域事实上的架构标准。
哪怕到了今天,全球超过99%智能手机的CPU内核,依然是基于ARM架构的设计。
这一统治性地位,在过去二十余年里,从未被真正撼动。
不过,仅靠低功耗特点,并不足以构筑ARM真正的技术优势,更深层的护城河,在于其催生并依托的庞大生态。
不妨想象一个场景:无数设备均采用ARM架构时,一个围绕其建立的庞大软件帝国便开始自我生长和强化,无论是操作系统(如安卓、iOS),还是应用开发工具、编译器、驱动软件……都是基于其架构在运作。
如此,便形成了一个强大的正向循环(飞轮):使用ARM的设备越多,为其开发的软件就越丰富、成熟;而软件生态越强大,越吸引新的芯片设计者和设备制造商选择ARM。
正是这个日益强大的“生态飞轮”,构筑了ARM最坚固的护城河:惊人的迁移成本。
对于客户来说,竞争者如果想要入局,就必须说服数百万开发者、无数软件公司与整个供应链,抛弃已极其成熟的ARM体系,去适应一套全新的架构,背后则是难以估量的时间与金钱代价。
正是这种基于整个产业广泛依赖形成的生态闭环,才让ARM的地位变得难以撼动。
这个“生态飞轮”的威力,甚至还冲破了移动领域的边界。
2020年,苹果在Mac电脑上全面启用自研的ARM架构芯片(M1),其出色的能效表现彻底颠覆了行业认知。
至此,ARM已不只是一家移动芯片设计商,而是成为横跨手机、PC与更多领域的底层基石。
而支撑这个庞大生态持续扩张的,正是其独特而高效的商业模式。
“卖图纸”的完美模式
如果用一句话来概括ARM究竟如何赚钱,那就是“卖授权”。
互联网时代,如果一家芯片公司从头开始设计处理器,等产品上市时,竞争对手可能已迭代了两三代,高昂的研发成本也早已烧穿预算。
因此,对绝大多数芯片公司而言,最经济高效的选择便是:向ARM购买现成的CPU核心设计。
只需支付一笔授权费,便可获得一颗经过充分验证的“芯片大脑”——包括完整的核心代码、配套工具链和验证模型。
随后,芯片公司以这个现成的、可靠的“大脑”为中心,根据需要增添图像处理、通信基带、视频编解码等专用模块,以形成自己的产品差异化。
最终,将这个完整的芯片设计方案,交由台积电或三星这样的晶圆代工厂进行制造即可。
而ARM等芯片量产后,便可按照事先约定的比例,再收取相应的版税。
这套商业模式既简单又实用:它让高通能够专注于5G基带与影像算法,让联发科可以全力投入功耗优化与成本竞争,也让苹果得以在CPU核心之外,集成进其领先的神经网络引擎。
所有参与者都无需从零开始搭建指令集,而是直接站在ARM奠定的基础上,专注于更高层的创新。
甚至,如果企业连芯片设计都嫌麻烦,ARM还可提供更贴心的“计算子系统”方案。这是一整套包含了GPU、内存接口、互联总线等预先集成、验证好的组件,拿到手几乎就可以立马安排生产,极大缩短了开发周期。
换句话说,ARM不仅“卖图纸”,也在卖一套“毛坯房”。而不管哪种模式,都让客户对ARM的依赖越来越深。
正因如此,ARM的毛利率得以长期维持在95%左右,稳居半导体行业盈利能力最强的公司行列。
2025财年,ARM全年营收突破40亿美元,其中63%来自版税,37%来自授权费。
由于不涉及制造、不持有库存,即使某一年手机市场出现波动,来自服务器、汽车等领域的芯片需求仍可支撑其增长——这种多元化的营收结构,赋予了ARM极强的抗风险能力。
可以说,这是一门建立在生态之上的、近乎“旱涝保收”的生意。
然而,随着时代演进,ARM逐渐意识到:仅靠授权收入的增长存在天花板。
在爆发增长的AI算力领域,英伟达、亚马逊、谷歌等巨头,正基于ARM的架构蓝图,在数据中心和云端建立起自己的算力帝国,并攫取了其中绝大部分利润。
这意味着,如果ARM继续只做那个“收租”的房东,就可能滑向价值链的底端。
因此,ARM才决定亲自下场,从生态规则的制定者,直接化身为关键赛道的参与者。
亲自下场“造芯”的背后
2016年,软银以320亿美元收购ARM,创下当时欧洲科技史上最大并购纪录。
孙正义对此给出的解释是,物联网时代将有上万亿台设备需要芯片,而ARM是核心的基础设施。
七年后,这一愿景在资本市场上得到了回响。
2023年9月,ARM在纳斯达克上市,IPO估值达545亿美元,并获得近10倍超额认购。上市后,其股价一路冲高,市值一度逼近1900亿美元。
市场对ARM所给出的,是远超传统芯片公司的估值溢价。而这个溢价背后,是一个明确的预期:市场在赌ARM不止于“收租”。
事实也是如此。
2026年3月,ARM首次以自有量产芯片的制造商身份进入数据中心市场,并抛出一个目标:2031年营收达到250亿美元,是当前规模的6倍以上。
然而,这个目标却并不那么容易实现。
根据公开报道,ARM从毛利率近98%的授权业务转向毛利率约50%的硬件业务,相当于其主动放弃了近一半的利润空间。
意味着,如果ARM希望在2031年达成250亿美元的营收目标,就必须在5年内从接近零的份额,切入一个被x86把持了40年的市场。
可问题是,目前整个服务器CPU市场基本是以英特尔Xeon(至强)与AMD的 EPYC(霄龙)为主,几乎没给ARM留下多少缝隙可以钻。
更何况,随着营收结构大幅向硬件倾斜后,即便ARM的总营收达到250亿美元,利润增幅也可能显著低于营收增幅。
比账面数字更棘手的,还有件麻烦事:ARM亲自下场造芯片,也让“老朋友们”很不安。
根据ARM年报,其前五大客户分别是高通、苹果、三星、亚马逊和ARM中国,合计贡献了超过56%的营收。
这些“衣食父母”,也恰恰是服务器CPU市场的直接竞逐者:英伟达有Grace CPU,亚马逊有Graviton,谷歌有Axion,微软和阿里也相继入局。
可正当英伟达、高通、苹果等巨头都凭借ARM授权的“图纸”在努力构建自己的芯片帝国,并为此支付高昂授权费时,ARM却宣布亲自下场设计并销售自研芯片。
这就像一个为所有开发商供应核心建材的巨头,突然宣布自己也要开发楼盘,成为客户们的直接竞争对手。
ARM给出的官方解释是,“芯片主要面向没有自研能力的中小客户,不会直接参与市场竞争”。
可问题没这么简单。
ARM能在移动端建立统治,很大程度上是因为它是“中立平台”,相当于给所有人卖图纸,不偏袒任何一家。
可一旦自己下场做芯片,这种中立性就打了折扣,将直接影响到客户对其的信赖与合作基础。
还有一个现实障碍:ARM芯片的量产高度依赖台积电的3纳米产能,可该产能正被英伟达、苹果、AMD等巨头激烈争夺。
毫无疑问,作为硬件领域的新玩家,ARM在产能争夺中几乎不具备任何优先级优势。
几笔账加在一起,ARM“下场”的赌注,分量不是一般的重。
既然如此,ARM亲自开发的这款芯片,优势何在?
AI时代的效率赌注
随着全球代理式AI的兴起,服务器的工作逻辑已经发生了根本性改变。
它不再只是短时间爆发算力,而是需要7×24小时持续稳定运行,同时处理数十乃至上百个相互关联、环环相扣的任务。
正是这一底层场景的巨变,直接推翻了传统服务器的评判标准。
简单说,单纯看核心数量或峰值性能早已不够,真正决定算力价值的变成了两项核心能力的比拼。
一方面是看数据在芯片内外的流转效率,也就是内存带宽与访问延迟;另一方面,是看在有限电力预算下,系统能完成多少有效工作,即整体能效。
而ARM设计的芯片,正是针对这两个方向设计的。
根据ARM官方公布,这款芯片单核心内存带宽达到6GB/s,缓存访问延迟压低到100纳秒以内,两项指标均达到同期顶级x86服务器芯片的近两倍。
这意味着,在同等算力负载下,ARM方案的整机功耗可降低约40%。
不仅如此,ARM还做出了一个反常识的关键选择:彻底放弃超线程。
要知道,传统服务器芯片普遍依赖超线程,用一个物理核心同时跑两个任务,以此提升核心利用率。
但在代理式AI这种高度并发、任务强关联的场景里,所有任务相互牵制,只要其中一个环节卡住,整条链路都会陷入等待。
ARM由此做了最务实的取舍,与其用超线程榨干单核利用率,不如让每个核心专职处理单一任务,以换取更稳定的延迟表现。
这个逻辑和当年ARM做移动芯片时如出一辙:不追求极限性能,只做最适合这个场景的事。
不过,技术参数再漂亮,也不代表市场就买账。
虽说ARM自己下场,技术上或许比授权客户的方案更极致,但软件生态的兼容性、运维工具的成熟度、与现有基础设施的整合难度,才是需求方真正考量的关键。
这条路,有人走过,结果不太好看。
比如,MIPS和PowerPC当年都是授权架构,也都试图在某个节点从“卖图纸”转向做完整解决方案。
可MIPS最终在移动时代被ARM打穿,核心业务辗转被收购;PowerPC在苹果2006年切换到x86之后,基本退出了主流市场,如今只剩工业和嵌入式领域的残余份额。
这些竞争对手得到教训是一样的:技术上能打,不代表生态上能赢;时机踩对了,也不代表市场给你留了位置。
客观来说,ARM的处境比它们稍好。至少,AI这波需求是真实的,数据中心能效的问题也是真实的。
但真实的需求并不等于触手可及的市场。
ARM所面临的真正考验在于,其新型芯片能否在由英伟达GPU和x86 CPU主导的格局中,找到并站稳属于自己的生态位。
纵观其历史,ARM的每一步关键成长,都始于在岔路口选择那条更少人走的路。
从设计蓝图的提供者,到核心架构的锻造者,ARM始终秉持着同一种理念:为即将到来的计算时代,提供那个最优解的答案。
如今,它又以部分利润为代价,换取了参与定义AI时代计算标准的机会。
这次,不是为了竞争,而是为了不被替代。