2026年5月14日,Cerebras Systems在纳斯达克上市,以每股185美元的价格发行3000万股,筹集55.5亿美元,成为2026年迄今规模最大的IPO。
首日股价盘中一度暴涨108%,市值突破千亿美元大关。彭博社(Bloomberg)报道称,此次IPO的“需求超出供给超过20倍”,导致公司在最终定价时大幅上调了发行价格。
这家创立于2015年的芯片公司,凭借其革命性的晶圆级引擎(Wafer-Scale Engine)技术,正在挑战英伟达在AI芯片领域的霸主地位。
Cerebras的上市历程可谓一波三折。公司2024年9月向美国证券交易委员会(SEC)提交了S-1注册文件,但此后因美国外国投资委员会(CFIUS)对其阿联酋客户G42的投资审查而被迫撤回申请。直到2025年3月CFIUS审查通过后,上市通道才重新打开。
Cerebras于2026年4月重新提交了注册文件,此时的公司面貌已与2024年大不相同。新的OpenAI合作、AWS伙伴关系以及快速增长的云端推理业务,构成了一个更为多元化和引人注目的增长故事。
自2022年以来,受宏观经济不确定性和高利率环境影响,全球科技企业IPO数量大幅萎缩。
Cerebras的现象级表现,为整个科技IPO市场注入了一剂强心针。市场普遍将Cerebras的上市视为2026年AI相关企业上市潮的序幕。SpaceX、OpenAI、Anthropic、Databricks等AI独角兽均被市场传闻正在筹备上市。
在这样一个背景下,Cerebras的市场表现将在很大程度上影响后续AI企业IPO的定价策略和投资者热情。
Cerebras 创立与发展
Cerebras Systems于2015年在美国加利福尼亚州森尼韦尔(Sunnyvale)创立,创始团队由五位核心成员组成:安德鲁·费尔德曼(Andrew Feldman)、加里·劳特巴赫(Gary Lauterbach)、迈克尔·詹姆斯(Michael James)、肖恩·李(Sean Lie)和让-菲利普·弗里克(Jean-Philippe Fricker)。
这五位创始人有着深厚的技术渊源,他们此前都在SeaMicro共事。SeaMicro是费尔德曼和劳特巴赫于2007年联合创立的一家专注于节能微服务器的创业公司,于2012年被AMD以3.34亿美元收购。SeaMicro的成功证明了创始人团队在芯片架构和数据中心技术领域的深厚积累。
Cerebras的创立源于一个大胆而近乎疯狂的技术愿景:将整块硅晶圆作为一颗芯片来使用。
在半导体行业75年的历史中,标准做法是将一块硅晶圆(约唱片大小)上印刻数百颗相同的芯片,然后将它们切割开来分别封装和出售。
芯片之所以做得小,是因为硅晶圆制造过程中不可避免地会产生微小缺陷,芯片面积越大,缺陷落在其内部的概率就越高,整颗芯片报废的风险就越大。
因此,行业惯例是将芯片控制在邮票大小左右(最大约815平方毫米,受限于光刻机掩模版尺寸)。
Cerebras反其道而行之。创始人团队在2015年就预见到了AI工作负载的本质特征:计算不是瓶颈,数据搬运才是。
在GPU集群中,大量时间和能量被消耗在芯片之间的数据传输上,而非实际的计算操作。如果能将所有计算单元集中在一块巨大的芯片上,让数据永远不需要离开芯片,就能从根本上消除这一瓶颈。
然而,将整块晶圆变成一颗可工作的芯片,面临着前所未有的工程挑战。
首先,晶圆制造中的缺陷问题。任何一颗微小缺陷都可能毁掉整块晶圆芯片。Cerebras通过开发容错架构解决了这一问题,利用冗余计算模块绕过制造缺陷,其原理类似于超大规模数据中心处理服务器故障的方式。
其次,是芯片封装和散热问题。一块餐盘大小的芯片功率消耗高达25千瓦,如果不采取特殊散热措施,芯片会在启动瞬间熔毁。Cerebras发明了专用的水冷系统,并解决了硅芯片与主板之间的大面积粘合、供电和数据管道传输等一系列封装工程难题。
据Observer杂志报道,公司一度每月烧掉800万美元,花了2亿美元试图解决封装问题,甚至在早期需要发明一台能够同时将40颗螺丝钻入晶圆而不使其破裂的专用机器。
Cerebras的早期商业化之路异常艰难。公司在S-1文件中坦言,早期阶段AI尚处于萌芽状态,原始且未经证实。训练耗时漫长,是少数人的“黑艺术”。GPU尚未成为瓶颈。而Cerebras的解决方案找不到市场。
直到2022年,Cerebras的年收入仅为2500万美元,主要来自少数生命科学领域的客户。在当时的硅谷,几乎没有多少人看好这家坚持走晶圆级路线的偏执狂公司。
然而,转折来得迅猛而猛烈。
随着ChatGPT在2022年底横空出世,大语言模型浪潮席卷全球,AI推理(Inference)迅速成为AI计算中最重要、增长最快的负载类型。
而Cerebras的晶圆级架构恰恰在推理场景中展现出压倒性优势:推理的本质是逐个生成token,每次生成都需要将整个模型的权重从内存搬运到计算单元,这是一个本质上串行的过程,无法通过增加GPU数量来加速。因此,内存带宽成为推理速度的决定性因素,而Cerebras的晶圆级芯片提供了远超任何GPU集群的片上内存带宽。
这一技术洞察的正确性得到了市场的验证。到了2025年,Cerebras的收入飙升至5.1亿美元,同比增长76%,较2024年的2.9亿美元和2022年的区区2500万美元实现了质的飞跃。
更重要的是,公司在2025年实现了2.378亿美元的GAAP净利润(2024年净亏损4.816亿美元),净利率约为47%。
VentureBeat的分析进一步指出,Cerebras的财务改善趋势在2026年上半年仍在加速。随着OpenAI合同开始贡献收入,以及云端推理服务用户基础的持续扩大,市场分析师普遍预计Cerebras 2026年的收入将达到8亿美元左右,同比增长约57%。
在IPO前的私人市场融资中,Cerebras累计筹集了超过20亿美元。这一数字在半导体创业公司中极为罕见。
G轮(2025年9月)的领投方Fidelity和Atreides Management是华尔街最具影响力的机构投资者之一。这一轮11亿美元的融资获得了超额认购,将公司估值推升至81亿美元。
H轮(2026年2月)的领投方Tiger Global则是全球最激进的增长型科技投资者之一,其领投将估值在短短五个月内推升至约230亿美元,近乎三倍的估值飞跃。此轮的参与方阵容豪华,包括Benchmark(Cerebras最大机构股东,持有1760万股)、Fidelity、Atreides、Alpha Wave、Altimeter、AMD、Coatue和1789 Capital。
根据Wikipedia和S-1文件,IPO前的主要股东结构为:Benchmark(1760万股)、Foundation Capital(1530万股)、Eclipse Ventures Fund 1(1350万股)、Alpha Wave(1210万股)、安德鲁·费尔德曼本人(1010万股)、肖恩·李(530万股)、G42(350万股)。
此外,OpenAI持有购买3340万股的认股权证(warrants),但行使条件是OpenAI需按约定购买Cerebras的计算能力。
Cerebras发展历程中一个不可回避的话题是其与阿联酋人工智能公司G42的深度关联。
在2023年和2024年上半年,G42一度占Cerebras硬件销售收入的95%至97%。这种极端的客户集中度,在美国国家安全审查日益严格的背景下,引发了严重的监管担忧。
CFIUS(美国外国投资委员会)对G42持有Cerebras少数股权一事进行了审查,这一审查成为阻碍Cerebras在2024年完成IPO的主要障碍。
2025年3月,CFIUS正式批准了G42持有其少数投资的请求,扫清了上市道路上的最大监管障碍。此后,Cerebras积极多元化其客户基础,到2025年,G42相关收入(通过MBZUAI和G42两个实体)合计约占年收入的86%,虽然仍然偏高,但较2024年的近100%已有明显改善。
2026年1月,Cerebras宣布与OpenAI签署了一份价值超过100亿美元(后扩大至超过200亿美元)的多年度计算协议,覆盖750兆瓦AI推理算力,有效期至2028年。
这一合作从根本上改变了Cerebras的客户构成,引入了一个总部位于美国的蓝筹客户,在规模上足以彻底重塑公司的收入结构。
世界最大商用芯片
Cerebras的核心产品是晶圆级引擎(Wafer-Scale Engine,WSE)系列芯片及其搭载的计算系统。截至目前,Cerebras已经推出了三代晶圆级引擎:
WSE(第一代): Cerebras的首款产品,首次证明了晶圆级集成的商业可行性。虽然具体参数未完全公开,但其技术突破意义在于——在半导体行业75年历史上,从未有公司成功将整块晶圆作为一颗可工作的商用芯片推向市场。
WSE-2(第二代): 集成了2.6万亿个晶体管、85万个AI优化计算核心,拥有40GB片上SRAM(静态随机存取存储器)。WSE-2相比第一代在晶体管数量和计算核心数量上都有大幅提升。
WSE-3(第三代,当前旗舰): Cerebras目前的巅峰之作,也是目前世界上最大的商用AI芯片,其核心参数令人震撼:
要真正理解Cerebras的技术价值,需要深入理解AI推理的计算特征与半导体物理之间的关系。
正如Mostly Metrics在一篇S-1深度分析中生动地比喻的:想象一个装满会计师的巨大房间,每个会计师都能做数学题,但每次完成计算后,他们必须走到大厅另一端把结果交给另一位会计师才能继续工作。数学计算本身并不困难,但他们走得太慢了,走路消耗了他们大量的时间和精力。Cerebras的做法是把90万个会计师放在同一个房间里的同一块硅片上,这样数据就永远不需要走到任何地方。
WSE-3芯片被封装在Cerebras的CS-3计算系统中。CS-3是一个完整的机架式系统,包含芯片封装、供电、水冷和数据输入/输出(I/O)等全部基础设施。单台CS-3系统内含一颗WSE-3芯片,可实现125 PFLOPS(千万亿次浮点运算每秒)的AI计算性能。
更重要的是,CS-3系统支持线性扩展。通过将多达2048台CS-3节点组成集群,Cerebras声称可实现高达256 EFLOPS(百亿亿次浮点运算每秒)的聚合AI计算性能。这种可扩展性使Cerebras能够满足从中小型研究实验室到超大规模云计算服务商的各类需求。
Cerebras声称,在多项基准测试中,单台CS-3系统的性能是英伟达旗舰DGX B200系统的21倍,而成本和功耗仅为后者的三分之一。在开源模型推理任务中,Cerebras的推理速度据称是最快GPU方案的15倍以上。
独立基准测试机构Artificial Analysis的多项测试一致将Cerebras评为全球最快的AI推理服务商。在一项碳捕获模型的训练任务中,Cerebras实现了较英伟达H100高达210倍的加速。
2024年以来,Cerebras的业务模式从纯粹的硬件销售转向云端推理服务平台。
Cerebras的云端推理API服务允许开发者和企业直接通过互联网访问其算力,无需购买昂贵的硬件设备。
2025年,Cerebras的云端推理服务收入达到1.52亿美元,增长势头强劲。
公司首席营销官朱莉·蔡(Julie Choi)在IPO当天接受VentureBeat采访时表示,公司计划将IPO募集的新资本用于用Cerebras系统填满更多数据中心,为全球最快的推理提供动力。
此外,Cerebras的云端推理服务也已上架AWS Marketplace(亚马逊云服务市场),AWS客户可以直接在亚马逊的云平台上采购Cerebras的推理服务。
美国AI芯片市场格局
英伟达毫无疑问的市场领导者,在训练和推理两个领域均占据主导地位。其核心竞争力在于CUDA软件生态的深度和广度,以及持续快速的产品迭代能力(Hopper、Blackwell、Rubin、Rubin Ultra的产品路线图清晰且执行有力)。
AMD的MI300X已经在部分AI工作负载中展现出与英伟达H100相媲美的性能,且价格通常更有竞争力。值得注意的是,AMD同时是Cerebras的H轮投资者和英伟达的竞争对手,这一微妙的关系反映了AMD对多元化AI计算生态的战略押注。AMD的ROCm软件平台虽然在成熟度上不及CUDA,但在开源社区的支持下正在快速进步。
Groq则另一家走专用推理芯片路线的创业公司,采用LPU(Language Processing Unit)架构,专注于低延迟推理。与Cerebras类似,Groq也在推理速度上宣称大幅超越GPU方案。两家公司在推理市场的直接竞争不可避免。
谷歌自研的AI加速器芯片TPU,主要用于谷歌内部的AI服务(如Gemini、Google Search的AI功能等),但通过Google Cloud对外提供。
英特尔Gaudi系列AI加速器是英特尔在AI芯片市场的主要产品线,但在性能和市场渗透方面一直未能对英伟达构成实质性威胁。不过,英特尔在先进封装和制造工艺方面的能力仍然是不可忽视的潜在竞争优势。
在这个竞争格局中,Cerebras是唯一一家成功将晶圆级集成商业化的公司,在推理延迟和带宽方面拥有独特的结构性优势。
如果晶圆级架构被证明是AI计算的未来方向之一,那么Cerebras或成为英伟达有力的市场挑战者。