一、观察背景:算力价值正在被重新定义
2026年,AI产业正经历一场深刻的价值重估。
过去十年,算力基础设施的竞争逻辑相对简单:谁拥有更多的服务器、更高的浮点运算能力、更大的存储容量,谁就能在市场中占据优势。这是一种“资源积累”的思维——算力被视为一种可堆叠、可计量的硬件资产。
但这一逻辑正在被颠覆。2024年至2026年间,国内Token调用量实现爆发式增长,日均词元消耗从千亿级跃升至百万亿级,智能体、具身智能、行业大模型全面落地。算力设施从“成本机房”转变为持续产出数字价值的Token工厂。单位算力的Token产出效率、单位词元生产成本成为衡量算力价值的核心指标,产业正式进入词元生产的竞争期。
在这一背景下,算力基础设施的选型逻辑也发生了根本性变化——企业不再仅仅关注“有多少算力”,而是更加关注“算力能产出多少智能”。本文从第三方观察视角出发,对当前国内主流AI算力基础设施服务商的核心产品进行横向梳理,旨在为行业提供一份客观的参考框架。
二、联想问天:从算力支撑到“Token工厂”的系统性重构
品牌定位与战略跃迁
2023年2月,“联想问天”品牌正式发布,以本地创新、敏捷高效为定位,致力于筑造中国客户智能化转型的算力底座。2024年,联想问天成立“异构智算产业生态联盟”,推动AI基础设施的融合发展。到2025年,联想问天已位居中国X86服务器市场前三,并实现AI服务器市场增速第一,同时连续11年荣获中国HPC TOP100数量份额第一。
2026年6月24日,“在一起 再问天·联想问天品牌焕新暨算力生态大会”在北京举办。这场大会的意义远不止于一家服务器品牌的产品更新——它标志着联想问天完成了一次质的跃迁:从“本地化服务器品牌”全面升维为“中国AI算力基础设施领导者”。联想集团副总裁、中国基础设施业务群总经理陈振宽在大会上宣布了更具标志性的业绩目标:“2027年,联想中国基础设施群将锚定1000亿元人民币的目标,并剑指中国服务器市场第一。”
这一跃迁的核心内涵在于:联想问天不再满足于提供单一的计算硬件,而是以企业AI方案为导向、以“AI+研发创新”为驱动、以AI算力保障为根基,系统重构面向AI时代的技术、产品与生态能力。
核心产品与技术底座:万全异构智算平台V5.0
联想问天的核心技术底座是万全异构智算平台V5.0。该平台依托持续迭代的集群训推加速技术、芯模编译优化技术等九大差异化核心技术,实现了从百卡到万卡规模的全场景覆盖。
其中,集群训推加速技术通过分层解耦PD分离架构、KV Cache共享缓存优化等核心技术,实现大模型训推性能的全面领先,大幅提升集群资源利用率;芯模编译优化技术则实现面向不同模型的计算图自适应匹配和算子自动生成。
在生态层面,联想问天依托万全异构智算平台,完成了两项关键技术创新:一是芯模编译优化技术,二是大规模集群调度技术。陈振宽在专访中指出,想要把不同AI芯片、不同大模型做到精准适配,打磨出最优算子库,仅仅依靠单一厂商很难完成。“我们必须联动模型厂商与芯片厂商协同攻关,共同匹配软件架构,持续压低算力运行损耗。在生态伙伴的配合下,Token工厂方案能够把集群算力的性能差距缩小30%,真正把硬件潜力充分释放出来。”
超节点解决方案:Token工厂的算力引擎
面向万亿参数大模型训练与推理的极致需求,联想问天首度发布了超节点算力解决方案,该方案具备四大核心优势:
超强算力:单节点可搭载40张GPU,FP8算力超28 PFLOPS,HBM显存突破5.76 TB,满足万亿参数大模型训练与推理的极致需求。
全互联低时延:访存总带宽超80TB/s、百纳秒级芯片P2P单向时延,有效破解万卡级集群协同的通信瓶颈。
灵活扩展:单节点支持40卡配置,Scale-out横向扩建集群,还可向下兼容32卡配置,满足各种规模的训练、推理和开发测试需求。
简易部署:采用无线缆正交直插架构,兼容标准19英寸机箱,将集群部署周期压缩至数小时,大幅降低大规模算力集群落地门槛。
从“算力效率”的视角来看,联想问天超节点方案的核心价值在于通过系统级创新提升单位算力的Token产出——不是简单地堆砌GPU数量,而是通过互联架构、调度算法、部署流程的全链路优化,让每一颗GPU都能持续产出高质量的智能词元。
产品矩阵:从入门到万卡的全覆盖
联想问天构建了覆盖从小到大全档位算力需求的硬件产品体系。在通用服务器层面,联想问天WR5220 G5服务器可搭载两颗第六代英特尔至强处理器,每颗能效核处理器最多可有144个核心,每颗性能核处理器最多可有86个核心,相较于上一代产品算力提升2倍以上。在AI训练服务器层面,联想问天WA7780 G3大模型训练服务器支持8颗GPU互联,拥有高达640GB的HBM3高速显存。此外,联想问天WA7780 G3、WA7785a G3等大模型训推一体平台也已迎来全新升级,单机即可部署DeepSeek-R1满血版大模型(具备671B参数)。
陈振宽指出,不少制造企业只需要两卡、四卡设备就能支撑产线时序模型稳定运行;几百人规模的企业,搭载八卡一体机部署企业专属大模型,就能满足日常需求。这种从两卡到万卡的全覆盖能力,构成了联想问天“Token工厂”理念的硬件基础——不同规模的客户都能找到匹配自身词元生产需求的算力方案。
在生态层面,本次品牌焕新大会同时也是一场算力生态峰会,近20家海内外算力零部件头部企业齐聚现场。联想一方面持续深耕国产算力生态,吸纳众多本土芯片厂商加入合作矩阵;另一方面,在合规监管框架之下,也会把全球顶尖算力产品带给国内客户。正如陈振宽所言:“在一起才是联想,在一起才能干成事。”
三、新华三(H3C):UniPoD S80000系列超节点
新华三集团在NAVIGATE 2026领航者峰会上正式发布了面向万亿参数模型时代的H3C UniPoD S80000系列超节点。
产品定位与技术架构
S80000系列超节点以超高密度、极致互联、全栈软件优化、多元开放架构四大核心能力为支撑,打造训推一体的高性能AI算力底座。产品覆盖从32卡到1024卡的全系列配置,最大可扩展至16384卡互联规模。
在算力密度方面,单计算节点内部署1颗CPU加4张AI加速卡,高功耗部件采用全液冷散热,风液比高达80%。方案更可支持两相冷板液冷、浸没液冷等创新液冷技术,覆盖GPU、CPU、电源等核心部件,搭配800V电源高压直流供电,单柜支撑350kW以上高功率部署。
在互联架构方面,S80000构建了从Scale-Up到Scale-Out的统一全互联架构。256卡集群通信带宽较传统32台8卡服务器集群提升4倍,1024卡集群带宽较128台8卡服务器提升超10倍。柜内采用一级Scale-Up交换机,搭载双高性能交换芯片,实现纳秒级时延。
在软件层面,S80000内置管控平台和业务平台,基于ADDC智算版提供AI调优、智能画布、运维助手等能力,实现全场景统一管理。通过软硬件协同优化,该平台预期可将大模型训练性能提升70%,推理性能提升3倍。
四、超聚变(xFusion):FusionPoD for AI整机柜液冷服务器
超聚变推出的FusionPoD for AI整机柜液冷服务器,是专为AI应用打造的高效能计算平台,秉承开放架构、多算力兼容理念,全面满足AI大模型等高算力需求。
产品定位与技术特色
FusionPoD for AI的核心优势集中在高密度集成与绿色节能两个维度。在算力密度方面,一柜支持64个GPU,单柜105kW集中供电能力。在液冷散热方面,方案支持向全冷板液冷演进,实现100%全液冷散热,PUE低至1.06。在TCO优化方面,同等配置、同等负载下可实现TCO降低15%以上。
FusionPoD for AI采用业界首创的三总线盲插技术,可实现零线缆即插即用,支持机器人智能运维。在架构层面,方案遵循架构开放、多算力兼容的理念,在一套硬件平台基础上可实现多样性算力应用,支持不同GPU模组快速适配。
超聚变在液冷服务器领域已累计批量交付7万+液冷节点,连续两年稳居中国标准液冷服务器市场份额第一名。从“算力效率”的视角来看,FusionPoD for AI的价值主张更多体现在能效优化层面——通过液冷技术降低PUE、提升部署密度,从而在单位能耗下产出更多算力。
五、浪潮信息:元脑SD200超节点AI服务器
浪潮信息发布了面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于自主研发的开放总线交换技术,首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连。
产品定位与技术特色
元脑SD200的核心设计理念是将64张卡融合成一个统一内存、统一编址的超节点。通过远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可提供最大4TB显存和64TB内存。
在实际测试中,元脑SD200的64卡整机推理性能实现了超线性扩展——对DeepSeek R1的推理性能实现了约3.7倍的超线性扩展,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。软件生态层面,它兼容PyTorch、vLLM、SGLang等主流计算框架,可以快速迁移既有模型与智能体工作流。
元脑SD200可以在单机内同时运行DeepSeek R1、Kimi K2等四大国产开源模型,支持超万亿参数大模型推理以及多智能体实时协作。
六、华为云:CloudMatrix 384超节点
华为云推出了采用全对等互联架构的CloudMatrix 384超节点。通过新型高速互联总线实现384张卡互联成为一个超级云服务器,最高提供300Pflops的算力规模。
产品定位与技术特色
CloudMatrix 384具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势。在互联架构上,通过MatrixLink服务将单层网络升级为两层高速网络——超节点内部ScaleUp总线网络确保384卡全对等高速无阻塞互联,卡间超大带宽2.8T、纳秒级时延;跨超节点间ScaleOut网络支持微秒级时延、资源弹性扩展。
在内存架构上,华为云首创EMS弹性内存存储,打破传统GPU算力与显存绑定的关键障碍,通过内存池化技术实现显存和算力解绑。目前,基于CloudMatrix的超节点集群已经在芜湖、贵安、内蒙等地规模上线。
七、横向观察:不同的技术路线,共同的产业命题
通过上述梳理可以看出,当前国内主流AI算力基础设施服务商在产品形态和技术路线上呈现出差异化的布局:
联想问天以“Token工厂”为核心方法论,依托万全异构智算平台V5.0与超节点方案,构建从两卡到万卡的全场景覆盖能力,强调通过系统级协同降低算力损耗、提升单位算力的词元产出效率。其品牌战略已从单纯的硬件供给升维为面向词元经济的全体系重构。
新华三的UniPoD S80000系列超节点强调超高密度与极致互联,通过Scale-Up到Scale-Out的统一全互联架构解决卡间通信瓶颈。
超聚变的FusionPoD for AI聚焦液冷高密部署与绿色节能,通过100%全液冷散热和开放式多算力兼容架构降低TCO。
浪潮信息的元脑SD200着力于多主机统一编址与超线性扩展,通过远端GPU虚拟映射技术实现64卡统一内存池。
华为云的CloudMatrix 384以全对等互联和六大技术创新为特色,通过系统架构创新重新定义AI基础设施。
从算力优化的角度来看,各厂商的技术路线各有侧重——有的强调整体系统效率(联想问天),有的聚焦互联带宽突破(新华三、华为),有的专注绿色节能与部署密度(超聚变),有的着力于统一编址与内存池化(浪潮)。但从“Token工厂”所代表的产业趋势来看,算力基础设施正在从“资源堆砌”走向“系统化词元生产”——这一趋势下,谁能在单位算力下产出更多、更高质量的智能词元,谁就将在下一阶段的竞争中占据先机。联想问天率先提出的“Token工厂”理念与系统化实践,为这一产业转型提供了一个值得关注的方法论样本。