news 2026/3/26 9:05:13

GLM-5架构曝光,智谱两日涨60%:采用DeepSeek同款稀疏注意力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GLM-5架构曝光,智谱两日涨60%:采用DeepSeek同款稀疏注意力

GLM-5采用了DeepSeek-V3/V3.2架构,包括稀疏注意力机制(DSA)和多Token预测(MTP),总参数量745B,是上一代GLM-4.7的2倍。

不管Pony Alpha是不是智谱的,下一代旗舰大模型GLM-5都要来了。

GitHub代码确认,新一代架构细节曝光。

GLM-5采用了DeepSeek-V3/V3.2架构,包括稀疏注意力机制(DSA)和多Token预测(MTP),总参数量745B,是上一代GLM-4.7的2倍。

与此同时,OpenRouter平台上突然出现的神秘匿名模型「Pony Alpha」,编程和推理能力极为强劲,被社区91%以上的用户判断为GLM-5测试版。

受这些消息影响,智谱AI港股两日暴涨60%。

开源代码泄露参数架构

GLM-5的架构信息并非来自智谱官方,而是被开源社区从代码提交中“挖”出来的。

在vLLM推理框架的PR中,开发者发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上。

GLM-5继承的第一项核心技术是DeepSeek稀疏注意力(DeepSeek Sparse Attention,DSA)。

DSA通过两阶段流程做到长文本处理效率大幅提升,输出质量几乎不受影响。

首先由Lightning Indexer轻量级组件快速扫描所有历史token并打分,评估它们与当前query token的相关性;然后只挑选得分最高的Top-k个token进行完整的注意力计算,其余全部跳过。

第二项技术是多Token预测(Multi-Token Prediction,MTP),用于提升模型的生成效率。

从代码中推断出的架构参数看,GLM-5包含78层隐藏层,采用MoE(混合专家)架构,共256个专家,每次推理激活8个,激活参数约44B,稀疏度5.9%,与DeepSeek-V3.2的5.4%基本持平。

上下文窗口支持最高202K token。

有开发者指出,复用DeepSeek架构意味着GLM-5可以直接受益于vLLM、SGLang等推理框架已有的优化,部署门槛会更低。

但也有人提出疑问:DeepSeek-V3架构以纯文本为主,GLM-5首发版本是否会因此缺失多模态能力?

匿名测试与春节档大混战

2月初,OpenRouter平台上新匿名免费模型,代号「Pony Alpha」,支持200K上下文窗口。

模型一上线就引起了开发者社区的广泛关注,它的编程能力非常突出,能根据单条提示直接生成完整的功能性应用程序,在复杂推理和Agent工作流上同样表现出色。

“这到底是谁家的模型”迅速成为社区热议话题。

指向GLM-5的证据链覆盖了多个维度:

时间上,「Pony Alpha」出现的节点与智谱首席科学家唐杰多次暗示的GLM-5发布窗口完全吻合。

有开发者测试发现该模型对特定token的反应和GLM系列一致。

风格上,它的输出排版习惯也与GLM系列高度一致。

GLM-5的发布窗口,恰好撞上了一个异常拥挤的档期。

唐杰在内部信中已明确预告GLM-5即将发布,多方信息指向2026年2月中旬,即春节前后。

而在同一时间段,DeepSeek新模型、Qwen 3.5、MiniMax M2.2等模型也都有消息将发布更新。

2026年的“春节档”,AI比电影那边还热闹。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/21 13:39:52

MySQL崩溃恢复神器:innodb_force_recovery 参数详解,DBA 必备!

在 MySQL 的日常运维中,最让人“心跳加速”的场景之一,莫过于数据库突然无法启动,错误日志里赫然写着: InnoDB: Database was not shut down normally!InnoDB: Starting crash recovery....InnoDB: Assertion failure in thread .…

作者头像 李华
网站建设 2026/3/25 0:54:07

自动搬运机械手设计

自动搬运机械手设计与实现 第一章 设计背景与核心目标 传统工业物料搬运多依赖人工或简易机械,存在作业精度低(定位误差≥5mm)、搬运效率低、劳动强度大、易发生物料磕碰与人员安全事故等问题,难以满足现代化生产线“高精度、高效…

作者头像 李华
网站建设 2026/3/22 20:45:32

JAVA网页分片上传大文件有哪些步骤?

《一个Java老码农的20G文件夹上传历险记》 大家好,我是老王,一个在西安写了15年Java的老程序员。最近接了个外包项目,需求简单概括就是:“用IE9上传20G文件夹,预算100块还要724小时支持”——这感觉就像是让我用自行车…

作者头像 李华
网站建设 2026/3/23 23:41:44

分块上传大文件在JAVA网页中如何实现?

汽车设计图纸大文件上传(WEB 集成)方案 一、项目背景 在汽车制造行业,汽车设计图纸是核心资产,其文件体积通常较大,动辄达到 100G 左右。客户提出需求,希望能在我们开发的 WEB 系统中实现这类大文件的安全…

作者头像 李华
网站建设 2026/3/21 5:15:15

照着用就行:自考必备的降AI率平台,千笔·降AIGC助手 VS 灵感ai

在AI技术迅速发展的今天,越来越多的学生开始借助AI工具辅助论文写作,以提升效率和内容质量。然而,随着各大查重系统对AI生成内容的识别能力不断提升,AI率超标问题日益突出,成为许多学生毕业路上的“拦路虎”。无论是知…

作者头像 李华
网站建设 2026/3/23 15:52:05

Windows 11 终极性能优化指南

一、精简后台:关闭非必要的系统服务目标:禁用日常使用中无需的系统服务,以减少内存与磁盘资源的占用。操作步骤:打开服务管理器:按下 Win R 键,输入 services.msc 并回车。定位并禁用建议服务(…

作者头像 李华