news 2026/6/12 3:37:41

GLM-4.5-Air开源:120亿参数智能体模型高效新体验

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GLM-4.5-Air开源:120亿参数智能体模型高效新体验

GLM-4.5-Air开源:120亿参数智能体模型高效新体验

【免费下载链接】GLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air

导语:大语言模型领域再添重要成员,GLM-4.5-Air模型正式开源,以120亿活跃参数的紧凑设计,为智能体应用提供高效且强大的基础能力。

行业现状:随着大语言模型技术的快速迭代,模型参数规模与性能之间的平衡成为行业关注焦点。一方面,千亿级参数模型展现出卓越的智能水平,但高昂的计算成本和部署门槛限制了其广泛应用;另一方面,轻量级模型虽部署便捷,但在复杂任务处理能力上仍有不足。在此背景下,兼具高性能与高效部署特性的模型成为市场新宠,尤其在智能体(AI Agent)这一前沿应用领域,对模型的综合能力、响应速度和资源占用提出了更高要求。

产品/模型亮点

GLM-4.5-Air作为GLM-4.5系列的重要成员,专为智能体应用场景设计,其核心亮点在于:

  1. 创新架构设计:采用"总参数量与活跃参数分离"的架构,总参数量达1060亿,而活跃参数为120亿。这种设计使得模型在保持较高性能的同时,显著降低了计算资源消耗,实现了效率与性能的平衡。

  2. 统一智能体能力:模型整合了推理、编码和智能体核心能力,能够满足智能体应用在任务规划、工具使用、多轮对话等复杂场景下的需求,为开发者构建各类智能体应用提供了一体化的基础模型支持。

  3. 混合推理模式:提供"思考模式"与"非思考模式"两种运行模式。前者适用于复杂推理任务和工具调用场景,后者则针对简单查询提供即时响应,兼顾了任务处理的深度与交互的流畅性。

  4. 优异的性能表现:根据12项行业标准基准测试综合评估,GLM-4.5-Air取得了59.8分的优异成绩,在保证高效部署特性的同时,展现出与更大规模模型相竞争的性能水平。其系列模型中的GLM-4.5(320亿活跃参数)更是以63.2分的成绩在所有专有和开源模型中排名第三。

  5. 开源与商用友好:GLM-4.5-Air基于MIT开源许可证发布,允许商业使用和二次开发,极大降低了企业和开发者的使用门槛,有望加速智能体技术的普及和创新。

行业影响

GLM-4.5-Air的开源将对AI行业产生多方面影响:

  1. 降低智能体开发门槛:120亿活跃参数的设计使得模型能够在相对经济的硬件环境下运行,让更多中小企业和开发者有机会参与到智能体应用的开发中,推动行业创新。

  2. 推动智能体技术标准化:模型统一了推理、编码和智能体能力,并提供了工具解析器和推理解析器的实现(可在transformers、vLLM、SGLang等框架中找到),为智能体开发提供了标准化的技术路径。

  3. 促进开源生态发展:作为一款高性能且商用友好的开源模型,GLM-4.5-Air有望吸引社区贡献,围绕模型形成丰富的应用生态,加速相关技术的迭代与落地。

  4. 启发模型设计新思路:其"大总参数量+小活跃参数"的设计思路,为未来模型在性能与效率平衡方面提供了有价值的参考,可能引领新一轮模型架构创新。

结论/前瞻

GLM-4.5-Air的开源标志着智能体基础模型向"高效化、实用化"方向迈出了重要一步。通过创新的架构设计和能力整合,该模型在保持高性能的同时,显著提升了部署效率和商用可行性。对于开发者而言,这不仅是一个强大的工具,更是探索智能体应用边界的新起点。随着技术的不断成熟,我们有理由相信,像GLM-4.5-Air这样兼顾性能与效率的模型将成为智能体应用开发的主流选择,推动AI技术在更多行业场景中实现规模化落地与价值创造。

【免费下载链接】GLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 2:47:43

解密黑苹果配置终极方案:OpCore Simplify模块化引擎实战指南

解密黑苹果配置终极方案:OpCore Simplify模块化引擎实战指南 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify OpCore Simplify作为一款革命…

作者头像 李华
网站建设 2026/6/6 7:04:49

3步解锁AI图像生成:零基础玩转Fooocus创意工具

3步解锁AI图像生成:零基础玩转Fooocus创意工具 【免费下载链接】Fooocus Focus on prompting and generating 项目地址: https://gitcode.com/GitHub_Trending/fo/Fooocus 你是否曾想过,只需输入简单文字就能将脑海中的创意转化为专业级图像&…

作者头像 李华
网站建设 2026/6/10 2:05:47

WebSailor-3B:30亿参数打造网页导航AI新体验

WebSailor-3B:30亿参数打造网页导航AI新体验 【免费下载链接】WebSailor-3B 项目地址: https://ai.gitcode.com/hf_mirrors/Alibaba-NLP/WebSailor-3B 导语:阿里巴巴NLP团队推出WebSailor-3B模型,以30亿参数实现复杂网页导航与信息检…

作者头像 李华
网站建设 2026/5/23 0:55:10

不用写代码!Qwen2.5-7B微调脚本已预置开箱用

不用写代码!Qwen2.5-7B微调脚本已预置开箱用 1. 这不是教程,是“开箱即用”的微调体验 你有没有试过微调大模型? 是不是一打开文档就看到满屏的 pip install、git clone、torch.compile()、PEFT_CONFIG……然后默默关掉网页,继续…

作者头像 李华