news 2026/2/7 7:26:30

GLM-4.5-Air开源:120亿参数智能体模型免费商用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GLM-4.5-Air开源:120亿参数智能体模型免费商用

GLM-4.5-Air开源:120亿参数智能体模型免费商用

【免费下载链接】GLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air

导语:智谱AI正式开源GLM-4.5-Air大模型,以120亿活跃参数的紧凑设计和MIT许可证下的免费商用权益,为智能体应用开发提供了高性能且低成本的解决方案。

行业现状:随着大语言模型技术的快速迭代,智能体(AI Agent)已成为行业发展的重要方向。根据近期行业报告,具备自主决策、工具使用和复杂任务处理能力的智能体模型正逐步渗透到企业服务、自动化办公、智能交互等多个领域。然而,高性能大模型普遍存在部署成本高、商用授权复杂等问题,制约了中小型企业和开发者的创新应用。在此背景下,兼具性能与经济性的开源模型成为市场迫切需求。

产品/模型亮点:GLM-4.5-Air作为GLM-4.5系列的轻量版,核心优势体现在三个方面:

首先是高效的参数设计。该模型采用1060亿总参数配合120亿活跃参数的混合专家(MoE)架构,在保持轻量化部署特性的同时,实现了推理、编码与智能体能力的统一。据官方测试数据,其在12项行业标准基准测试中综合得分为59.8,在同量级模型中表现突出。

其次是创新的混合推理模式。模型支持"思考模式"与"非思考模式"双模式切换:前者适用于复杂逻辑推理和工具调用场景,可通过多轮思考提升任务完成质量;后者则针对简单问答提供即时响应,显著降低计算资源消耗。这种设计使模型能灵活适配不同复杂度的应用需求。

最后是宽松的商用条款。GLM-4.5-Air采用MIT开源许可证,允许开发者免费用于商业用途和二次开发,大幅降低了企业级应用的技术门槛。官方同时提供了与Transformers、vLLM、SGLang等主流框架的适配代码,简化了本地化部署流程。

行业影响:GLM-4.5-Air的开源可能加速智能体技术的普及应用。对于企业用户而言,120亿参数规模意味着可在单GPU服务器上实现高效部署,将显著降低AI基础设施投入;对开发者社区来说,开放的模型权重和推理代码为研究智能体架构、优化模型性能提供了优质样本。值得注意的是,其3550亿参数的完整版GLM-4.5已在综合评测中获得63.2分,位列全球模型性能第三,显示出该系列在技术上的竞争力。

结论/前瞻:随着GLM-4.5-Air的开源,大模型行业正迎来"高性能与低成本"并行发展的新阶段。这种"核心模型闭源+轻量版本开源"的策略,既保护了企业的核心技术优势,又通过生态共建扩大了技术影响力。未来,随着智能体应用场景的深化,具备工具调用能力、多模态交互和低资源部署特性的模型将成为竞争焦点,而开源社区的创新活力或将推动行业加速进入"智能体普及期"。

【免费下载链接】GLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/3 7:55:57

通义千问2.5-7B-Instruct部署卡顿?显存优化技巧提升GPU利用率

通义千问2.5-7B-Instruct部署卡顿?显存优化技巧提升GPU利用率 1. 引言:为何选择通义千问2.5-7B-Instruct? 随着大模型在实际业务场景中的广泛应用,开发者对“中等体量、高可用性、可本地部署”的模型需求日益增长。通义千问2.5-7…

作者头像 李华
网站建设 2026/2/7 6:00:04

小白也能懂的GPT-OSS-20B部署:网页推理一键启动指南

小白也能懂的GPT-OSS-20B部署:网页推理一键启动指南 1. 背景与技术价值 随着大模型技术的快速发展,本地化、轻量化部署已成为开发者和研究者关注的重点。OpenAI 近期开源了其新一代语言模型 GPT-OSS 系列中的 gpt-oss-20b,该模型在保持高性…

作者头像 李华
网站建设 2026/2/6 12:32:35

AI自瞄系统:重新定义你的游戏瞄准体验

AI自瞄系统:重新定义你的游戏瞄准体验 【免费下载链接】RookieAI_yolov8 基于yolov8实现的AI自瞄项目 项目地址: https://gitcode.com/gh_mirrors/ro/RookieAI_yolov8 还在为游戏中的精准瞄准而烦恼吗?AI自瞄系统正悄然改变着游戏竞技的规则。这套…

作者头像 李华
网站建设 2026/2/4 11:27:25

3分钟搞定编辑器@提及功能:Tiptap终极集成指南

3分钟搞定编辑器提及功能:Tiptap终极集成指南 【免费下载链接】tiptap The headless editor framework for web artisans. 项目地址: https://gitcode.com/GitHub_Trending/ti/tiptap 还在为编辑器中的用户功能发愁吗?从复杂的用户列表加载到繁琐…

作者头像 李华
网站建设 2026/2/4 15:50:54

DeepSeek-OCR医疗影像:报告与图像关联

DeepSeek-OCR医疗影像:报告与图像关联 1. 背景与挑战 在现代医疗信息化进程中,医学影像数据(如X光、CT、MRI)与对应的诊断报告通常以非结构化或半结构化形式存储。尽管医院普遍采用PACS(影像归档和通信系统&#xff…

作者头像 李华