news 2026/7/4 13:03:42

GLM-4.5-Air开源:120亿参数智能体模型效率新标杆

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GLM-4.5-Air开源:120亿参数智能体模型效率新标杆

GLM-4.5-Air开源:120亿参数智能体模型效率新标杆

【免费下载链接】GLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air

导语:Zhipu AI正式开源GLM-4.5-Air智能体模型,以120亿活跃参数实现高性能与轻量化的平衡,为智能体应用开发提供新选择。

行业现状:智能体(AI Agent)正成为大语言模型应用的重要方向,其需要模型具备复杂任务规划、工具使用和多轮交互能力。当前行业面临两难:高性能模型通常参数规模庞大(千亿级以上),部署成本高昂;轻量级模型虽部署门槛低,但智能体所需的推理和工具调用能力不足。据行业报告显示,2024年智能体相关应用开发需求增长达180%,开发者对"高效能+低门槛"模型的需求迫切。

模型亮点:GLM-4.5-Air作为专为智能体设计的基础模型,核心创新体现在三个方面:

首先是混合参数设计,采用1060亿总参数+120亿活跃参数的架构,通过MoE(混合专家)技术实现资源高效利用。这一设计使模型在保持120亿活跃参数轻量化特性的同时,能调用更多专家模块处理复杂任务。

其次是双推理模式,提供"思考模式"和"非思考模式"切换:前者适用于逻辑推理、工具调用等复杂任务,后者针对简单问答提供快速响应。这种灵活性使模型能根据任务复杂度动态调整计算资源,平均响应速度提升40%。

第三是全面能力集成,统一了推理、编码和智能体能力。在12项行业标准基准测试中,GLM-4.5-Air获得59.8分的成绩,尤其在代码生成(HumanEval 72.3分)和数学推理(GSM8K 85.6分)方面表现突出,接近部分千亿级闭源模型水平。

行业影响:GLM-4.5-Air的开源将加速智能体技术民主化进程。对于中小企业和开发者,120亿参数规模意味着可在单张消费级GPU上部署,将智能体应用开发成本降低60%以上;对于行业生态,MIT商业友好许可允许二次开发,有望催生更多垂直领域智能体解决方案,如自动化办公助手、智能运维机器人等。

值得注意的是,GLM-4.5系列同时提供3550亿总参数(320亿活跃参数)的完整版模型,形成"轻量-专业"产品线,满足不同场景需求。这种分级策略可能成为大模型厂商的新趋势,推动智能体技术从实验室走向产业落地。

结论/前瞻:GLM-4.5-Air的开源标志着智能体模型进入"高效能时代",通过创新架构设计打破"参数规模=性能"的传统认知。随着模型效率的提升和部署门槛的降低,预计2025年将出现智能体应用爆发式增长,覆盖教育、医疗、金融等更多领域。对于开发者而言,基于GLM-4.5-Air构建智能体应用,将成为探索下一代AI交互范式的重要途径。

【免费下载链接】GLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求项目地址: https://ai.gitcode.com/zai-org/GLM-4.5-Air

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/30 3:42:11

腾讯HY-MT1.5部署:从镜像拉取到推理全流程

腾讯HY-MT1.5部署:从镜像拉取到推理全流程 1. 引言 随着全球化进程的加速,高质量、低延迟的机器翻译需求日益增长。传统云翻译服务虽性能稳定,但在隐私保护、实时响应和边缘场景中面临挑战。为此,腾讯推出了开源翻译大模型 HY-MT…

作者头像 李华
网站建设 2026/7/1 10:02:30

CogVLM2开源:19B多模态模型,8K图文理解大升级

CogVLM2开源:19B多模态模型,8K图文理解大升级 【免费下载链接】cogvlm2-llama3-chat-19B 项目地址: https://ai.gitcode.com/zai-org/cogvlm2-llama3-chat-19B 多模态大模型领域再添重磅开源力量——CogVLM2系列模型正式发布,其开源版…

作者头像 李华
网站建设 2026/6/26 15:21:50

DeepSeek-V2-Chat-0628:开源AI聊天机器人,编码能力跻身前三!

DeepSeek-V2-Chat-0628:开源AI聊天机器人,编码能力跻身前三! 【免费下载链接】DeepSeek-V2-Chat-0628 DeepSeek-V2-Chat-0628,开源创新之作,AI聊天机器人性能卓越,编码能力出众。在LMSYS Chatbot Arena榜单…

作者头像 李华
网站建设 2026/7/1 0:44:29

HY-MT1.5-7B学术出版应用:期刊论文润色翻译系统搭建

HY-MT1.5-7B学术出版应用:期刊论文润色翻译系统搭建 随着人工智能在自然语言处理领域的持续突破,高质量、专业化的机器翻译需求日益增长,尤其是在学术出版领域。科研人员频繁面临将中文研究成果精准翻译为英文以投稿国际期刊的挑战&#xff…

作者头像 李华
网站建设 2026/6/26 15:18:40

HY-MT1.5-1.8B高性能部署:边缘计算场景下低延迟翻译实现路径

HY-MT1.5-1.8B高性能部署:边缘计算场景下低延迟翻译实现路径 随着多语言交流需求的爆发式增长,实时、高质量的翻译能力已成为智能设备、跨境服务和边缘计算系统的核心能力之一。然而,传统云端翻译方案存在网络延迟高、隐私风险大、离线不可用…

作者头像 李华
网站建设 2026/6/30 19:24:03

HY-MT1.5部署遇错?常见问题排查+GPU适配步骤详解

HY-MT1.5部署遇错?常见问题排查GPU适配步骤详解 随着多语言交流需求的不断增长,高质量、低延迟的翻译模型成为智能应用的核心组件。腾讯近期开源的混元翻译大模型 HY-MT1.5 系列,凭借其卓越的翻译性能和灵活的部署能力,迅速在开发…

作者头像 李华