news 2026/1/29 13:43:27

百度ERNIE 4.5-A3B:210亿参数文本大模型免费开放!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
百度ERNIE 4.5-A3B:210亿参数文本大模型免费开放!

百度ERNIE 4.5-A3B:210亿参数文本大模型免费开放!

【免费下载链接】ERNIE-4.5-21B-A3B-Base-Paddle项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-Base-Paddle

百度ERNIE系列再添新成员,210亿参数的ERNIE-4.5-21B-A3B-Base-Paddle文本大模型正式免费开放,标志着国内大模型技术在开放生态建设上迈出重要一步。

近年来,大语言模型(LLM)领域呈现爆发式发展,模型参数规模不断突破,应用场景持续拓展。然而,高性能大模型往往伴随着高昂的使用成本和技术门槛,限制了其在中小企业和开发者群体中的普及应用。在此背景下,百度此次开放210亿参数级别的ERNIE 4.5-A3B模型,无疑为行业注入了新的活力,有望推动大模型技术的民主化进程。

ERNIE-4.5-21B-A3B-Base作为一款文本专用的混合专家模型(MoE),其核心亮点在于创新性的架构设计与高效的性能表现。该模型总参数达到210亿,而每个token的激活参数为30亿,这种设计在保证模型能力的同时,有效降低了计算资源消耗。模型采用28层网络结构,配备20个查询头和4个键值头,并包含64个文本专家(每次激活6个)和64个视觉专家(每次激活6个),以及2个共享专家,支持长达131072 tokens的上下文长度,为处理超长文本任务提供了强大支撑。

在技术创新方面,ERNIE 4.5系列采用了多模态异构MoE预训练技术,通过异构MoE结构、模态隔离路由以及特殊的损失函数设计,实现了文本与视觉模态的有效协同训练,提升了模型在跨模态推理任务上的表现。同时,百度构建了高效的模型训练与推理基础设施,采用异构混合并行和分层负载均衡策略,结合FP8混合精度训练、细粒度重计算等技术,显著提升了训练吞吐量。在推理优化上,通过多专家并行协作和卷积码量化算法,实现了4位/2位无损量化,进一步降低了部署门槛。

对于开发者和企业用户而言,ERNIE-4.5-21B-A3B-Base的开放意味着更多可能性。基于PaddlePaddle深度学习框架,开发者可通过ERNIEKit工具包便捷地进行模型微调(如SFT、LoRA)和对齐训练(如DPO),快速适配特定业务场景。在部署方面,借助FastDeploy,用户可实现模型的快速服务化部署,单卡部署仅需80G GPU内存资源,降低了硬件要求。

此次百度开放ERNIE-4.5-21B-A3B-Base模型,不仅丰富了国内开源大模型生态,更为AI技术的普惠化发展提供了有力支撑。一方面,中小企业和开发者能够以更低成本获取高性能大模型能力,加速AI应用创新;另一方面,开放的模型也将促进学术界和产业界的技术交流与合作,推动大模型技术的持续迭代。随着模型能力的不断提升和应用成本的降低,我们有理由相信,大语言模型将在更多领域落地生根,为千行百业的智能化转型注入新动能。

【免费下载链接】ERNIE-4.5-21B-A3B-Base-Paddle项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-Base-Paddle

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/27 9:43:46

CentOS零基础入门:从安装到基本命令全掌握

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个交互式CentOS学习平台,功能包括:1. 可视化安装向导;2. 命令行模拟器;3. 常用命令速查表;4. 实战练习场景。采用…

作者头像 李华
网站建设 2026/1/25 2:35:14

5大高效策略:Windows屏幕管理终极指南,告别自动休眠烦恼

5大高效策略:Windows屏幕管理终极指南,告别自动休眠烦恼 【免费下载链接】NoSleep Lightweight Windows utility to prevent screen locking 项目地址: https://gitcode.com/gh_mirrors/nos/NoSleep 还在为重要演示时屏幕突然变暗而措手不及吗&am…

作者头像 李华
网站建设 2026/1/25 0:32:21

MediaPipe Hands性能对比:不同硬件环境测试

MediaPipe Hands性能对比:不同硬件环境测试 1. 引言:AI 手势识别与追踪的现实挑战 随着人机交互技术的不断演进,手势识别正逐步成为智能设备、虚拟现实(VR)、增强现实(AR)和智能家居等场景中的…

作者头像 李华
网站建设 2026/1/28 3:02:32

提升效率:一键修复Android模拟器GZIP错误

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 设计一个自动化工具,能够一键修复Android模拟器中的GZIP包错误。工具应具备以下功能:1. 自动检测GZIP包错误;2. 提供一键修复按钮;3…

作者头像 李华
网站建设 2026/1/25 23:09:21

LIN协议入门指南:5分钟用快马创建第一个项目

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个最简单的LIN协议演示项目,包含1个主节点和1个从节点。功能要求:1) 主节点每秒发送1次0x22信号 2) 从节点收到信号后返回0x33 3) 在网页界面显示通信…

作者头像 李华
网站建设 2026/1/25 21:52:26

GLM-4.6V-Flash-WEB实战案例:法律文书图像识别系统

GLM-4.6V-Flash-WEB实战案例:法律文书图像识别系统 智谱最新开源,视觉大模型。 1. 引言:为何选择GLM-4.6V-Flash-WEB构建法律文书识别系统? 1.1 法律文书识别的行业痛点 在司法、律所、企业合规等场景中,大量历史纸质…

作者头像 李华