news 2026/2/9 12:48:47

LG重磅推出混合注意力模型EXAONE 4.0,多参数版本引领AI性能新高度

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
LG重磅推出混合注意力模型EXAONE 4.0,多参数版本引领AI性能新高度

LG重磅推出混合注意力模型EXAONE 4.0,多参数版本引领AI性能新高度

【免费下载链接】EXAONE-4.0-32B项目地址: https://ai.gitcode.com/hf_mirrors/LGAI-EXAONE/EXAONE-4.0-32B

在全球人工智能技术迅猛发展的浪潮中,LG集团近日宣布正式推出其最新研发的混合注意力模型EXAONE 4.0,此次发布涵盖了32B和1.2B两种不同参数规模的版本,旨在满足从云端高性能计算到边缘设备轻量化应用的全场景需求,为AI行业注入新的活力。

EXAONE 4.0 32B作为该系列的旗舰型号,在多项权威基准测试中展现出令人瞩目的卓越性能,充分彰显了其在通用语言理解、编程能力以及复杂推理任务上的强大实力。在MMLU Pro通用语言理解评估中,该模型以81.8%的得分率脱颖而出,这一成绩意味着它在涵盖人文社科、自然科学等多个领域的知识掌握和理解能力上达到了新的高度;在LiveCodeBench v6编程基准测试中,EXAONE 4.0 32B取得了66.7%的优异成绩,展现出其在代码生成、调试和优化方面的出色表现,为开发者提供了强大的技术支持;而在GPQA-Diamond(科学)测试中,75.4%的得分则体现了其对复杂科学问题的深度分析和解答能力;尤其值得一提的是,在AIME 2025(数学)测试中,该模型更是以85%的高得分率,凸显了其在高级数学推理领域的领先地位。通过与同等规模的Qwen 3 32B模型进行对比测试可以发现,EXAONE 4.0 32B在多个关键指标上均实现了超越,进一步印证了其卓越的综合性能。

EXAONE 4.0的出色表现源于其深厚的技术积累和先进的训练策略。该模型基于高达14万亿token的海量数据进行预训练,这些数据涵盖了文本、代码、科学文献等多种类型,为模型的知识广度和深度奠定了坚实基础。与此同时,EXAONE 4.0还集成了多项前沿技术特性,其中多模态内容理解(MCP)功能使其能够无缝处理文本、图像等多种类型的信息,极大地拓展了其应用场景;工具调用能力则赋予了模型与外部应用程序和服务进行交互的能力,使其能够更灵活地完成各种复杂任务;而128K的超长上下文长度支持,更是让模型能够处理更长篇幅的文档、对话和代码,满足了实际应用中对大篇幅内容理解和生成的需求。

除了面向高性能计算场景的32B版本外,LG此次还同步发布了适用于边缘设备的14亿参数版本。该版本在保持核心功能和性能的同时,通过优化模型结构和参数规模,显著降低了对硬件资源的要求,使其能够在智能手机、物联网设备等边缘终端上高效运行,为边缘计算场景下的AI应用提供了强大的算力支持,推动了AI技术在更广泛领域的普及和应用。

为了促进AI技术的开放与创新,LG已通过HuggingFace平台正式发布了EXAONE 4.0的开放权重模型。这一举措将为全球的研究机构、开发者和企业提供宝贵的技术资源,有助于加速AI模型的研究、定制化开发和应用落地,推动整个AI生态系统的繁荣发展。开发者可以通过访问指定仓库(仓库地址:https://gitcode.com/hf_mirrors/LGAI-EXAONE/EXAONE-4.0-32B)获取相关资源,基于EXAONE 4.0开发出更多具有创新性的应用和解决方案。

综合来看,LG EXAONE 4.0的发布不仅是LG在人工智能领域技术实力的一次重要展示,也为整个AI行业带来了新的发展机遇。其多参数版本策略、卓越的性能表现以及开放共享的理念,将有力推动AI技术在各个行业的深入应用。展望未来,随着技术的不断迭代和优化,EXAONE系列模型有望在更多领域发挥重要作用,为解决复杂问题、提升生产效率、改善用户体验做出更大贡献,同时也将激励更多企业和研究机构投身于AI技术的创新与探索,共同推动人工智能行业迈向新的高峰。

【免费下载链接】EXAONE-4.0-32B项目地址: https://ai.gitcode.com/hf_mirrors/LGAI-EXAONE/EXAONE-4.0-32B

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/5 14:45:53

6、提升网络工具使用与安全:Wget和SSH的高级应用

提升网络工具使用与安全:Wget和SSH的高级应用 1. Wget的高级使用技巧 1.1 协议认证参数 对于主要协议,可分别使用 --ftp-user 、 --ftp-password 、 --http-user 和 --http-password 进行认证。例如,在访问FTP或HTTP资源时,可通过这些参数提供用户名和密码。 1…

作者头像 李华
网站建设 2026/2/8 11:52:26

视频处理工具:轻松应对Widevine DRM加密

还在为无法下载流媒体加密视频而烦恼吗?Video Decrypter这款专业的视频处理工具,专门针对MPEG-DASH Widevine DRM加密视频进行处理和下载。无论您是想保存珍贵视频内容,还是需要离线观看流媒体,这款开源工具都能让您轻松应对DRM保…

作者头像 李华
网站建设 2026/2/8 19:18:44

如何彻底解决Windows安全防护冲突问题

如何彻底解决Windows安全防护冲突问题 【免费下载链接】defender-control An open-source windows defender manager. Now you can disable windows defender permanently. 项目地址: https://gitcode.com/gh_mirrors/de/defender-control 你是否曾经遇到过这样的困扰&…

作者头像 李华
网站建设 2026/2/6 20:34:39

Qwen3Guard-Gen-8B:三级防护+119种语言,重塑大模型内容安全标准

导语 【免费下载链接】Qwen3Guard-Gen-8B 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3Guard-Gen-8B 阿里云通义千问团队推出的Qwen3Guard-Gen-8B安全模型,以三级风险分级体系和119种语言支持能力,重新定义了大模型内容安全防护标准…

作者头像 李华
网站建设 2026/2/4 12:52:39

20倍速推理+790年视频训练:Emu3.5开启多模态世界学习新纪元

20倍速推理790年视频训练:Emu3.5开启多模态世界学习新纪元 【免费下载链接】Emu3.5 项目地址: https://ai.gitcode.com/BAAI/Emu3.5 导语 北京智源研究院发布的"悟界Emu3.5"多模态世界大模型,通过10万亿多模态Token训练实现物理世界动…

作者头像 李华