news 2026/6/13 11:29:41

解锁LLM新能力!Engram:用条件记忆重塑大语言模型架构(THS)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
解锁LLM新能力!Engram:用条件记忆重塑大语言模型架构(THS)

解锁LLM新能力!Engram:用条件记忆重塑大语言模型架构

当MoE与N-gram相结合,一种全新的稀疏性范式正在悄然改变大语言模型的能力边界。

近期,来自北京大学和深度求索的研究团队提出了一种名为Engram的创新条件记忆模块,它通过结合经典的N-gram嵌入技术和现代深度学习架构,为大语言模型引入了高效的知识检索能力。Engram的核心突破在于,它能够在不增加计算开销的前提下,通过静态记忆存储大幅提升模型在知识、推理和长上下文任务上的表现

这一技术实现是基于一个深刻的洞见:语言建模中的许多任务本质上是静态、模式化的知识检索,而非动态推理。传统Transformer架构缺少原生的知识查找机制,被迫用昂贵的计算来模拟检索过程。Engram则通过简单的哈希查找,以O(1)的时间复杂度直接获取这些模式化知识。

1. 条件计算 vs. 条件记忆:两种稀疏性范式

当前的稀疏性研究主要集中在条件计算领域,以混合专家(MoE)模型为代表。MoE通过动态路由激活不同专家子网络来处理不同输入,从而实现模型容量的扩展而不显著增加计算成本。这类似于一个大型图书馆,每次只取出少量相关的书籍进行阅读。

但语言信号本身具有内在的异质性,语言建模实际上涉及两种本质不同的子任务:

  1. 组合推理:需要深度、动态的计算过程
  2. 知识检索:处理静态、模式化的语言模式(如命名实体、成语短语)

传统Transformer架构缺乏专门的知识检索机制,导致即使是检索一个简单的多令牌实体(如“Diana, Princess of Wales”)也需要消耗多个注意力层和前馈网络层进行计算。这实质上是用昂贵的计算来重建静态查找表,浪费了宝贵的计算深度。

Engram提出的条件记忆范式,则通过在模型中引入稀疏查找操作,直接检索静态知识,从而与MoE的条件计算形成互补。它将静态模式存储与动态计算在结构上分离,让模型各司其职。

2. Engram核心模块:现代化的N-gram嵌入

2.1 架构概览

Engram模块的设计目标是增强Transformer主干的表示能力,同时保持计算效率。该模块仅应用于特定层,将标准输入嵌入和输出层保持不变。

Engram的处理流程分为两个功能阶段:检索和融合。

2.2 基于哈希

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 22:18:20

复合材料成型仿真案例大全|覆盖模压 / RTM / 固化 / SMC,实操步骤直接抄

封神🔥PAM-COMPOSITE 仿真案例大全|覆盖模压 / RTM / 固化 / SMC,实操步骤直接抄 做复合材料成型仿真的工程师、高校同仁,是不是都有同一个痛点?—— 想学 PAM-COMPOSITE 却缺真实案例,小白对着软件无从下手,老手遇到复杂工艺(如链式仿真、共固化变形)也得反复试错;…

作者头像 李华
网站建设 2026/5/29 10:38:37

【期货量化实战】期货量化交易策略实盘优化技巧(Python量化)

一、前言 实盘交易与回测存在很大差异,实盘优化是量化策略成功的关键。本文总结实盘交易中的常见问题和优化技巧,帮助策略在实盘中取得更好表现。 本文将介绍: 回测与实盘的差异滑点与手续费处理订单执行优化风险控制优化实盘监控与调试 …

作者头像 李华
网站建设 2026/6/12 21:27:10

‌用AI模拟第三方API超时:韧性指标(MTTF)优化指南

‌一、MTTF的核心价值与第三方API挑战‌ MTTF(Mean Time To Failure)衡量系统无故障运行的平均时间,是评估软件韧性的关键指标,直接影响用户体验和业务连续性。其倒数代表故障率,高MTTF意味着更可靠的系统。在微服务架…

作者头像 李华
网站建设 2026/6/10 2:16:09

Java 代码注释的艺术:构建高质量、可读性与架构级文档的终极指南

1.概述:代码即文学,注释即灵魂 在企业级 Java 后端开发的浩瀚工程中,代码质量往往不仅仅取决于算法的复杂度或架构的解耦程度,更取决于其可读性与可维护性。作为一名深耕 Java 技术栈多年的开发者,我们深知“代码是写…

作者头像 李华
网站建设 2026/5/28 14:57:38

闭眼入!8个一键生成论文工具测评:本科生毕业论文+开题报告写作全攻略

在当前学术写作日益数字化的背景下,本科生在撰写毕业论文和开题报告时面临诸多挑战,如选题思路不清晰、文献资料查找困难、格式排版繁琐以及内容原创性难以保障。为帮助广大学子高效应对这些难题,我们基于2026年的实测数据与真实用户反馈&…

作者头像 李华