20-4 长时工作记忆（AGI基础理论）-平芜编程栈

《智能的理论》全书转至目录

不同AGI的研究路线对比简化版：《AGI（具身智能）路线对比》，欢迎各位参与讨论、批评或建议。

工作记忆模型得到了许多实验的支持，但是有些记忆现象也是此模型难以解释的。比如，在实验室里研究得到的工作记忆容量是非常有限的，在下棋、心算、医疗诊断等熟练的认知活动中，专家的工作记忆容量却非常大。另外，熟练的认知活动被中断后，无需费力就能迅速恢复，用工作记忆短暂储存的性质也是不能解释的。可见，工作记忆的概念需要加以扩充。

一．熟练记忆理论

1.记忆术

记忆术是指通过给记忆项目安排一个对应的联想项目进行编码，以帮助记忆的方法。世界记忆锦标赛总冠军王峰，他是这样记长串数字的，在一个50位数字的记忆中，对于前12位数字“185469385050”，王峰对此的编码是“哑巴在横杠上对巫师做了一个动作，八卦圈将妇女套在了门上，楼梯上有两位武林高手在决斗”。其中18利用其谐音转化为“哑巴”；54同样利用谐音转化为“巫师”；69转化为“八卦圈”，这是利用了近似的形状；38转化为“妇女”，因为熟悉的38妇女节；50转化为“武林高手”，由谐音联想而得（戈逸，2013）。

在一项研究中（Chase和Ericsson，1981；1982），一位普通大学生SF经过两年约合200个小时的练习后，原本数字记忆广度只有7的他（能记忆7个数字），最终的数字广度达到了82个数。而另一个被试DD，经过三年近800次的练习，其数字记忆广度达到104个数字。通过研究发现，SF对记忆材料构建了有明显的、层次性的结构。例如，记忆一个30位的数字串时，SF首先将前4个数字理解为一个跑步成绩，如将2315理解为每跑一英里用时2分31秒5，并将这一成绩作为一个基层。对于前面16个数，可以得到4个基层（成绩），然后将这四个基层作为一个小组，同样的后面14位数也用同样的方式合成一个小组，两个小组最终合并成一个30位数的大组。如图1。

图1

综上所述，有效的记忆策略包括两个方面，一是将抽象的记忆材料转化为有意义的词汇、日期或者时间等，以此将零散的记忆单位整合起来。最终扩大短时记忆基本单位，达到组块的容量；二是将单个的记忆单位与序列位置联系起来，通过如编故事的方法或者位置编码（如图，不同的数字组在不同位置），形成有层次的提取结构。

2.理论内容

根据上述现象，Chase和Ericsson（1982）提出熟练记忆理论，认为超常记忆归为“熟练”而非“先天”的结果。该理论提出了三个原则：（a）有意义的编码原则。即记忆材料通过精细编码与长时记忆中的知识联系起来，形成组块。比如将数字转化为更有意义的词汇或时间等，以此将零散的数字整合起来形成一个整体。其中，记忆材料所对应的长时记忆知识是这个记忆材料的提取线索，如记忆材料“18”所对应的提取线索是“哑巴”；（b）提取结构原则。以提取线索为材料，建构更有组织和更有层次的提取结构，提取结构即由一组特定记忆以及一组专门提取这些特定记忆的提取线索所组成的结构，即同时包括多组记忆材料及对应提取线索所组成的结构。通过结构中不同位置的提取线索，能迅速提取相应的记忆项目。第一个小组第一个基层的提取线索“2分31秒5”能提取数字“2315”；（c）速度提升原则。通过对某一领域（如记忆数字）不断地练习，这种记忆术的加工速度会越来越快。

3.提取结构

所谓提取结构就是由一组提取线索和待编码信息的联结组成的一个稳定的组合，它是一种通过大量练习形成的稳定结构，如图2。短时记忆中的任何线索都是通过一个提取结构和长时记忆中的结点联系的（提取结构包含了长时记忆中的信息），这样通过短时记忆中的线索就能将长时记忆中的信息提取出来。信息提取的速度很快，而且是自动化的。

图2

Chase和Ericsson（1982）对提取结构结构进行了研究，他们发现，经过大量的训练，被试的数字记忆广度可以超过90。达到这样的成绩，就需要被试形成有效的策略，把这些数字同长时记忆中熟悉的模式联系起来，并把这种模式作为提取线索。例如，他们的一名被试是一位赛跑运动员，他把数字3596与赛跑的情境联系起来，然后把这些数字编码成3分59.6秒跑一英里的路程（第一层提取线索）。然后，再把这些编码好的数字组编入更高一级层次，如把3596放在左一位置，在回忆时将提取结构的唯一位置重新生成作为提取线索（第二层提取线索），提取相应的数字组。这位被试通过精细编码，不仅把数字同提取线索联系起来（几位数字），而且把编码的信息进一步联系起来，形成一种具有层次等级的提取结构（很多位数字，如几十位）。

这种提取结构不但对数字记忆起着重要作用。同样，语篇阅读理解中提取结构也具有举足轻重的作用。

首先，在阅读中，一方面，把一个一个的命题整合起来，形成连贯的心理表征，这个过程就是理解。这样，阅读中形成的新命题，就成为语篇库或情境模型结构的组成部分。这些命题以各种方式（如时空的、因果的）与这种结构中的其它命题相联结。而且，命题因其不同的联系可以形成较大的结构，而这些结构又可以构成更宏观的结构。这是新命题同其他命题相联结的情形。另一方面，这些命题还要同长时记忆中的各种结构（如图式、脚本、框架、情景记忆单元等）相联结。这样，关于这篇文章的完整的提取结构就建立起来了。这种结构便是形成连贯心理表征的基础。

其次，提取结构在理解中具有知识激活作用。这里举一个歧义词的语义提取问题来说明。“bank”是一个多义词，即包含“河岸”和“银行”两个词义。由于bank被经常使用，因此它属于熟悉领域因而在长时记忆中形成提取结构。在启动实验中，对被试呈现例句1（包含bank）（语境句），在启动词bank出现后，立即呈现目标词，研究发现不论是与语境相一致的目标词如“钱”还是与语境不一致的目标词如“河流”，它们的反应时间都比其他词的反应时间短。说明bank的这两个词义都被启动了。但是，如果启动词bank呈现的350毫秒后再呈现目标词，此时只有“钱”这个词的反应时间短，这是因为延缓判断使被试有时间对情景句进行整合，与语境相一致的词义（钱）被选择而与语境不一致的词义（河流）则被去激活（不再被启动）。如果延缓时间增加（至少750毫秒），“抢劫”一词也能被启动。因为那时句子语义表征已经形成。“抢劫”虽然不在句中出现，但它却处于句子所在的情景中（鲁忠义，2000）。

例1

Two masked gunmen made their getaway with $100,000 from the First National Bank.

二．长时工作记忆

Ericsson和Kintseh（1995）在熟练记忆理论的基础提出了长时工作记忆。在传统的记忆理论中，长时记忆中的信息是相对固定的，提取和存储速度比较慢；而短时记忆中的信息则是随着任务的变化而变化，信息变化速度较快。长时记忆中的信息需要被激活才能进入工作记忆。而长时工作记忆则认为，工作记忆可以分短时工作记忆和长时工作记忆。短时工作记忆就是传统意义上的工作记忆（在其他章节中均用工作记忆表示）；而长时工作记忆的主要成分是提取结构，是通过反复练习形成的，其本质是熟练的长时记忆信息，它即包括长时记忆的特点同时也包括短时工作记忆的特点，一方面它有长时记忆容量大的特点；另外一方面它的存取速度很快，即便处于意识之外，只要被提取结构所联结，也能轻易的被提取到短时工作记忆中。

Glanzer等人（1981）的一个有代表性的实验中，让实验组的被试读一篇实验材料，其中1、3、5...句构成相互联系的一篇文章，2、4、6...句是与这篇文章无关的句子，用于阅读中断，即在每读完一个正常句子后，读一个无关句。控制组的被试只读正常的文章，即由1、3、5构成的文章。两组被试在读完后都进行阅读理解测验。实验结果是，阅读中断对理解毫无影响。在中断情况下，被试回答问题的正确率和没有中断的回答是一样的，只是中断后阅读每个句子的时间增加了400毫秒。这种结果用经典的工作记忆理论是无法解释的。因为按照过去的解释，阅读无关句子就会使前面的句子从短时记忆中消失掉。要恢复它，就需要进行耗费资源的搜索，结果会使理解成绩大大降低。然而，长时工作记忆则很容易对此作出解释，无关句之后的句子可以作为短时记忆中的线索，用以从长时工作记忆提取阅读前面文章所形成的长时记忆痕迹。Glanzer 通过改变中断时间和不同的中断活动，如以做数学题来进行实验，得到了同样的结果。语篇的中断并不妨碍阅读理解，是因为长时工作记忆可以使读者利用提取线索，可靠地访问长时记忆中保存的语篇的记忆痕迹，而且，从长时工作记忆中提取信息是非常快的，大约只需要花费400毫秒。

在进行某一个熟悉领域的任务时，在短时工作记忆中的与之相关的信息能在长时工作记忆中激活对应的提取结构。在某一时刻，可能会有某一提取线索处于短时工作记忆中，用于快速提取相关信息，而其余的提取结构则处于备用状态，即其余的提取结构处于高度易得的状态，但都未被真正激活（只有在短时工作记忆中才能被真正激活）。个体可以通过提取线索将需要的信息从长时工作记忆中快速牵引出来（至短时工作记忆），或者根据提取结构中提取线索之间的关系获取其他提取线索。如图3所示，图中的网络为一提取结构，白色圆（某一提取线索或知识）处于短时工作记忆中，其余结构（其余提取线索和知识）用黑点表示，它们处于长时工作记忆中，并通过连线互相关联（孙健，2016）。手电筒的比喻经常被用来描述短时工作记忆，在长时记忆中被小光束照亮的3到5个节点。每个被照亮的节点都会在长时记忆中联结部分未被点亮的节点。这些被联结的未被点亮的节点就是长时工作记忆，如图。随着任务的进行，不断有新的被照亮的节点的产生，而之前被激活的节点消退（Kintsch，Patel和Ericsson，1999）。

图3

20-4 长时工作记忆（AGI基础理论）

一．熟练记忆理论

1.记忆术

2.理论内容

3.提取结构

二．长时工作记忆

通过Taotoken CLI工具一键配置团队视频创作项目的统一AI环境

多模态AI评估框架M3-Bench核心技术解析

RISC-V嵌入式开发：轻量级C库rv的设计原理与实战集成

使用 curl 命令快速测试 Taotoken 的 OpenAI 兼容接口

快速入门如何在 Taotoken 控制台创建并管理你的第一个 API Key

IX7012 × DeepSeek V4@ACP#国产 PCIe 3.0 交换芯片，轻量化推理的 “高性价比 IO 扩展核心”