不到30行代码实现AI Agent，看懂 Claude Code 核心逻辑，原来一切都源于一个循环-平芜编程栈

在当下AI编程工具层出不穷的时代，相信很多开发者都对 Claude Code、Cursor 这类智能编程助手充满好奇。它们不再是简单的代码补全工具，而是能够自主读取项目文件、执行脚本命令、查看运行报错、根据结果反复优化代码，甚至完成一整个小型项目开发的AI助手。不少人会下意识认为，这类工具背后一定有着极其复杂的架构设计，涉及多层系统调用、复杂的状态管理、海量的算法优化，普通人根本无法理解其底层逻辑。

但事实恰恰相反，剥离掉所有花哨的功能和包装后，这些AI Agent的核心骨架异常简洁，甚至用不到30行核心代码就能实现。整个系统的灵魂，就是一个简单的while循环，再搭配一个基础的Bash工具调用，就构成了现代AI Agent的底层逻辑。理解了这个极简的实现模式，就相当于掌握了所有AI Agent系统的设计基因，无论是单智能体还是多智能体协作，无论是简单的代码执行还是复杂的任务规划，都离不开这个核心框架。本文将从零拆解这个被称为Agent Loop的核心机制，带你一步步看懂如何从零搭建一个极简版Claude Code，真正理解AI Agent与真实世界交互的底层逻辑。

一、语言模型的天生短板：活在文本里，触碰不到现实世界

在谈论AI Agent之前，我们必须先认清一个核心问题，那就是大语言模型本身存在的先天缺陷。如今的大模型在代码推理、逻辑分析、方案设计等方面展现出了惊人的能力，它们可以读懂复杂的业务逻辑，能写出高效的算法代码，甚至能针对特定场景给出完整的技术方案。但这些能力都局限在文本世界里，模型本身没有感知真实环境、操作现实事物的能力，这是它无法突破的天然枷锁。

具体到编程场景中，大语言模型无法直接读取你本地磁盘上的代码文件，不知道你的项目目录结构，无法知晓当前项目依赖的版本信息；它不能自主运行Python脚本、执行Shell命令，无法看到pytest测试用例的执行结果，也不能通过git log查看项目的提交记录；更无法根据代码运行的报错信息，自主定位问题、修改代码并重新调试。在没有外部辅助的情况下，大模型每次只能处理你输入对话框的纯文本内容，所有的信息交互都依赖人工传递。

这就导致了一个很尴尬的使用场景：当你让大模型帮你修改代码时，你需要手动把文件内容复制粘贴给它；模型给出修改建议后，你需要手动替换本地代码；运行代码出现报错，你又要把报错信息复制给模型，等待模型给出新的解决方案。在这个过程中，你本人就充当了模型与真实世界之间的桥梁，手动完成了信息的传递和工具的执行，相当于你自己变成了AI的“手脚”，帮它完成所有现实操作。

这种模式显然无法满足高效开发的需求，尤其是面对复杂项目时，反复的复制粘贴会耗费大量时间，也违背了AI提升效率的初衷。想要让大模型真正具备自主解决问题的能力，就必须打破文本世界的壁垒，让模型能够自主调用工具、获取真实环境信息、根据反馈持续迭代，而实现这一目标的核心方案，就是搭建一个自动循环机制，也就是AI Agent的核心，Agent Loop。

二、Harness系统：AI Agent的“手脚”与“神经系统”

在深入解析Agent Loop之前，我们需要先理解一个更宏观的概念，那就是Harness系统，也可以称之为约束套件系统。Harness一词原本源于工程领域，指的是线束、安全带、马具这类起到约束和连接作用的装置，它的核心作用是将不同部件连接起来，同时规范部件的运行范围。在AI Agent的开发体系中，Harness层就是包裹在大语言模型外部，负责连接模型与外部世界的基础设施，是AI Agent不可或缺的组成部分。

我们可以把AI Agent的整体架构分为三个核心层级，每个层级都有明确的职责分工，相互配合实现完整的智能交互。

第一个层级是LLM核心层，这一层相当于AI Agent的大脑，承担着推理、决策、生成内容的核心任务。它接收所有的上下文信息，分析用户的需求，判断当前需要执行的操作，规划解决问题的步骤，最终生成对应的文本回复或工具调用指令。没有大脑的决策，整个系统就失去了智能核心，只能进行机械的命令执行。

第二个层级是Harness层，这一层相当于AI Agent的手脚和神经系统，是连接大脑与外部世界的关键。它的核心职责包括工具执行、消息历史管理、循环流程控制等。当大脑发出工具调用指令后，Harness层负责执行对应的命令，获取执行结果；同时它会记录所有的交互信息，维护完整的消息历史，让模型始终基于完整上下文做决策；更重要的是，它控制着整个循环的启动、运行与终止，确保系统按照合理的逻辑运转。

第三个层级就是Agent Loop，它是Harness系统的心跳，也是驱动整个AI Agent运转的心脏。没有这个循环，Harness层就无法实现自动的信息传递和工具执行，模型依然只能进行单次交互。Agent Loop持续推动模型进行思考、调用工具、获取反馈、再次思考的闭环操作，直到任务完成，是AI Agent具备自主能力的核心动力。

而Harness系统最核心、最简化的实现，就是我们接下来要拆解的Agent Loop。这个循环是模型从文本世界走向现实世界的第一道桥梁，也是所有复杂AI Agent系统的基础。无论后续的系统如何迭代升级，增加多少功能，这个核心循环的逻辑都不会发生本质改变。

三、Agent Loop的工作原理：一个循环打通AI与现实的壁垒

Agent Loop的工作逻辑并不复杂，整体流程清晰易懂，整个循环只有一个唯一的退出条件，那就是当模型判断任务完成，不再调用任何工具时，循环自动终止。在循环运行期间，工具执行的结果会被持续追加到消息历史中，模型始终基于完整的上下文信息进行决策，不断调整自己的操作，直到满足退出条件。

整个工作流程可以简单概括为：用户输入需求后，消息进入Agent Loop核心循环；模型首先基于消息历史进行推理分析，生成对应的回复或工具调用指令；随后系统判断模型的停机原因，如果模型没有调用工具，说明任务已完成，直接退出循环并输出最终结果；如果模型触发了工具调用，就会执行对应的工具操作，获取工具执行后的结果；工具结果会被追加到消息历史中，重新带回循环顶部，让模型基于新的上下文再次进行推理，重复上述流程，直到任务结束。

用一句通俗的话总结就是，一个工具搭配一个循环，就能构建出一个完整的AI Agent。这也是现代AI Agent设计的核心精髓，不需要复杂的状态机，不需要预设固定的执行步骤，一切都由模型自主判断、自主决策。

为了让大家更直观地理解这个流程，我们可以把整个Agent Loop的运行过程拆解为几个关键步骤：首先是用户发起查询，将需求传递给系统；随后进入循环，模型完成推理并判断是否需要调用工具；若不需要工具调用，循环直接结束，输出结果；若需要工具调用，系统执行工具并获取结果，将结果反馈给模型，模型再次进入推理环节，以此往复。

这种循环模式彻底解决了大语言模型无法触碰现实世界的问题，让模型能够通过工具获取环境信息，根据反馈调整行为，真正具备了自主解决问题的能力。而实现这一切的代码，却异常简洁，核心部分甚至不到30行，接下来我们就逐行拆解这个极简AI Agent的代码实现，看懂每一部分的设计逻辑。

四、逐行拆解极简AI Agent代码：30行实现Claude Code核心

这个极简版AI Agent的代码主要分为四个核心部分，分别是工具定义、安全执行层、核心Agent Loop循环以及主程序REPL外壳。每一部分都各司其职，共同构成完整的系统，我们逐一进行解析。

（一）工具定义：给AI开放操作现实的权限

工具是AI Agent连接现实世界的媒介，没有工具，模型依然只能停留在文本交互阶段。在这个极简实现中，我们只给模型开放了一个核心工具，也就是Bash命令执行工具，通过这个工具，模型就能够执行Shell命令，实现文件操作、代码运行、环境查看等一系列操作，这也是编程类AI Agent最核心的工具。

工具的定义采用JSON Schema格式，这种格式能够清晰地规范工具的名称、功能描述以及输入参数，方便大语言模型理解工具的用途和使用方式。在定义中，我们明确工具名称为bash，功能描述为运行Shell命令，输入参数为一个字符串类型的command，也就是需要执行的命令，同时规定这个参数为必填项，确保模型调用工具时必须传入合法的命令。

这种工具定义方式是行业通用标准，无论是Anthropic的API还是其他大模型接口，都支持这种JSON Schema格式的工具声明。模型会根据工具的描述和参数规范，自主判断在什么场景下调用该工具，传入什么样的参数。后续如果需要扩展AI Agent的能力，只需要在工具列表中增加新的工具，比如文件读写工具、网络请求工具、数据库查询工具等，不需要修改核心循环代码，就能让模型的能力边界持续扩展。

（二）安全执行层：给AI的操作加上安全锁

模型虽然能够自主生成工具调用指令，但它无法判断指令是否存在安全风险，直接执行模型生成的所有命令，很可能会对本地系统造成不可逆的破坏，比如删除系统文件、重启设备、获取系统权限等。因此，我们必须搭建一个安全执行层，对模型生成的命令进行过滤和限制，这是AI Agent落地使用的必要保障。

在这个极简实现中，安全执行层通过run_bash函数实现，主要完成三项核心安全保障工作。第一项是黑名单过滤，我们提前定义了危险命令列表，包括rm -rf /、sudo、shutdown、reboot等可能危害系统安全的命令，当模型生成的命令中包含这些危险指令时，系统直接阻断执行，并返回错误提示，从源头杜绝安全风险。

第二项是超时保护，在执行Shell命令时，可能会出现命令死循环、长时间阻塞的情况，这会导致整个AI Agent系统卡死。因此我们设置了120秒的超时限制，当命令执行时间超过这个阈值，系统会强制中止命令执行，并返回超时错误提示，保证循环能够正常运行。

第三项是输出截断，大语言模型的上下文窗口有长度限制，如果工具执行的输出内容过长，会撑爆上下文窗口，导致模型推理失败。因此我们对输出结果进行截断，最多返回50000字节的内容，既保证模型能够获取足够的有效信息，又避免了上下文溢出的问题。

这个安全执行层是AI Agent与本地系统交互的防火墙，尤其是在本地部署AI编程助手时，安全防护至关重要。即便模型出现推理错误，生成了危险指令，安全层也能及时阻断，保护本地环境不受破坏。

（三）核心Agent Loop：AI Agent的心脏代码

这是整个系统的核心，也是不到30行代码就能实现AI Agent的关键。agent_loop函数接收消息历史列表作为参数，通过一个无限while循环，实现模型推理、工具调用、结果反馈的闭环操作。

循环的第一步，是调用大模型接口，将消息历史和工具定义传入模型，让模型基于完整上下文进行推理。这里需要指定模型版本、系统提示词，同时设置最大token数，保证模型能够生成足够长度的回复和工具调用指令。

第二步，将模型生成的助手回复追加到消息历史列表中，记录模型的每一次决策，确保后续推理能够基于完整的交互历史进行。这一步是实现多轮迭代的基础，没有消息历史的累积，模型就无法记住之前的操作和结果，只能进行单次交互。

第三步，判断模型的停机原因，这是循环是否继续的关键。如果停机原因不是tool_use，也就是模型没有调用任何工具，说明模型认为当前任务已经完成，直接退出循环，结束迭代。如果停机原因是tool_use，说明模型需要调用工具获取信息，继续执行后续步骤。

第四步，遍历模型回复中的所有工具调用块，提取模型生成的命令，通过run_bash函数安全执行，并收集执行结果。这里需要注意tool_use_id字段，这个字段是工具调用与执行结果的配对凭证，Anthropic API要求每条工具结果必须通过这个ID对应回原始的工具调用请求，即便模型一次调用多个工具，也能保证结果被正确归属，避免信息错乱。

第五步，将工具执行结果以用户消息的形式追加到消息历史列表中，然后回到循环顶部，再次调用模型进行推理。此时模型已经获取了工具执行的反馈，能够基于新的上下文继续规划后续操作，完成新一轮迭代。

整个核心循环的代码简洁高效，没有多余的逻辑，却实现了AI Agent最核心的自主迭代能力。模型自主决定是否调用工具、调用什么工具、何时结束任务，不需要人工干预，也不需要预设执行步骤，完全基于上下文智能决策。

3.1 极简代码示例：还原 Agent Loop 核心逻辑

核心：Agent Loop 伪代码

def agent_loop(消息历史): # 无限循环，对应流程图的核心循环 while 循环开启: # 步骤1：调用LLM，对应流程图第一步 模型响应 = 调用大模型(消息历史, 工具列表) # 步骤2：把模型回复加入历史，保留上下文 消息历史.append(模型响应) # 步骤3：判断是否停止循环，对应流程图第二步 if 模型响应.停机原因 != 工具调用: # 步骤5：结束循环，输出结果 return # 步骤4：执行工具，对应流程图第四步 工具结果 = 执行指定工具(模型响应.工具参数) # 步骤6+7：结果回传，返回循环顶部 消息历史.append(工具结果)

真实可运行的 Agent Loop 核心代码如下：

def agent_loop(messages: list): # 无限循环：Agent Loop的核心载体 while True: # 1. 调用LLM：传入上下文+工具，让模型推理决策 response = client.messages.create( model="claude-3-haiku", messages=messages, tools=TOOLS ) # 2. 追加模型回复到历史，保留决策记录 messages.append({"role": "assistant", "content": response.content}) # 3. 判断退出条件：模型不调用工具，任务完成 if response.stop_reason != "tool_use": return # 退出循环，结束任务 # 4. 执行工具：调用Bash命令，获取执行结果 tool_results = [] for block in response.content: if block.type == "tool_use": result = run_bash(block.input["command"]) tool_results.append({"type": "tool_result", "tool_use_id": block.id, "content": result}) # 6+7. 工具结果回传，重新进入循环 messages.append({"role": "user", "content": tool_results})

（四）REPL外壳：搭建用户与AI交互的入口

核心循环实现了AI Agent的自主迭代能力，但还需要一个用户交互入口，让用户能够输入需求，查看AI的最终回复。主程序入口通过一个外层循环，维护一个全局的消息历史列表，实现跨轮次的对话上下文保留。

系统启动后，会在终端显示交互提示符，用户输入需求后，系统会判断用户是否输入退出指令，如果输入q、exit或空内容，就终止程序。如果是正常需求，就将用户输入追加到消息历史列表中，然后调用核心agent_loop函数，启动AI Agent的迭代循环。

当循环结束后，系统从消息历史的最后一条助手消息中，提取文本内容并打印输出，展示给用户最终的处理结果。这个全局的消息历史列表会在整个会话期间持续累积，无论AI进行多少轮工具调用，模型都能看到完整的对话和操作历史，保证决策的连贯性。

这个REPL外壳就像是AI Agent的交互界面，让普通人能够轻松使用这个极简系统，感受AI Agent自主解决问题的能力。整个代码组合起来，核心迭代逻辑不到30行，却实现了Claude Code这类编程助手的核心功能，足以证明这个循环模式的强大与简洁。

五、一次完整执行生命周期：看懂AI Agent如何自主完成任务

为了让大家更直观地理解这个极简AI Agent的运行过程，我们以创建一个打印Hello World的Python文件为例，完整拆解一次任务执行的生命周期，看清每一轮循环的具体操作。

首先是用户输入阶段，用户在终端输入需求，创建一个打印Hello World的hello.py文件，这条需求作为第一条用户消息进入消息历史列表，随后启动核心Agent Loop。

进入第一轮循环，模型接收到消息历史和工具定义后，经过推理分析，判断需要通过Bash命令创建文件，于是生成对应的工具调用指令，停机原因设置为tool_use。系统提取模型生成的echo命令，执行文件创建操作，由于命令执行成功没有输出，工具结果返回无输出信息。随后，这条工具结果被追加到消息历史中，完成第一轮迭代。

紧接着进入第二轮循环，模型基于更新后的消息历史，判断文件已经成功创建，当前任务已经完成，不再需要调用任何工具，因此停机原因设置为end_turn，满足循环退出条件。模型生成对应的文本回复，告知用户文件已创建完成，循环终止，系统提取模型的文本回复并打印给用户。

在这个过程中，AI Agent自主完成了需求分析、工具调用、结果反馈、任务终止的全流程，没有任何人工干预。从创建文件到确认任务完成，仅通过两轮循环就实现了目标，充分展现了Agent Loop模式的高效性。如果是更复杂的任务，比如调试代码、安装依赖、运行测试，模型会根据实际情况增加循环次数，持续调用工具获取反馈，直到问题彻底解决。

六、极简循环的强大之处：所有AI Agent的设计基因

很多人会疑惑，如此简洁的循环模式，为什么能够支撑起Claude Code、Cursor这类复杂的AI编程工具，甚至成为所有现代AI Agent的设计基础？这正是这个模式的精妙所在，它的强大体现在三个核心方面。

第一，模型自主决策，无需预设流程。在传统的自动化系统中，需要提前编写状态机，规划好每一步的执行逻辑，固定工具调用的顺序和次数，灵活性极差。而Agent Loop模式让模型自己决定何时调用工具、调用几次、何时停止迭代，完全基于当前上下文自主判断。面对不同的任务，模型能够动态调整执行策略，不需要修改任何代码，具备极强的通用性和灵活性。

第二，能力可无限扩展，循环逻辑不变。这个极简实现只开放了Bash一个工具，但如果我们给模型增加文件读写、网络请求、数据库操作、API调用等更多工具，模型的能力边界会自然扩展，能够完成更复杂的任务。而核心的Agent Loop循环不需要修改一行代码，只需要在工具列表中新增工具定义即可。这意味着这个循环模式具备极强的可扩展性，无论是简单的单工具Agent，还是复杂的多工具、多智能体系统，都能在这个基础上叠加功能。

第三，核心逻辑通用，是所有AI Agent的DNA。无论是当下流行的单智能体编程助手，还是更复杂的多智能体协作系统，亦或是具备长期记忆、规划能力的高级Agent，其底层核心都是这个Agent Loop。后续所有的复杂机制，比如多轮对话管理、工具权限控制、生命周期钩子、任务分解、记忆存储等，都是在这个循环之上叠加的优化功能，循环本身的核心逻辑始终保持不变。

理解了这个不到30行的循环，就相当于掌握了现代AI Agent的核心设计基因。我们不需要纠结于复杂的架构和算法，回归本质就能发现，AI Agent的核心就是让模型通过循环自主调用工具，实现与现实世界的交互。

七、回归本质：AI Agent的核心是连接模型与现实

从复杂的AI编程工具，到极简的30行代码实现，我们能够清晰地看到AI Agent的本质。大语言模型本身只是一个具备强大推理能力的文本模型，它的价值在于思考和决策，而AI Agent的作用，就是给这个“大脑”配上手脚，让它能够把思考转化为实际行动，作用于现实世界。

Agent Loop作为AI Agent的核心，解决了模型与现实世界交互的最后一公里问题。它通过自动循环，替代了人工的信息传递，让模型能够持续获取环境反馈，不断优化自己的行为，最终完成复杂的任务。这个模式没有花哨的技术，却直击痛点，用最简单的方式实现了最核心的功能，这也是它能够成为行业标准的原因。

对于开发者而言，理解这个极简实现有着重要的意义。我们不必再对Claude Code这类工具抱有神秘感，也不用觉得AI Agent是高不可攀的技术。只要掌握了Agent Loop的核心逻辑，每个人都能从零搭建属于自己的AI Agent，根据自己的需求定制工具、优化循环，打造适配不同场景的智能助手。

未来，AI Agent技术还会持续发展，多智能体协作、自主规划、长期记忆、权限精细化管理等功能会不断完善，但无论技术如何迭代，Agent Loop这个核心循环都不会被淘汰。它就像是AI Agent的底层DNA，支撑着所有高级功能的实现。

从一个简单的while循环，到改变编程方式的AI助手，技术的魅力往往就在于化繁为简。不到30行代码，打通了模型与现实的壁垒，让AI真正具备了自主解决问题的能力。相信随着对这个核心模式的深入挖掘，我们还能开发出更多高效、实用的AI Agent，让AI技术更好地服务于开发工作，提升整个行业的生产效率。而对于每一个想要学习AI Agent开发的人来说，从这个极简循环开始，就是最正确的入门方式，看懂它，就看懂了整个AI Agent时代的核心逻辑。