news 2026/5/13 5:38:22

AI 的逐步进化:从被动的“思考者”到主动的“行动者”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI 的逐步进化:从被动的“思考者”到主动的“行动者”

你输入问题,它给出答案。这种交互模式已经很有用了,但也仅此而已,现在的AI的使用方式跟GPT3.5刚出来的时候已经完全不一样了,无论是dify、coze这些平台,还是Codex、Claude Code等开发者工具,都在以不一样的方式来改变我们的生活。

最近,来自UIUC、Meta、亚马逊、谷歌DeepMind、UCSD和耶鲁大学的研究人员对目前的智能体推理系统进行了系统化的总结、形式化定义和框架构建,这篇论文就是 Agentic Reasoning for Large Language Models。核心想法很简单:

"Rather than passively generating sequences, LLMs are reframed as autonomous reasoning agents that plan, act, and learn through continual interaction with their environment. This refraining unifies reasoning with acting, positioning reasoning as the organizing principle for perception, planning, decision, and verification."

AI不再只是处理输入然后输出结果,而是可以主动规划、执行任务、从反馈中学习。下面简单总结下这篇论文的主要内容:

一:从静态计算到动态交互

传统LLM的工作方式是扩展测试时计算(scaling test-time computation):输入问题,模型内部计算,输出答案。整个过程是一次性的。

智能体推理不同。它强调扩展测试时互动(scaling test-time interaction)。AI被放在一个环境中,通过多轮交互来完成任务。它可以尝试、观察结果、调整策略,然后再尝试。

两者的区别:

这个变化意味着AI的能力不再取决于它记住了多少知识,而是取决于它能否在实际环境中找到信息、使用工具、根据反馈调整方法。

二:AI可以从错误中学习

更有意思的是自主演进智能体推理(Self-Evolving Agentic Reasoning)。AI可以通过经验改进自己的表现。

这依赖两个机制:

反馈:AI完成任务后会评估自己的推理过程。比如Reflexion框架让AI检查自己的行动序列是否有效。发现问题后,它会在下次任务中避免同样的错误。

记忆:AI会记录每次交互的结果。成功和失败的经验都会被保存下来,用于改进未来的决策。

这让AI可以在使用过程中持续改进,而不需要每次都重新训练模型。

三:多个AI协同工作

集体多智能体推理(Collective Multi-Agent Reasoning)让多个AI分工合作。一个AI团队可能包括:

  • 管理者:分解任务
  • 工作者:执行具体操作,比如调用工具或编写代码
  • 验证者:检查结果是否正确

这种分工的好处是每个AI专注于自己擅长的部分。管理者规划路线,工作者执行任务,验证者把关质量。它们之间会互相反馈,逐步优化最终结果。

四:AI可以创造工具

以前AI只能使用人类提供的工具和API。现在AI可以自己编写代码来创建新工具。

当遇到现有工具无法解决的问题时,AI会写代码、测试、调试,直到创建出能用的工具。比如ToolMaker框架甚至可以把整个GitHub仓库转换成AI可调用的工具集。

这意味着AI不再受限于预设的功能。它可以根据需要扩展自己的能力。

结论

智能体推理代表了AI发展的一个新方向。AI从被动响应转向主动解决问题,从静态知识库转向动态学习系统。

这项研究提出的四个方向——动态交互、从错误中学习、多智能体协作、创造工具——都指向同一个趋势:AI正在变得更加自主。

这些能力还在早期阶段,但已经显示出实用价值。接下来值得关注的就是这些技术如何在实际应用中落地。

学习资源推荐

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

​因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/5 5:10:06

安捷伦 Keysight 16195B 是德 16195B 校准套件

是德科技 16195B校准套件‌主要用于高频阻抗测量仪的校准,特别是在7 mm接头平面上进行校准。该套件包含以下组件: E4991-60021 (SHORT)、 E4991-60022 (OPEN)以及一个50欧姆的负载,频率范围为DC…

作者头像 李华
网站建设 2026/5/10 12:16:41

力科Teledyne LeCroy PP024 示波器探头 PP024-2

力科PP024探头 是一款无源衰减探头,适用于示波器,具有10:1的衰减值和500MHz的带宽。‌ 该探头的输入电阻为10MΩ,最大电压值为CAT I 500V和CAT II 400V,输入电容为10pF,电缆长度为51.181英寸(约1300毫米&am…

作者头像 李华
网站建设 2026/5/11 7:56:52

springboot旅游旅行攻略网站的设计与实现vue

目录系统架构设计核心功能模块技术实现要点扩展功能设计部署方案开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!系统架构设计 SpringBoot旅游旅行攻略网站采用前后端分离架构,后端使用SpringBoot框架提供RESTful A…

作者头像 李华
网站建设 2026/5/9 10:23:47

【dz-670】基于单片机的智能化光伏发电监控与管理系统设计

基于单片机的智能化光伏发电监控与管理系统 摘要:当前全球能源需求持续增长,同时对环境保护的重视程度也日益提高,光伏发电作为一种有清洁、可再生特性的能源技术,已获得广泛应用,本文设计了一种以单片机为基础的智能化…

作者头像 李华
网站建设 2026/5/10 8:41:52

ZUI15 平板充电样式怎么改?个性化设置教程来了!

对于使用联想 ZUI15 系统平板的用户来说,细节处的个性化定制总能让设备更具专属感。充电时的显示样式看似是小细节,却能在日常使用中带来不一样的仪式感 —— 单调的默认样式看久了难免乏味,不少小伙伴都在寻找更改充电样式的方法&#xff0c…

作者头像 李华
网站建设 2026/5/12 5:31:40

计算机毕设Java基于微信小程序的社区志愿者服务管理系统 基于微信小程序的社区志愿服务管理平台的Java开发实践 微信小程序环境下Java实现的社区志愿者服务管理系统设计

计算机毕设Java基于微信小程序的社区志愿者服务管理系统76x8l9(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。 随着社会的快速发展,社区志愿服务在促进社区和谐与提…

作者头像 李华