AI智能体详细介绍（一）-平芜编程栈

一、AI Agent 的重要性

token --> 词元

AI 工具琳琅满目，但是 AI Agent 开发最为耀眼！

1、微软CEO纳德拉透露，微软30%代码由AlAgent生成，预计2030年95%代码将由Al Agent生成。

2、通用AIAgent创业公司Manus上线仅2个月后，即完成一轮7500万美元融资，融资后估值达5亿美元，比之前增长了近五倍

3、百度创始人李彦宏表示：Agent是我最看好的AI应用发展方向

4、2024年全球AlAgent市场规模约为51亿美金，2030年有望增长至471亿美元，年复合增长率达44.8%

Agent = 大模型+工具

二、普通程序员的机会

1、显卡GPU（硬件+嵌入式）：以英伟达为首，市值全球前三内存条价格翻翻，但普通人机会比较少

卖芯片芯片销售岗位

2、大语言模型（算法）：以OpenAI（chatgpt）、通义千问(阿里巴巴)、DeepSeek（梁文锋）为首，Seed（字节跳动张一明）

3、智能体（应用开发）：2025年迅速崛起，大厂全力投入

智能体绝对是普通程序员的非常好的出路：

主业突破：借助AIAgent在本职工作中突破上限，逆势晋升

跳槽换行：跳出舒适区，投身全新的行业或岗位

另辟蹊径：开启AI副业，创造第二职业，双份收入使用 AI 将课本中的所有内容全部实现一遍

三、招聘市场

微软CEO提出AlAgent会颠覆SAAS 行业，在不远的未来，AlAgent的服务需求会超越软件外包

SaaS（Software as a Service）软件即服务

三、AI Agent 介绍

AlAgent是一个具有自主意识的智能实体（程序或系统）它能够感知环境、进行推理决策，并采取行动。

它可能是一段程序，也可能是一个系统。

龙虾其实就是一种智能体

CC 也是一种智能体

AI 员工：需要消耗 token

token 就是生成的文字，一个 token 大约对应 1-3 个字。因为它帮你生成文字的时候，需要消耗算力，而算力需要消耗电费。

智能体（AI Agents或Agents）是指能够自主感知环境、做出决策并执行行动的系统或程序。

根据IBM的定义，智能体是“能够通过设计其工作流和利用可用工具，代表用户或其他系统自主执行任务的系统或程序”[IBM]。

英伟达则将智能体描述为“AI 智能体是先进的 AI 系统，旨在根据高级目标自主进行推理，制定计划并执行复杂任务。”，代表了“从简单自动化向能够管理复杂工作流的自主系统过渡”的演进方向[NVIDIA]。

公司	智能体产品
openai	https://openai.com/index/introducing-deep-research/
manus	Manus: Hands On AI
沉思	https://chatglm.cn/main/alltoolsdetail?lang=zh

OpenAI 中的深度研究这个产品就是智能体

Manus : 智能体

在更专业的学术定义中，百度百科指出：“智能体是指能够感知环境并自主采取行动以实现特定目标的实体。这一概念最早由“人工智能之父”马文·明斯基提出，他认为某些问题可经由社会中的一些个体经过协商后解决，这些个体就是智能体。”[百度百科]

大白话：啥是智能体就是带脑子带手，能思考，还能自动干活

实现技术：

Claude：由Anthropic开发，公司由前OpenAI研究员创立，强调AI的“可解释性”和“安全性”。
GPT-4：由OpenAI开发，是当前最主流的闭源大模型之一

两者均是顶尖大模型，Claude在长文本、安全性上更突出，GPT-4在生态、多模态和开发灵活性上占优。选择取决于具体需求

梦想美元！

深度思考

市面上的智能体产品，比如最近非常火爆的龙虾（OpenClaw）

openai:深入研究是另一个产品

普通的 ai 产品，比如 chatgpt ,由于 token 的限制，很难进行深度的思考，所以 chatgpt 和深度思考（deep-research）是两个产品

manus:

manus 能干什么：https://www.bilibili.com/video/BV1KizLBHEDo/?spm_id_from=333.337.search-card.all.click&vd_source=fddf5e6da8d1e0550d4415e202024161

manus 帮助编写代码，分析股市：

特斯拉股票分析看板：

通义千问：

沉思：

四、智能体特征

智能体具有以下基本特征：

自主性(Autonomy)：智能体能够在没有人类或其他实体的直接干预下运行，并对其行动和内部状态具有某种程度的控制。
反应性(Reactivity)：智能体能够感知其环境，并对环境变化做出实时响应。

交互性/社交性(Socialability)：智能体能够与其他智能体或人类进行交互和协作。
适应性/主动性(Proactivity)：智能体能够根据环境变化主动调整其行为策略，适应新的情况。
学习能力：许多智能体具有通过经验或数据学习和改进的能力。

五、智能体和模型、大模型的区别

名词	核心概念
AI	人工智能（AI）是计算机科学的一个分支学科
模型	AI系统的核心算法组件，通过从数据中学习规律和模式来实现特定功能常见模型如：预测模型（分类、回归），生成模型（文本、图像生成）等模型是无实体的工具，不具有自主性
大模型	模型的特殊形态，以参数规模巨大（达到百亿、千亿甚至万亿）为显著特征主要用来处理复杂任务和复杂推理，对人类指令有很强的遵循能力
智能体	能够感知环境、自主决策并执行行动以实现特定目标的实体或系统智能体是AI技术落地的系统级应用形式能够形成完整的“感知-决策-行动”闭环

参数： y=ax+b a 和 b 假如是固定值，由 x 得出 y 的值

最大的模型网站Hugging Face：

六、智能体的类型

自主智能体 (Autonomous Agents)

自主智能体是一种能够在没有人类干预的情况下，自主执行任务、做出决策和与环境互动的智能系统。它们具有高度的自主性，能够独立地感知环境、做出决策并执行行动，而不需要外部的控制和干预。

反应智能体 (Reactive Agents)

反应智能体主要关注对环境变化的实时响应。使用简单反射模型，根据当前感知做出决策，而不需要复杂的内部状态或长期规划。

目前我们开发的智能体基本上都是反应智能体

通用智能体(AGI)是人工智能领域的一个核心概念，它指的是具备跨领域、跨任务自主学习和执行能力的人工智能系统。与专门下围棋的AlphaGo或专门写代码的Copilot不同，通用智能体追求的是像人类一样，能够适应新环境、理解新任务并利用通用知识解决问题。

目前还未实现！

七、智能体的发展阶段

OpenAI根据自身技术研发与产品开发提出了通往AGI的五级量表，将AI Agent分为五个阶段，每个阶段代表更高级的能力水平：[51CTO]

第1级：聊天机器人- 具有对话语言技能 chatgpt
第2级：实用工具- 能够执行具体任务比如能够上网
第3级：专家助手- 具有特定领域的专业知识目前大家都在做这个
第4级：团队合作者- 能够与人类团队协作比如 Manus
第5级：通用人工智能(AGI)- 具有与人类相当或超越人类的通用智能（未来，也是 Manus 的口号）

八、智能体的应用领域

工业自动化

在工业领域，智能体被用于：

自动化生产线监控和优化
设备预测性维护
仓储和物流自动化
质量控制和检测

机器视觉、制造门窗等

服务业

在服务业，智能体的应用包括：

智能客服和客户支持
个性化推荐系统
智能健康管理
智能金融分析和风险管理

推荐：字节跳动抖音、今日头条、汽水音乐

医疗健康

在医疗健康领域，智能体被用于：

医学影像辅助诊断
病人监测和远程医疗
药物研发和临床试验优化
个性化治疗方案设计

远程医疗

某个团队，每一年会发现 2~3 个新的蛋白质结构

教育

在教育领域，智能体的应用包括：

个性化学习推荐系统
智能教学助手
学习评估和反馈系统
虚拟教育助手

娱乐与创意

在娱乐与创意领域，智能体被用于：

智能内容创作和推荐
游戏AI和虚拟对手
数字助手和创意辅助工具
虚拟主播和内容生成

短剧、自动切片

以后的人，少学一些操作类的东西，多学一些提升自我认知和思维的东西。

九、智能体架构

单个智能体的构成：

- 大模型（LLM）（必选）
- Tools（必选）

多个智能体的串联：

- LangGraph
- Dify、Coze等平台

智能体的调用：

- Python/Node

十、智能体开发

智能体开发流程：

大模型创建
智能体工具开发
智能体开发
智能体串联（可选）
智能体运行

智能体知识架构图

十一、概念总结

1、智能体：大模型+工具

2、什么是大模型：英文 LLM，大语言模型，其实就是参数比较多而已

3、RAG: 知识库，就是提供额外数据库的技术

4、LangChain: 开发智能体的框架

5、LangGraph: 将多个智能体串联起来的技术（LangChain 生态的一员）

AI智能体详细介绍（一）

一、AI Agent 的重要性

二、普通程序员的机会

三、AI Agent 介绍

深度思考

四、智能体特征

五、智能体和模型、大模型的区别

六、智能体的类型

七、智能体的发展阶段

八、智能体的应用领域

九、智能体架构

十、智能体开发

十一、概念总结

显存还没爆，大模型先崩了？你的 KV Cache 正在悄悄杀掉你的显存预算

掌握MaxBot自动化抢票机器人：实现高效智能抢票的实战方案

Hive 内置函数

《算法设计与分析》全套PPT课件（西交）

Web安全实战指南：从SQL注入到CSRF的攻防原理与代码级防御

Gemini API多模态AI开发实战指南