一、AI Agent 的重要性
token --> 词元
AI 工具琳琅满目,但是 AI Agent 开发最为耀眼!
1、 微软CEO纳德拉透露,微软30%代码由AlAgent生成,预计2030年95%代码将由Al Agent生成。
2、 通用AIAgent创业公司Manus上线仅2个月后,即完成一轮7500万美元融资,融资后估值达5亿美元,比之前增长了近五倍
3、 百度创始人李彦宏表示:Agent是我最看好的AI应用发展方向
4、2024年全球AlAgent市场规模约为51亿美金,2030年有望增长至471亿美元,年复合增长率达44.8%
Agent = 大模型+工具
二、普通程序员的机会
1、 显卡GPU(硬件+嵌入式):以英伟达为首,市值全球前三 内存条价格翻翻,但普通人 机会比较少
卖芯片 芯片销售岗位
2、 大语言模型(算法):以OpenAI(chatgpt)、通义千问(阿里巴巴)、DeepSeek(梁文锋)为首,Seed(字节跳动 张一明)
3、 智能体(应用开发):2025年迅速崛起,大厂全力投入
智能体绝对是普通程序员的非常好的出路:
主业突破:借助AIAgent在本职工作中突破上限,逆势晋升
跳槽换行:跳出舒适区,投身全新的行业或岗位
另辟蹊径:开启AI副业,创造第二职业,双份收入 使用 AI 将课本中的所有内容全部实现一遍
三、招聘市场
微软CEO提出AlAgent会颠覆SAAS 行业,在不远的未来,AlAgent的服务需求会超越软件外包
SaaS(Software as a Service)软件即服务
三、AI Agent 介绍
AlAgent是一个具有自主意识的智能实体(程序或系统)它能够感知环境、进行推理决策,并采取行动。
它可能是一段程序,也可能是一个系统。
龙虾其实就是一种智能体
CC 也是一种智能体
AI 员工:需要消耗 token
token 就是生成的文字,一个 token 大约对应 1-3 个字。因为它帮你生成文字的时候,需要消耗算力, 而算力需要消耗电费。
智能体(AI Agents或Agents)是指能够自主感知环境、做出决策并执行行动的系统或程序。
根据IBM的定义,智能体是“能够通过设计其工作流和利用可用工具,代表用户或其他系统自主执行任务的系统或程序”[IBM]。
英伟达则将智能体描述为“AI 智能体是先进的 AI 系统,旨在根据高级目标自主进行推理,制定计划并执行复杂任务。”,代表了“从简单自动化向能够管理复杂工作流的自主系统过渡”的演进方向[NVIDIA]。
公司 | 智能体产品 |
openai | https://openai.com/index/introducing-deep-research/ |
manus | Manus: Hands On AI |
沉思 | https://chatglm.cn/main/alltoolsdetail?lang=zh |
OpenAI 中的深度研究这个产品就是智能体
Manus : 智能体
在更专业的学术定义中,百度百科指出:“智能体是指能够感知环境并自主采取行动以实现特定目标的实体。这一概念最早由“人工智能之父”马文·明斯基提出,他认为某些问题可经由社会中的一些个体经过协商后解决,这些个体就是智能体。”[百度百科]
大白话:啥是智能体 就是 带脑子带手,能思考,还能自动干活
实现技术:
- Claude:由Anthropic开发,公司由前OpenAI研究员创立,强调AI的“可解释性”和“安全性”。
- GPT-4:由OpenAI开发,是当前最主流的闭源大模型之一
两者均是顶尖大模型,Claude在长文本、安全性上更突出,GPT-4在生态、多模态和开发灵活性上占优。选择取决于具体需求
梦想美元!
深度思考
市面上的智能体产品,比如最近非常火爆的龙虾(OpenClaw)
openai:深入研究是另一个产品
普通的 ai 产品,比如 chatgpt ,由于 token 的限制,很难进行深度的思考,所以 chatgpt 和深度思考(deep-research)是两个产品
manus:
manus 能干什么:https://www.bilibili.com/video/BV1KizLBHEDo/?spm_id_from=333.337.search-card.all.click&vd_source=fddf5e6da8d1e0550d4415e202024161
manus 帮助编写代码,分析股市:
特斯拉股票分析看板:
通义千问:
沉思:
四、智能体特征
智能体具有以下基本特征:
- 自主性(Autonomy):智能体能够在没有人类或其他实体的直接干预下运行,并对其行动和内部状态具有某种程度的控制。
- 反应性(Reactivity):智能体能够感知其环境,并对环境变化做出实时响应。
- 交互性/社交性(Socialability):智能体能够与其他智能体或人类进行交互和协作。
- 适应性/主动性(Proactivity):智能体能够根据环境变化主动调整其行为策略,适应新的情况。
- 学习能力:许多智能体具有通过经验或数据学习和改进的能力。
五、智能体和模型、大模型的区别
名词 | 核心概念 |
AI | 人工智能(AI)是计算机科学的一个分支学科 |
模型 |
|
大模型 |
|
智能体 |
|
参数: y=ax+b a 和 b 假如是固定值,由 x 得出 y 的值
最大的模型网站Hugging Face:
六、智能体的类型
- 自主智能体 (Autonomous Agents)
自主智能体是一种能够在没有人类干预的情况下,自主执行任务、做出决策和与环境互动的智能系统。它们具有高度的自主性,能够独立地感知环境、做出决策并执行行动,而不需要外部的控制和干预。
- 反应智能体 (Reactive Agents)
反应智能体主要关注对环境变化的实时响应。使用简单反射模型,根据当前感知做出决策,而不需要复杂的内部状态或长期规划。
目前我们开发的智能体基本上都是反应智能体
通用智能体(AGI)是人工智能领域的一个核心概念,它指的是具备跨领域、跨任务自主学习和执行能力的人工智能系统。与专门下围棋的AlphaGo或专门写代码的Copilot不同,通用智能体追求的是像人类一样,能够适应新环境、理解新任务并利用通用知识解决问题。
目前还未实现!
七、智能体的发展阶段
OpenAI根据自身技术研发与产品开发提出了通往AGI的五级量表,将AI Agent分为五个阶段,每个阶段代表更高级的能力水平:[51CTO]
- 第1级:聊天机器人- 具有对话语言技能 chatgpt
- 第2级:实用工具- 能够执行具体任务 比如能够上网
- 第3级:专家助手- 具有特定领域的专业知识 目前大家都在做这个
- 第4级:团队合作者- 能够与人类团队协作 比如 Manus
- 第5级:通用人工智能(AGI)- 具有与人类相当或超越人类的通用智能 (未来,也是 Manus 的口号)
八、智能体的应用领域
工业自动化
在工业领域,智能体被用于:
- 自动化生产线监控和优化
- 设备预测性维护
- 仓储和物流自动化
- 质量控制和检测
机器视觉、制造门窗等
服务业
在服务业,智能体的应用包括:
- 智能客服和客户支持
- 个性化推荐系统
- 智能健康管理
- 智能金融分析和风险管理
推荐: 字节跳动 抖音、今日头条、汽水音乐
医疗健康
在医疗健康领域,智能体被用于:
- 医学影像辅助诊断
- 病人监测和远程医疗
- 药物研发和临床试验优化
- 个性化治疗方案设计
远程医疗
某个团队,每一年会发现 2~3 个新的蛋白质结构
教育
在教育领域,智能体的应用包括:
- 个性化学习推荐系统
- 智能教学助手
- 学习评估和反馈系统
- 虚拟教育助手
娱乐与创意
在娱乐与创意领域,智能体被用于:
- 智能内容创作和推荐
- 游戏AI和虚拟对手
- 数字助手和创意辅助工具
- 虚拟主播和内容生成
短剧 、自动切片
以后的人,少学一些 操作类的东西,多学一些提升自我认知和思维的东西。
九、智能体架构
- 单个智能体的构成:
- 大模型(LLM)(必选)
- Tools(必选)
- 多个智能体的串联:
- LangGraph
- Dify、Coze等平台
- 智能体的调用:
- Python/Node
十、智能体开发
智能体开发流程:
- 大模型创建
- 智能体工具开发
- 智能体开发
- 智能体串联(可选)
- 智能体运行
智能体知识架构图
十一、概念总结
1、智能体: 大模型+工具
2、什么是大模型:英文 LLM,大语言模型,其实就是参数比较多而已
3、RAG: 知识库,就是提供额外数据库的技术
4、LangChain: 开发智能体的框架
5、LangGraph: 将多个智能体串联起来的技术 (LangChain 生态的一员)