news 2026/7/3 3:23:56

AI智能体详细介绍(一)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI智能体详细介绍(一)

一、AI Agent 的重要性

token --> 词元

AI 工具琳琅满目,但是 AI Agent 开发最为耀眼!

1、 微软CEO纳德拉透露,微软30%代码由AlAgent生成,预计2030年95%代码将由Al Agent生成。

2、 通用AIAgent创业公司Manus上线仅2个月后,即完成一轮7500万美元融资,融资后估值达5亿美元,比之前增长了近五倍

3、 百度创始人李彦宏表示:Agent是我最看好的AI应用发展方向

4、2024年全球AlAgent市场规模约为51亿美金,2030年有望增长至471亿美元,年复合增长率达44.8%

Agent = 大模型+工具

二、普通程序员的机会

1、 显卡GPU(硬件+嵌入式):以英伟达为首,市值全球前三 内存条价格翻翻,但普通人 机会比较少

卖芯片 芯片销售岗位

2、 大语言模型(算法):以OpenAI(chatgpt)、通义千问(阿里巴巴)、DeepSeek(梁文锋)为首,Seed(字节跳动 张一明)

3、 智能体(应用开发):2025年迅速崛起,大厂全力投入

智能体绝对是普通程序员的非常好的出路

主业突破:借助AIAgent在本职工作中突破上限,逆势晋升

跳槽换行:跳出舒适区,投身全新的行业或岗位

另辟蹊径:开启AI副业,创造第二职业,双份收入 使用 AI 将课本中的所有内容全部实现一遍

三、招聘市场

微软CEO提出AlAgent会颠覆SAAS 行业,在不远的未来,AlAgent的服务需求会超越软件外包

SaaS(Software as a Service)软件即服务

三、AI Agent 介绍

AlAgent是一个具有自主意识的智能实体(程序或系统)它能够感知环境、进行推理决策,并采取行动。

它可能是一段程序,也可能是一个系统。

龙虾其实就是一种智能体

CC 也是一种智能体

AI 员工:需要消耗 token

token 就是生成的文字,一个 token 大约对应 1-3 个字。因为它帮你生成文字的时候,需要消耗算力, 而算力需要消耗电费。

智能体(AI Agents或Agents)是指能够自主感知环境、做出决策并执行行动的系统或程序

根据IBM的定义,智能体是“能够通过设计其工作流和利用可用工具,代表用户或其他系统自主执行任务的系统或程序”[IBM]。

英伟达则将智能体描述为“AI 智能体是先进的 AI 系统,旨在根据高级目标自主进行推理,制定计划并执行复杂任务。”,代表了“从简单自动化向能够管理复杂工作流的自主系统过渡”的演进方向[NVIDIA]。

公司

智能体产品

openai

https://openai.com/index/introducing-deep-research/

manus

Manus: Hands On AI

沉思

https://chatglm.cn/main/alltoolsdetail?lang=zh

OpenAI 中的深度研究这个产品就是智能体

Manus : 智能体

在更专业的学术定义中,百度百科指出:“智能体是指能够感知环境并自主采取行动以实现特定目标的实体。这一概念最早由“人工智能之父”马文·明斯基提出,他认为某些问题可经由社会中的一些个体经过协商后解决,这些个体就是智能体。”[百度百科]

大白话:啥是智能体 就是 带脑子带手,能思考,还能自动干活

实现技术:

  • Claude:由Anthropic开发,公司由前OpenAI研究员创立,强调AI的“可解释性”和“安全性”。
  • GPT-4:由OpenAI开发,是当前最主流的闭源大模型之一

两者均是顶尖大模型,Claude在长文本、安全性上更突出,GPT-4在生态、多模态和开发灵活性上占优。选择取决于具体需求

梦想美元!

深度思考

市面上的智能体产品,比如最近非常火爆的龙虾(OpenClaw)

openai:深入研究是另一个产品

普通的 ai 产品,比如 chatgpt ,由于 token 的限制,很难进行深度的思考,所以 chatgpt 和深度思考(deep-research)是两个产品

manus:

manus 能干什么:https://www.bilibili.com/video/BV1KizLBHEDo/?spm_id_from=333.337.search-card.all.click&vd_source=fddf5e6da8d1e0550d4415e202024161

manus 帮助编写代码,分析股市:

特斯拉股票分析看板:

通义千问:

沉思:

四、智能体特征

智能体具有以下基本特征:

  • 自主性(Autonomy):智能体能够在没有人类或其他实体的直接干预下运行,并对其行动和内部状态具有某种程度的控制。
  • 反应性(Reactivity):智能体能够感知其环境,并对环境变化做出实时响应。

  • 交互性/社交性(Socialability):智能体能够与其他智能体或人类进行交互和协作。
  • 适应性/主动性(Proactivity):智能体能够根据环境变化主动调整其行为策略,适应新的情况。
  • 学习能力:许多智能体具有通过经验或数据学习和改进的能力。

五、智能体和模型、大模型的区别

名词

核心概念

AI

人工智能(AI)是计算机科学的一个分支学科

模型

  • AI系统的核心算法组件,通过从数据中学习规律和模式来实现特定功能
  • 常见模型如:预测模型(分类、回归),生成模型(文本、图像生成)等
  • 模型是无实体的工具,不具有自主性

大模型

  • 模型的特殊形态,以参数规模巨大(达到百亿、千亿甚至万亿)为显著特征
  • 主要用来处理复杂任务和复杂推理,对人类指令有很强的遵循能力

智能体

  • 能够感知环境自主决策并执行行动以实现特定目标的实体或系统
  • 智能体是AI技术落地的系统级应用形式
  • 能够形成完整的“感知-决策-行动”闭环

参数: y=ax+b a 和 b 假如是固定值,由 x 得出 y 的值

最大的模型网站Hugging Face

六、智能体的类型

  • 自主智能体 (Autonomous Agents)

自主智能体是一种能够在没有人类干预的情况下,自主执行任务、做出决策和与环境互动的智能系统。它们具有高度的自主性,能够独立地感知环境、做出决策并执行行动,而不需要外部的控制和干预。

  • 反应智能体 (Reactive Agents)

反应智能体主要关注对环境变化的实时响应。使用简单反射模型,根据当前感知做出决策,而不需要复杂的内部状态或长期规划。

目前我们开发的智能体基本上都是反应智能体

通用智能体(AGI)是人工智能领域的一个核心概念,它指的是具备跨领域、跨任务自主学习和执行能力的人工智能系统。与专门下围棋的AlphaGo或专门写代码的Copilot不同,通用智能体追求的是像人类一样,能够适应新环境、理解新任务并利用通用知识解决问题。

目前还未实现!

七、智能体的发展阶段

OpenAI根据自身技术研发与产品开发提出了通往AGI的五级量表,将AI Agent分为五个阶段,每个阶段代表更高级的能力水平:[51CTO]

  1. 第1级:聊天机器人- 具有对话语言技能 chatgpt
  2. 第2级:实用工具- 能够执行具体任务 比如能够上网
  3. 第3级:专家助手- 具有特定领域的专业知识 目前大家都在做这个
  4. 第4级:团队合作者- 能够与人类团队协作 比如 Manus
  5. 第5级:通用人工智能(AGI)- 具有与人类相当或超越人类的通用智能 (未来,也是 Manus 的口号)

八、智能体的应用领域

工业自动化

在工业领域,智能体被用于:

  • 自动化生产线监控和优化
  • 设备预测性维护
  • 仓储和物流自动化
  • 质量控制和检测

机器视觉、制造门窗等

服务业

在服务业,智能体的应用包括:

  • 智能客服和客户支持
  • 个性化推荐系统
  • 智能健康管理
  • 智能金融分析和风险管理

推荐: 字节跳动 抖音、今日头条、汽水音乐

医疗健康

在医疗健康领域,智能体被用于:

  • 医学影像辅助诊断
  • 病人监测和远程医疗
  • 药物研发和临床试验优化
  • 个性化治疗方案设计

远程医疗

某个团队,每一年会发现 2~3 个新的蛋白质结构

教育

在教育领域,智能体的应用包括:

  • 个性化学习推荐系统
  • 智能教学助手
  • 学习评估和反馈系统
  • 虚拟教育助手

娱乐与创意

在娱乐与创意领域,智能体被用于:

  • 智能内容创作和推荐
  • 游戏AI和虚拟对手
  • 数字助手和创意辅助工具
  • 虚拟主播和内容生成

短剧 、自动切片

以后的人,少学一些 操作类的东西,多学一些提升自我认知和思维的东西。

九、智能体架构

  • 个智能体的构成:
    • 大模型(LLM)(必选)
    • Tools(必选)
  • 个智能体的串联:
    • LangGraph
    • Dify、Coze等平台

  • 智能体的调用:
    • Python/Node

十、智能体开发

智能体开发流程:

  • 大模型创建
  • 智能体工具开发
  • 智能体开发
  • 智能体串联(可选)
  • 智能体运行

智能体知识架构图

十一、概念总结

1、智能体: 大模型+工具

2、什么是大模型:英文 LLM,大语言模型,其实就是参数比较多而已

3、RAG: 知识库,就是提供额外数据库的技术

4、LangChain: 开发智能体的框架

5、LangGraph: 将多个智能体串联起来的技术 (LangChain 生态的一员)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/3 3:19:21

显存还没爆,大模型先崩了?你的 KV Cache 正在悄悄杀掉你的显存预算

同一个 Llama-3-8B(Q4_K_M),同一段 prompt。-ngl 0 纯 CPU 解码,我这台机器上大约 2 tokens/s;-ngl 99 全塞进一张 RTX 4090,稳定在 150 tokens/s 上下——75 倍。中间那条曲线不是直线,也不是你以为的样子。 先说一个大多数教程都写错的事实:n_gpu_layers=10 不是把前…

作者头像 李华
网站建设 2026/7/3 3:16:14

掌握MaxBot自动化抢票机器人:实现高效智能抢票的实战方案

掌握MaxBot自动化抢票机器人:实现高效智能抢票的实战方案 【免费下载链接】tix_bot Max搶票機器人(maxbot) help you quickly buy your tickets 项目地址: https://gitcode.com/gh_mirrors/ti/tix_bot MaxBot抢票机器人是一款基于Python 3和Selenium技术开发…

作者头像 李华
网站建设 2026/7/3 3:16:02

Hive 内置函数

字符串函数-- 字符串长度 select length(hello) -- 替换 select replace(hello,l,x) -- 截取 select substr(hello,2,3) -- 拼接 select concat(hello,hello,hello) select hello||hello||helloselect concat(id,name)from hero -- 拼接时添加分隔符, 分隔符写在第一个参数 s…

作者头像 李华
网站建设 2026/7/3 3:13:00

《算法设计与分析》全套PPT课件(西交)

《算法设计与分析》全套课件(西交) 课件内容: 第1章鄭法引论.pdf 第2章递归与分治策略.pdf 第3章动态规划-1.pdf 第4章贪心算法.pdf 第5章回溯法-1.pdf 第6章分支限界法-1.pdf 第7章概率算法.pdf 第8章NP完全性理论.pdf 第9章近似算法.pdf 第…

作者头像 李华
网站建设 2026/7/3 3:05:55

Web安全实战指南:从SQL注入到CSRF的攻防原理与代码级防御

1. 项目概述:为什么Web安全是每个开发者的必修课最近几年,我处理过不少线上应急响应,从数据库被拖到用户信息泄露,再到服务器被当成“肉鸡”去攻击别人,这些事故的根源,十有八九都出在Web应用的安全漏洞上。…

作者头像 李华
网站建设 2026/7/3 2:54:31

Gemini API多模态AI开发实战指南

1. Gemini API 快速入门指南如果你正在寻找一个强大的AI开发工具,Gemini API绝对值得关注。作为Google推出的新一代AI开发接口,它让开发者能够轻松调用包括Gemini、Veo、Nano Banana等在内的多种先进模型。我最近在实际项目中使用了这个API,发…

作者头像 李华