2026 年中观察:AI 从"聊天"到"干活",Agent 时代真的来了
如果你还在把 AI 当成一个高级聊天机器人,那你已经落后了一个时代。
2026 年 6 月,AI 行业正在经历自 ChatGPT 诞生以来最深刻的一次范式转移——AI 不再只是"说",而是开始"做"。
一、Agentic AI:年度关键词
6 月初的 Computex 上,黄仁勋说出了今年最具分量的一句话:
“能够盈利的 AI 已经到来。”
他指的正是Agentic AI(代理式 AI)——能够自主规划、执行多步骤任务、调用工具、并在真实世界中产生结果的 AI 系统。
这不是营销话术。看看过去一个月发生了什么:
- Anthropic的 Claude Code 现在支持Dynamic Workflows(动态工作流)——在单次会话中并行运行数百个子 Agent,自动拆分任务、分配执行、验证汇总。Stripe 实测:5000 万行 Ruby 代码库一天内完成迁移,而人类团队原本需要两个月。
- Google发布了Gemini Spark——一个"永远在线"的个人 Agent,即使用户关闭终端也能在云端持续工作,深度集成整个 Google 生态。
- Microsoft推出了Scout后台 Agent,并宣布"操作系统和应用的时代已经结束,Agent 取而代之"。
- OpenAI和高通被曝正在联合打造一款"没有 App、只有 AI 界面"的 Agent 原生手机。
高通 CEO 干脆把 2026 年称为“Agent 之年”。这不是夸张——这是一场从"工具"到"同事"的质变。
二、编程 Agent 军备竞赛:硅谷程序员的"新同事"
编程领域是 Agent 能力最直观的试金石。2026 年上半年,这场竞赛进入了白热化阶段:
模型对决
| 基准测试 | Claude Opus 4.8 | GPT-5.5 | Claude Fable 5 |
|---|---|---|---|
| SWE-bench Pro(仓库级工程) | 69.2% | 58.6% | 80.3% |
| Terminal-Bench 2.0(终端/Shell) | 74.6% | 82.7% | — |
| OSWorld(桌面自动化) | 83.4% | 78.7% | — |
| Humanity’s Last Exam | 49.8% | 41.4% | — |
| 100 万 Token 长上下文推理 | 68.1% | 45.4% | — |
三个趋势值得关注
第一,从"辅助"到"替代"。Bun 的作者用 Claude Code 将整个运行时从 Zig 迁移到 Rust——75 万行代码,11 天完成,测试通过率 99.8%。这在一年前是不可想象的。
第二,从"单打独斗"到"团队协作"。Claude Code 现在可以同时运行多个 Agent:一个审代码,一个写测试,一个改文档,并行推进。开发者不再是"一个人 + 一个 AI 助手",而是"一个人 + 一群 AI 同事"。
第三,市场格局变了。Anthropic 的企业采用率在 2026 年 4 月首次超越 OpenAI(34.4% vs 32.3%)。在编程市场份额上,Anthropic 占据了约 54%。Claude Code 的企业客户从 1000 家飙升至 30 万家。Cursor 已将默认模型从 GPT 切换为 Claude。
但 GPT-5.5 在终端/Shell 场景依然领先,DeepSeek V4 Pro以 $0.435/百万 token 的极致性价比成为开发者的"省钱利器"。多模型组合使用,正在成为企业的最佳实践。
三、多模态融合:AI 长出"五感"
如果说 Agent 是 AI 的"手",那么多模态就是 AI 的"眼"和"耳"。
2026 年,多模态已经从"拼接式"(文本归文本、图片归图片)转向原生多模态融合:
- Google Gemini Omni实现了 any-to-any 的全模态输入输出——视频、音频、图像、文本任意组合,并且具备对物理世界的深层认知。
- 腾讯混元 HY World打造了实时交互的视频世界模型,从离线内容生成演进到实时交互。
- Nvidia Cosmos 3作为物理世界的世界基础模型,为具身智能和自动驾驶提供核心支撑。
最值得关注的是**具身智能(Embodied AI)**的爆发。Figure AI连续 5 天直播机器人分拣包裹——33 小时+,处理 40,000+ 个包裹。智谱机器人在中国交付了第 10,000 台通用具身机器人。Nvidia 发布了开源人形机器人参考设计Isaac GR00T。
黄仁勋说了一句很精辟的话:“对于物理 AI,计算就是数据。”模拟环境中的每一次交互,都在为 AI 理解物理世界积累经验。
四、治理与安全:刹车踏板的安装
当 AI 开始"干活"而不是"聊天",风险也成倍放大。
美国的行动
2026 年 6 月 2 日,特朗普签署了名为“促进先进人工智能创新与安全”的行政令,核心内容包括:
- 自愿性预发布审查:AI 公司被要求在发布"前沿模型"前 30 天提交政府测试(最初草案是 90 天,因行业反对而缩短)。
- AI 网络安全信息交换中心:由财政部牵头,协调漏洞发现、验证和补丁分发。
- NSA 分类基准测试:国家安全局等机构需开发机密流程,评估 AI 模型的网络攻击能力。
- 明确声明不设立强制许可或预审制度。
Anthropic 的激进立场
触发白宫行动的直接导火索是Anthropic 的 Mythos 模型——它能在短时间内发现并利用大规模软件漏洞。Anthropic 随后发布了自己的治理框架,呼吁:
- 政府有权阻止或处罚危险的 AI 部署,罚金可与全球营收挂钩。
- 覆盖超过 10²⁵ FLOPs 训练量的模型。
- 识别四类灾难性风险:生物武器、大规模网络漏洞发现、自主系统失控、AI 自动化自身研发。
OpenAI 的分歧
OpenAI 提出了与白宫不同的方案:主张强制评估(而非自愿),要求由民用机构 CAISI(而非 NSA)主导评估,反对机密基准测试。
更广泛的全球图景
- 欧盟:AI 法案通过"数字综合修正案",高风险系统合规截止日延长至 2027 年 12 月/2028 年 8 月。
- 中国:启动 2026 年"清朗"行动,重点打击 AI 欺诈、深度伪造和未注册大模型。
- 印度:最高法院起草了《2026 年法院使用 AI 条例》,要求披露 AI 辅助的法律文件,但禁止 AI 参与量刑和保释决定。
- 五眼联盟:发布关于安全采用 Agentic AI 系统的联合指南。
一个核心矛盾正在浮现:创新速度 vs 安全节奏。行业普遍希望有规则,但对"谁来制定规则、规则有多严格"存在巨大分歧。而中国在 AI 领域的快速追赶,使得每一次监管讨论都笼罩在地缘竞争的阴影之下。
五、经济学:Token、就业与万亿赌注
Token 经济学正在改变
GPT-5.5 提高了单 Token 价格,但显著减少了每次对话的 Token 消耗。“TokenMaxxing”(最大化 Token 使用量)正在被成本敏感型模型选择取代。TokenTuner 等工具帮助公司将模型选择与业务产出对齐。
一个有趣的趋势:推理(Inference)正在取代训练(Training)成为成本大头,这反过来推动了对 CPU 的需求增长——不仅仅是 GPU。
就业:恐惧还是希望?
黄仁勋在 Computex 上直接回应了就业焦虑:
“如果一个开发者的生产力能带来 9 万亿美元的增长,每个人都会想要更多开发者。”
但现实更复杂。AI 编程 Agent 的能力正在从"辅助编码"向"自主完成项目"进化。Stripe 的 5000 万行迁移、Bun 的 75 万行重写,这些案例暗示着某种程度的替代是不可避免的。但与此同时,新的岗位也在诞生——AI 训练师、Agent 编排者、AI 安全审计员……
资本:万亿豪赌
- Alphabet 完成了847.5 亿美元的股权融资——史上最大。
- 2026 年资本支出指引:1800-1900 亿美元(仅 AI 基础设施)。
- 摩根士丹利估计,2025-2028 年科技巨头将花费3 万亿美元在数据中心上。
- Anthropic 估值逼近1 万亿美元,已申请 IPO。
- Nvidia 市值突破5 万亿美元;三星、美光、SK 海力士全部成为万亿级芯片公司。
这不是泡沫——至少不全是。这是对一种新范式的全球性押注。
六、站在 2026 年 6 月的路口
回顾过去 18 个月,AI 的发展轨迹清晰可见:
ChatGPT 时刻 (2022.11) ↓ 大模型竞赛 (2023-2024) ↓ 多模态融合 (2024-2025) ↓ Agent 自主行动 (2025-2026) ← 我们在这里 ↓ 具身智能 + 通用 Agent (2026-?)我们正处于一个微妙的时刻:
- 技术上,AI 已经从"能说会道"进化到"能干活"。Agent 不再是 PPT 概念,而是切实可用的生产力工具。
- 商业上,万亿资本正在重新配置。每一次模型迭代、每一个基础设施投资,都在重塑全球科技版图。
- 治理上,规则还在追赶技术。自愿还是强制?民用还是军方主导?联邦还是州权?这些问题没有共识。
- 社会层面,工作、教育、创造力的定义都在被重新书写。
如果说 ChatGPT 在 2022 年让世界看到了 AI 的可能性,那么 2026 年的 Agent 浪潮正在让世界感受到 AI 的力量——真实、可度量、不可逆转。
写在最后
写这篇文章的时候,我用了 Claude Code 帮我搜集资料、整理数据、检查事实。某种程度上,这篇文章本身就是 Agent 时代的产物。
但核心的观点、结构的选择、价值的判断——这些仍然是人类的工作。
2026 年的 AI 不是要取代你,而是要给你一群"AI 同事"。问题不在于要不要用它们,而在于你是否知道如何指挥它们。
这才是这个时代最值得思考的问题。
本文写于 2026 年 6 月 11 日。数据和事实截至当日。
参考来源:O’Reilly Radar June 2026、Computex 2026 / GTC Taipei、Anthropic 官方博客、OpenAI 官方博客、NPR/CNN/Politico 报道、智源大会 2026、36氪、CSDN 等。