Claude Sonnet 5 上线
Claude 把 Agent 模型打到更便宜,豆包继续补真实工作流,OpenAI 则把企业最头疼的内网工具接入问题拿出来单独解决。
今天 AI 圈可以看的事不少,但真正值得普通读者停一下的,其实只有三件。
不是谁又发了一个小功能。
也不是某个榜单名次变了两格。
而是三家公司在同一天把同一个方向讲得更清楚了:
AI 正在从“会回答”继续往“能交付”走。区别只在于,有人降价,有人补能力,有人补企业基础设施。
第一件事:Claude Sonnet 5 上线,价格比声量更值得看
Anthropic 发布了 Claude Sonnet 5。
它不是最适合拿来刷存在感的那种“最强模型”叙事,但它的商业信号很硬:全计划可用,进入 Claude Code 和 Claude Platform,并给出限时 API 价格。
到 2026 年 8 月 31 日前,Claude Sonnet 5 的 API 价格是每百万输入 token 2 美元、每百万输出 token 10 美元;之后调整为每百万输入 3 美元、输出 15 美元。
这组价格,比“又聪明了多少”更值得看。
因为 Agent 真正跑起来,最先烧掉的不是宣传语,而是 token。
一个能改代码、查资料、点工具、跑多步任务的模型,如果每一步都太贵,就只能停留在少数高价值场景里。Sonnet 5 的位置,正好卡在企业和开发者最敏感的区间:
够强,能干活。
够便宜,能多跑。
Anthropic 还强调,Sonnet 5 在编码、Agent、职业工作流上比前代 Sonnet 更进一步,尤其是多步任务、浏览器和电脑使用能力。
这不是单纯模型升级。
这是在告诉市场:Agent 的竞争,已经进入“每完成一件事多少钱”的阶段。
第二件事:豆包 Seed2.1 不是炫技,重点是“交付完整任务”
字节 Seed 团队发布 Seed2.1,豆包和火山引擎用户已经可以访问。
这条国内进展比很多“模型发布”更值得看,因为它讲的不是单点能力,而是三类真实工作:
多工具、多环境的 Agent 执行。
端到端 Coding 交付。
更强的多模态理解。
字节在官方说明里反复提到“真实工作流”,这很关键。
过去模型厂商很喜欢讲静态榜单。今天大家开始换话术:能不能看懂一堆文件,能不能拆任务,能不能调用工具,能不能写完代码,能不能把结果交付出来。
Seed2.1 里尤其值得注意的是两个点。
第一,它强调跨工具、跨环境执行,不只是在聊天框里回答。
第二,它把企业级开发场景拆成需求分析、功能实现、Bug 修复、环境配置、结果验证这些完整环节。
这说明国内大模型也在从“模型能力”往“可用工作流”迁移。
豆包的优势不只是模型本身,还在于字节有足够多真实产品入口:办公、内容、视频、剪辑、搜索、协作、开发者平台。模型如果能被这些入口持续喂给真实任务,迭代速度会很快。
这才是它对阿里千问、智谱 GLM、Kimi、MiniMax 的压力。
不是谁更会聊天。
而是谁更快把 AI 放进每天真实发生的任务里。
第三件事:OpenAI 没发大模型,却解决了企业最现实的一堵墙
OpenAI 开发者博客发布 Secure MCP Tunnel。
这件事不适合普通热搜,但对企业 AI 落地很关键。
很多公司不是没有内部工具,也不是不想让 AI 调用工具,而是不敢把内部服务暴露到公网。
数据库、工单系统、知识库、审批系统、代码平台、内部 API,哪一个都不能随便开口子。
OpenAI 这次给出的思路是:让企业在自己的私有环境里运行一个小客户端,由它主动向外建立 HTTPS 连接;ChatGPT、Codex 或其他 OpenAI 产品需要调用 MCP 工具时,请求通过这条通道转发到内部 MCP Server,再把结果带回来。
听起来很工程,但影响很直接。
企业之前要让 AI 接入内部工具,常见办法是开公网端点、上第三方隧道、搞 VPN 或网络互联。
每一种都麻烦。
每一种都要过安全、法务、采购和运维。
OpenAI 现在想把这个问题变成更窄的一条路:内部服务不出门,只让一个可审查的客户端向外连。
这不是大模型能力更新。
但它决定 AI 能不能进入企业核心系统。
因为模型再强,如果连不上真实工具、拿不到真实数据、不能在权限边界内执行,它就只能做一个更聪明的外部顾问。
企业 AI 的下一步,不是“多会说”,而是“能不能在不破坏安全边界的前提下做事”。