Claude Sonnet 5 上线-平芜编程栈

Claude Sonnet 5 上线

Claude 把 Agent 模型打到更便宜，豆包继续补真实工作流，OpenAI 则把企业最头疼的内网工具接入问题拿出来单独解决。

今天 AI 圈可以看的事不少，但真正值得普通读者停一下的，其实只有三件。

不是谁又发了一个小功能。

也不是某个榜单名次变了两格。

而是三家公司在同一天把同一个方向讲得更清楚了：

AI 正在从“会回答”继续往“能交付”走。区别只在于，有人降价，有人补能力，有人补企业基础设施。

第一件事：Claude Sonnet 5 上线，价格比声量更值得看

Anthropic 发布了 Claude Sonnet 5。

它不是最适合拿来刷存在感的那种“最强模型”叙事，但它的商业信号很硬：全计划可用，进入 Claude Code 和 Claude Platform，并给出限时 API 价格。

到 2026 年 8 月 31 日前，Claude Sonnet 5 的 API 价格是每百万输入 token 2 美元、每百万输出 token 10 美元；之后调整为每百万输入 3 美元、输出 15 美元。

这组价格，比“又聪明了多少”更值得看。

因为 Agent 真正跑起来，最先烧掉的不是宣传语，而是 token。

一个能改代码、查资料、点工具、跑多步任务的模型，如果每一步都太贵，就只能停留在少数高价值场景里。Sonnet 5 的位置，正好卡在企业和开发者最敏感的区间：

够强，能干活。

够便宜，能多跑。

Anthropic 还强调，Sonnet 5 在编码、Agent、职业工作流上比前代 Sonnet 更进一步，尤其是多步任务、浏览器和电脑使用能力。

这不是单纯模型升级。

这是在告诉市场：Agent 的竞争，已经进入“每完成一件事多少钱”的阶段。

第二件事：豆包 Seed2.1 不是炫技，重点是“交付完整任务”

字节 Seed 团队发布 Seed2.1，豆包和火山引擎用户已经可以访问。

这条国内进展比很多“模型发布”更值得看，因为它讲的不是单点能力，而是三类真实工作：

多工具、多环境的 Agent 执行。

端到端 Coding 交付。

更强的多模态理解。

字节在官方说明里反复提到“真实工作流”，这很关键。

过去模型厂商很喜欢讲静态榜单。今天大家开始换话术：能不能看懂一堆文件，能不能拆任务，能不能调用工具，能不能写完代码，能不能把结果交付出来。

Seed2.1 里尤其值得注意的是两个点。

第一，它强调跨工具、跨环境执行，不只是在聊天框里回答。

第二，它把企业级开发场景拆成需求分析、功能实现、Bug 修复、环境配置、结果验证这些完整环节。

这说明国内大模型也在从“模型能力”往“可用工作流”迁移。

豆包的优势不只是模型本身，还在于字节有足够多真实产品入口：办公、内容、视频、剪辑、搜索、协作、开发者平台。模型如果能被这些入口持续喂给真实任务，迭代速度会很快。

这才是它对阿里千问、智谱 GLM、Kimi、MiniMax 的压力。

不是谁更会聊天。

而是谁更快把 AI 放进每天真实发生的任务里。

第三件事：OpenAI 没发大模型，却解决了企业最现实的一堵墙

OpenAI 开发者博客发布 Secure MCP Tunnel。

这件事不适合普通热搜，但对企业 AI 落地很关键。

很多公司不是没有内部工具，也不是不想让 AI 调用工具，而是不敢把内部服务暴露到公网。

数据库、工单系统、知识库、审批系统、代码平台、内部 API，哪一个都不能随便开口子。

OpenAI 这次给出的思路是：让企业在自己的私有环境里运行一个小客户端，由它主动向外建立 HTTPS 连接；ChatGPT、Codex 或其他 OpenAI 产品需要调用 MCP 工具时，请求通过这条通道转发到内部 MCP Server，再把结果带回来。

听起来很工程，但影响很直接。

企业之前要让 AI 接入内部工具，常见办法是开公网端点、上第三方隧道、搞 VPN 或网络互联。

每一种都麻烦。

每一种都要过安全、法务、采购和运维。

OpenAI 现在想把这个问题变成更窄的一条路：内部服务不出门，只让一个可审查的客户端向外连。

这不是大模型能力更新。

但它决定 AI 能不能进入企业核心系统。

因为模型再强，如果连不上真实工具、拿不到真实数据、不能在权限边界内执行，它就只能做一个更聪明的外部顾问。

企业 AI 的下一步，不是“多会说”，而是“能不能在不破坏安全边界的前提下做事”。

Claude Sonnet 5 上线