结合前面梳理的各类智能体产品,区分云端 Web 服务架构、终端应用架构,讲解架构差异、技术栈、运行逻辑、优缺点、典型产品,并补充混合架构方案,同时结合之前提到的 Codex、Claude Code、OpenClaw、豆包、通义等实例对照。
一、核心概念界定
1. 云端 Web 服务型智能体
智能体核心逻辑、模型调用、任务编排、工具执行全部部署在云端服务器 / 云集群,用户通过浏览器、网页端、H5、小程序、云端 CLI接入,本地仅做界面展示 + 指令收发,无核心运算。
- 数据流:本地客户端 → 公网 / 内网请求 → 云端服务(调度 / 模型 / 工具 / 沙箱)→ 结果回传本地
- 本质:瘦客户端 + 云端重计算
2. 终端应用程序型智能体
智能体核心逻辑可运行在本地 PC、终端、IDE、桌面客户端、移动端,分为两类:
- 纯终端离线智能体:模型、编排、工具全部本地运行,不依赖云端;
- 终端 + 云端混合:界面 / 基础逻辑 / 部分工具本地运行,大模型推理、复杂任务调用云端。
- 数据流:本地终端(界面 + 编排 + 本地工具)→按需调用云端模型 / 能力 → 本地汇总输出
- 本质:胖客户端,算力与逻辑下沉到终端
二、两大架构详细拆解
(一)云端 Web 服务架构
1. 分层架构(标准企业级设计)
plaintext
用户层(浏览器/网页/云端CLI/API) ↓ 接入层(负载均衡、网关、鉴权、限流、HTTPS) ↓ 业务编排层(智能体核心:意图识别、任务规划、多Agent调度、状态管理) ↓ 能力层(模型服务、RAG知识库、工具网关MCP、沙箱执行环境) ↓ 数据层(向量库、关系库、文件存储、日志/审计、检查点快照)2. 核心组件说明
- API 网关 / 任务网关统一接收请求、身份认证、权限校验、流量控制、接口路由,企业级必备。
- 智能体编排引擎任务拆解、子代理调度、流程控制、异常重试,对应DeepAgent/LangGraph 运行时。
- 模型服务集群大模型私有化部署 / 云原生模型 API,弹性扩缩容,支撑高并发。
- 安全沙箱集群代码、Shell、脚本统一在云端隔离沙箱执行(如 Codex、千帆、HiAgent),杜绝宿主机风险。
- 统一数据底座集中存储会话、文件、知识库、审计日志、状态快照,支持断点续跑。
3. 技术栈参考
- 服务框架:FastAPI/Go Gin/Spring Cloud
- 编排引擎:LangGraph、DeepAgent、自研工作流
- 容器编排:K8s、Docker
- 存储:MySQL/Redis/ 向量库 (Chroma/Pinecone/ Milvus)、对象存储
- 沙箱:Modal、Daytona、Landlock 内核级隔离
4. 优势 & 短板
✅ 优势
- 统一管控:权限、安全、审计、版本更新、策略配置全局统一,适配企业合规。
- 算力可控:云端集群弹性扩容,支持高并发、超大批量任务。
- 免本地部署:用户无需配置环境、下载模型,打开网页 / 调用 API 即用。
- 能力复用:一套服务支撑全公司 / 多租户,运维成本低。
❌ 短板
- 依赖网络:断网不可用,弱网体验差。
- 数据上云:敏感数据会流出本地,涉密场景需额外做私有化隔离。
- 网络时延:多轮工具调用叠加,交互延迟高于本地终端。
- 定制门槛高:本地无法深度改造智能体逻辑。
5. 典型产品(对应前文清单)
- 国外:OpenAI Codex、Microsoft Copilot Web、Salesforce Agentforce、AWS Bedrock
- 国内:豆包网页版、通义千问网页版、百度千帆、火山 HiAgent(公有云版)、腾讯元器
(二)终端应用程序架构
分为本地终端客户端、IDE 内嵌终端智能体两大主流形态,架构分层如下:
1. 分层架构(标准终端架构)
形态 A:桌面客户端 / 独立终端程序
plaintext
本地UI/终端交互层(桌面App/系统终端Terminal) ↓ //不需要接入层和负载均衡 ↓ 本地编排层(任务规划、多子代理、本地状态管理、上下文维护) ↓ 本地能力层(本地工具、本地文件读写、系统自动化、本地轻量模型) ↓ 可选:云端调用模块(大模型推理、联网检索、云端知识库) ↓ 本地数据层(本地文件、本地会话、本地记忆、本地日志)形态 B:IDE 内嵌智能体(代码类专属)
plaintext
IDE 宿主(VS Code/IDE终端) ↓ 插件层(指令接收、代码关联、文件联动) ↓ 本地执行层(代码解析、本地命令行、本地测试运行) ↓ 编排+模型层(本地逻辑 + 按需调用云端大模型) //只有大模型在云端2. 核心组件说明
- 本地交互入口系统终端、桌面 APP、IDE 插件,直接和本地操作系统打通。
- 本地智能体运行时任务规划、流程流转全部在本地进程完成,不依赖云端编排;代表:Claude Code、OpenClaw。
- 本地工具集直接调用本地文件、本地 Shell、本地 Git、本地编译器,无跨网转发。
- 本地沙箱 / 权限控制应用层权限校验、本地轻量沙箱,部分产品依赖用户手动授权。
- 本地持久化会话、文件、记忆、日志全部存在本机,数据不出设备。
3. 技术栈参考
- 客户端框架:Electron、Rust、Go、Python CLI
- 终端交互:Shell、PTY 伪终端、IDE 插件体系
- 本地运行时:原生进程、轻量容器、本地 Python/Node 环境
- 模型:云端模型 API / 端侧轻量化大模型(离线场景)
4. 优势 & 短板
✅ 优势
- 低时延:工具调用、文件操作、流程执行本地完成,响应更快。
- 隐私性强:核心数据、代码、文档留存本地,适合涉密 / 高隐私场景。
- 断网可用:纯本地逻辑、端侧模型可离线运行。
- 深度系统集成:可直接操控本地文件、软件、浏览器、操作系统(如 OpenClaw)。
❌ 短板
- 本地资源占用:消耗终端 CPU、内存,低配设备体验差。
- 管控困难:企业难以统一权限、审计、版本、安全策略。
- 部署成本高:每台终端需安装客户端 / 插件,批量运维繁琐。
- 算力受限:本地无法支撑超大并发、超复杂批量任务。
5. 典型产品(对应前文清单)
- 国外:Claude Code(终端 / IDE)、OpenClaw(桌面本地自动化)、Lindy、Character.AI 桌面版
- 国内:字节 Trae(IDE 编程智能体)、通义灵码客户端、DeepSeek 桌面端
三、混合架构(主流落地方案)
目前绝大多数商用智能体采用「终端交互 + 云端算力」混合架构,取长补短,也是企业级产品首选。
架构逻辑
- 终端层:界面展示、本地文件 / 系统操作、简单流程编排、指令输入输出;
- 云端层:大模型推理、复杂任务规划、云端沙箱、统一审计、知识库、高算力任务;
- 分工原则:轻量操作本地跑,重算力 / 强安全 / 统一管控上云端。
典型案例
- Claude Code终端接管本地代码、文件、Git;复杂推理、长上下文解析调用 Claude 云端模型。
- 豆包桌面客户端 / 通义千问客户端界面、本地文件上传本地处理;对话、创作、联网检索全部走云端服务。
- 企业版 RPA+AI 智能体(实在智能)RPA 流程本地执行,AI 识别、决策、报表分析调用云端模型。
四、两类架构关键维度对比表
表格
| 对比维度 | 云端 Web 服务型智能体 | 终端应用程序型智能体 |
|---|---|---|
| 核心部署位置 | 云端服务器集群 | 用户本地电脑 / 终端 / IDE |
| 主要接入方式 | 浏览器、网页、API、云端 CLI | 桌面 App、系统终端、IDE 插件 |
| 数据存储 | 集中云端存储,统一管理 | 数据本地留存,隐私性高 |
| 网络依赖 | 强依赖网络,断网失效 | 弱依赖 / 可离线运行 |
| 响应时延 | 较高(网络 + 云端调度) | 较低(本地直连) |
| 安全审计 | 企业全局审计、权限统一管控 | 审计困难,依赖本地权限 |
| 运维升级 | 云端统一更新,零客户端维护 | 逐台终端更新,运维成本高 |
| 系统集成 | 对接云端 SaaS、API 系统 | 深度集成本地 OS、本地软件、文件 |
| 适用场景 | 企业统一办公、批量任务、合规涉密企业、高并发 | 研发编码、个人自动化、隐私数据处理、离线场景 |
| 代表产品 | Codex、豆包网页版、千帆、HiAgent | Claude Code、OpenClaw、Trae、本地 CLI 工具 |
五、结合你关注产品的架构归类 & 选型建议
1. 产品架构划分
- 纯云端 Web 服务OpenAI Codex、火山 HiAgent 公有云、百度千帆、腾讯元器、ChatGPT 网页版
- 纯终端本地架构OpenClaw(主打本地自动化,核心逻辑全本地)
- 终端 + 云端混合架构(主流)Claude Code、字节 Trae、通义灵码、豆包 / 通义桌面客户端、Lindy
2. 架构选型建议
选 云端 Web 服务架构
- 企业多租户、需要统一权限 / 审计 / 合规;
- 面向全员办公、客服、知识管理、批量自动化任务;
- 希望免部署、轻量化使用、集中运维。
选 终端应用架构
- 研发场景(代码智能体)、需要读写本地代码库;
- 处理隐私 / 涉密文档、数据禁止上云;
- 个人 / 小团队使用,追求低延迟、本地系统深度联动。
选 混合架构(推荐企业研发 / 复合型场景)
- 兼顾本地文件操作 + 云端大模型强能力;
- 既保证使用体验,又可通过云端做部分安全管控与模型升级。