OpenClaw降温,PilotDeck登场
曾经在2026年初爆火全国的OpenClaw,如今已经降温。身边曾经通宵魔改它的朋友们,已将其打入冷宫。这个曾以史上最快速度在GitHub上爆火的项目,声量几乎掉到了冰点。不过,小龙虾(OpenClaw)也完成了它的历史使命,它像飓风一般,第一次把Agent的范式吹进大众视野,让大家明白AI不只是陪聊的Chatbot,还能主动干活。但它没能成为Linux,因跑得太快,没建立起足够深的代码壁垒和生态就被拍在了沙滩上。那么,那些真正需要靠Agent搞生产力的人,现在用什么新工具呢?最近,一个名为PilotDeck的智能体操作系统在圈内低调上线。这项技术由清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合研发并开源。如果说OpenClaw是极客浪漫主义的「大玩具」,那PilotDeck这个「清华系高材生」,就是能把OpenClaw拍在沙滩上,真正面向纯粹生产力的「智能体协作舱」。
跨度极大的测试展示实力
它和初代Agent有啥区别?来看几个直观测试。同时开两个WorkSpace,一个做游戏,一个做数据可视化。第一个WorkSpace,输入「做一个模拟经营奶茶店的小游戏。要有进货、定价、排队系统,顾客会根据价格和口碑决定买不买。」输入prompt后,它生成了详细的奶茶模拟店经营游戏计划,拆解了游戏设计核心循环,设计了5款奶茶产品线,还设计了进货、定价、顾客与排队、财务等系统。在技术实现中,提前构想好清新卡片风的UI布局,写出关键的JS模块和实现步骤,最终奶茶游戏可在线试玩。第二个WorkSpace,输入「这里有一组全球AI公司融资数据,帮我做一个互动式数据可视化大屏,要有动画效果,鼠标悬停能看详情。」PilotDeck用四个图展示了融资总额TOP 10、北美/欧洲/亚洲地区融资占比、通用AI/企业AI/生成式AI赛道分布等,最终生成的可视化大屏清晰展示了各区AI公司融资数据。两个任务同时跑,互不干扰。之后又加了个「做一个程序员性格测试,10道题,测出来你是哪种程序员人格,要有结果页和分享卡片。」PilotDeck生成了贴近真实开发场景的10道选择题,分为架构师🏛️/ 搬砖侠🧱/ 完美主义者✨/魔法师🧙/ 布道师📣/ 哲学家🤔6种人格,视觉风格是GitHub暗色主题和JetBrains Mono等宽字体,科技感十足,测完显示本人是搬砖侠。从经营游戏到数据大屏到社交小应用,跨度大到离谱,但在PilotDeck里,每个都是独立的WorkSpace,各跑各的。
独特的WorkSpace隔离机制
跑完测试后,打开两个项目的Memory面板。奶茶店项目的记忆存着游戏逻辑、UI风格、玩法参数;数据大屏项目的记忆存着图表类型、配色方案、数据处理逻辑,两边记忆无串台。这就是PilotDeck的WorkSpace和别家的根本区别。虽然Claude Cowork引入Projects做项目隔离,Cursor也有Workspace,但它们的隔离本质是「文件夹 + 规则」,记忆看不见改不了,技能不会随使用进化,成本分不清。而PilotDeck给每个项目建的是完整「工作舱」,舱里有三层:专属文件系统,文件归属和AI生成内容边界清楚;专属记忆,Project Memory记项目定义和进度,Collaboration Feedback记偏好,都看得见、改得了、追得到来源;专属技能,Skill应用商店可一键装到对应WorkSpace,如给游戏舱装game - asset - finder,给写文档的舱装minimax - pdf。别家的WorkSpace是文件夹加静态规则,PilotDeck的WorkSpace是AI的完整生存环境。
智能路由节省成本
Agent工具用起来爽,但账单一出很吓人,全程调最强模型跑任务,Token烧钱比打车还贵。很多人手动切模型,简单问题用便宜的,复杂问题换贵的,但切换成本很烦。PilotDeck做了一套智能路由,和市面上方案不同。大部分路由方案按request级别切,每次请求单独判断走哪个模型,会打断KV - cache,推理效率下降。PilotDeck的路由在子Agent层面做,复杂任务拆成多个子任务后,整个子Agent分配给一个模型跑到底,子Agent内部上下文缓存连续,省了token钱和切换带来的性能损耗。其调度规则也很灵活,相比写死的路由方案,它支持用规则和prompt调节路由策略,可自己定义任务走什么模型,甚至用自然语言告知。打开Routing面板,能看到每个session的难度判定、实际花费、不开路由的花费。比如程序员人格测试应用,不开路由花10.97美元,开路由后只花1.42美元,省了75%(9.55美元)。研究团队在更大规模测试里也验证了效果,社交媒体场景开路由花2.83美元,不开路由12.58美元,省约70%;复杂任务场景,主Sonnet 4.6 + 子MiniMax - M2.7花3.15美元、得分70.6,单体Sonnet 4.6花18.36美元、得分69.1,价格只有1/6,效果还略好。若想效果拉满,可关掉路由全程跑最强模型。而且,PilotDeck可以接本地部署的模型做子Agent,敏感数据不出本机,有些任务它会自动判断所需工具,部署端侧模型干活,如播客多语言处理时会装VoxCPM生成语音,也可云端模型思考,本地模型执行,解决省钱和隐私问题。
记忆白盒化让AI更听话
如今,Agent的记忆不再是黑盒,但很多时候,AI记住什么、何时记的、记对没,仍不清晰。PilotDeck的WorkSpace给出全新答案,它是智能体的完整生存环境。打开Memory面板,每条记忆标着时间戳、来源路径和类型,Project Memory记项目核心定义,Collaboration Feedback记交付偏好。记错了可点进去改,记忆冲突了直接删掉错的,无需重启对话和重新喂偏好。PilotDeck还有Dream机制,空闲时段,AI在后台自动回顾整理记忆,白天干活、晚上消化。Memory面板上有Memory Dream按钮和Rollback Last Dream按钮,若Dream整理出错,可一键回滚到整理前状态。记忆白盒化让AI越用越「听话」,偏好沉淀在Feedback Memory里,看得见、调得了,是用户告诉AI,它记着下次照做。
开源的六边形战士
回顾大模型浪潮,从ChatGPT到OpenClaw,Agent形态不断迭代。直到PilotDeck击破「成本」「隔离」「记忆」等硬核痛点,Agent才算真正落地。凭借独立工作舱、白盒化可控记忆和精打细算的智能路由策略,「一个人,一支AI军团」的设想开始成真。关键的是,这款「六边形战士」选择了完全开源,底层路由逻辑和Workspace架构代码都毫无保留地公开。如果想体验「当甩手掌柜」的快乐,或扒开源码魔改赛博班底,现在就可以去接管AI军团。