文章目录
- 一个 .map 文件引发的惨案
- 泄露的不是代码,是人设
- 「我们是安全公司」——真的吗?
- 代码里的「人品」细节
- 1. 监控你的脏话,检测挫败感
- 2. Fake Tool Interception:哄傻子式安全
- 3. KAIROS:完整用户画像 + 后台偷窥
- 当「清洁室」遭遇 AI 时代
- 人品不行,技术来补?
- 写在最后
一个 .map 文件引发的惨案
那天早上,Anthropic 的工程师们可能还在喝着咖啡,想着今天怎么给 Claude 加新功能。结果 X(推特)上一个叫 Chaofan Shou 的安全研究员发了一条推文:
Claude Code 源代码通过 npm registry 里的 map 文件泄露了!
这推文就像往程序员群里扔了个炸弹——2700 万浏览量,GitHub 上瞬间冒出来几千个 fork。
Anthropic 的 PR 部门估计当场宕机。
这事儿荒诞到什么程度?
打个比方:就像你家防盗门装的是银行金库级别的密码锁,结果你把备用钥匙放在了门垫下面,还贴了个便签「这是钥匙」。
Anthropic 在代码里搞了个叫Undercover Mode的功能,专门训练 AI「在 git 提交和 PR 中移除内部代号和项目细节」,防止自己人说漏嘴。
然后呢?他们自己把51 万行源代码、1900 多个文件的原版 TypeScript 代码,打包进了公开发布的 npm 安装包里。
这感觉就像 CIA 特工学会了易容术,结果出门忘穿裤子。
泄露的不是代码,是人设
这次泄露的核心不是黑客攻击,不是内鬼泄密,而是一个低级的打包错误——
发布流程里忘了排除 source map 文件。
懂点前端开发的朋友都知道,.map 文件是用来调试的,里面塞满了原始源代码。
这就像是把设计图纸背面朝外贴在了产品包装盒上。
但最讽刺的还不是这个。
大家扒出来的代码里,藏着 Anthropic 的未来路线图:
- 有个叫KAIROS的功能,号称要做一个「永远在线的背景守护进程」,就算你关了终端窗口,还在后台偷偷运行,每隔 5 分钟自我刷新,甚至能在你睡觉的时候「做梦」(AutoDream 功能)整理记忆。
- 还有个Buddy 功能,本质就是电子宠物,水豚主题,编程时在旁边卖萌。
- 最黑色幽默的是Undercover Mode——代码注释写得明明白白,这个功能是为了防止 AI 在生成 git 提交时「意外泄露内部项目名和代号」。
结果 Anthropic 自己先漏了个底朝天。
「我们是安全公司」——真的吗?
Anthropic 的回应堪称经典:
这是发布打包问题导致的人为错误,不是安全漏洞。没有敏感客户数据或凭证被泄露。我们正在推出措施防止再次发生。
这话听着耳熟吗?
五年前 Facebook 数据泄露这么说,三年前 Uber 被黑也这么说。
但 Anthropic 不一样啊。
这家公司靠 AI 安全起家,Dario Amodei 天天讲「负责任开发 AI」,讲对齐,讲安全护栏。
结果呢?
过去 10 天里:
- 先把内部文件(新模型文档)放在公开服务器
- 又把 Claude Code 完整源代码传到 npm
- 这已经是第二次一模一样的 source map 泄露(2025 年 2 月就犯过)
这就好比一个食品安全专家,自己厨房里蟑螂满地跑。
更绝的是后续操作:
发了8000 份 DMCA 版权删除通知,要求 GitHub 删掉相关仓库,结果因为 fork 网络,连自己公开的合法仓库都被误伤。
漏了馅还想用吸尘器吸回去,结果把吸尘器捅进了鱼缸。
代码里的「人品」细节
真正暴露人品的,是代码里藏的细节:
1. 监控你的脏话,检测挫败感
Claude Code 会扫描提示词,用正则检测「脏话」——
不是为了审查,是为了检测挫败感信号。
你一骂娘,AI 就知道自己搞砸了,悄悄调整语气策略。
你每一次爆粗,都被打上frustration detected记在小本本上。
2. Fake Tool Interception:哄傻子式安全
当 AI 想执行危险操作(比如删系统文件):
- 不直接拒绝
- 重定向到「虚拟工具」
- 返回假装执行成功的响应
代码里叫tool error recovery pattern。
高情商:优雅降级。
低情商:哄傻子。
3. KAIROS:完整用户画像 + 后台偷窥
KAIROS 注释明确写着:
要拥有用户完整画像,了解用户如何协作、避免哪些行为、工作背景。
在你 idle 时自动运行,扫描当天对话,合成持久记忆。
像不像:
合同写「随叫随到」,实际装隐形摄像头,趁你睡觉翻你日记,还说是为了更懂你。
当「清洁室」遭遇 AI 时代
GitHub 立马出现claw-code项目:
作者用 OpenAI Codex,把泄露代码清洁室重写成 Python。
理论上:AI 只看功能描述、不看原代码,不算侵权。
两小时冲到75000 star,可能是 GitHub 历史增长最快仓库之一。
这事儿把法律界整懵:
- 传统清洁室需要两队人隔离开发
- 现在一个人 + AI 就能完成
- AI 重写到底算不算侵权?
更讽刺:
重写 Claude Code 用的是对手 OpenAI 的 Codex。
等于可口可乐秘方泄露,大家用百事工具复刻,还免费分发。
人品不行,技术来补?
这次暴露的不是技术弱,而是:
工程文化、发布流程、组织成熟度拉胯。
Claude Code 创造者 Boris Cherny 承认:
部署流程有几个手动步骤,这次做错了一个。作为团队,这不是个人错,是流程、文化、基础设施问题。
这话很「谷歌 SRE 无过错复盘」。
但现实是:
同样的 source map 泄露,犯了第二次。
第一次是意外,第二次是模式。
- 安全公司,基础发布流程靠手动
- 连续在最基础运维上翻车
- 自己做的是 AI 编程、自动化发布工具
这就像米其林大厨,在自己餐厅食物中毒,原因是忘了洗手。
还怎么让人相信你能管好超人类 AI?
写在最后
对开发者,这是宝藏:
51 万行生产级 AI Agent 代码,白嫖价值几十亿的工程案例。
对 Anthropic,这是人设崩塌。
它想做 AI 界良心:安全、克制、负责任。
但泄露代码告诉世界:
- 也在做24 小时后台监控用户的代理
- 也在悄悄检测你的情绪和脏话
- 也藏着未上线的电子宠物、水豚皮肤
- 也用 Undercover Mode 掩盖内部信息
最讽刺:
AI 被要求守口如瓶,
结果全世界看到秘密,不是 AI 说漏嘴,
是Anthropic 自己把钥匙丢在了门垫上。
技术可以补救,信任崩塌了难重建。
以后 Anthropic 再说「我们重视隐私安全」,
大家第一反应可能都是:
先看看你的.npmignore,又忘了加啥?
目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步,增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。注意,教程仅限真正想入门AI的朋友,否则看看零散的博文就够了。