ClaudeCode创造者：上月没打开过IDE，新人反而更会用大模型！卡帕西：软件行业在经历9级大地震；播客自曝LLM组合用法-平芜编程栈

大家好，我是Boris，我在Claude Code工作。我打算开始在X上更活跃一些，因为这里有很多关于人工智能和编程的讨论。欢迎随时向我反馈 Claude Code 的使用体验或提交 bug 报告。我很想了解大家是如何使用 Claude Code 的，以及我们如何才能让它变得更好。

圣诞节当天，ClaudeCode 背后创造者终于决定：我准备在X上多说点什么了！

25日，被外界视为 ClaudeCode 之父的 Boris Cherny，出来发了一条X帖子，表示之后自己打算在X上活跃起来！

大家好，我是Boris，我在Claude Code工作。我打算开始在X上更活跃一些，因为这里有很多关于人工智能和编程的讨论。欢迎随时向我反馈 Claude Code 的使用体验或提交 bug 报告。我很想了解大家是如何使用 Claude Code 的，以及我们如何才能让它变得更好。

当天，评论区就炸了，大神 Karpathy 也闻讯过来反馈了一个关于CC token文件上下文限制的问题。很快 Boris 就给出了回复：下一个版本就会新增功能解决。

更重磅的还得是今天一早。这两位大佬又开始互动了。

Karpathy 几个小时前发帖表示，一场 9 级地震正在席卷程序员行业。“作为一名程序员，我从未像现在这样感到自己在掉队。这个职业正在被剧烈地重构。”

为什么这么惊悚？

Karpathy举例说道，程序员真正亲手贡献的那部分代码，正在变得越来越稀疏、越来越零散。

我隐约感觉到，只要能把过去大约一年里出现的这些新能力真正串联起来，我完全可以变得强大 10 倍；而如果没能吃到这波增益，那种挫败感几乎可以明确地归结为“能力问题”。

他提到两点：一个是全新的抽象层技术栈，另一个是覆盖全局的心智模型。

首先，我们现在需要掌握的是一层全新的、可编程的抽象层（而且是在传统技术栈之上再叠一层）：它涉及 agents、subagents，以及它们的 prompts、上下文、记忆、模式、权限、工具、插件、skills、hooks、MCP、LSP、斜杠命令、工作流、IDE 集成等等；

其次，你还必须在脑中构建一个覆盖全局的心智模型，用来理解这些本质上随机、可能出错、不可解释、而且持续变化的“实体”的优势与陷阱。

而它们如今，已经与过去那套“老派但可靠”的工程实践彻底交织在一起。

“这感觉就像是某种强大的外星工具被突然发到了每个人手里，但它没有说明书，所有人都只能一边摸索怎么握住它、怎么操作它。”

（不止是编程，小编更有这样的感觉，我甚至对同事说：我发现自己在日益强大的大模型面前，感觉自己的能力越来越渺小。有一种，萤烛之火也敢与日月争辉的感觉～）

CC之父：每周都有这样的感觉

作为开发顶流编程AI产品的 Boris 则很快回应到：+1，而且是几乎每周都有这样的感觉！

并曝料：上个月，自己作为工程师第一次整整一个月都没有打开过 IDE。Opus 4.5 写了大约 200 个 PR，每一行代码都是它写的。

软件工程正在发生根本性的变化，而即便是像我们这样最早的一批使用者和实践者，最难的部分依然是：不断重新调整自己的预期。
而这，仍然只是一个开始。

在10天前，Boris 在一次播客中还表示自己其实会亲自下手编写核心循环的逻辑代码。但很快，Boris 就发现大模型已经厉害到连第一代AI使用者都可能比不过了。

有时候我会开始用“人工”的方式去处理一个问题，然后才提醒自己一句：“Claude 可能就能直接搞定这个。”

Boris 还举了两个对比鲜明的例子。

最近我们在调试 Claude Code 里的一个内存泄漏问题，我一开始又走了老路：连上 profiler，跑应用，暂停 profiler，然后手动翻 heap 分配情况。
与此同时，我的一个同事也在看同一个问题，他的做法是——直接让 Claude 生成一个 heap dump，然后再让 Claude 读这个 dump，去找那些大概率不该被保留的对象。Claude 一次就命中了问题，还顺手提了一个 PR。这样的事情几乎每周都会发生。

Boris 甚至感觉某些方面，新人工程师更有 AI 原生优势。

某种程度上，那些新同事，甚至刚毕业的新人工程师，因为他们对模型“能做什么、不能做什么”没有太多先入为主的判断——也没有那些在使用老模型时形成的“历史记忆”——反而能把模型用得最有效。

要跟上模型能力的变化，其实需要相当多的心理调整成本：几乎每隔一两个月，你就得重新校准一次自己对模型能力的认知，因为模型在写代码和工程能力上的提升实在太快了。

近期一场必看的Boris播客

可以说，Boris 真的如自己所说，越来越公开活跃了。正如上文所说，前不久他还罕见接受了一次采访播客，聊了自己的职业生涯。Boris 之前在 Facebook 工作过，而后随着 ChatGPT 的爆发，催发了他想加入 Anthropic，为这个行业做一点点贡献的念头。

其中小编感受最深的是，一、Boris 是一个很看重“常识”和使命感的工程文化的人。大公司往往由于成熟的组织结构和路径依赖，会把常识拉走；二，ClaudeCode 竟然背后还有一段联合创始人逼着 Boris 往前看的经历。Boris被逼着把视野放长些，“不要为今天的模型做产品，而是要为6个月之后的模型做产品！”

篇幅关系，这里把大家最为关注的Claude Code相关的部分截取了出来，如果想看全部内容，可以走这个传送门。

https://www.youtube.com/watch?v=AmdLVWMdjOk

希望能对身处百忙之中的各位有所启发！

为什么离开Meta加入Claude？

主持人：你离开 Meta 加入 Anthropic，我一直很好奇你当时是怎么想的。

Boris Cherny：我记得第一次用 ChatGPT 的时候，那已经是好几年前了。我当时在日本，一个小镇里只有我一个工程师，也是唯一一个说英语的人，身边完全没有人可以聊技术。每天早上我都会刷 Hacker News。后来用了 ChatGPT，真的被震住了。那种感觉——现在大家可能已经习以为常了，但当时的大模型真的像魔法一样，是一种不可思议的技术。后来我的看法又变了：在我看来，大模型更像是一种“外星生命形式”，我们在把它们培育出来、带到这个世界上，它不只是技术而已。

我自己也读很多书，尤其是科幻小说。那是我最喜欢的类型。所以当时我就在想：“天哪，我一定要参与到这个东西里。”于是我开始琢磨，哪些实验室在做这件事，就去和在不同实验室工作的朋友聊。等我来到 Anthropic，我还记得第一次午餐，是和联合创始人之一 Ben，还有一群同事一起。我提到了一本科幻书，挺冷门的，应该是 Greg Egan 写的那种硬科幻。我以前几乎没遇到过读过这本书的人。我随口讲了书里的一个情节，结果桌上所有人都说：“对对，那本不错，但你看过另外那本吗？”那一刻我就意识到，这是一个由一群重度科幻迷组成的团队，是一群会对我关心的这些问题进行极深思考的人。

还有一点是，读多了科幻，你会对这些技术可能走向哪里形成一种直觉性的想象。AI 对社会的影响太具颠覆性了。它现在首先冲击的是工程领域，但它会波及社会的每一个角落，影响一切。我们现在看到的，只是第一波浪潮。我读得够多，也大概知道这件事可能走向哪些糟糕的结局，出问题的方式太多了。所以对我来说，Anthropic 几乎是一个显而易见的选择——我想待在一个地方，哪怕只是以工程师的身份，尽我所能让这件事往好的方向发展。

说起来也挺有意思的。加入之前，我对“安全”是认真对待的，但更多是一种抽象概念。在 Meta，安全常常被视为一种“税”，是完整性团队推着你做的事，但很少有人真正为此感到兴奋，因为它不是产品本身。这就是我以前对安全的理解。但我同时也隐约觉得，它可能完全不是这么一回事。到了 Anthropic 之后，我发现真的完全不同。每一个新模型发布，我都会看到它带来的新风险；我也看到公司如何真正“言行一致”——有多少算力投入到安全与对齐研究，有多少人在做这件事。我们过去甚至因为无法确认模型是否安全，而推迟过发布，直到确认安全为止。

像 Opus 4 这种模型，风险就陡然上升了。如果模型能够设计生物病毒，能做这些极其危险的事情，那风险已经完全不是一个量级了。早期模型的基线风险可能还是选举操纵之类的问题，那在当时已经是大事了。但随着模型能力不断增强，风险迅速升级，人们开始可以用模型去制造真正威胁人类的东西——不是某个国家的政治问题，而是关乎人类存续本身。这不是科幻，这是当下真实存在、我们必须正面应对的风险。所以能参与其中，哪怕只是贡献一点点，这件事本身就已经足够让我下定决心。

Anthropic的工程文化：常识和使命感

主持人：
那你刚加入的时候呢？从你之前待过的工程文化，到 Anthropic，有没有让你感到很“冲击”的差异？

Boris Cherny：
我觉得主要有两点。第一是，作为一家仍然处在创业阶段的公司，这里充满了常识。这是所有大公司都会逐渐失去的东西——决策者离决策影响越来越远，不管是对产品还是对人，于是就需要各种流程把他们拉回来，提升决策质量。但在一家创业公司里，大家天然就有常识，通常都会去做“对的事情”。我不需要花太多时间去说服别人，只要事情该做，大家一看就明白，然后就去做了。

第二点，对我个人来说，真正驱动我的，是使命感。这一点极其重要，也是我每天愿意、而且兴奋地去上班的原因。它让我在周末写代码，不是因为有截止日期，而是因为我真的想做这件事。我在 Facebook Groups 时期其实也很有这种感觉，那里的使命感很强。当时的 VP Jen Dolski 曾是 change.org 的 CEO，她几乎是把 Facebook Groups 当成一家非营利组织来运营，有一整套“改变理论”，讲的是如何把志同道合的人连接起来、形成社区，那种感觉非常有激励性。到了 Instagram，也许是地理距离，也许是别的原因，我始终没有找到同样强烈的使命感。但在 Anthropic，这种感觉非常强烈，对我来说，这可能是最让人兴奋的一点。

被创始人逼着放大视野，为6个月之后的模型做产品

主持人：
我知道你被认为是 Claude Code 的创造者，这个故事你在很多地方都讲过了。但我更好奇的是，当年 Claude Code 出现的时候，内部环境到底是什么样的。我之前和一个朋友聊起这件事，当时其实已经有不少接入模型的竞品工具了。你觉得，Claude Code 到底有什么不同，为什么它能脱颖而出，并且在内部迅速“野火般”扩散开来？

Boris Cherny：
在那个时间点，大家对“写代码”这件事的想象完全不一样。如果你当时提到 AI 编程，大多数人想到的就是自动补全，仅此而已。可能有一些非常早期的 agent，但那更多是自动补全之外的附属品，很多时候还是被当作问答工具在用，并不是真正用来写代码。所以当时大家心里的 AI 编程产品形态，其实就是“按 Tab 自动补全”。我当时也是这么想的，觉得这差不多就是全部了。
后来是 Ben——当时我的经理——逼着我把视野放大一点。我觉得他是真的把“规模定律”内化进去了。毕竟他从 Anthropic 创立之初就在，也在其他实验室待过，所以他很清楚模型能力会以多快的速度提升。他当时对我施加了很大的压力：不要为“今天的模型”做产品，要为“六个月后的模型”做产品。
说实话，在很长一段时间里，Claude Code 并不是一个好用的产品。即便在内部，我可能也就用它写了 10% 左右的代码，偶尔用用，但模型能力不够，大多数事情它还做不了。直到后来我们发布了 Sonnet 和 Opus 4——我记得大概是今年三月——产品突然就“跑通”了。这一点无论是使用数据，还是我自己的编程体验，都非常明显。我开始能用它写大概一半的代码。而这完全验证了当初的判断：那正好是项目启动六个月之后。
现在，Claude Code 本身大概有 80% 到 90% 的代码是用 Claude Code 写的。如果你看 Anthropic 内部的一些团队，有的团队 90% 的代码都是通过 Claude Code 完成的，而且不只是我们这一组。如果看整体生产力，Anthropic 今年以来规模大概翻了三倍，但按你刚才提到的那种“每工程师成本产出”来衡量，人均生产力几乎提升了 70%，而这基本上就是 Claude Code 带来的结果。
所以作为一个做产品的人，我通常会往前想一步；而在实验室里，你反而要用一种不太一样的方式思考——既不是想两步之后，而是非常清楚模型本身，以及我们正处在一条指数级增长曲线上。

自己有一套大模型的组合用法

主持人：
你看了 Karpathy 最近的那次采访吗？

Boris Cherny：
还没来得及看。

主持人：
他说了一点挺有意思的内容，也算是一种“反向提醒”。他说 vibe coding 虽然能带来很多看起来很神奇的结果，但同时也会产出不少“垃圾”——或者说，有一些隐性的代价。所以我很好奇，当模型生成了大量代码，但结果并不完全符合你的预期，甚至埋着一些不那么明显的问题时，你是怎么思考和应对的？

Boris Cherny：
AI 编程和我们使用的其他工具一样，本质上是一种工具，而工具是需要学习怎么用的。Karpathy 本身当然非常会写代码。我觉得很多刚接触这类工具的人，常犯的一个错误是：一上来就让模型做太大的事情，或者对模型写出来的代码，和对自己写的代码，设定了不一样的标准。
在 Claude Code 团队里，我坚持的一点是：无论代码是模型写的，还是人写的，标准完全一样。如果代码不行，我们就不会合并；标准只有一个。然后你就让模型继续改，把代码变好。
另外，这类工具的“使用方式”其实有很多种。有时候你确实可以 vibe coding，这在写一次性代码、原型代码、或者不在关键路径上的代码时非常重要。我自己也经常这么做，但这绝对不该成为唯一模式。因为在很多场景下，你需要的是可维护的代码，需要对每一行都非常谨慎。不同的问题，本来就应该用不同的方法。
我自己通常会有一套组合用法。有时候会 vibe coding，但其实挺少的，主要用在原型或即弃代码上。更多的时候，我是和模型“结对”写代码。我们先对齐一个计划——在 Claude Code 里就是用 Shift+Tab 进入计划模式。模型先给出计划，我再看代码，然后让它改进、清理，整个过程非常深入，是我和模型一起协作完成的。
当然，有些地方我还是会自己手写。比如在核心查询循环的一些部分，我对参数命名、某一行代码具体写在哪里都有很强的主观判断，这种时候我就会直接自己写。
整体来说，我认为模型目前在“写代码”这件事上还远谈不上优秀，提升空间非常大。但这已经是它“最差”的状态了。回头看一年前，AI 编程还只是预测式输入，而现在已经完全是另一个世界了。再想想接下来几个月、几年会发生什么，这条轨迹本身就足够让人兴奋。对我来说，真正让我持续保持热情的，就是对这条演进路径的清晰认知。
当人们听到 Claude Code，第一反应往往还是“写代码”，但其实它指向的远不止这些。

不止编程，万物皆可ClaudeCode

主持人：
不过，Claude Code 的用途显然不只是软件工程本身。比如数据科学家用它来查询数据。当你把 Claude Code 放在“万物皆可用”的语境下，你是怎么想的？

Boris Cherny：
这件事对我来说真的挺疯狂的。我记得大概六个月前，我走进办公室，看到我们的数据科学家 Brandon 在电脑上开着 Claude Code。他就坐在我们旁边。我问他：“哥们，你在干嘛？是在试用吗？”他说：“不是啊，这是我在干活。”我当时直接愣住了。
他自己摸索着学会了怎么用终端、怎么装 Node.js，然后装了 Claude Code，接着就开始写一堆 SQL，帮他做数据分析。现在我再从数据科学家那一排走过去，几乎每个人屏幕上都同时开着好几个 Claude Code 窗口，已经不是一个了。他们在干各种事情：写 SQL、跑数据、写 DBT pipeline，也在写代码。
所以我觉得，除了“写代码”之外，还有大量的应用场景。看到大家用它来做各种事情，真的很酷。甚至还有完全不算技术背景的用户——在 Anthropic，差不多一半的销售团队都在用 Claude Code 工作。他们可以把它接到 Salesforce，接各种数据源，然后直接完成自己的工作。这完全不是我们最初设计它时的预期，也不是最初的使用意图。

不要被竞品带跑偏

主持人：
当我听到 Claude Code 的时候，也会想到 Codex，它算是你们最大的竞争对手之一。我挺好奇的，你怎么看和 Codex、OpenAI 的竞争？Claude Code 做得更好的地方是什么？另外，这类 AI 产品的“黏性”从哪里来？是什么让用户留在 Claude Code，而不是转去 Codex？

Boris Cherny：
说实话，我也不太确定。我自己并不怎么用其他产品。
对我来说，我一直跟团队强调的一点是：太容易被竞争对手带跑偏了。我在大公司里见过这种失败模式很多次——竞争者一多，你就会忍不住去看他们在做什么，然后照着抄。这样做很容易，但真正难的是想出新的点子，用更好的方式解决用户的问题。
所以我一直很刻意地提醒团队：不要被其他产品分散注意力。产品永远会有很多，竞争者越多，其实越说明我们做对了一些事情。我们真正要保持高度聚焦的，是解决我们自己的问题，解决 Anthropic 研究人员的问题，以及解决用户的问题。

编程是一门实操学问

主持人：在快结束之前，我想问几个关于职业发展的回顾。一个我注意到的点是，你并没有计算机科学背景，却成长为一名非常强的软件工程师。你有没有在某些阶段觉得这件事限制过你？还是你觉得它其实并不重要？

Boris Cherny：我学的是经济学，后来为了创业直接辍学了。对我来说，不管做什么，真正的学习都发生在工作中。编程是一项极其偏实践的技能。我很难想象，在学校里学到的那些东西，比如数据结构课程，如果你从来没真正做过产品，那到底有什么现实意义？

所以我给别人的建议通常是：用非常实用的方式去学编程。这是一门实操技能。如果之后你想回过头来补理论，再去学就好。就我个人而言，我从来没有觉得没有 CS 学位这件事拖过我的后腿。

高效的核心秘诀：Agent

主持人：
那说说生产力吧。我看到你说自己基本是朝九晚六，而且只用两根手指打字，但你的产出却非常惊人。你有很多 side project，主线工作也一点不轻松。你的核心效率秘诀是什么？

Boris Cherny：
现在的答案，和几年前会完全不一样。现在的“秘诀”其实很简单：学会用 Claude Code，学会同时跑一堆 Claude Code 去干活。
比如我们前几周刚上线插件功能，Daisy 是负责这个的工程师之一。她直接让一堆 Claude Code 帮她建看板、拆任务，然后开了一个“群”，大概 20 个 Claude Code，在一个周末里一起写插件。她把它们跑在 Docker 容器的危险模式下，几天就搞定了。这种工作方式，我觉得就是工程的未来。
所以现在谈生产力，本质上是学会用 Claude 来自动化那些重复劳动，也学会让多个 Claude 一起协作完成工作。你更像是在编排，而不是手写所有代码。
如果是几年前，我的建议可能会很不一样，会更偏向于时间管理、专注时段之类的传统方法。

主持人：
这也让我想到一个问题：Claude Code 会不会改变我们常说的“创造者日程”和“管理者日程”的区别？听你刚才描述，工程师好像越来越像管理者，手里有一支 Claude Code 的“队伍”，不再依赖长时间深度专注，而是频繁在很多事情之间切换。你现在还会有大块的专注编码时间吗？

Boris Cherny：
比以前少了。我现在也会在周末写代码，因为我很喜欢那种安静的时间。但平时的话，我每天早上基本都是打开 Claude Code——包括手机端。我们这周刚发布了一个新的版本，里面有一个 Code 标签，其实内部已经用了一段时间了。
所以我每天醒来，第一件事就是启动几个 agent，让它们先帮我把当天要写的代码跑起来。
这真的很疯狂。如果你在六个月前问我，我会不会用这种方式写代码，我大概会说：“你疯了吗？怎么可能这样写代码？”但事实证明，它真的可行。它已经在这里了，而且确实能跑起来，这已经成了我现在写大量代码的方式。我通常会先启动几个 agent，等我真正坐到电脑前，再去看进度。有时候代码看起来没问题，我就直接合并；有时候我会拉到本地，像“瞬移”一样稍微改几下。
而且你之后会和 Fiona 聊到。从她跟我说的情况来看，她已经差不多十年没写过代码了，但现在却每周都会写好几次。作为一名管理者，她的日程非常疯狂，但她依然可以用手机 App、用 Web 端，甚至直接开个终端，随手就能写点代码。
所以，是的，这真的太不可思议了。我们正亲身经历这样一次转变：我们一直以来做的事情、我成长过程中熟悉的那套方式，正在发生彻底改变。而且这件事真的很酷——写代码这件事，正在变得对所有人都可达。

不要路径依赖，要保持常识

主持人：
最后一个问题。以你现在对职业发展的理解，如果你能回到刚入行的自己，给当时的自己一些建议，你会说什么？

Boris Cherny：
用常识行事。我觉得尤其是在大公司里，有太多东西会把你从常识中拉走。各种组织结构、路径依赖，“事情之所以这么做，是因为一直以来都是这么做的”。还有很多激励机制并不对齐。当然，大公司也有很多好东西，但这些问题同样存在。
所以，保持常识非常重要。职业早期我做过不少创业项目，也在很多初创公司待过，在那些地方也是一样的道理：用常识去判断市场真正想要什么，用户真正需要什么，然后去做。总之，信任自己，慢慢培养并打磨你的常识判断力。

主持人：
太棒了。非常感谢你，Boris，抽出时间来分享，真的很感激。

Boris Cherny：
谢谢，谢谢你。

如果你想更深入地学习大模型，以下是一些非常有价值的学习资源，这些资源将帮助你从不同角度学习大模型，提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取