news 2026/5/22 3:33:41

重磅!AI 大神 Karpathy 加盟 + 算力工具链垄断,Anthropic 凭啥围剿 OpenAI?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
重磅!AI 大神 Karpathy 加盟 + 算力工具链垄断,Anthropic 凭啥围剿 OpenAI?

在敬畏中冲刺,重写 AI 权力的游戏。

整理 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)

今早,一条简短的推文让整个硅谷的目光从各大厂商的产品发布会上移开。

全球人工智能领域的标志性人物、OpenAI 联合创始人、前特斯拉 AI 总监 Andrej Karpathy 在社交媒体 X 上正式宣布:“个人近况:我已经加入了 Anthropic。我认为未来几年,在大语言模型(LLM)的最前沿,将是极其具有‘塑造性(formative)’的时期。我非常兴奋能加入这里的团队并重返研发一线(R&D)。我依然对教育充满热情,并计划在适当时机恢复这方面的工作。

这条消息立刻震动了整个推特 AI 圈,毕竟这几年,Karpathy 的 “网红” 属性已经逐渐超越了他的其他标签,从去年带火氛围编程这个词,到现在 Agent 时代的各种造词造梗,都离不开这个大神的身影。

英伟达具身自主研究负责人 Jim Fan 在推文下半开玩笑地评论,这比当天举行的 Google I/O 开发者大会 Keynote 是“更重磅的新闻”;而 Anthropic 麾下的 Claude Code 作者 Boris Cherny 等一众开发者圈核心人物,则迅速转发表达了狂热的欢迎。

Karpathy 的加盟,是一次对前沿 AI 研发方向极其赤裸的“公开站队”。在 OpenAI 深陷内忧外患、被马斯克的官司强势打压、冲刺千亿美金 IPO 的剧烈动荡期,这位“建校元老”选择走向它最致命的竞争对手,不仅给 Anthropic 带去了不可估量的技术号召力,更向整个行业释放了一个冷酷的信号:大模型竞争的下半场,尚未到纯粹拼商业变现的时刻,最惨烈的战役,依然在最前沿的研发(R&D)腹地。

Who is Karpathy?

平时各大媒体都会直接叫“卡帕西大神”,主要是因为 Andrej Karpathy 的 title 太长,他在当前的硅谷,确实拥有着三重身份。

他是深度学习正史的书写者之一。师从李飞飞,在斯坦福创立了传奇的 CS231n 课程,随后作为最初的 11 名创始成员之一,与 Ilya Sutskever、Sam Altman 共同缔造了 OpenAI。

他是将理论转化为工程现实的顶级架构师。在 Elon Musk 的招募下,他曾执掌特斯拉 AI 部门五年,力排众议主导了纯视觉(Vision-Only)自动驾驶神经网络架构,是在实体物理世界部署超大规模 AI 的先驱。

他更是大模型时代的底层布道者。他早年提出的“软件 2.0(Software 2.0)”概念——即用神经网络权重取代传统手写代码——如今已成为行业共识。而在创办 Eureka Labs 期间,他更是引领了面向开发者的“AI 原生”教育。

这样一位兼具顶级学术视野、超强工程落地能力与开发者社区“神格”的复合型天才,他的下注,本质上是在用自己的职业生涯,为当前 AI 行业的两条不同路线进行“公投”。

2024 年他离开 OpenAI,2026 年重返一线。他没有选择回归那个他亲手创办、如今估值逼近 8520 亿美元的旧主,而是转身走向了 Anthropic。

Karpathy 在推文中特意强调了两个词:“塑造性(formative)”“重返 R&D”。这不仅是个人志向的抒发,更是对当前行业一种悲观论调的正面回击。

过去十八个月里,硅谷弥漫着一种焦虑:预训练大模型的“Scaling Laws”正在放缓。

虽然这两年,英伟达老黄两次 GTC Keynote 都在证明 Scaling Law 的神话还在继续,但毕竟,他要卖显卡啊。

总之,靠粗暴堆砌参数和算力,似乎已经很难再砸出 GPT-3 到 GPT-4 那种阶跃式的奇迹。于是,大厂们纷纷将重心转向了后训练(Post-training)、模型微调和商业化应用包装。

但不仅是老黄不信邪,Anthropic 也不信邪,Karpathy 更是不信。

根据 Anthropic 预训练主管 Nicholas Joseph 的确认,Karpathy 此次直接杀入了最核心、最昂贵的“预训练团队”。但他不是去继续手写代码做实验的,他的任务是:“使用 Claude 模型本身来加速预训练研究。”

在此之前,Karpathy 在 GitHub 上开源的autoresearchnanochat项目已经初露锋芒。他提出了一种全新的科研范式:研究人员不再手动写 Python,而是编写 Markdown 文件,指挥一个由众多 AI 组成的“智能体蜂群(Agent Swarms)”去自主搞科研。在这个系统里,模型自己讨论、自己调整超参数、自己清洗数据,将原本需要一周的训练时间指数级压缩到了个位数小时。

Karpathy 加盟 Anthropic 的核心使命,就是打破传统的预训练瓶颈,开启人工智能的圣杯——递归自我改进(Recursive Self-Improvement)

今年有个明显的信号,就是 AI 研发本身正在被 AI 化。谷歌前段时间开发者大会就透露自己内部代码很多是 AI 写的,而 Claude 现在也是被用来分析它自己的训练日志,寻找人类工程师根本无法察觉的微小算法瑕疵,筛选更高质量的数据,最终自己训练下一代更强大的 Claude。当前沿竞争陷入焦灼,谁能率先让模型形成“自我进化的飞轮”,谁就能在下一个世代的算力军备竞赛中形成降维打击。

这正是 Karpathy 所说的“最具塑造性的时期”。

AI 开发者计划开放申请,免费领 50 小时云算力券

支持主流 AI 框架与模型部署

两条路线的殊途,与前沿格局的重构

如果脱离 2026 年的宏观商业语境,就无法看懂 Anthropic 为何对 Karpathy 具备如此致命的吸引力。这背后,是两家顶级 AI 实验室在“科研纯粹性”与“商业狂奔”上的彻底分道扬镳。

此时的 OpenAI,正困于一场焦头烂额的“生死局”。

为了冲刺 2026 年底 8520 亿美元的惊天 IPO,Sam Altman 正在强推极度激进的商业化路线。他们把 ChatGPT、Codex(编码)和 API 强行揉合成一个意图垄断市场的“超级应用(Super App)”。

代价是惨痛的。为了商业让路,OpenAI 取消了曾高调宣传的“OpenAI for Science”部门,永久下线了科研工具 Prism,甚至在 4 月关停了 Sora 的所有网页端和 API 服务。随之而来的是核心人才的大失血:科学团队负责人 Kevin Weil、Sora 负责人 Bill Peebles 离职;更早之前,从 Ilya Sutskever 到 Jan Leike,再到后训练负责人 John Schulman(同样加入了 Anthropic),建校元老与安全技术中坚力量几乎被彻底掏空。

反观 Anthropic,却在 2026 年迎来了恐怖的爆发。

CEO Dario Amodei 披露,今年一季度,Anthropic 实现了击穿所有预测模型的“80 倍增长”,ARR(年化经常性收入)暴涨至 300 亿美元。

更可怕的是他们解决算力危机的方式——Anthropic 极其戏剧性地与 Elon Musk 旗下的 SpaceX 达成了绝地交易,整体接管了拥有 22 万张 GPU 的 Colossus 1 数据中心。要知道,Musk 此刻正因为 1300 亿美元的诉讼要求法院解散 OpenAI,但他却对 Anthropic 开放了弹药库,甚至直言这支团队“没有触发我的邪恶探测器”。

拥有了 SpaceX 级别的无限算力,外加免于 IPO 季度财报压力的纯粹研发环境,Anthropic 自然成为了 Karpathy 这种顶级极客重返 R&D 战场的唯一选择。

如果说算力和预训练团队是 Anthropic 的“重武器”,那么他们在开发者工具链上的战略吞噬,则是吸引 Karpathy 的“软生态”。

Karpathy 曾提出过“氛围编程(Vibe Coding)”,而现在的硅谷,这种趋势已经异化为一种疯狂的生产力状态。Karpathy 坦言自己现在手工代码与 AI 生成代码的比例已经是 0:100,他甚至称这种停不下来的状态为“AI 精神狂躁(AI Psychosis)”。

为了承载这种极端的开发效率,Anthropic 在过去几个月完成了极其凶狠的垂直整合:

  1. 收购 Bun:将大模型执行代码的底层解释器启动时间压缩到 3 毫秒,直接掌控了下一代智能体敏捷执行的“发动机”。

  2. 收购 Stainless:就在 Karpathy 官宣加盟的前一天,Anthropic 斥资超 3 亿美元买下了这家垄断了全球 AI 公司 API 生成 SDK 的基础设施企业,并随后切断了外部供应。这一招“釜底抽薪”,直接让 OpenAI 和 Google 瞬间失去了维护自身开发者生态的关键自动化工具链。

从大语言模型,到连接外部环境的 MCP 协议,再到毫秒级的底层运行环境 Bun,Anthropic 已经形成了一个极其封闭且高效的全栈垄断。对于一生致力于推动 AI 开发者教育的 Karpathy 来说,这里的土壤,比世界上任何地方都更接近他脑海中的“软件 3.0”时代。

拥有最顶尖的智囊、无限的算力、垄断的工具链,以及由 Opus 4.7 领衔的旗舰模型矩阵,Anthropic 已经具备了颠覆格局的所有筹码。

但更让行业侧目的是他们的“克制”。当他们内部那个展现出灾难级网络攻防实力(甚至能反向工程零日漏洞)的怪物模型 Claude Mythos 诞生时,Anthropic 没有拿它去资本市场换取估值,而是启动了绝密补贴项目,直接向美国国防部和 G20 国家财长预警,协助修复全球金融基建。同时,他们正在利用“自然语言自编码器(NLA)”技术,试图完全透明化模型的内部思维。

一边是对前沿能力无休止的探索(递归自我改进),一边是对力量边界的绝对敬畏。这或许才是 Karpathy 选择 Anthropic 最根本的原因。

前沿大语言模型的战争远未结束,它甚至还没有进入真正的高潮。

当 OpenAI 正在努力成为一家卖“超级应用”的成熟商业公司时,Anthropic 正在聚合这个时代最聪明的大脑,试图在实验室里孕育出真正超越人类理解的“下一次工业革命”。Karpathy 回到了他的研发主战场,而全球人工智能权力的天平,已经随着他的转身,轰然倾斜。

免费领取 50 小时 AI 算力|限时开放

加入 AI 开发者计划

获取:

✅ AI 算力资源

✅ 官方技术社群

✅ Workshop 与 AI Academy

✅ 开发者专属福利

完成认证后,额外领取:
☕ 9.9 元瑞幸咖啡券

立即加入

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/22 3:32:36

Redis——list相关指令

下面是list数据结构的示意图,以及起相关指令所起作用的位置示意:说明:lpush相当于头插,lindex相当于根据下标获取列表中的一个元素。头部添加元素(左进)LPUSH key v1 v2 ... //向列表头部插入一个或多个元素…

作者头像 李华
网站建设 2026/5/22 3:32:28

【限时解密】Midjourney后现代风格黄金参数矩阵(含27组实测CR值对比数据):错过本轮更新将永久失去V6.1前最后兼容窗口期

更多请点击: https://intelliparadigm.com 第一章:后现代视觉语法的解构与重铸 在当代前端工程实践中,“视觉语法”已不再仅指代CSS规则或设计系统规范,而演变为一种融合语义、交互意图与上下文感知的多维表达协议。后现代语境下…

作者头像 李华
网站建设 2026/5/22 3:31:06

【2026实测】论文AI率爆红怎么办?5款降AI工具横测与免费指令指南

辛辛苦苦熬夜敲出来的两万字内容,满心欢喜去测aigc率,结果满屏飘红。那种委屈又无语的崩溃感,经历过的人一定都懂。为了能帮到大家,我这大半个月都在测试各类降ai率工具。 今天就把那些真正能降低ai率的实用方法和靠谱的降ai率工…

作者头像 李华
网站建设 2026/5/22 3:31:05

应对2026检测算法:实测5大降AI神器,附免费微调指令

辛辛苦苦熬夜敲出来的两万字内容,满心欢喜去测aigc率,结果满屏飘红。那种委屈又无语的崩溃感,经历过的人一定都懂。为了能帮到大家,我这大半个月都在测试各类降ai率工具。 今天就把那些真正能降低ai率的实用方法和靠谱的降ai率工…

作者头像 李华
网站建设 2026/5/22 3:28:42

Arm DS调试中全局变量显示问题解析与解决方案

1. 为什么Arm DS的Variables视图中不显示某些全局变量?在Arm Development Studio(Arm DS)中进行调试时,许多开发者会遇到一个困惑:为什么Variables视图没有显示所有预期的全局变量?这个问题其实与调试器的工…

作者头像 李华
网站建设 2026/5/22 3:28:23

关于国内SDR(成都振芯)的介绍说明

概述 软件无线电(SDR)是一种无线电通信技术,其关键功能(如调制解调、滤波、变频等)通过软件在可编程硬件(如FPGA、DSP)上实现,而非依赖固定的硬件电路。这使得无线电设备具有高度的灵…

作者头像 李华