为什么 AI 公司都在疯狂"造芯片"?—— 一篇给你讲明白
2026 年 6 月,OpenAI 发布了第一款自研芯片 Jalapeño。一周后,Anthropic 被曝正在接触三星,也要造自己的芯片。
为什么写软件的公司,突然都跑去搞硬件了?这篇文章用最通俗的语言,一次给你讲清楚。
1. 先搞懂:AI 芯片到底在"算"什么?
你可能听说过"GPU"、"AI 芯片"这些词。但在聊为什么大厂要自己造之前,我们需要先搞懂一个问题:
AI 芯片到底在算什么?
答案是:矩阵乘法。
一个大语言模型(比如 ChatGPT、Claude)的本质是什么?是一层一层的矩阵(你可以理解成一张巨大的 Excel 表格),里面填满了数字(参数)。GPT-4 有 1.8 万亿个参数,你可以想象一张 1.8 万亿个格子的表格。
当 AI "思考"时,它做的核心运算就是:把输入矩阵 × 参数矩阵,一层一层乘下去。
输入(你的问题) ↓ 矩阵乘法 × 第1层参数 ↓ 矩阵乘法 × 第2层参数 ↓ ...(重复几十到几百层) ↓ 输出(AI 的回答)每秒要做几万亿次这样的乘法。这就是为什么 AI 需要专门的芯片——普通的 CPU(你电脑里的处理器)虽然什么都能算,但算矩阵太慢了。
💡一句话理解:AI 芯片 = 为"疯狂做矩阵乘法"而优化的计算器。
2. 以前大家都是"买显卡",为什么现在要自己造?
2.1 训练 vs 推理:这是两件完全不同的事
要理解这波"造芯片"潮,你必须分清楚两个概念:
| 训练(Training) | 推理(Inference) | |
|---|---|---|
| 做什么? | 用海量数据"教"模型 | 用训练好的模型"回答"问题 |
| 算多久? | 几个月,几万台机器一起跑 | 每次几毫秒到几秒 |
| 用什么芯片? | 英伟达 H100/B200 GPU | 可以用 GPU,也可以用专用芯片 |
| 花多少钱? | 训练一次几亿美元 | 每次回答几分钱,但累积起来更多 |
| 类比 | 建工厂 | 工厂每天生产产品 |
关键洞察:推理成本才是 AI 公司最大的长期开销。
ChatGPT 每天有上亿次对话,每次对话都要做矩阵乘法。训练模型是"一次性投入",推理是"持续烧钱"。OpenAI 2025 年营收 130 亿美元,但支出高达 340 亿美元——大部分烧在了推理算力上。
2.2 英伟达的 GPU 很好,但有两个问题
英伟达的 GPU(比如 H100)是目前 AI 计算的绝对王者,训练模型离不开它。但对于推理来说,它有两个问题:
问题一:太贵了。
一块 H100 售价约 3-4 万美元,一个集群要上万块。而且英伟达的毛利率超过 70%——这意味着你花的钱,大头是英伟达的利润。
问题二:它是"通用"的,不是"专用"的。
GPU 最初是为游戏图形设计的,后来发现很适合 AI。它很灵活,什么都能算。但灵活是有代价的——芯片上有很多电路你根本用不到,但它们也在耗电。
💡一句话理解:用 GPU 做推理,就像开卡车去超市买菜——当然能装,但太费油了。
3. OpenAI 的 Jalapeño 到底是什么?为什么 9 个月就能造出来?
3.1 什么是 ASIC?
OpenAI 的 Jalapeño 是一种ASIC(Application-Specific Integrated Circuit,专用集成电路)。
| GPU | ASIC |
|---|---|
| 什么都能算 | 只会算一种东西 |
| 灵活,通用 | 死板,专用 |
| 贵,功耗高 | 便宜,功耗低(约省 50%) |
| 买来就能用 | 需要专门设计和制造 |
ASIC 的思路是:既然我知道我的芯片只需要做大模型推理,那我就把所有电路都优化成只做这一件事——砍掉所有不需要的部分,把省下来的面积和功耗全部堆到矩阵乘法上。
结果就是:性能不输 GPU,但成本只有一半。
3.2 为什么 9 个月就能造出来?
以前造芯片动辄要 2-3 年。Jalapeño 只用了 9 个月,原因有三:
- 只用做推理,不用做训练:训练芯片涉及复杂的数据调度和互联,推理芯片只需要"喂数据→出结果",设计简单得多
- 博通兜底:博通提供了成熟的 IP 核和设计工具,OpenAI 不用从零画电路
- AI 辅助设计:OpenAI 用自己的模型来优化芯片布局和验证——用 AI 来设计 AI 芯片
💡一句话理解:Jalapeño 不是"从沙子开始造芯片",而是在博通提供的地基上,针对自己的模型定制了一套最优方案。
3.3 Anthropic 为什么也要跟进?
Anthropic 找三星的逻辑和 OpenAI 几乎一样:
- Claude 每天要处理海量推理请求 → 推理成本是生命线
- 英伟达 GPU 供不应求且太贵 → 需要第二供应源
- 自研芯片可以根据 Claude 模型的特点深度定制 → 比通用 GPU 更高效
这正在变成一个行业规律:做大模型的公司,到了一定规模就必须自己造芯片。就像连锁餐厅到了一定规模就会自建中央厨房。
4. 这对我们普通人意味着什么?
你可能觉得"芯片"离你很远。但其实它正在影响你每天使用的 AI 产品:
4.1 AI 会越来越便宜
推理成本降 50%,最终会反映在 API 价格和订阅费用上。现在调用一次 GPT-5 可能要几分钱,未来可能会降到几厘甚至更低。更便宜的推理 = 更多 AI 应用场景 = 更多创业机会。
4.2 AI 会越来越快
专用芯片的延迟更低。未来的 AI 回复可能从"等几秒"变成"几乎瞬时"——这对语音助手、实时翻译、自动驾驶等场景至关重要。
4.3 竞争格局在变
当 OpenAI 和 Anthropic 都用自己的芯片时,他们不再受制于英伟达的供货周期和定价。这意味着:
- ✅ 模型迭代更快(不再等显卡到货)
- ✅ 价格竞争更激烈(成本结构改善)
- ⚠️ 小公司更难追赶(自研芯片门槛极高)
4.4 但对开发者来说,核心能力不变
无论底层跑的是英伟达 GPU 还是自研 ASIC,你调用的 API 接口(HTTP 请求 → 返回 JSON)不会变。理解 Prompt Engineering、系统设计、业务逻辑的能力,永远比"跑在什么芯片上"更重要。
📊 一张图总结
AI 芯片进化路线: 过去:买英伟达 GPU(通用、贵、受制于人) ↓ 现在:自研推理 ASIC(专用、便宜、自主可控) ↓ 未来:训练芯片也可能自研 → 彻底摆脱外部依赖 OpenAI 的第一步是推理(Jalapeño) Anthropic 正在跟进(接触三星) Google 已经走完这条路(TPU 系列) Meta 也在路上(MTIA 系列)💡 一个值得思考的问题
如果你今天开始学习 AI 全栈开发,五年后这些芯片知识对你有用吗?
答案是:不需要会设计芯片,但需要理解这个趋势。
就像做 Web 开发不需要会造服务器,但需要知道 AWS 和 Vercel 的区别;做 AI 开发不需要会画电路,但需要知道:
- 推理成本为什么在下降 → 判断什么时候可以给产品加更多 AI 功能
- 各家模型的能力边界 → 做技术选型时不被营销话术忽悠
- 行业格局怎么变 → 投资自己的学习方向时更有判断力
底层在变,但应用层的机会只会越来越多。
📅 2026 年 7 月 4 日
📝 参考资料:OpenAI 官方公告、CNBC、36氪 等