为什么 AI 公司都在疯狂“造芯片“？—— 一篇给你讲明白-平芜编程栈

为什么 AI 公司都在疯狂"造芯片"？—— 一篇给你讲明白

2026 年 6 月，OpenAI 发布了第一款自研芯片 Jalapeño。一周后，Anthropic 被曝正在接触三星，也要造自己的芯片。
为什么写软件的公司，突然都跑去搞硬件了？这篇文章用最通俗的语言，一次给你讲清楚。

1. 先搞懂：AI 芯片到底在"算"什么？

你可能听说过"GPU"、"AI 芯片"这些词。但在聊为什么大厂要自己造之前，我们需要先搞懂一个问题：

AI 芯片到底在算什么？

答案是：矩阵乘法。

一个大语言模型（比如 ChatGPT、Claude）的本质是什么？是一层一层的矩阵（你可以理解成一张巨大的 Excel 表格），里面填满了数字（参数）。GPT-4 有 1.8 万亿个参数，你可以想象一张 1.8 万亿个格子的表格。

当 AI "思考"时，它做的核心运算就是：把输入矩阵 × 参数矩阵，一层一层乘下去。

输入（你的问题） ↓ 矩阵乘法 × 第1层参数 ↓ 矩阵乘法 × 第2层参数 ↓ ...（重复几十到几百层） ↓ 输出（AI 的回答）

每秒要做几万亿次这样的乘法。这就是为什么 AI 需要专门的芯片——普通的 CPU（你电脑里的处理器）虽然什么都能算，但算矩阵太慢了。

💡一句话理解：AI 芯片 = 为"疯狂做矩阵乘法"而优化的计算器。

2. 以前大家都是"买显卡"，为什么现在要自己造？

2.1 训练 vs 推理：这是两件完全不同的事

要理解这波"造芯片"潮，你必须分清楚两个概念：

训练（Training）	推理（Inference）
做什么？	用海量数据"教"模型	用训练好的模型"回答"问题
算多久？	几个月，几万台机器一起跑	每次几毫秒到几秒
用什么芯片？	英伟达 H100/B200 GPU	可以用 GPU，也可以用专用芯片
花多少钱？	训练一次几亿美元	每次回答几分钱，但累积起来更多
类比	建工厂	工厂每天生产产品

关键洞察：推理成本才是 AI 公司最大的长期开销。

ChatGPT 每天有上亿次对话，每次对话都要做矩阵乘法。训练模型是"一次性投入"，推理是"持续烧钱"。OpenAI 2025 年营收 130 亿美元，但支出高达 340 亿美元——大部分烧在了推理算力上。

2.2 英伟达的 GPU 很好，但有两个问题

英伟达的 GPU（比如 H100）是目前 AI 计算的绝对王者，训练模型离不开它。但对于推理来说，它有两个问题：

问题一：太贵了。

一块 H100 售价约 3-4 万美元，一个集群要上万块。而且英伟达的毛利率超过 70%——这意味着你花的钱，大头是英伟达的利润。

问题二：它是"通用"的，不是"专用"的。

GPU 最初是为游戏图形设计的，后来发现很适合 AI。它很灵活，什么都能算。但灵活是有代价的——芯片上有很多电路你根本用不到，但它们也在耗电。

💡一句话理解：用 GPU 做推理，就像开卡车去超市买菜——当然能装，但太费油了。

3. OpenAI 的 Jalapeño 到底是什么？为什么 9 个月就能造出来？

3.1 什么是 ASIC？

OpenAI 的 Jalapeño 是一种ASIC（Application-Specific Integrated Circuit，专用集成电路）。

GPU	ASIC
什么都能算	只会算一种东西
灵活，通用	死板，专用
贵，功耗高	便宜，功耗低（约省 50%）
买来就能用	需要专门设计和制造

ASIC 的思路是：既然我知道我的芯片只需要做大模型推理，那我就把所有电路都优化成只做这一件事——砍掉所有不需要的部分，把省下来的面积和功耗全部堆到矩阵乘法上。

结果就是：性能不输 GPU，但成本只有一半。

3.2 为什么 9 个月就能造出来？

以前造芯片动辄要 2-3 年。Jalapeño 只用了 9 个月，原因有三：

只用做推理，不用做训练：训练芯片涉及复杂的数据调度和互联，推理芯片只需要"喂数据→出结果"，设计简单得多
博通兜底：博通提供了成熟的 IP 核和设计工具，OpenAI 不用从零画电路
AI 辅助设计：OpenAI 用自己的模型来优化芯片布局和验证——用 AI 来设计 AI 芯片

💡一句话理解：Jalapeño 不是"从沙子开始造芯片"，而是在博通提供的地基上，针对自己的模型定制了一套最优方案。

3.3 Anthropic 为什么也要跟进？

Anthropic 找三星的逻辑和 OpenAI 几乎一样：

Claude 每天要处理海量推理请求 → 推理成本是生命线
英伟达 GPU 供不应求且太贵 → 需要第二供应源
自研芯片可以根据 Claude 模型的特点深度定制 → 比通用 GPU 更高效

这正在变成一个行业规律：做大模型的公司，到了一定规模就必须自己造芯片。就像连锁餐厅到了一定规模就会自建中央厨房。

4. 这对我们普通人意味着什么？

你可能觉得"芯片"离你很远。但其实它正在影响你每天使用的 AI 产品：

4.1 AI 会越来越便宜

推理成本降 50%，最终会反映在 API 价格和订阅费用上。现在调用一次 GPT-5 可能要几分钱，未来可能会降到几厘甚至更低。更便宜的推理 = 更多 AI 应用场景 = 更多创业机会。

4.2 AI 会越来越快

专用芯片的延迟更低。未来的 AI 回复可能从"等几秒"变成"几乎瞬时"——这对语音助手、实时翻译、自动驾驶等场景至关重要。

4.3 竞争格局在变

当 OpenAI 和 Anthropic 都用自己的芯片时，他们不再受制于英伟达的供货周期和定价。这意味着：

✅ 模型迭代更快（不再等显卡到货）
✅ 价格竞争更激烈（成本结构改善）
⚠️ 小公司更难追赶（自研芯片门槛极高）

4.4 但对开发者来说，核心能力不变

无论底层跑的是英伟达 GPU 还是自研 ASIC，你调用的 API 接口（HTTP 请求 → 返回 JSON）不会变。理解 Prompt Engineering、系统设计、业务逻辑的能力，永远比"跑在什么芯片上"更重要。

📊 一张图总结

AI 芯片进化路线： 过去：买英伟达 GPU（通用、贵、受制于人） ↓ 现在：自研推理 ASIC（专用、便宜、自主可控） ↓ 未来：训练芯片也可能自研 → 彻底摆脱外部依赖 OpenAI 的第一步是推理（Jalapeño） Anthropic 正在跟进（接触三星） Google 已经走完这条路（TPU 系列） Meta 也在路上（MTIA 系列）