news 2026/7/5 2:37:29

为什么 AI 公司都在疯狂“造芯片“?—— 一篇给你讲明白

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
为什么 AI 公司都在疯狂“造芯片“?—— 一篇给你讲明白

为什么 AI 公司都在疯狂"造芯片"?—— 一篇给你讲明白

2026 年 6 月,OpenAI 发布了第一款自研芯片 Jalapeño。一周后,Anthropic 被曝正在接触三星,也要造自己的芯片。
为什么写软件的公司,突然都跑去搞硬件了?这篇文章用最通俗的语言,一次给你讲清楚。


1. 先搞懂:AI 芯片到底在"算"什么?

你可能听说过"GPU"、"AI 芯片"这些词。但在聊为什么大厂要自己造之前,我们需要先搞懂一个问题:

AI 芯片到底在算什么?

答案是:矩阵乘法

一个大语言模型(比如 ChatGPT、Claude)的本质是什么?是一层一层的矩阵(你可以理解成一张巨大的 Excel 表格),里面填满了数字(参数)。GPT-4 有 1.8 万亿个参数,你可以想象一张 1.8 万亿个格子的表格。

当 AI "思考"时,它做的核心运算就是:把输入矩阵 × 参数矩阵,一层一层乘下去

输入(你的问题) ↓ 矩阵乘法 × 第1层参数 ↓ 矩阵乘法 × 第2层参数 ↓ ...(重复几十到几百层) ↓ 输出(AI 的回答)

每秒要做几万亿次这样的乘法。这就是为什么 AI 需要专门的芯片——普通的 CPU(你电脑里的处理器)虽然什么都能算,但算矩阵太慢了。

💡一句话理解:AI 芯片 = 为"疯狂做矩阵乘法"而优化的计算器。


2. 以前大家都是"买显卡",为什么现在要自己造?

2.1 训练 vs 推理:这是两件完全不同的事

要理解这波"造芯片"潮,你必须分清楚两个概念:

训练(Training)推理(Inference)
做什么?用海量数据"教"模型用训练好的模型"回答"问题
算多久?几个月,几万台机器一起跑每次几毫秒到几秒
用什么芯片?英伟达 H100/B200 GPU可以用 GPU,也可以用专用芯片
花多少钱?训练一次几亿美元每次回答几分钱,但累积起来更多
类比建工厂工厂每天生产产品

关键洞察:推理成本才是 AI 公司最大的长期开销。

ChatGPT 每天有上亿次对话,每次对话都要做矩阵乘法。训练模型是"一次性投入",推理是"持续烧钱"。OpenAI 2025 年营收 130 亿美元,但支出高达 340 亿美元——大部分烧在了推理算力上。

2.2 英伟达的 GPU 很好,但有两个问题

英伟达的 GPU(比如 H100)是目前 AI 计算的绝对王者,训练模型离不开它。但对于推理来说,它有两个问题:

问题一:太贵了。

一块 H100 售价约 3-4 万美元,一个集群要上万块。而且英伟达的毛利率超过 70%——这意味着你花的钱,大头是英伟达的利润。

问题二:它是"通用"的,不是"专用"的。

GPU 最初是为游戏图形设计的,后来发现很适合 AI。它很灵活,什么都能算。但灵活是有代价的——芯片上有很多电路你根本用不到,但它们也在耗电。

💡一句话理解:用 GPU 做推理,就像开卡车去超市买菜——当然能装,但太费油了。


3. OpenAI 的 Jalapeño 到底是什么?为什么 9 个月就能造出来?

3.1 什么是 ASIC?

OpenAI 的 Jalapeño 是一种ASIC(Application-Specific Integrated Circuit,专用集成电路)。

GPUASIC
什么都能算只会算一种东西
灵活,通用死板,专用
贵,功耗高便宜,功耗低(约省 50%)
买来就能用需要专门设计和制造

ASIC 的思路是:既然我知道我的芯片只需要做大模型推理,那我就把所有电路都优化成只做这一件事——砍掉所有不需要的部分,把省下来的面积和功耗全部堆到矩阵乘法上。

结果就是:性能不输 GPU,但成本只有一半。

3.2 为什么 9 个月就能造出来?

以前造芯片动辄要 2-3 年。Jalapeño 只用了 9 个月,原因有三:

  1. 只用做推理,不用做训练:训练芯片涉及复杂的数据调度和互联,推理芯片只需要"喂数据→出结果",设计简单得多
  2. 博通兜底:博通提供了成熟的 IP 核和设计工具,OpenAI 不用从零画电路
  3. AI 辅助设计:OpenAI 用自己的模型来优化芯片布局和验证——用 AI 来设计 AI 芯片

💡一句话理解:Jalapeño 不是"从沙子开始造芯片",而是在博通提供的地基上,针对自己的模型定制了一套最优方案。

3.3 Anthropic 为什么也要跟进?

Anthropic 找三星的逻辑和 OpenAI 几乎一样:

  • Claude 每天要处理海量推理请求 → 推理成本是生命线
  • 英伟达 GPU 供不应求且太贵 → 需要第二供应源
  • 自研芯片可以根据 Claude 模型的特点深度定制 → 比通用 GPU 更高效

这正在变成一个行业规律:做大模型的公司,到了一定规模就必须自己造芯片。就像连锁餐厅到了一定规模就会自建中央厨房。


4. 这对我们普通人意味着什么?

你可能觉得"芯片"离你很远。但其实它正在影响你每天使用的 AI 产品:

4.1 AI 会越来越便宜

推理成本降 50%,最终会反映在 API 价格和订阅费用上。现在调用一次 GPT-5 可能要几分钱,未来可能会降到几厘甚至更低。更便宜的推理 = 更多 AI 应用场景 = 更多创业机会。

4.2 AI 会越来越快

专用芯片的延迟更低。未来的 AI 回复可能从"等几秒"变成"几乎瞬时"——这对语音助手、实时翻译、自动驾驶等场景至关重要。

4.3 竞争格局在变

当 OpenAI 和 Anthropic 都用自己的芯片时,他们不再受制于英伟达的供货周期和定价。这意味着:

  • ✅ 模型迭代更快(不再等显卡到货)
  • ✅ 价格竞争更激烈(成本结构改善)
  • ⚠️ 小公司更难追赶(自研芯片门槛极高)

4.4 但对开发者来说,核心能力不变

无论底层跑的是英伟达 GPU 还是自研 ASIC,你调用的 API 接口(HTTP 请求 → 返回 JSON)不会变。理解 Prompt Engineering、系统设计、业务逻辑的能力,永远比"跑在什么芯片上"更重要。


📊 一张图总结

AI 芯片进化路线: 过去:买英伟达 GPU(通用、贵、受制于人) ↓ 现在:自研推理 ASIC(专用、便宜、自主可控) ↓ 未来:训练芯片也可能自研 → 彻底摆脱外部依赖 OpenAI 的第一步是推理(Jalapeño) Anthropic 正在跟进(接触三星) Google 已经走完这条路(TPU 系列) Meta 也在路上(MTIA 系列)

💡 一个值得思考的问题

如果你今天开始学习 AI 全栈开发,五年后这些芯片知识对你有用吗?

答案是:不需要会设计芯片,但需要理解这个趋势。

就像做 Web 开发不需要会造服务器,但需要知道 AWS 和 Vercel 的区别;做 AI 开发不需要会画电路,但需要知道:

  • 推理成本为什么在下降 → 判断什么时候可以给产品加更多 AI 功能
  • 各家模型的能力边界 → 做技术选型时不被营销话术忽悠
  • 行业格局怎么变 → 投资自己的学习方向时更有判断力

底层在变,但应用层的机会只会越来越多。


📅 2026 年 7 月 4 日
📝 参考资料:OpenAI 官方公告、CNBC、36氪 等

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/5 2:35:51

智能驾驶摄像头带宽计算与SerDes选型:很多项目不是算法差,而是第一根线就算错了

智能驾驶摄像头带宽计算与SerDes选型:很多项目不是算法差,而是第一根线就算错了 01 一辆智能车为什么长满了“眼睛”? 你有没有发现,十年前的汽车只有一颗倒车摄像头,今天的智能车却恨不得把前后左右都装满摄像头?这不是车企在堆配置,而是智能驾驶系统被场景逼出来的结果…

作者头像 李华
网站建设 2026/7/5 2:32:17

Skill 与 MCP 集成、项目后记

能不止是文件目录:Web 多租户下的技能管理 Claude Code 的技能管理纯靠文件系统:每个技能是一个目录,里面除了 SKILL.md,还可以放脚本、模板、配置文件等辅助文件。加技能的方式很灵活:可以从别人那里拷贝一个目录过来…

作者头像 李华
网站建设 2026/7/5 2:29:56

路由协议(RIP、OSPF、BGP等)

目录 路由整体基础分类 1.路由两大类型 2.五种基础路由条目 3.核心通用规则 RIP 1.核心原理 2. 关键特性 3.RIPv1 与 RIPv2 核心区别 4.优缺点 OSPF 1. 核心原理 2. 关键特性 3. 优势 IS-IS 协议 BGP 边界网关协议(唯一 EGP) 路由配套核…

作者头像 李华
网站建设 2026/7/5 2:29:43

5 天逆向极验4滑块验证码:从 30 万行混淆 JS 到纯协议 5/5 success

5 天逆向极验4滑块验证码:从 30 万行混淆 JS 到纯协议 5/5 success 本文记录了一次完整的极验4(Geetest v4)滑块验证码纯协议逆向过程。不使用浏览器自动化,仅通过静态分析、抓包对照和算法还原,实现了从请求构造到验证…

作者头像 李华
网站建设 2026/7/5 2:28:40

如何为OpenEuler SONIC内核补丁贡献代码:开发者入门指南

如何为OpenEuler SONIC内核补丁贡献代码:开发者入门指南 【免费下载链接】sonic-linux-kernel The OpenEuler kernel patches used with SONIC 项目地址: https://gitcode.com/openeuler/sonic-linux-kernel 前往项目官网免费下载:https://ar.ope…

作者头像 李华