news 2025/12/24 9:46:36

OpenAI 突然开源了一个“只有 0.4B 参数”的模型——

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenAI 突然开源了一个“只有 0.4B 参数”的模型——

OpenAI 突然开源了一个“只有 0.4B 参数”的模型——

但它的 99.9% 权重都是 0。

是的,你没看错。
这个叫Circuit Sparsity的新模型,仅靠 0.1% 的活跃连接,就完成了传统稠密模型需要数十亿参数才能做的任务。

更惊人的是:

  • 它的推理路径像电路图一样清晰——每一条激活通路都可追溯;
  • 移除任意一个关键节点,任务立刻失效,能力与结构强绑定
  • 推理速度极快,资源消耗近乎为零,特别适合边缘设备或高并发场景。

OpenAI 说,这是他们探索“可解释 AI”的关键一步。

但作为开发者,我看到的却是另一个现实:

这种新型稀疏架构,和 GPT-5、Gemini、Claude、Mistral、GLM……完全不是一个物种。

它的 API 格式不同,token 计算逻辑不同,甚至“输入-输出”行为都更接近符号系统而非概率生成。

如果你现在想试试它?恭喜,你又要写一套全新的适配层。


而我?我只改了一行配置。

因为在Gateone.AI,Circuit Sparsity 从上线第一天起,就被纳入了统一智能路由体系

Python

编辑

# 切换模型?只需改 model 名 response = gateone.chat.completions.create( model="openai/circuit-sparsity", # 或 "gpt-5.2", "gemini-3-deepthink", "glm-4-6v" messages=[{"role": "user", "content": "解释量子隧穿效应"}] )

自动处理稀疏模型的特殊输入格式—— 无需研究其“电路激活协议”;
统一输出结构—— 无论底层是稠密、MoE、还是稀疏架构,返回格式一致;
A/B 测试超简单—— 对比 Circuit Sparsity 的可解释性 vs. GPT-5.2 的流畅性,数据秒出;
成本几乎为零—— 因其极低计算开销,调用费用趋近于免费,Gateone 自动优先调度它用于轻量任务;
未来兼容无忧—— 下次 OpenAI 发布“量子稀疏”或“神经符号混合体”,我们照样无缝接入。


稀疏模型不是替代大模型,而是补齐 AI 工具箱的最后一块拼图。

  • 高风险决策?用 Circuit Sparsity,路径可审计;
  • 实时边缘推理?用它,省电又快;
  • 教学/研究?它是绝佳的“白盒 AI”范例。

但前提是——你得能轻松用上它,而不是被集成复杂度劝退。


Gateone.AI 的使命,从来不是“聚合更多模型”,

而是让每一种 AI 范式,都为你所用,而不为你所累。

无论是 675B 的 Mistral Large 3,
还是 0.4B 的 Circuit Sparsity,
在 Gateone 看来,都是你工具箱里的一把刀——
你只管选,我们负责磨好、递到你手上。


🎁新用户注册即送 $2 体验额度(无需绑卡)
🔬 Circuit Sparsity 已上线 Gateone 平台,支持即时调用与对比实验
🔗 立即体验下一代 AI 范式的自由:https://gateone.ai

当世界在分裂成“稠密派”和“稀疏派”,
我们选择做那个连接所有可能的人

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/20 8:17:58

vue基于Springboot框架二手车托运物流管理系统

目录已开发项目效果实现截图开发技术系统开发工具:核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式&…

作者头像 李华
网站建设 2025/12/17 1:58:19

《Etsy 最狠的地方,不是封号,而是先让你注册成功》

如果你是第一次做 Etsy 买家账号,我可以先告诉你一个不太好听的事实: 你现在网上看到的注册教程,基本都已经失效了。 什么换个 IP 开无痕 一个邮箱一个号 这些在 Etsy 现在的风控体系里,几乎等于“裸奔注册”。一、新手最容易掉进…

作者头像 李华
网站建设 2025/12/17 1:56:24

IoTDB详解

IoTDB 全称为 Internet of Things Database,是一款由清华大学团队主导开发的开源时序数据库,专门为物联网(IoT)场景量身打造。简单来说,它就是为海量、高频的物联网设备数据 “量身定做的存储与管理管家”。一、核心定…

作者头像 李华
网站建设 2025/12/20 22:33:24

【深度收藏】AI智能体:从概念到实践,构建能独立完成任务的数字员工

AI智能体是具有自主性的AI系统,能独立完成复杂业务流程,而非仅对输入做出回应。它更像"数字员工"而非工具,可自主理解需求、提取数据、调用服务并做出判断。构建智能体需经历分类任务、数据提取、外部服务调用和评估推理等步骤。与…

作者头像 李华
网站建设 2025/12/17 1:52:18

1 篇吃透!从静态到动态:MySQL锁等待排查的performance_schema终极实战

传统的锁排查如同翻阅一本已经写完的侦探小说,而基于 performance_schema 的排查则像在案发现场安装了一个实时监控摄像头。 一、锁排查的范式转移:从“事后尸检”到“实时监控” 在 MySQL 5.7 之前,数据库管理员们主要依赖 SHOW ENGINE INN…

作者头像 李华