news 2026/3/7 23:09:03

微软推出算力高达10000TFLOPS的AI加速器Maia200, 主要用于推理, 台积电3nm制程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
微软推出算力高达10000TFLOPS的AI加速器Maia200, 主要用于推理, 台积电3nm制程

https://blogs.microsoft.com/blog ... uilt-for-inference/

Maia 200 —— 一款突破性的推理加速器,旨在大幅改善 AI token 生成的经济性。Maia 200 是一款强大的 AI 推理引擎:它采用台积电 3nm 制程打造,配备原生 FP8/FP4 张量核心,重新设计的内存系统,拥有 216GB HBM3e(带宽达 7 TB/s) 和 272MB 片上 SRAM,并结合数据传输引擎,确保超大模型能够持续、高速且高利用率地运行。

这使得 Maia 200 成为所有超大规模云服务商中性能最强的第一方自研芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,FP8 性能也超过了谷歌第七代 TPU。同时,Maia 200 也是微软迄今部署过的最高效推理系统,其每美元性能比当前机群中最新一代硬件提升了 30%。


Maia 200 是我们异构 AI 基础设施的一部分,将服务于多个模型,包括来自 OpenAI 的最新 GPT-5.2 模型,为 Microsoft Foundry 和 Microsoft 365 Copilot 带来更优的性价比优势。微软超级智能(Superintelligence)团队将使用 Maia 200 进行合成数据生成和强化学习,以提升下一代自研模型的能力。
在合成数据流水线场景中,Maia 200 的独特设计有助于加速高质量、特定领域数据的生成与筛选,为下游训练提供更新、更有针对性的信号。

Maia 200 目前已部署在美国中部数据中心区域(爱荷华州得梅因附近),接下来将部署于美国西部 3 区域(亚利桑那州菲尼克斯附近),未来还将扩展到更多区域。Maia 200 与 Azure 实现无缝集成,我们正在预览 Maia SDK,提供一整套用于在 Maia 200 上构建和优化模型的工具。
该 SDK 包含完整能力集,包括 PyTorch 集成、Triton 编译器与优化内核库,以及对 Maia 底层编程语言的访问权限。这使开发者在需要时能够进行细粒度控制,同时也支持在异构硬件加速器之间轻松移植模型。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/5 20:36:02

LFM信号与P4码组合调制波形的脉冲压缩与模糊函数分析

一、脉冲压缩实现 1.1 匹配滤波流程 频域匹配滤波:对接收信号进行FFT,与发射信号共轭频谱相乘。 时域卷积:采用FIR滤波器组实现脉冲压缩,压缩比 CRB⋅Tp。 多普勒补偿:通过相位补偿消除目标运动引起的频率偏移。 …

作者头像 李华
网站建设 2026/3/5 16:40:51

全网最全8个AI论文工具,助本科生轻松搞定毕业论文!

全网最全8个AI论文工具,助本科生轻松搞定毕业论文! AI 工具让论文写作不再难 对于大多数本科生来说,撰写毕业论文是一项既重要又充满挑战的任务。面对繁重的写作压力、复杂的格式要求以及对学术规范的不熟悉,很多学生常常感到无从…

作者头像 李华
网站建设 2026/3/3 3:43:45

关于CPU的介绍(四)----CMO(Cache Maintenance Operations)

在阅读ACE协议spec的时候,有关于CMO的介绍,下面详细介绍下CMO操作: 一、CMO 的定义 CMO(Cache Maintenance Operations,缓存维护操作)是一套硬件指令或总线事务,用于主动管理缓存的状态&#…

作者头像 李华
网站建设 2026/3/7 9:21:30

计算机小程序毕设实战-基于springboot的文物知识科普“江西文物时讯”微信小程序【完整源码+LW+部署说明+演示视频,全bao一条龙等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/3/3 5:52:08

情感视角:AI伦理测试中的开发者责任

随着AI技术在心理干预、客服、教育等情感密集型场景的普及,情感交互的伦理缺陷已成为系统失效的高发区。2025-2026年间,全球已记录17起因伦理测试缺失导致的重大事故,其中欧盟AI法案的首张罚单源于聊天机器人对抑郁用户输出“结束痛苦是解脱”…

作者头像 李华