news 2026/4/16 18:59:48

AMD Nitro-E:304M轻量AI绘图4步生成每秒39.3张

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AMD Nitro-E:304M轻量AI绘图4步生成每秒39.3张

AMD Nitro-E:304M轻量AI绘图4步生成每秒39.3张

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

AMD近日推出轻量级文本到图像扩散模型Nitro-E,以304M参数实现高效图像生成,其蒸馏版本在单张AMD Instinct MI300X GPU上可达到每秒39.3张的生成速度,标志着高效AI绘图技术进入新阶段。

行业现状:效率成为AIGC竞争新焦点

随着AIGC技术的快速发展,生成式AI模型正朝着两个方向并行演进:一方面是追求极致生成质量的大参数模型,如Stable Diffusion XL、Midjourney V6等;另一方面,轻量化、高效率的模型逐渐成为行业关注重点。据市场研究机构Omdia数据,2024年边缘AI计算市场规模预计增长45%,对低资源消耗、高吞吐量的AI模型需求激增。在此背景下,AMD推出的Nitro-E模型,以"轻量高效"为核心定位,正是顺应了这一行业趋势。

Nitro-E核心亮点:小参数大能量

Nitro-E系列模型的核心优势体现在三个维度:

极致轻量化设计:采用创新的Efficient Multimodal Diffusion Transformer (E-MMDiT)架构,通过视觉令牌压缩技术和多路径压缩模块,将模型参数控制在304M,仅为传统扩散模型的1/5左右。这种设计不仅降低了内存占用,更使训练成本大幅降低——在8张AMD Instinct MI300X GPU组成的单节点上,从零开始训练仅需1.5天。

突破性生成效率:基础版Nitro-E在单张MI300X GPU上实现每秒18.8张(512px图像,批次32)的吞吐量;而经过蒸馏优化的Nitro-E-512px-dist版本,更是将生成步骤压缩至4步,吞吐量提升至每秒39.3张,这一速度指标在同类轻量级模型中处于领先地位。

多版本灵活选择:AMD提供了三个版本满足不同需求:基础版Nitro-E-512px(20步生成)、蒸馏版Nitro-E-512px-dist(4步生成)以及采用Group Relative Policy Optimization (GRPO)策略优化的Nitro-E-512px-GRPO,形成从速度优先到质量优先的完整产品矩阵。

技术创新:效率与质量的平衡之道

Nitro-E的高效性能源于多项技术创新:其提出的Alternating Subregion Attention (ASA)技术通过子区域注意力计算,在保证生成质量的同时显著降低计算成本;Position Reinforcement机制增强了位置信息保留,有效解决了轻量化模型常见的空间一致性问题;而AdaLN-affine模块则通过高效的调制参数计算,进一步提升了 transformer 块的运行效率。这些优化使Nitro-E在仅304M参数下,仍能保持与大模型接近的视觉生成质量。

行业影响:重塑AIGC应用格局

Nitro-E的推出将对AIGC行业产生多方面影响:在硬件层面,其针对AMD Instinct GPU的深度优化,将加速AI加速卡市场的竞争;在应用层面,39.3张/秒的生成速度使实时图像生成成为可能,为直播、游戏、AR/VR等场景提供新的技术支撑;对于开发者而言,轻量化模型降低了AIGC技术的准入门槛,特别是中小企业和边缘计算场景将从中受益。

结论与前瞻

AMD Nitro-E模型通过架构创新和蒸馏优化,在参数规模、训练成本和推理速度之间取得了突破性平衡,展示了轻量级AIGC模型的巨大潜力。随着开源代码和技术文档的发布,预计将推动高效扩散模型的进一步发展。未来,随着硬件性能的提升和算法的持续优化,"实时生成、边缘部署"有望成为AIGC技术普及的关键方向,而Nitro-E无疑为这一进程提供了重要的技术参考。

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/12 13:21:47

基于nanopb的高效序列化:资源受限设备完整指南

用 nanopb 打造极致轻量通信:MCU 上的 Protobuf 实战全解析 你有没有遇到过这样的场景? 手里的 STM32 只剩不到 10KB Flash 空间,RAM 不到 4KB,却要通过 LoRa 把传感器数据发出去。你想用 JSON,结果发现光是 &quo…

作者头像 李华
网站建设 2026/4/16 13:25:40

WebSailor:3B小模型攻克网页导航高难任务

WebSailor:3B小模型攻克网页导航高难任务 【免费下载链接】WebSailor-3B 项目地址: https://ai.gitcode.com/hf_mirrors/Alibaba-NLP/WebSailor-3B 导语:阿里巴巴NLP团队推出WebSailor训练方法,其3B参数小模型在复杂网页导航任务上实…

作者头像 李华
网站建设 2026/4/15 10:48:48

高校合作项目:将VibeVoice引入计算机课程实验

高校合作项目:将VibeVoice引入计算机课程实验 在人工智能技术不断渗透教育场景的今天,如何让学生真正“触摸”到前沿AI系统,而不仅仅是停留在公式推导与代码复现层面?一个理想的答案或许藏在一个名为 VibeVoice-WEB-UI 的开源语音…

作者头像 李华
网站建设 2026/4/16 11:51:32

5分钟搞定Docker国内镜像源配置

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个极简Docker镜像源快速配置工具,只需选择镜像源提供商(阿里云、腾讯云、华为云等),就能自动生成对应的配置命令。要求:1) 支持一键复制配…

作者头像 李华
网站建设 2026/4/15 10:50:14

混元Image-gguf:8步极速AI绘图,小白也能轻松上手

混元Image-gguf:8步极速AI绘图,小白也能轻松上手 【免费下载链接】hunyuanimage-gguf 项目地址: https://ai.gitcode.com/hf_mirrors/calcuis/hunyuanimage-gguf 导语:腾讯混元Image-gguf模型通过GGUF格式优化,将AI绘图门…

作者头像 李华
网站建设 2026/4/16 12:11:54

如何用LFM2-1.2B快速提取多语言文档信息

如何用LFM2-1.2B快速提取多语言文档信息 【免费下载链接】LFM2-1.2B-Extract 项目地址: https://ai.gitcode.com/hf_mirrors/LiquidAI/LFM2-1.2B-Extract 导语:Liquid AI推出轻量级模型LFM2-1.2B-Extract,以12亿参数实现多语言文档信息结构化提取…

作者头像 李华