news 2026/2/10 1:48:26

AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

AMD近日发布了一款突破性的轻量级文本到图像生成模型Nitro-E,以仅304M的参数量实现了高效AI绘图能力,尤其在推理速度上展现出惊人表现——其蒸馏版本在单张AMD Instinct MI300X GPU上可达到每秒39.3张图像的生成速度,且仅需4步推理即可完成,为AI图像生成领域带来了效率革命。

当前AI图像生成领域正面临着模型规模与性能之间的平衡难题。主流模型如Stable Diffusion系列参数量普遍在数十亿级别,不仅对硬件资源要求高,且生成速度难以满足实时应用需求。行业正迫切寻求轻量化、高性能的解决方案,以推动AI绘图技术在边缘设备、实时交互等场景的普及应用。在此背景下,AMD Nitro-E的推出恰逢其时,以"轻量高效"为核心定位,重新定义了轻量级文本到图像模型的性能标准。

Nitro-E的核心优势体现在三大维度:极致轻量化架构、突破性推理速度与创新技术设计。该模型采用全新的Efficient Multimodal Diffusion Transformer(E-MMDiT)架构,通过多重创新技术实现了效率突破。其采用高度压缩的视觉tokenizer和多路径压缩模块,显著减少了计算令牌数量;创新的Alternating Subregion Attention(ASA)技术通过子区域内注意力计算降低开销;而AdaLN-affine模块则实现了transformer块中调制参数的高效计算。这些技术共同造就了仅304M参数的轻量化模型体量。

在性能表现上,Nitro-E创造了新的效率纪录:基础版本在单张MI300X GPU上实现18.8张/秒的吞吐量(512px图像,批处理大小32),而蒸馏版本更是将这一数字提升至39.3张/秒,且将推理步骤从标准的20步大幅缩减至仅需4步。更值得关注的是其训练效率,Nitro-E从 scratch 训练仅需1.5天,在配备8张AMD Instinct MI300X GPU的单节点上即可完成,显著降低了模型开发成本。该模型系列包含三个版本:基础版Nitro-E-512px(20步推理)、蒸馏版Nitro-E-512px-dist(4步推理)以及采用Group Relative Policy Optimization (GRPO)策略优化的Nitro-E-512px-GRPO版本,满足不同场景需求。

Nitro-E的推出将对AI图像生成领域产生多重影响。首先,其极致的推理效率为实时图像生成应用铺平道路,有望推动AI绘图在直播、游戏、AR/VR等交互式场景的深度集成。其次,304M的轻量化模型为边缘设备部署提供了可能,使智能手机、嵌入式系统等终端设备也能运行高质量AI绘图模型。对于企业用户而言,Nitro-E极低的训练和推理成本将显著降低AI图像生成技术的采用门槛,尤其利好内容创作、设计、广告等行业的中小企业。

从技术趋势看,Nitro-E印证了AI生成模型"轻量化、高效率"的发展方向。AMD通过创新架构设计而非单纯增加参数量来提升性能的思路,可能成为未来模型优化的主流路径。该模型采用MIT开源许可,并已开放源代码和技术博客,这将加速高效扩散模型技术的研究与应用。随着硬件与软件协同优化的深入,我们有理由期待轻量级AI生成模型在保持质量的同时,实现更惊人的速度突破,推动AI创意工具向实时化、普及化方向加速发展。

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/9 2:27:31

终极原神帧率解锁指南:3步突破60fps限制

想要在原神PC版中体验极致流畅的游戏画面吗?原神帧率优化工具正是您需要的解决方案。这款开源工具能够轻松突破游戏内置的60fps限制,让您的游戏体验达到全新高度。无论您是追求更顺滑的战斗操作,还是希望在探索提瓦特大陆时享受更精美的视觉效…

作者头像 李华
网站建设 2026/2/5 18:56:46

SMUDebugTool深度解析:AMD硬件调试与性能优化的终极指南

SMUDebugTool深度解析:AMD硬件调试与性能优化的终极指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://…

作者头像 李华
网站建设 2026/2/4 13:36:03

vivado2018.3安装步骤系统学习:面向Artix-7初学者指南

从零开始搭建 FPGA 开发环境:vivado2018.3 安装与 Artix-7 实战指南 你是不是也曾在实验室里看着同学轻松烧录代码到开发板,而自己却卡在“Vivado 打不开”、“License 加载失败”这种基础问题上?别急——每一个 FPGA 工程师的起点&#xff…

作者头像 李华
网站建设 2026/2/8 9:10:14

少数民族语言支持计划:未来CosyVoice是否会加入藏语蒙古语?

少数民族语言支持计划:未来CosyVoice是否会加入藏语蒙古语? 在智能语音助手逐渐走进千家万户的今天,我们是否注意到——当城市用户轻松用普通话与AI对话时,许多使用藏语、蒙古语的边疆居民却仍被隔绝在这场技术浪潮之外&#xff1…

作者头像 李华
网站建设 2026/2/7 15:35:05

一文说清Realtek HD Audio驱动的系统级架构组成

深入理解 Realtek HD Audio 驱动的系统级架构:从硬件到操作系统的完整通路 你有没有遇到过这样的情况?插入耳机,系统却迟迟没有切换输出设备;或者播放音乐时突然“咔哒”一声爆音,让人皱眉。这些问题背后,…

作者头像 李华
网站建设 2026/2/8 5:22:38

Fritzing从零实现:制作你的第一个面包板电路

从零开始点亮LED:用Fritzing打造你的第一个电子原型 你有没有过这样的经历?刚接触电子,面对一堆电阻、LED、杜邦线和Arduino,脑子里全是“这根线接哪儿?”、“为什么灯不亮?”的困惑。电路图上的符号像天书…

作者头像 李华