news 2026/5/10 10:31:56

全新软件与模型优化为 NVIDIA DGX Spark 注入强大动力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
全新软件与模型优化为 NVIDIA DGX Spark 注入强大动力

作者:Allen Bourgoyne

自发布以来,NVIDIA 通过持续的软件优化以及与软件合作伙伴和开源社区的紧密协作,不断提升基于 Grace Blackwell 架构的 DGX Spark 的性能。这些举措在推理、训练和创意工作流方面都取得了显著的成效。

在 CES 2026 上,全新的 DGX Spark 软件版本结合新的模型更新和开源库,为 DGX Spark 以及基于 GB10 的 OEM 系统带来了显著的性能提升。

使用统一内存和NVFP4本地扩展大模型

DGX Spark 专为大模型本地化应用而设计,配备 128GB 统一内存,并采用紧凑的桌面形态。两台 DGX Spark 系统互连可提供 256GB 的组合内存,支持开发者能够在本地运行更大的模型。

系统通过 ConnectX-7 网络连接,提供 200Gbps 带宽,实现高速、低延迟的多节点工作负载。

支持 NVIDIA NVFP4 数据格式,可使新一代模型大幅降低内存占用,同时提升吞吐量。例如,在相同的双 DGX Spark 配置上,使用 NVFP4 精度和推测解码运行 Qwen-235B 模型,相比 FP8 执行性能最高提升 2.6 倍。

使用 FP8 精度时,该模型会耗尽两台系统的组合内存,从而限制多任务处理和整体响应速度。将模型量化为 NVFP4 后,可将内存使用量减少约 40%,同时保持高精度,使开发者能够在获得 FP8 等效结果的同时实现更高性能,并释放足够内存以同时运行其他工作负载。最终使本地 AI 开发体验更加响应迅速且高效。

创作者打造的强大桌面平台

DGX Spark 不仅是 AI 开发者的卓越平台,创作者也能充分利用其桌面级功能。

通过将 AI 工作负载转移到 DGX Spark,创作者可以使自己的笔记本电脑或 PC 在内容生成过程中保持响应。

阿里巴巴的 Qwen-Image 等领先的扩散模型正利用 NVFP4 减少内存占用,同时实现更高性能。

AI 视频生成尤其适合 DGX Spark,因为它需要大量的内存和算力。采用 NVFP8 优化权重的音视频生成模型相比上一代性能显著提升,使高质量视频生成在桌面端成为可能。

DGX Spark现已纳入NVIDIA认证系统计划

NVIDIA 认证系统计划用于验证系统在广泛加速图形处理、计算和 AI 工作负载方面的性能表现。NVIDIA 认证系统为 AI 开发、桌面推理、数据科学、设计和内容创作工作负载提供了可信的基础,同时也对数据中心和云资源进行增强。

DGX Spark 和基于 GB10 的 OEM 系统现已纳入该计划,DGX Spark 及合作伙伴系统目前正在测试中。

快速上手

了解我们如何帮助开发者立即提高生产力,展示 Blackwell GPU 的可能性,包括:

  • Nemotron 3 Nano:本地运行 NVIDIA 高效的 30B 参数 MoE 模型,以用于 LLM 实验。
  • Live VLM WebUI:将网络摄像头画面输入数据流传输至视觉语言模型中进行实时分析,并利用 GPU 进行处理。
  • Isaac Sim / Lab:利用 GPU 加速的仿真与强化学习,构建并训练机器人应用。
  • SGLang 与 vLLM 服务 Playbook:清晰的模型支持矩阵能够显示已测试与支持的模型及量化选项。
  • GPU 加速的量化金融与基因组学 Playbook:与基于 CPU 的实现相比,这些工作流所需的代码改动极少。
  • 使用 PyTorch 微调:通过 FSDP 与 LoRA,在两台 DGX Spark 系统上分布式微调,支持参数最高达 70B 的 LLM。

简单可靠、步骤清晰且实用的故障排除指南,已在最新 DGX OS 上验证配置,能够让用户减少设置时间,将更多时间用于构建。

使用NVIDIA Brev随时随地访问DGX Spark

借助 NVIDIA Brev,用户可以通过安全连接随时随地访问 DGX Spark。Brev 让开发者能够轻松创建 AI 云实例,利用 Launchables 功能,实现一键即可配置 AI 环境。在 CES 上,Brev 的更新展示了注册本地计算(如 DGX Spark)的能力。在 Brev 完成注册后,用户即可随时随地访问 DGX Spark,并安全地与团队共享访问权限。

Brev 支持本地与云模型的混合部署。借助路由层,用户可以将电子邮件或专有数据处理等敏感任务保留在运行于 DGX Spark 上的本地开放模型上,同时将一般推理任务路由至云端的前沿模型。实现细节可参阅 NVIDIA LLM Router 开发者示例。

Brev 对本地计算的支持将在 CES 上进行预览,正式支持将于 2026 年春季推出。

打造专属智能

如需进一步探索,NVIDIA 与 Hugging Face 合作展示如何构建个人桌面 AI 助手。使用 DGX Spark 搭配 Reachy Mini,用户可以创建一个私有 AI 助手,在本地私密的处理数据。请参阅 NVIDIA 与 Hugging Face 教程开始体验。

加入 DGX Spark 开发者社区,开启 AI 构建之旅。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 1:20:31

效率爆炸!我用 Python + DeepSeek 写了个“能听懂人话”的 OCR 神器

还在手动敲表格?还在为截图里的数据抓狂? 今天给大家分享一个我刚刚撸出来的 Python 神器——智能 OCR 表格提取助手。它不仅能一键把图片变 Excel,更厉害的是,它接入了 DeepSeek V3,能自动帮你补全数据! …

作者头像 李华
网站建设 2026/5/8 9:27:47

SpringBoot+Vue +周边游平台平台完整项目源码+SQL脚本+接口文档【Java Web毕设】

摘要 随着旅游业的发展和人们生活水平的提高,周边游逐渐成为大众休闲娱乐的重要选择。传统的旅游服务模式存在信息不对称、预订流程繁琐、用户体验不佳等问题,难以满足现代游客的个性化需求。互联网技术的快速发展为旅游行业提供了新的解决方案&#xf…

作者头像 李华
网站建设 2026/5/3 15:44:40

基于SpringBoot+Vue的政府管理系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】

摘要 随着信息技术的快速发展,数字化政务管理已成为提升政府工作效率和服务质量的重要手段。传统政府管理系统中存在信息孤岛、数据冗余、响应速度慢等问题,亟需通过信息化手段实现业务流程的优化和数据的集中管理。政府管理系统通过整合各部门资源&…

作者头像 李华
网站建设 2026/5/3 15:07:47

Emby高级功能解锁与媒体服务器配置全指南

Emby高级功能解锁与媒体服务器配置全指南 【免费下载链接】emby-unlocked Emby with the premium Emby Premiere features unlocked. 项目地址: https://gitcode.com/gh_mirrors/em/emby-unlocked 想要低成本体验Emby媒体服务器的高级功能?通过科学配置实现E…

作者头像 李华