news 2026/4/15 16:50:49

pytorch cuda安装实践:用set_sync_debug_mode,来测试gpu的使用情况

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pytorch cuda安装实践:用set_sync_debug_mode,来测试gpu的使用情况

在 CUDA 12.4 环境下,要结合 torch.set_sync_debug_mode() 测试 GPU 使用情况,需先明确该函数的作用:它用于开启 CUDA 同步调试模式,检测异步操作中的错误,搭配现有的设备和线程配置,具体代码如下:
import torch

1. 定义 GPU 设备 ID

dev_id = 0

2. 设置使用的 GPU 设备(两种写法等价,推荐显式指定设备对象)

torch.cuda.set_device(f’cuda:{dev_id}')

或更推荐的写法:device = torch.device(f’cuda:{dev_id}')

3. 设置 CPU 线程数(仅影响 CPU 侧运算/数据传输的并行度,与 GPU 无关)

torch.set_num_threads(10)

4. 开启 CUDA 同步调试模式(核心新增代码)

mode=1:开启严格同步检查,捕获所有异步 CUDA 错误

mode=0:关闭(默认);mode=2:开启但仅警告不抛出异常

torch.set_sync_debug_mode(1)

---------------- 测试 GPU 使用情况的示例代码 ----------------

验证设备是否可用

if torch.cuda.is_available():
print(f"当前使用 GPU: {torch.cuda.get_device_name(dev_id)}“)
print(f"CUDA 版本: {torch.version.cuda}”)

# 创建测试张量并移至 GPU x = torch.randn(1000, 1000, device=f'cuda:{dev_id}') y = torch.matmul(x, x.T) # 执行 GPU 矩阵运算 print(f"GPU 运算结果形状: {y.shape}") # 强制同步 GPU 操作(配合调试模式,确保错误及时捕获) torch.cuda.synchronize(dev_id)

else:
print(“CUDA 不可用,请检查 GPU 驱动和 PyTorch 安装”)
CUDA 12.4 额外注意点
确保 PyTorch 安装时匹配 CUDA 12.4,例如使用命令安装:
bash
运行
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
调试时可搭配 torch.cuda.synchronize() 强制 GPU 同步,确保所有异步操作完成后再检查结果。
测试 GPU 使用率的补充建议
设备设置的等价写法
torch.cuda.set_device(‘cuda:0’) 是合法的,但更推荐使用 torch.device 对象进行后续操作,例如:device = torch.device(f’cuda:{dev_id}')
x = torch.randn(1000, 1000, device=device)

set_num_threads 的作用范围
该函数设置的是 CPU 线程数,用于 PyTorch 的 CPU 运算(如张量初始化、数据预处理),不会影响 GPU 的并行计算。
若要测试 GPU 本身的算力,可通过 torch.backends.cudnn.benchmark = True 开启 cuDNN 自动调优(可选)。

如果需要监控 GPU 实时使用率 / 显存占用(而非仅调试错误),可以在运行代码时搭配 nvidia-smi 命令:
新建终端,执行 watch -n 1 nvidia-smi(每秒刷新一次 GPU 状态)。
运行上述 Python 代码,观察终端中 GPU 使用率、显存占用的变化。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/11 21:50:27

2025最新!8个AI论文平台测评:本科生写论文痛点全解析

2025最新!8个AI论文平台测评:本科生写论文痛点全解析 2025年AI论文平台测评:为何值得一看? 随着人工智能技术的不断进步,越来越多的本科生开始借助AI工具辅助论文写作。然而,面对市场上琳琅满目的平台&…

作者头像 李华
网站建设 2026/4/7 17:33:11

哈希-03-字母异位词分组

文章目录1. 题目描述2. 思路及代码错误示例1:错误示例2:正确示例:总结1. 题目描述 给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 示例 1: 输入: strs [“eat”, “tea”, “tan”, “ate”…

作者头像 李华
网站建设 2026/4/15 3:33:27

MySQL 审计级别配置指南

目录标题 MySQL 审计级别配置指南一、当前环境审计配置1.1 已安装的审计插件1.2 当前审计参数 二、Percona Audit Plugin 审计级别详解Policy 对照表 三、各级别详细说明Level 0: NONE(关闭审计)Level 1: LOGINS(基础审计)Level 2…

作者头像 李华
网站建设 2026/4/15 16:47:49

测试团队的技术规划与技术债管理

质量防线的双重挑战 在敏捷与DevOps主流化的今天,软件测试团队的角色已从传统的“质量守门员”演变为“质量赋能者”。这一转变意味着测试工作不再仅仅是发现缺陷,更需要深度融入开发流程,并通过技术手段提升效率与可靠性。然而,…

作者头像 李华
网站建设 2026/4/12 21:20:30

从用户体验(UX)设计中学习测试用例设计灵感

打破专业壁垒,从同理心出发 在追求软件质量的旅程中,测试与设计的角色并非两条平行线。用户体验(UX)设计的核心是“理解人”,致力于创造高效、愉悦且满足需求的交互过程;而软件测试的使命是“保障质量”&a…

作者头像 李华
网站建设 2026/4/13 16:50:38

降重 + 去 AIGC 双 buff 拉满!虎贲等考 AI:学术合规的智能破局方案

论文查重率 “超标预警”?AI 生成痕迹被精准标记?辛苦创作的稿件因 “机器感过重” 被打回重改?在学术规范日趋严格的当下,“降重” 与 “清除 AIGC 痕迹” 成为学术创作的两大核心痛点。普通工具要么只做表面文字替换&#xff0c…

作者头像 李华