news 2026/5/30 14:56:11

如何快速测试GPU的推理速度

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何快速测试GPU的推理速度
importtorchimporttime# 1. 设置设备iftorch.cuda.is_available(): device=torch.device("cuda")print(f"检测到设备: {torch.cuda.get_device_name(0)}")else: device=torch.device("cpu")print("使用 CPU")# 2. 增加矩阵尺寸,让 GPU 有事可做 (比如 4000x4000 或 8000x8000)# 1000x1000 对高端卡来说太小了size=4000print(f"正在初始化矩阵 (Size: {size}x{size})...")A=torch.randn(size, size,device=device)B=torch.randn(size, size,device=device)# --- 关键步骤:GPU 预热 (Warm-up) ---print("正在进行 GPU 预热 (第一次运行通常很慢)...")# 跑几次空运算,触发库加载和初始化for_inrange(5): _=torch.mm(A, B)torch.cuda.synchronize()print("预热完成,开始正式计时!")# ------------------------------------# 3. 正式计时 GPUtorch.cuda.synchronize()start_time=time.time()# 循环多次取平均值更准确loop_times=10for_inrange(loop_times): C=torch.mm(A, B)torch.cuda.synchronize()# 等待所有计算完成end_time=time.time()avg_gpu_time=(end_time - start_time)/ loop_times print(f"GPU 平均运行时间: {avg_gpu_time:.5f} 秒")# 4. 对比 CPU (如果尺寸太大,CPU可能会非常慢,建议 CPU 测试时如果太慢就减少 loop)iftorch.cuda.is_available(): print("正在准备 CPU 数据 (这可能需要一点时间)...")A_cpu=A.cpu()B_cpu=B.cpu()start_time_cpu=time.time()# CPU 一般不需要像 GPU 那样严格预热,但跑一次也没坏处# 注意:如果 size 是 4000,CPU 跑这 10 次可能会很慢cpu_loops=2# 减少 CPU 循环次数以免等太久for_inrange(cpu_loops): C_cpu=torch.mm(A_cpu, B_cpu)end_time_cpu=time.time()avg_cpu_time=(end_time_cpu - start_time_cpu)/ cpu_loops print(f"CPU 平均运行时间: {avg_cpu_time:.5f} 秒")# 修正加速比公式:CPU时间 / GPU时间speedup=avg_cpu_time / avg_gpu_time print(f"---")print(f"真实性能对比: GPU 比 CPU 快 {speedup:.2f} 倍")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/29 14:29:17

Arduino IDE 2.0高效实战指南:如何快速掌握嵌入式开发?

Arduino IDE 2.0高效实战指南:如何快速掌握嵌入式开发? 【免费下载链接】arduino-ide Arduino IDE 2.x 项目地址: https://gitcode.com/gh_mirrors/ar/arduino-ide Arduino IDE 2.0作为一款现代化的开源开发环境,为嵌入式系统和物联网…

作者头像 李华
网站建设 2026/5/27 13:33:58

系统伪装革命:让任意Windows设备秒变三星Galaxy Book

系统伪装革命:让任意Windows设备秒变三星Galaxy Book 【免费下载链接】galaxybook_mask This script will allow you to mimic your windows pc as a Galaxy Book laptop, this is usually used to bypass Samsung Notes 项目地址: https://gitcode.com/gh_mirror…

作者头像 李华
网站建设 2026/5/25 8:53:50

RedPill黑群晖引导工具RR 25.6.4版本完整指南

RedPill黑群晖引导工具RR 25.6.4版本完整指南 【免费下载链接】rr Redpill Recovery (arpl-i18n) 项目地址: https://gitcode.com/gh_mirrors/rr2/rr RedPill(简称RR)是一款专为黑群晖系统设计的引导工具,能够让用户在非官方硬件上稳定…

作者头像 李华
网站建设 2026/5/25 8:53:08

SQL 从基础操作到高级查询

文章目录SQL从基础操作到高级查询一、SQL基础操作1.1 数据查询(SELECT)1.2 数据操作插入数据(INSERT)更新数据(UPDATE)删除数据(DELETE)二、高级查询技巧2.1 WHERE子句高级用法2.2 排…

作者头像 李华
网站建设 2026/5/27 23:16:02

Vision Transformer瘦身指南:如何将1243MiB大模型压缩到37MiB

还在为Vision Transformer的庞大体积发愁吗?想要在移动设备上部署ViT却频频碰壁?别担心,本文将带你掌握ViT模型从"巨无霸"到"小精灵"的魔法变身术!🚀 【免费下载链接】vision_transformer 项目…

作者头像 李华
网站建设 2026/5/27 18:45:12

_医院档案管理系统的设计与实现(11465)

有需要的同学,源代码和配套文档领取,加文章最下方的名片哦 一、项目演示 项目演示视频 二、资料介绍 完整源代码(前后端源代码SQL脚本)配套文档(LWPPT开题报告)远程调试控屏包运行 三、技术介绍 Java…

作者头像 李华