news 2026/1/1 12:17:34

DAY 37 GPU训练及类的call方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DAY 37 GPU训练及类的call方法

一、GPU性能的查看:看架构代际、核心数、线程数

二、GPU性能的查看:看显存、看级别、看架构代际

三、GPU训练的方法:数据和模型移动到GPU device上

模型在 GPU 上训练,主要是将模型和数据迁移到 GPU 设备上。

在 PyTorch 里,.to(device) 方法的作用是把张量或者模型转移到指定的计算设备(像 CPU 或者 GPU)上。

- 对于张量(Tensor):调用 .to(device) 之后,会返回一个在新设备上的新张量。

- 对于模型(nn.Module):调用 .to(device) 会直接对模型进行修改,让其所有参数和缓冲区都移到新设备上。

在进行计算时,所有输入张量和模型必须处于同一个设备。要是它们不在同一设备上,就会引发运行时错误。并非所有 PyTorch 对象都有 .to(device) 方法,只有继承自 torch.nn.Module 的模型以及 torch.Tensor 对象才有此方法。

RuntimeError: Tensor for argument #1 'input' is on CPU, but expected it to be on GPU

这个常见错误就是输入张量和模型处于不同的设备。

四、类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)

Python 中,只要一个类定义了 __call__ 方法,这个类的实例就变成了可调用对象(可以像函数一样加括号调用)。

self.fc1(x) 能直接调用的本质是:self.fc1 指向的是一个可调用对象(通常是 PyTorch/TensorFlow 等框架的层类实例,这些类实现了 __call__ 方法),而 __call__ 是 Python 中让实例 “像函数一样被调用” 的核心魔法方法。

self.fc1 通常是 nn.Linear 类的实例,而 nn.Linear(以及所有 nn.Module 子类)都实现了 __call__ 方法,且 __call__ 会关联到层的前向传播逻辑(forward 方法)。

self.fc1(x) 能直接写的核心是:

  • fc1 是 nn.Module 子类(如nn.Linear)的实例;
  • nn.Module 实现了 __call__ 方法,使得实例可被 “函数式调用”;
  • 调用 self.fc1(x) 时,自动触发 __call__ → 调用 forward 方法,完成前向传播。

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/12 21:05:27

苹果生态AI新纪元:本地化大模型如何重塑您的智能体验

苹果生态AI新纪元:本地化大模型如何重塑您的智能体验 【免费下载链接】Qwen3-32B-MLX-6bit 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-32B-MLX-6bit 您是否曾遇到过这样的情况:在处理敏感文档时,因担心隐私泄露而不得…

作者头像 李华
网站建设 2025/12/17 5:40:06

终极SimSun字体获取指南:如何快速使用经典中文字体

SimSun.ttf字体是一款备受推崇的中文排版字体,以其清晰优雅的设计风格而闻名。这款经典中文字体在文档编辑和设计领域中发挥着重要作用,为用户提供专业的中文显示效果。 【免费下载链接】simsun.ttf字体文件下载仓库 SimSun.ttf是一款经典的中文字体&…

作者头像 李华
网站建设 2025/12/12 21:04:28

探索Android代码编辑器的革新之路:Sora-Editor深度解析

探索Android代码编辑器的革新之路:Sora-Editor深度解析 【免费下载链接】sora-editor A multifunctional Android code editor library. (aka CodeEditor) 项目地址: https://gitcode.com/gh_mirrors/so/sora-editor 在移动开发日益复杂的今天,一…

作者头像 李华
网站建设 2025/12/18 6:47:39

YYEVA动态MP4播放器:让视频资源真正“动“起来

YYEVA动态MP4播放器:让视频资源真正"动"起来 【免费下载链接】YYEVA YYEVA(YY Effect Video Animate)是YYLive推出的一个开源的支持可插入动态元素的MP4动效播放器解决方案,包含设计资源输出的AE插件,客户端…

作者头像 李华
网站建设 2025/12/12 21:02:57

top一区轴承诊断迁移学习代码 故障诊断代码 复现 首先使用一维的cnn对源域和目标域进行特征...

top一区轴承诊断迁移学习代码 故障诊断代码 复现 首先使用一维的cnn对源域和目标域进行特征提取,域适应阶段:将源域和目标域作为cnn的输入得到特征,然后进行边缘概率分布对齐和条件概率分布对齐,也就是进行JDA联合对齐。 此域适应…

作者头像 李华