import torch from torch.utils.data import Dataset, DataLoader from torchvision import datasets, transforms import matplotlib.pyplot as plt # ========================================== # 1. 深入理解 Dataset (自定义演示) # ========================================== class SimpleNumberDataset(Dataset): def __init__(self, start, end): # 模拟数据:生成一个范围内的数字 self.data = list(range(start, end)) def __len__(self): # 返回数据集大小 return len(self.data) def __getitem__(self, index): # 返回一个样本及其标签(这里假设标签就是数字本身) sample = self.data[index] label = sample return torch.tensor(sample), torch.tensor(label) # ========================================== # 2. MNIST 数据集与 DataLoader 实战 # ========================================== # 定义预处理步骤:转为 Tensor 并标准化 transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,)) ]) # 下载并加载 MNIST 训练集 train_dataset = datasets.MNIST( root='./data', train=True, download=True, transform=transform ) # 创建 DataLoader train_loader = DataLoader( dataset=train_dataset, batch_size=64, shuffle=True ) # ========================================== # 3. 验证与回顾 # ========================================== def review(): # 回顾 Dataset 的 len 和 getitem print(f"MNIST 数据集总长度: {len(train_dataset)}") # 取出一个样本 image, label = train_dataset[0] print(f"单个样本形状: {image.shape}, 标签: {label}") # 回顾 DataLoader 的迭代 # 取出一个 batch data_iter = iter(train_loader) images, labels = next(data_iter) print(f"一个 Batch 的图片形状: {images.shape}") # [64, 1, 28, 28] print(f"一个 Batch 的标签形状: {labels.shape}") # [64] # 可视化一个样本 plt.imshow(images[0].numpy().squeeze(), cmap='gray') plt.title(f"Label: {labels[0]}") plt.show() if __name__ == "__main__": review()day38打卡
张小明
前端开发工程师
强化学习系统性学习笔记(一):从理论基础到策略优化
1.1 理论溯源:从生物学习到数学框架强化学习的思想源头可以追溯到生物行为心理学中的"试错学习"原理。在自然界中,生物个体通过反复尝试不同行为并观察环境反馈,逐步学会选择能够带来更好结果的行动策略。这一朴素而普适的学习模式…
想做大数据架构师,HCIP - 大数据认证是必备吗?
不少考了HCIP大数据认证的朋友吐槽:持证面试大数据架构师仍屡屡碰壁,甚至疑惑证书是否没用。结合同行转型经验与招聘实情,核心问题并非证书无效,而是大家缺失了认证之外的关键能力——这正是转型失败的主要原因。 一、先搞懂&…
基于微信小程序的校友惠超市管理系统【源码文末联系】
基于微信小程序的校友惠超市管理系统 三个角色(管理员,用户,超市) 效果如下: 商品信息详情页面 登陆页面 系统首页面 管理员页面 用户管理页面 商品分类页面 商品信息页面 用户首页 研究背景 在高校数字化转型浪潮…
Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅
背景 我们的知识库问答系统使用 Azure Container Apps + Azure AI Search + Azure OpenAI 构建,架构如下: 用户请求 → Container App → AI Search (向量搜索) → OpenAI (生成回答)系统上线后,性能表现不佳: P50 响应时间:18 秒 P99 响应时间:41 秒 最慢请求:40.9 秒…
碱性电解槽单元槽内流体均匀性设计探秘
碱性电解槽单元槽内流体均匀性设计,目前行业内单元槽主要分为圆形和方形结构单元槽,极板包括平板型,乳突型,棱型凹凸结构,分析单元槽内气液比,速度,压力,湍动能,涡分布&a…
加速200倍,单显卡1.8秒生成5秒高清视频!清华与Vidu解开了视频扩散模型的速度枷锁
TurboDiffusion将视频生成从漫长的渲染等待变成了实时的所见即所得。清华、生数科技与伯克利联手解开了视频扩散模型的速度枷锁。加速后的Wan2.1-T2V-1.3B-480P,单显卡1.8秒生成5秒视频,加速约93倍。Wan2.2-I2V-A14B-720P,5秒视频加速约119倍…