ResNet18多标签分类：云端支持自定义数据集，按小时租用-平芜编程栈

ResNet18多标签分类：云端支持自定义数据集，按小时租用

引言

当你带着宠物去医院拍X光片时，医生可能需要判断是否存在骨折、关节炎、肿瘤等多种问题。传统方式需要医生逐一查看每张片子，既耗时又容易遗漏细节。现在，通过ResNet18多标签分类技术，我们可以让AI同时识别X光片中的多种异常情况，就像给每张片子装上"智能扫描仪"。

对于宠物医院这类场景，数据安全和灵活使用是关键需求。CSDN算力平台提供的ResNet18镜像支持：

私有化训练：数据无需上传公有云，完全在独立环境中处理
按小时计费：像租用会议室一样按需使用GPU资源，用完即删
自定义适配：可快速修改模型输出层，匹配不同病症标签

本文将手把手带你完成从数据准备到模型训练的全流程，即使没有深度学习经验也能轻松上手。

1. 环境准备：10分钟搞定基础配置

1.1 选择适合的云端镜像

在CSDN算力平台镜像广场搜索"ResNet18"，选择预装PyTorch和CUDA的基础镜像。这个镜像已经包含：

PyTorch 1.12 + CUDA 11.6
预下载的ResNet18权重文件
常用图像处理库（OpenCV, Pillow等）

💡 提示
选择按小时计费的GPU实例（如RTX 3090），训练完成后可立即释放资源，成本可控。

1.2 数据准备规范

宠物医院的X光片需要按以下结构组织：

pet_xray_dataset/ ├── images/ │ ├── dog_001.jpg │ ├── cat_002.jpg │ └── ... └── labels.csv

labels.csv文件示例：

filename,fracture,arthritis,tumor dog_001.jpg,1,0,1 cat_002.jpg,0,1,0

2. 模型改造：让ResNet18认识多种病症

2.1 修改输出层

原始ResNet18是为单标签分类设计（如ImageNet的1000类），我们需要调整最后一层：

import torch import torch.nn as nn from torchvision.models import resnet18 # 加载预训练模型 model = resnet18(pretrained=True) # 冻结除最后一层外的所有参数 for param in model.parameters(): param.requires_grad = False # 修改最后一层（假设有3种病症标签） num_features = model.fc.in_features model.fc = nn.Linear(num_features, 3) # 3个输出节点

2.2 自定义数据加载

创建专属的数据加载器处理多标签数据：

from torch.utils.data import Dataset import pandas as pd from PIL import Image class PetXrayDataset(Dataset): def __init__(self, csv_path, img_dir, transform=None): self.labels = pd.read_csv(csv_path) self.img_dir = img_dir self.transform = transform def __getitem__(self, idx): img_path = os.path.join(self.img_dir, self.labels.iloc[idx, 0]) image = Image.open(img_path).convert('RGB') labels = torch.FloatTensor(self.labels.iloc[idx, 1:].values) if self.transform: image = self.transform(image) return image, labels def __len__(self): return len(self.labels)

3. 训练实战：私有化训练三步走

3.1 启动训练任务

使用以下命令开始训练（根据数据量调整epochs）：

python train.py \ --data_dir ./pet_xray_dataset \ --epochs 20 \ --batch_size 16 \ --lr 0.001 \ --output_dir ./results

3.2 关键参数解析

参数	推荐值	作用说明
--batch_size	8-32	根据GPU显存调整，3090建议16
--lr	0.001-0.0001	初始学习率，可配合衰减策略
--weight_decay	0.01	防止过拟合的正则化参数
--pos_weight	自动计算	处理标签不平衡问题

3.3 训练监控技巧

在代码中添加TensorBoard日志记录：

from torch.utils.tensorboard import SummaryWriter writer = SummaryWriter() for epoch in range(epochs): # ...训练代码... writer.add_scalar('Loss/train', loss.item(), epoch) writer.add_scalar('Accuracy/train', accuracy, epoch)

通过浏览器访问http://<实例IP>:6006即可查看实时训练曲线。

4. 模型应用与资源释放

4.1 模型导出与测试

训练完成后导出最佳模型：

torch.save(model.state_dict(), 'best_model.pth')

测试单张图片的示例代码：

def predict(image_path, model): transform = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]) img = Image.open(image_path).convert('RGB') img_tensor = transform(img).unsqueeze(0) with torch.no_grad(): outputs = torch.sigmoid(model(img_tensor)) return outputs.numpy() # 返回各标签的概率值