保姆级教程：用YOLOv5搞定PCB缺陷检测，从数据集处理到模型部署全流程-平芜编程栈

工业级PCB缺陷检测实战：基于YOLOv5的完整解决方案

在电子制造业中，PCB（印刷电路板）的质量直接影响最终产品的可靠性。传统人工检测方法效率低下且容易漏检，而基于深度学习的自动视觉检测系统正在成为行业新标准。本文将带您从零构建一个完整的PCB缺陷检测系统，使用YOLOv5这一工业界广泛采用的实时目标检测框架，覆盖数据准备、模型训练到生产部署的全流程。

1. 数据工程：构建高质量PCB缺陷数据集

1.1 DeepPCB数据集深度解析

DeepPCB作为业界公认的基准数据集，包含1500张640×640像素的子图像，每张图像包含3-12个标注缺陷。其六类典型缺陷具有不同的视觉特征：

缺陷类型	视觉特征描述	常见发生场景
open	线路断裂的线性痕迹	蚀刻工艺缺陷
short	相邻线路异常连接	曝光对位偏差
mousebite	边缘不规则的圆形凹陷	钻孔机械故障
spur	线路表面的毛刺状突起	铜箔处理不当
pin-hole	微小的圆形孔洞	电镀工艺问题
copper	非预期的铜残留区域	蚀刻不彻底

提示：实际工业场景中，建议对原始图像进行EDA分析，使用OpenCV的直方图均衡化可以增强低对比度缺陷的可见性。

1.2 数据预处理流水线搭建

原始数据需要转换为YOLO训练格式，以下是关键步骤的Python实现：

import xml.etree.ElementTree as ET from PIL import Image def convert_annotation(xml_path, classes): tree = ET.parse(xml_path) root = tree.getroot() size = root.find('size') w = int(size.find('width').text) h = int(size.find('height').text) yolo_annotations = [] for obj in root.iter('object'): cls = obj.find('name').text if cls not in classes: continue xmlbox = obj.find('bndbox') b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text)) # 转换为YOLO格式：中心点坐标和宽高（归一化） x_center = ((b[0] + b[1]) / 2) / w y_center = ((b[2] + b[3]) / 2) / h width = (b[1] - b[0]) / w height = (b[3] - b[2]) / h yolo_annotations.append(f"{classes.index(cls)} {x_center} {y_center} {width} {height}") return yolo_annotations

配套的目录结构建议如下：

PCB_Defect/ ├── images/ │ ├── train/ │ ├── val/ │ └── test/ └── labels/ ├── train/ ├── val/ └── test/

1.3 数据增强策略

针对PCB缺陷的特性，推荐采用以下增强组合：

# Albumentations 增强配置示例 transform = A.Compose([ A.HorizontalFlip(p=0.5), A.VerticalFlip(p=0.5), A.RandomBrightnessContrast(p=0.2), A.GaussNoise(var_limit=(10.0, 50.0), p=0.3), A.Rotate(limit=15, p=0.5), A.RandomResizedCrop(640, 640, scale=(0.8, 1.0), ratio=(0.9, 1.1), p=0.5), ], bbox_params=A.BboxParams(format='yolo'))

2. YOLOv5模型架构与调优

2.1 模型选择与配置

YOLOv5提供不同规模的预训练模型，PCB检测推荐选择：

YOLOv5s：适合嵌入式设备部署（<2MB）
YOLOv5m：精度与速度平衡（工业产线常用）
YOLOv5l：高精度场景（检测微小缺陷）

配置文件关键参数修改：

# yolov5s_PCB.yaml nc: 6 # 缺陷类别数 depth_multiple: 0.33 width_multiple: 0.50 anchors: - [10,13, 16,30, 33,23] # P3/8 - [30,61, 62,45, 59,119] # P4/16 - [116,90, 156,198, 373,326] # P5/32

2.2 训练参数优化

针对PCB缺陷特点调整超参数：

python train.py \ --img 640 \ --batch 16 \ --epochs 300 \ --data PCB_Defect.yaml \ --cfg yolov5s_PCB.yaml \ --weights yolov5s.pt \ --hyp data/hyps/hyp.scratch-low.yaml \ --optimizer AdamW \ --cos-lr \ --label-smoothing 0.1

关键参数说明：

--img 640：匹配原始图像分辨率
--cos-lr：余弦退火学习率调度
--label-smoothing：缓解类别不平衡

2.3 损失函数改进

对于微小缺陷检测，可修改loss.py：

class ComputeLoss: def __init__(self, model, autobalance=False): self.sort_obj_iou = False # 禁用obj_iou排序 self.box_ratio = 0.05 # 增加box loss权重 self.cls_ratio = 0.5 # 降低cls loss权重

3. 模型评估与可视化分析

3.1 关键指标解读

训练完成后，val.py会输出以下指标：

指标	健康范围	提升建议
mAP@0.5	>0.85	增加正样本增强
Precision	>0.90	调整置信度阈值
Recall	>0.80	改进锚框尺寸
F1-score	>0.85	平衡精确率与召回率

3.2 结果可视化技巧

使用detect.py时添加热力图可视化：

python detect.py \ --weights runs/train/exp/weights/best.pt \ --source test_images/ \ --hide-labels \ --hide-conf \ --visualize

典型缺陷检测效果对比：

正常线路 open缺陷 short缺陷 ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ ┌─────┐ │ │ ┌─┐ ┌─┐ │ │ ┌─────┐ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ └─────┘ │ │ └─┘ └─┘ │ │ └─────┘ │ │ │ │ │ └─────────────┘ └─────────────┘ └─────────────┘

4. 生产环境部署方案

4.1 模型导出与优化

导出为ONNX格式并进行TensorRT加速：

import torch model = torch.hub.load('ultralytics/yolov5', 'custom', path='best.pt') model.eval() torch.onnx.export( model, torch.zeros(1, 3, 640, 640), "pcb_detect.onnx", opset_version=12, input_names=['images'], output_names=['output'] )