概述
HOG行人检测是一种基于方向梯度直方图特征的计算机视觉目标检测技术,它通过计算图像局部区域的梯度方向直方图来描述目标的外观形状特征。该算法首先将图像分割为小的连通区域(细胞单元),计算每个单元内像素的梯度方向并生成直方图,然后将相邻的细胞单元组合成块并对块内的直方图进行归一化处理,最终形成能够有效描述行人轮廓和形状的特征向量。这些特征向量被输入到预先训练好的SVM分类器中,判断图像区域是否包含行人,并通过多尺度扫描策略在不同大小的窗口中搜索目标,从而实现对图像中行人的准确检测和定位。
实践
/* by 01022.hk - online tools website : 01022.hk/zh/websocket.html */ // 读取图像 using var img = Cv2.ImRead(ImagePath, ImreadModes.Color); if (img.Empty()) { MessageBox.Show("无法读取图像文件", "错误", MessageBoxButton.OK, MessageBoxImage.Error); return; } // 创建HOG描述符 using var hog = new HOGDescriptor(); hog.SetSVMDetector(HOGDescriptor.GetDefaultPeopleDetector()); // 检查检测器大小 bool b = hog.CheckDetectorSize(); Console.WriteLine("CheckDetectorSize: {0}", b); // 运行人检测 // 使用默认参数运行检测器。要获得更高的命中率(以及更多的误报), // 降低hitThreshold和groupThreshold(将groupThreshold设置为0以完全关闭分组)。 OpenCvSharp.Rect[] found = hog.DetectMultiScale( img, HitThreshold, new Size(8, 8), new Size(24, 16), 1.05, GroupThreshold);按照读取图像、创建HOG描述符、检测三个步骤来实现。
可以发现里面自带了一个行人检测器。
查看SetSVMDetector方法:
/* by 01022.hk - online tools website : 01022.hk/zh/websocket.html */ public virtual void SetSVMDetector(float[] svmDetector) { ThrowIfDisposed(); using var svmDetectorVec = new VectorOfFloat(svmDetector); NativeMethods.HandleException( NativeMethods.objdetect_HOGDescriptor_setSVMDetector(ptr, svmDetectorVec.CvPtr)); GC.KeepAlive(this); }SetSVMDetector 是 HOGDescriptor 类中的一个关键方法,用于设置线性 SVM 分类器的系数,这些系数决定了 HOG 描述符如何识别特定对象。
然后也是使用DetectMultiScale这个方法进行目标检测,查看它的函数签名:
public virtual Rect[] DetectMultiScale(Mat img, double hitThreshold = 0, Size? winStride = null, Size? padding = null, double scale=1.05, int groupThreshold = 2)DetectMultiScale 是 HOGDescriptor 类中最核心的方法之一,用于在图像中执行多尺度目标检测,特别适用于检测不同大小的目标对象。
| 参数名 | 类型 | 默认值 | 含义说明 | 调优建议 |
|---|---|---|---|---|
img | Mat | 必需 | 输入图像,支持 CV_8UC1(灰度图)和 CV_8UC4(彩色图)格式 | 确保图像格式正确,必要时进行转换 |
hitThreshold | double | 0 | 特征与 SVM 分类平面之间的距离阈值。值越低检测越敏感,值越高检测越严格 | 误报多时增加此值,漏检时降低此值 |
winStride | Size? | null | 窗口滑动步长,必须是块步长的倍数。控制检测窗口在图像上移动的步长 | 较大值(如8x8)提高速度,较小值(如4x4)提高精度 |
padding | Size? | null | 填充参数,为了保持 CPU 接口兼容性。必须为 (0,0) | 通常保持默认值即可 |
scale | double | 1.05 | 检测窗口的缩放系数,控制多尺度检测时窗口大小的变化率 | 检测小目标时用接近1的值(1.01-1.03),速度优先时用较大值(1.1-1.2) |
groupThreshold | int | 2 | 相似度阈值系数,用于合并重叠的检测框。值为0表示不执行分组 | 同一对象被多矩形检测到时增加此值,不同对象被错误合并时降低此值 |
效果: