OpenCV4入门120:HOG特征描述子—多尺度检测

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
import cv2 as cv

if __name__ == '__main__':
src = cv.imread("../images/pedestrian.png")
cv.imshow("input", src)
hog = cv.HOGDescriptor()
hog.setSVMDetector(cv.HOGDescriptor_getDefaultPeopleDetector())
# Detect people in the image
(rects, weights) = hog.detectMultiScale(src,
winStride=(4, 4),
padding=(8, 8),
scale=1.25,
useMeanshiftGrouping=False)
for (x, y, w, h) in rects:
cv.rectangle(src, (x, y), (x + w, y + h), (0, 255, 0), 2)

cv.imshow("hog-detector", src)
cv.waitKey(0)
cv.destroyAllWindows()

HOG(Histogram of Oriented Gradient)特征本身不支持旋转不变性,通过金字塔可以支持多尺度检测实现尺度空间不变性,OpenCV中支持HOG描述子多尺度检测的相关API如下:

1
2
3
4
5
6
7
8
9
10
virtual void cv::HOGDescriptor::detectMultiScale(
InputArray img,
std::vector< Rect > & foundLocations,
double hitThreshold = 0,
Size winStride = Size(),
Size padding = Size(),
double scale = 1.05,
double finalThreshold = 2.0,
bool useMeanshiftGrouping = false
)
1
2
3
4
foundLocations  = cv.HOGDescriptor.detectMultiScale(img, hitThreshold, 
winStride, padding,
scale, finalThreshold,
useMeanshiftGrouping)

foundLocations 表示发现对象矩形框
img 表示输入图像
hitThreshold 表示SVM距离度量,默认0表示,表示特征与SVM分类超平面之间
winStride 表示窗口步长
padding 表示填充
scale 表示尺度空间
finalThreshold 最终阈值,默认为2.0
useMeanshiftGrouping 不建议使用,速度太慢拉

这个其中窗口步长与Scale对结果影响最大,特别是Scale,小的尺度变化有利于检出低分辨率对象,同事也会导致FP发生,高的可以避免FP但是会产生FN(有对象漏检)。窗口步长是一个或者多个block区域,关于Block区域可以看第一张图: