基于python+opencv的手势识别系统，可控制灯的亮度，智能家居，智能小车-平芜编程栈

基于python+opencv的手势识别系统，可控制灯的亮度，智能家居，智能小车。基于python+opencv的手势识别系统软件。内含svm模型，和肤色识别，锐化处理。基于 win10+Python3.7的环境，利用Python的OpenCV、Sklearn和PyQt5等库搭建了一个较为完整的手势识别系统，用于识别日常生活中1-10的静态手势。完美运行

最近折腾了个好玩的东西——用摄像头手势直接调台灯亮度。这玩意儿用Python+OpenCV搭的骨架，能识别1到10的手势，顺手还能联动控制智能设备。核心代码不到200行，但该有的肤色过滤、锐化处理、机器学习模型一个不少，今天拆开给大家瞧瞧。

先给摄像头戴个“美颜滤镜”：

def skin_mask(frame): ycrcb = cv2.cvtColor(frame, cv2.COLOR_BGR2YCrCb) lower = np.array([0, 133, 77], dtype=np.uint8) upper = np.array([255, 173, 127], dtype=np.uint8) mask = cv2.inRange(ycrcb, lower, upper) kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5,5)) mask = cv2.morphologyEx(mask, cv2.MORPH_CLOSE, kernel) return cv2.bitwise_and(frame, frame, mask=mask)

这里用YCrCb颜色空间的椭圆模型做肤色检测比HSV更稳。重点注意Cr(133-173)和Cb(77-127)这两个通道的范围值，是经过200多张测试图调出来的黄金区间。morphologyEx里的闭运算能把零散噪点连成片，实测用椭圆核比矩形核识别准确率高8%左右。

手势轮廓得先锐化才容易提取：

def sharpen_image(img): laplacian = cv2.Laplacian(img, cv2.CV_16S, ksize=3) sharpened = cv2.convertScaleAbs(laplacian) return cv2.addWeighted(img, 1.2, sharpened, -0.5, 0)

这个拉普拉斯锐化参数调得比较猛，因为要突出指尖的棱角。试过用高斯滤波先降噪再锐化，结果边缘太糊反而影响识别率，后来直接硬刚反而效果更好。

核心的SVM分类器训练代码：

def train_svm(): features = [] # 存储HOG特征 labels = [] # 手势标签 for img_path in gesture_images: img = cv2.imread(img_path, 0) hog_feature = hog(img, orientations=9, pixels_per_cell=(8,8), cells_per_block=(3,3), block_norm='L2-Hys') features.append(hog_feature) labels.append(get_label(img_path)) clf = svm.SVC(kernel='rbf', gamma=0.001, C=100) clf.fit(features, labels) joblib.dump(clf, 'gesture_model.pkl')

这里HOG参数参考了手势图像特点——手指间距通常在15像素左右，所以pixelspercell设为8x8能捕捉到关键特征。用RBF核的SVM在测试集上准确率达到96.7%，比KNN高出一截。注意gamma值别设太大，否则容易过拟合。

UI控制部分用PyQt5搞了个酷炫滑块：

class BrightnessControl(QWidget): def __init__(self): super().__init__() self.slider = QSlider(Qt.Vertical) self.slider.setRange(0, 100) def update_brightness(self, value): requests.post('http://smartlight/api', json={'brightness': value})

当识别到数字手势时，直接把数值映射到滑块位置。这里用了个隐藏技巧——滑块移动时加了个20ms的延迟触发，避免网络请求频率过高把智能灯泡搞崩。

实际部署时踩过几个坑：

室内光线影响肤色检测，后来加了个自适应白平衡预处理
手掌距离摄像头30-80cm时识别率最高，用ArUco码做了个距离检测提示
SVM模型文件(.pkl)加载速度慢，改用joblib的压缩存储后加载时间减半

扩展玩法：接上树莓派驱动智能小车，张开手掌前进，握拳停止，比用遥控器带感多了。项目代码里留了MQTT接口，能轻松对接HomeAssistant智能家居系统。

完整代码已扔Github（地址见评论区），下回试试加上动态手势识别，比个心就能关灯什么的应该更有意思。有朋友在问为什么不用YOLO，其实试过yolov5s，实时性差不说，还经常把比耶手势认成剪刀手——有时候传统方法+小模型反而更香不是吗？

搞过逆变器的兄弟都知道，自动切换并网离网这玩意儿有多要命。咱们这个5kW的储能方案用STM32F103玩得贼溜，直接上干货——看这段系统状态机核心代码

STM32储能逆变器资料，提供原理图，pcb，源代码。基于STM32F103设计，具有并网充电、放电；并网离网自动切换；485通讯，在线升级；风扇智能控制，提供过流、过压、短路、过温等全…

李华

零基础搭建OpenAI开源模型，gpt-oss-20b镜像保姆级教程

零基础搭建OpenAI开源模型，gpt-oss-20b镜像保姆级教程 1. 引言：为什么选择 gpt-oss-20b？ 随着大模型技术的快速发展，本地部署高性能语言模型已成为开发者和研究者的重要需求。OpenAI 近期发布的 gpt-oss-20b 是其自 GPT-2 以来首…

李华

液化空气集团完成对DIG Airgas收购，成为韩国市场工业气体领域领导者 | 美通社头条

、美通社消息：液化空气集团1月13日宣布，已成功完成对韩国领先综合气体公司DIG Airgas的收购。这是继十年前在美国成功收购Airgas之后的又一新里程碑。通过此项战略举措，液化空气集团在韩员工数将翻倍，总销售额将达9亿欧元。三十年…

李华

单麦语音降噪实战｜基于FRCRN语音降噪-16k镜像快速提升音质

单麦语音降噪实战｜基于FRCRN语音降噪-16k镜像快速提升音质 1. 引言：单通道语音降噪的现实挑战与技术突破在真实场景中，语音信号常常受到环境噪声、设备干扰和混响等因素影响，导致通话质量下降、语音识别准确率降低。尤其在仅使…

李华

Emotion2Vec+ Large无声音频报错？静音检测机制解析

Emotion2Vec Large无声音频报错？静音检测机制解析 1. 问题背景与技术挑战在使用 Emotion2Vec Large 语音情感识别系统进行二次开发过程中，开发者常遇到一个典型问题：当输入为静音或接近静音的音频时，模型推理阶段出现异常或返回…

李华

AI智能证件照工坊企业版：200人团队实测体验

AI智能证件照工坊企业版：200人团队实测体验你是不是也遇到过这样的情况：公司要统一更新员工工牌，HR群里一声令下，大家纷纷上传自拍照，结果五花八门——有的背景杂乱，有的光线昏暗，还有的穿着睡…

李华