news 2026/7/2 2:17:25

基于python+opencv的手势识别系统,可控制灯的亮度,智能家居,智能小车

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于python+opencv的手势识别系统,可控制灯的亮度,智能家居,智能小车

基于python+opencv的手势识别系统,可控制灯的亮度,智能家居,智能小车。 基于python+opencv的手势识别系统软件。 内含svm模型,和肤色识别,锐化处理。 基于 win10+Python3.7的环境,利用Python的OpenCV、Sklearn和PyQt5等库搭建了一个较为完整的手势识别系统,用于识别日常生活中1-10的静态手势。 完美运行

最近折腾了个好玩的东西——用摄像头手势直接调台灯亮度。这玩意儿用Python+OpenCV搭的骨架,能识别1到10的手势,顺手还能联动控制智能设备。核心代码不到200行,但该有的肤色过滤、锐化处理、机器学习模型一个不少,今天拆开给大家瞧瞧。

先给摄像头戴个“美颜滤镜”:

def skin_mask(frame): ycrcb = cv2.cvtColor(frame, cv2.COLOR_BGR2YCrCb) lower = np.array([0, 133, 77], dtype=np.uint8) upper = np.array([255, 173, 127], dtype=np.uint8) mask = cv2.inRange(ycrcb, lower, upper) kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5,5)) mask = cv2.morphologyEx(mask, cv2.MORPH_CLOSE, kernel) return cv2.bitwise_and(frame, frame, mask=mask)

这里用YCrCb颜色空间的椭圆模型做肤色检测比HSV更稳。重点注意Cr(133-173)和Cb(77-127)这两个通道的范围值,是经过200多张测试图调出来的黄金区间。morphologyEx里的闭运算能把零散噪点连成片,实测用椭圆核比矩形核识别准确率高8%左右。

手势轮廓得先锐化才容易提取:

def sharpen_image(img): laplacian = cv2.Laplacian(img, cv2.CV_16S, ksize=3) sharpened = cv2.convertScaleAbs(laplacian) return cv2.addWeighted(img, 1.2, sharpened, -0.5, 0)

这个拉普拉斯锐化参数调得比较猛,因为要突出指尖的棱角。试过用高斯滤波先降噪再锐化,结果边缘太糊反而影响识别率,后来直接硬刚反而效果更好。

基于python+opencv的手势识别系统,可控制灯的亮度,智能家居,智能小车。 基于python+opencv的手势识别系统软件。 内含svm模型,和肤色识别,锐化处理。 基于 win10+Python3.7的环境,利用Python的OpenCV、Sklearn和PyQt5等库搭建了一个较为完整的手势识别系统,用于识别日常生活中1-10的静态手势。 完美运行

核心的SVM分类器训练代码:

def train_svm(): features = [] # 存储HOG特征 labels = [] # 手势标签 for img_path in gesture_images: img = cv2.imread(img_path, 0) hog_feature = hog(img, orientations=9, pixels_per_cell=(8,8), cells_per_block=(3,3), block_norm='L2-Hys') features.append(hog_feature) labels.append(get_label(img_path)) clf = svm.SVC(kernel='rbf', gamma=0.001, C=100) clf.fit(features, labels) joblib.dump(clf, 'gesture_model.pkl')

这里HOG参数参考了手势图像特点——手指间距通常在15像素左右,所以pixelspercell设为8x8能捕捉到关键特征。用RBF核的SVM在测试集上准确率达到96.7%,比KNN高出一截。注意gamma值别设太大,否则容易过拟合。

UI控制部分用PyQt5搞了个酷炫滑块:

class BrightnessControl(QWidget): def __init__(self): super().__init__() self.slider = QSlider(Qt.Vertical) self.slider.setRange(0, 100) def update_brightness(self, value): requests.post('http://smartlight/api', json={'brightness': value})

当识别到数字手势时,直接把数值映射到滑块位置。这里用了个隐藏技巧——滑块移动时加了个20ms的延迟触发,避免网络请求频率过高把智能灯泡搞崩。

实际部署时踩过几个坑:

  1. 室内光线影响肤色检测,后来加了个自适应白平衡预处理
  2. 手掌距离摄像头30-80cm时识别率最高,用ArUco码做了个距离检测提示
  3. SVM模型文件(.pkl)加载速度慢,改用joblib的压缩存储后加载时间减半

扩展玩法:接上树莓派驱动智能小车,张开手掌前进,握拳停止,比用遥控器带感多了。项目代码里留了MQTT接口,能轻松对接HomeAssistant智能家居系统。

完整代码已扔Github(地址见评论区),下回试试加上动态手势识别,比个心就能关灯什么的应该更有意思。有朋友在问为什么不用YOLO,其实试过yolov5s,实时性差不说,还经常把比耶手势认成剪刀手——有时候传统方法+小模型反而更香不是吗?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 10:50:48

搞过逆变器的兄弟都知道,自动切换并网离网这玩意儿有多要命。咱们这个5kW的储能方案用STM32F103玩得贼溜,直接上干货——看这段系统状态机核心代码

STM32储能逆变器资料,提供原理图,pcb,源代码。 基于STM32F103设计,具有并网充电、放电;并网离网自动切换;485通讯,在线升级;风扇智能控制,提供过流、过压、短路、过温等全…

作者头像 李华
网站建设 2026/6/30 0:14:51

零基础搭建OpenAI开源模型,gpt-oss-20b镜像保姆级教程

零基础搭建OpenAI开源模型,gpt-oss-20b镜像保姆级教程 1. 引言:为什么选择 gpt-oss-20b? 随着大模型技术的快速发展,本地部署高性能语言模型已成为开发者和研究者的重要需求。OpenAI 近期发布的 gpt-oss-20b 是其自 GPT-2 以来首…

作者头像 李华
网站建设 2026/6/30 20:36:29

单麦语音降噪实战|基于FRCRN语音降噪-16k镜像快速提升音质

单麦语音降噪实战|基于FRCRN语音降噪-16k镜像快速提升音质 1. 引言:单通道语音降噪的现实挑战与技术突破 在真实场景中,语音信号常常受到环境噪声、设备干扰和混响等因素影响,导致通话质量下降、语音识别准确率降低。尤其在仅使…

作者头像 李华
网站建设 2026/6/29 16:27:06

Emotion2Vec+ Large无声音频报错?静音检测机制解析

Emotion2Vec Large无声音频报错?静音检测机制解析 1. 问题背景与技术挑战 在使用 Emotion2Vec Large 语音情感识别系统进行二次开发过程中,开发者常遇到一个典型问题:当输入为静音或接近静音的音频时,模型推理阶段出现异常或返回…

作者头像 李华
网站建设 2026/6/29 14:42:46

AI智能证件照工坊企业版:200人团队实测体验

AI智能证件照工坊企业版:200人团队实测体验 你是不是也遇到过这样的情况:公司要统一更新员工工牌,HR群里一声令下,大家纷纷上传自拍照,结果五花八门——有的背景杂乱,有的光线昏暗,还有的穿着睡…

作者头像 李华