news 2026/5/30 17:19:02

毕业设计 基于机器视觉的人体姿态行为识别

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
毕业设计 基于机器视觉的人体姿态行为识别

文章目录

  • 0 简介
  • **1、人体姿态估计简介**
  • 2、人体姿态估计数据集
  • 4、实现原理
  • 5、实现神经网络
  • 6 部分关键代码
  • 7 最后

0 简介

今天学长向大家分享一个毕业设计项目

毕业设计 基于机器视觉的人体姿态行为识别

项目运行效果:

毕业设计 深度学习人体姿势姿态识别

🧿 项目分享:见文末!

1、人体姿态估计简介

人体姿态估计(Human Posture Estimation),是通过将图片中已检测到的人体关键点正确的联系起来,从而估计人体姿态。

人体关键点通常对应人体上有一定自由度的关节,比如颈、肩、肘、腕、腰、膝、踝等,如下图。

通过对人体关键点在三维空间相对位置的计算,来估计人体当前的姿态。

进一步,增加时间序列,看一段时间范围内人体关键点的位置变化,可以更加准确的检测姿态,估计目标未来时刻姿态,以及做更抽象的人体行为分析,例如判断一个人是否在打电话等。

人体姿态检测的挑战:

1. 每张图片中包含的人的数量是未知的。 2. 人与人之间的相互作用是非常复杂的,比如接触、遮挡等,这使得联合各个肢体,即确定一个人有哪些部分变得困难。 3. 图像中人越多,计算复杂度越大(计算量与人的数量正相关),这使得实时检测变得困难。

2、人体姿态估计数据集

由于缺乏高质量的数据集,在人体姿势估计方面进展缓慢。在近几年中,一些具有挑战性的数据集已经发布,这使得研究人员进行研发工作。人体姿态估计常用数据集:

  • COCO Keypoints challenge
  • MPII Human Pose Dataset
  • VGG Pose Dataset
  • CMU Panoptic Dataset(本案例所用数据集)

人体姿态估计技术在体育健身、动作采集、3D试衣、舆情监测等领域具有广阔的应用前景,人们更加熟悉的应用就是抖音尬舞机。

4、实现原理

    1. 输入一幅图像,经过卷积网络提取特征,得到一组特征图,然后分成两个岔路,分别使用 CNN网络提取Part Confidence Maps 和 Part Affinity Fields;
    1. 得到这两个信息后,我们使用图论中的 Bipartite Matching(偶匹配) 求出Part Association,将同一个人的关节点连接起来,由于PAF自身的矢量性,使得生成的偶匹配很正确,最终合并为一个人的整体骨架;
    1. 最后基于PAFs求Multi-Person Parsing—>把Multi-person parsing问题转换成graphs问题—>[Hungarian Algorithm(匈牙利算法)]

(匈牙利算法是部图匹配最常见的算法,该算法的核心就是寻找增广路径,它是一种用增广路径求二分图最大匹配的算法。)

5、实现神经网络

阶段一:VGGNet的前10层用于为输入图像创建特征映射。

阶段二:使用2分支多阶段CNN,其中第一分支预测身体部位位置(例如肘部,膝部等)的一组2D置信度图(S)。 如下图

![](https://img-blog.csdnimg.cn/20190421232819272.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzM4MTA2OTIz,size_16,color_FFFFFF,t_70)

第二分支预测一组部分亲和度的2D矢量场(L),其编码部分之间的关联度。 如下图所示,显示颈部和左肩之间的部分亲和力。

![](https://img-blog.csdnimg.cn/20190421232935425.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzM4MTA2OTIz,size_16,color_FFFFFF,t_70)

阶段三: 通过贪心推理解析置信度和亲和力图,对图像中的所有人生成2D关键点。

6 部分关键代码

POSE_PAIRS = [ ["Neck", "RShoulder"], ["Neck", "LShoulder"], ["RShoulder", "RElbow"], ["RElbow", "RWrist"], ["LShoulder", "LElbow"], ["LElbow", "LWrist"], ["Neck", "RHip"], ["RHip", "RKnee"], ["RKnee", "RAnkle"], ["Neck", "LHip"], ["LHip", "LKnee"], ["LKnee", "LAnkle"], ["Neck", "Nose"], ["Nose", "REye"], ["REye", "REar"], ["Nose", "LEye"], ["LEye", "LEar"] ] inWidth = args.width inHeight = args.height net = cv.dnn.readNetFromTensorflow("graph_opt.pb") cap = cv.VideoCapture(args.input if args.input else 0) while cv.waitKey(1) < 0: hasFrame, frame = cap.read() if not hasFrame: cv.waitKey() break frameWidth = frame.shape[1] frameHeight = frame.shape[0] net.setInput(cv.dnn.blobFromImage(frame, 1.0, (inWidth, inHeight), (127.5, 127.5, 127.5), swapRB=True, crop=False)) out = net.forward() out = out[:, :19, :, :] # MobileNet output [1, 57, -1, -1], we only need the first 19 elements assert(len(BODY_PARTS) == out.shape[1]) points = [] for i in range(len(BODY_PARTS)): # Slice heatmap of corresponging body's part. heatMap = out[0, i, :, :] # Originally, we try to find all the local maximums. To simplify a sample # we just find a global one. However only a single pose at the same time # could be detected this way. _, conf, _, point = cv.minMaxLoc(heatMap) x = (frameWidth * point[0]) / out.shape[3] y = (frameHeight * point[1]) / out.shape[2] # Add a point if it's confidence is higher than threshold. points.append((int(x), int(y)) if conf > args.thr else None) for pair in POSE_PAIRS: partFrom = pair[0] partTo = pair[1] assert(partFrom in BODY_PARTS) assert(partTo in BODY_PARTS) idFrom = BODY_PARTS[partFrom] idTo = BODY_PARTS[partTo] if points[idFrom] and points[idTo]: cv.line(frame, points[idFrom], points[idTo], (0, 255, 0), 3) cv.ellipse(frame, points[idFrom], (3, 3), 0, 0, 360, (0, 0, 255), cv.FILLED) cv.ellipse(frame, points[idTo], (3, 3), 0, 0, 360, (0, 0, 255), cv.FILLED)

7 最后

项目运行效果:

毕业设计 深度学习人体姿势姿态识别

🧿 项目分享:见文末!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/29 23:18:32

Web自动化测试

&#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快一、什么是web自动化测试自动化&#xff08;Automation&#xff09;是指机器设备、系统或过程&#xff08;生产、管理过程&#xff09;在没有人或较少人的直接参与下…

作者头像 李华
网站建设 2026/5/29 19:28:47

食品X光机:AI与双能成像如何提升异物检测精度

在食品工业范畴之内、检测精度属于衡量一台食品X光机核心价值的最为关键的指标。对于能否有效剔除产品之中微小的金属、玻璃、石子、骨头甚至高密度塑料等异物这一情况、它直接产生关联。伴随全球食品安全的严实监管以及消费者所拥有的对“零容忍”异物的期望、市场对于高精度检…

作者头像 李华
网站建设 2026/5/27 22:48:12

YouCompleteMe:让Vim成为你的智能编程伙伴

YouCompleteMe&#xff1a;让Vim成为你的智能编程伙伴 【免费下载链接】YouCompleteMe 项目地址: https://gitcode.com/gh_mirrors/you/YouCompleteMe 在当今快节奏的开发环境中&#xff0c;智能代码补全已经成为提升编程效率的关键工具。YouCompleteMe&#xff08;简称…

作者头像 李华
网站建设 2026/5/30 3:29:01

无人机巡检终极指南:CuPy GPU加速实现毫秒级图像处理完整方案

无人机巡检终极指南&#xff1a;CuPy GPU加速实现毫秒级图像处理完整方案 【免费下载链接】cupy cupy/cupy: Cupy 是一个用于 NumPy 的 Python 库&#xff0c;提供了基于 GPU 的 Python 阵列计算和深度学习库&#xff0c;可以用于机器学习&#xff0c;深度学习&#xff0c;图像…

作者头像 李华
网站建设 2026/5/22 8:09:19

38、高级模型/视图编程与应用国际化

高级模型/视图编程与应用国际化 1. 树状结构中的表格数据表示 理解树状模型比理解表格模型(或列表模型,列表模型可看作单列表格)更具挑战性。不过,在许多情况下,可以借助或修改相关代码来降低难度。 PyQt 内置的视图小部件和图形视图小部件为数据集的可视化提供了很大的…

作者头像 李华
网站建设 2026/5/29 21:36:45

Python--常量和变量

目录 1.常量和表达式 2.变量和类型 2.1变量是什么 2.2变量的语法 2.3变量的类型 2.4动态类型特性 1.常量和表达式 我们可以把Python 当成一个计算器, 来进行一些算术运算print(1 2 - 3) print(1 2 * 3) print(1 2 / 3) 注意: print 是一个 Python 内置的函数, 这个稍后…

作者头像 李华