news 2026/3/30 21:51:28

监督学习训练图像聚类模型,性能大幅提升

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
监督学习训练图像聚类模型,性能大幅提升

使用监督学习训练图像聚类模型

在机器学习领域,大多数模型都依赖于监督学习,需要耗费高昂成本和时间来获取带标注的数据。无监督学习的主要方法——聚类,旨在根据显著特征将数据点分组,每个组(簇)代表一个类别,例如同一人物的照片或同一物种的动物图像。

传统的聚类算法通常依赖启发式规则来决定簇之间的边界,例如簇中心之间的阈值距离或簇的分布形状。在一篇提交给国际计算机视觉大会(ICCV)的论文中,提出了一种新方法:直接从数据中学习如何划分边界。

核心方法:分层图神经网络

该方法首先将视觉数据表示为一个,其中每个节点代表一张图像,每个节点与其在特征空间中的k个最近邻节点相连。

然后,使用一个图神经网络来生成图中节点的向量表示(节点嵌入)。与先前工作不同的是,该方法不依赖启发式规则,而是使用带标签的元训练数据来学习如何对这些向量进行聚类,并决定聚类的精细程度。

该方法的核心创新在于其分层处理方式。聚类模型基于节点嵌入预测节点之间的连接边,共享边的节点组被定义为一个簇。完成一层聚类后,将每个簇聚合成一个代表该簇的“超节点”,然后在新的超节点图上重复整个过程:构建k最近邻图,通过GNN传递,并预测超节点之间的连接边。这个过程迭代进行,直到模型不再预测出新的连接边为止。

模型训练与优势

该聚类模型基于两个目标进行训练:

  1. 准确预测节点之间的连接:正确的连接是指那些将元训练数据中同类型的两个代表(例如,同一演员的两张照片)联系起来的边。
  2. 准确预测局部数据密度:对于每个节点,模型需要预测其附近邻居中属于同类型的比例。

通过单一模型联合预测连接和密度,显著提高了计算效率。同时,由于采用了分层处理方案,模型可以优化整个输入图的聚类效果,避免了先前方法中将图分割成子图再进行处理所带来的局限性。

实验与结果

在实验中,使用两组不同的元训练数据:一组是人类面部特写,另一组是特定动物物种的图像。用训练好的面部模型在两个与训练集类别重叠极低(0%和低于2%)的数据集上进行测试;用训练好的物种模型在一个包含未见过的物种的数据集上进行测试。结果显示,与之前的基于GNN的聚类模型和无监督聚类方法相比,该方法的F分数平均提升了49%和47%。

这项正在进行的研究,正在探索训练一个更通用的聚类模型的可能性,以使其推理性能能够更好地跨不同数据类型(例如同时精确聚类人脸和动物物种)迁移。

鸣谢:Tianjun Xiao, Yongxin Wang, Yuanjun Xiong, Wei Xia, David Wipf, Zhang Zheng, Stefano Soatto
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/4 9:23:05

手势识别在零售中的应用:MediaPipe Hands案例分析

手势识别在零售中的应用:MediaPipe Hands案例分析 1. 引言:AI 手势识别与追踪的技术演进 随着人工智能和计算机视觉技术的快速发展,手势识别正逐步从实验室走向真实商业场景。尤其在零售行业,消费者行为分析、无接触交互、智能导…

作者头像 李华
网站建设 2026/3/25 6:22:47

MetaboAnalystR安装指南:7步搞定代谢组学分析环境搭建

MetaboAnalystR安装指南:7步搞定代谢组学分析环境搭建 【免费下载链接】MetaboAnalystR R package for MetaboAnalyst 项目地址: https://gitcode.com/gh_mirrors/me/MetaboAnalystR 还在为MetaboAnalystR的复杂安装过程头疼吗?作为功能强大的代谢…

作者头像 李华
网站建设 2026/3/30 20:02:23

GanttProject 3.3:企业级项目管理解决方案的5大核心优势

GanttProject 3.3:企业级项目管理解决方案的5大核心优势 【免费下载链接】ganttproject Official GanttProject repository 项目地址: https://gitcode.com/gh_mirrors/ga/ganttproject 在数字化转型加速的今天,高效的项目管理工具已成为企业竞争…

作者头像 李华
网站建设 2026/3/23 3:43:56

如何提升手势识别准确率?MediaPipe参数详解教程

如何提升手势识别准确率?MediaPipe参数详解教程 1. 引言:AI 手势识别与追踪的现实挑战 随着人机交互技术的发展,手势识别正逐步成为智能设备、虚拟现实、增强现实和智能家居等场景中的核心感知能力。传统的触摸或语音交互方式在特定环境下存…

作者头像 李华
网站建设 2026/3/29 23:18:53

S7.NET+终极实战指南:从零到精通的西门子PLC通信方案

S7.NET终极实战指南:从零到精通的西门子PLC通信方案 【免费下载链接】s7netplus S7.NET -- A .NET library to connect to Siemens Step7 devices 项目地址: https://gitcode.com/gh_mirrors/s7/s7netplus 还在为西门子PLC通信开发头疼吗?S7.NET这…

作者头像 李华