news 2026/7/5 9:11:22

热红外视觉下的车辆/船舶重识别新方法:Vc-fes

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
热红外视觉下的车辆/船舶重识别新方法:Vc-fes

在监控与海事安防等场景中,如何在**热红外图像**(灰度、无色彩、纹理弱)中准确识别同一辆车或同一艘船,是一个长期悬而未决的难题。近期发表于《International Journal of Machine Learning and Cybernetics》(2026年)的论文《Vc-fes: viewpoint-conditioned feature selection for vehicle re-identification in thermal vision》针对这一问题提出了一套完整的解决方案。

## 问题:热红外域重识别为什么难

传统的重识别(Re-ID)方法大多在RGB图像上训练,依赖颜色和纹理这类"跨视角通用"的线索来判断两张图片是否为同一目标。但在热红外图像中:

- 没有颜色信息,只剩灰度强度;

- 纹理细节被大幅削弱;

- 可获取的视角数量有限(不像RGB场景那样容易采集多角度样本)。

这导致同类目标(比如两艘外形相近的渔船)在缺乏颜色线索时高度相似,而同一目标从不同视角(前、侧、后)拍摄时特征差异又很大——这两个矛盾叠加,使得直接套用RGB域的重识别算法效果很差。

## 方法:视角条件化的特征选择

论文提出的核心思路是**将目标的前景图像按可见侧面(前、侧、后)拆分,分别提取特征并分空间比较**,再用各视角的"面积占比"作为置信度权重融合最终结果。整体流程分为两个子系统:

**1. 目标检测与跟踪**

基于 TraDeS 算法,针对热红外域做了适配与微调,先用转灰度的COCO数据预训练,再用新采集的热红外海事数据集及 Singapore Maritime Dataset 进行微调,使模型能够在缺乏颜色特征的情况下完成检测与跟踪。

**2. 视角条件化重识别**

- 首先用一个自建的编码器-解码器网络提取目标前景掩码(实验表明这一步比传统的 GrabCut 方法更适合热红外图像,尤其是在处理船体细小凸出部分和海面反光干扰时表现更好);

- 用预训练的 Dino-ViT 提取特征,并通过四个并行线性层将特征映射到"全局、前、侧、后"四个隐空间,每个空间用 ArcFace 损失增强类间可分性;

- 借助与 SPAN 模型类似的思路计算每个视角的**面积占比**(该视角前景掩码占总前景的比例),以此对各空间的 L2 距离加权求和,得到最终的置信度得分;

- 训练时联合使用身份分类损失和三元组损失。

这种设计的关键优势在于:当查询图像只能看到某一两个侧面时,面积占比会自动把不可见视角的权重降为零,避免了无效比较对最终结果的干扰。

## 数据集:首个公开的热红外海事重识别数据集

为验证方法,作者用 FLIR M232 热像仪自行采集了一个海事监控数据集,涵盖白天和夜晚场景,标注了船只、大型船舶、行人、水上摩托艇等4类目标的检测框,并整理出用于重识别评估的40艘小型船舶和32艘大型船舶的多视角图像子集。据作者所述,这是目前首个公开的热红外海事监控数据集,同时支持检测、跟踪与重识别三类任务的COCO格式标注。

## 结果

在跟踪任务上,改进后的 TraDeS 在热红外数据上取得了约 61.2% 的 MOTA,与其在RGB域的表现基本持平,同时保持 30fps 的处理速度,证明了域适配的有效性。

在重识别任务上,该方法在RGBNT100(热红外车辆数据集)和作者自建的海事数据集上分别以 mAP 提升 19.7% 和 12.8% 超过此前的最优方法(SPAN)。消融实验也表明:引入 ViT 特征提取、ArcFace 视角空间映射、以及多视角特征融合(相较仅用面积占比最大的单一视角)均能带来稳定的性能提升,尤其在热红外域收益最为明显。

## 链接

- 论文原文:https://link.springer.com/article/10.1007/s13042-026-03049-w

- 数据集主页:https://hevidra.github.io/

- 代码仓库:https://github.com/YasodGinige/VCFeS-Maritime-Surveillance

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/5 9:10:51

AI工程化转型指南:普通开发者如何抓住大模型应用红利

最近两年,AI领域的高薪招聘新闻层出不穷,动辄百万年薪的算法工程师、大模型研究员,让无数开发者和应届生心潮澎湃。但冷静下来看,这些新闻的主角,往往是顶尖名校的博士,或是手握顶会论文的资深研究员。一个…

作者头像 李华
网站建设 2026/7/5 9:07:23

如何为Unity游戏打造智能翻译系统:XUnity.AutoTranslator完全指南

如何为Unity游戏打造智能翻译系统:XUnity.AutoTranslator完全指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 还在为外语游戏的语言障碍而烦恼吗?XUnity.AutoTranslator为你提…

作者头像 李华
网站建设 2026/7/5 9:05:52

如何快速掌握空洞骑士模组安装?Scarab模组管理器完整指南

如何快速掌握空洞骑士模组安装?Scarab模组管理器完整指南 【免费下载链接】Scarab An installer for Hollow Knight mods written with Avalonia. 项目地址: https://gitcode.com/gh_mirrors/sc/Scarab Scarab是一款专为《空洞骑士》设计的免费模组管理器&am…

作者头像 李华
网站建设 2026/7/5 9:05:23

U盘加密故障全解析:从原理到实战解决金钻加密udef文件无法打开

1. 项目概述:当加密U盘“锁死”时,我们该怎么办?如果你也遇到过这种情况:一个存着重要资料的U盘,用“U盘超级加密3000”软件的金钻模式加密后,那个关键的.udef文件突然就打不开了,提示密码错误、…

作者头像 李华
网站建设 2026/7/5 9:03:47

HSAK社区贡献指南:从Fork到Pull Request的完整流程

HSAK社区贡献指南:从Fork到Pull Request的完整流程 【免费下载链接】hsak hsak stands for "Hybrid Storage Acceleration Kit", which is an IO software stack that provides high bandwidth and low latency for new storage media. 项目地址: https…

作者头像 李华