news 2026/5/20 15:32:12

多模态大模型Grounding目标检测数据集大全 「包含Grounding数据标注+训练评估脚本」(持续原地更新)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
多模态大模型Grounding目标检测数据集大全 「包含Grounding数据标注+训练评估脚本」(持续原地更新)

一、作者介绍:七年+算法开发经验、AI 算法经理、阿里云专家博主。擅长:检测、分割、理解、大模型等算法训练与推理部署任务。

二、数据集介绍

  • 质量高:高质量图片、高质量标注数据,原始目标检测标注框使用 labelimg 软件吐血标注、整理,可以作为训练模型的基础数据集或者作为原数据集的很好补充皆可;
  • 范围广:数据集涉及目标场景范围广,避免算法收敛到某一、某些固定场景;
  • 格式内容标注:组织成 ms-swift 支持的 jsonl 形式的多模态大模型 Grounding 任务自定义数据集格式;
  • 附加训练脚本:提供 ms-swift + Qwen3-VL 一键训练、测试、可视化检测结果脚本;;

下载说明:点击数据集对应的蓝色超链接即可跳转自行下载,如还未添加蓝色超链说明该数据集还在标注中还没发布,如果其他类型的数据集可以私信联系博主。另外未来新增数据集本帖原地更新,多模态大模型 Grounding 目标检测数据集汇总篇不再另开新篇,建议收藏关注 ~

Grounding数据集标注格式 (仅示例)

目录

交通相关

恶劣天气场景车辆检测数据集

动植物相关

苹果检测数据集

更多数据集更新中

交通相关

恶劣天气场景车辆检测数据集

  • 数据集介绍:恶劣天气场景车辆检测数据集,真实场景高质量图片数据,涉及场景丰富,比如暴雨天气道路、大雾天气高速、冰雪天气路面、夜间低光照、强逆光干扰、雨雪遮挡数据等,且类别丰富,划分为 "bike"、"bus"、"car"、"motor"、"person"、"rider"、"truck" 7 个类别;
  • 适用实际项目应用:恶劣天气交通监控场景下多目标检测项目,以及作为智能驾驶辅助、道路安全预警系统数据集场景数据的补充;
  • 标注说明:原始目标框标注信息采用 labelimg 标注软件进行标注,标注质量高,然后组织成多模态大模型 Grounding 目标检测数据集格式 (参考 ms-swift 自定义 Grounding 数据集格式 jsonl),可以直接用于如 Qwen3-VL 等的多模态大模型的训练;
  • 附赠训练示例:提供 ms-swift + Qwen3-VL 一键训练、测试、可视化检测结果脚本;

数据集点击蓝色链接下载 (若想要更多数量数据集请联系博主 ~):

  • 1000 张图片:多模态大模型Grounding目标检测数据集_恶劣天气场景车辆检测数据集_1000张图_+对应ms-swift+Qwen3-VL一键训练评估脚本
  • 更多:待更新
数据集缩略图截图
labelimg标注截图

动植物相关

苹果检测数据集

  • 数据集介绍:苹果检测数据集,真实场景高质量图片数据,涉及场景丰富,比如果园成熟苹果、采摘期苹果、枝叶遮挡苹果、果实密集分布、水果店苹果数据等,划分为 "apple" 一个类别;
  • 适用实际项目应用:果园智能采摘与产量估算场景下苹果识别项目,以及作为水果分选流水线、农业机器人视觉系统数据集场景数据的补充;
  • 标注说明:原始目标框标注信息采用 labelimg 标注软件进行标注,标注质量高,然后组织成多模态大模型 Grounding 目标检测数据集格式 (参考 ms-swift 自定义 Grounding 数据集格式 jsonl),可以直接用于如 Qwen3-VL 等的多模态大模型的训练;
  • 附赠训练示例:提供 ms-swift + Qwen3-VL 一键训练、测试、可视化检测结果脚本;

数据集点击蓝色链接下载 (若想要更多数量数据集请联系博主 ~):

  • 1000 张图片:多模态大模型Grounding目标检测_苹果检测数据集_1000张图_+对应ms-swift+Qwen3-VL一键训练评估脚本
  • 3000 张图片:多模态大模型Grounding目标检测_苹果检测数据集_3000张图_+对应ms-swift+Qwen3-VL一键训练评估脚本
  • 更多:待更新
数据集缩略图截图
labelimg标注截图

更多数据集更新中

其他数据集需求私信联系博主 ~

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 15:29:21

【码上爬】 题十一:wasm小试牛刀 wasm文件处理,堆栈分析

暗号:aHR0cHM6Ly9tYXNoYW5ncGEuY29tL3Byb2JsZW0tZGV0YWlsLzExLw题目:先分析数据接口,可以看到m和ts是加密的,但是这里的ts的值应该是一个时间戳,所以主要要逆向的值是m:然后在发起程序的最上面的堆栈下一个…

作者头像 李华
网站建设 2026/5/20 15:21:06

5步掌握Input Leap:实现跨设备键盘鼠标共享的完整指南

5步掌握Input Leap:实现跨设备键盘鼠标共享的完整指南 【免费下载链接】input-leap Open-source KVM software 项目地址: https://gitcode.com/gh_mirrors/in/input-leap 在现代多设备工作环境中,频繁切换键盘鼠标不仅降低效率,还会打…

作者头像 李华
网站建设 2026/5/20 15:15:02

稚晖君同款!Clion开发STM32必备的8个效率插件(附File Watchers配置参数)

Clion开发STM32的8个效率插件实战指南 在嵌入式开发领域,效率工具的选择往往决定了项目推进的速度和质量。对于使用Clion进行STM32开发的工程师来说,一套精心挑选的插件组合能够将开发体验提升到全新高度。本文将深入探讨8款经过实战检验的效率插件&…

作者头像 李华