news 2026/6/4 9:02:00

最大规模机器人抓取训练数据集发布

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
最大规模机器人抓取训练数据集发布

为了提升仓库中执行分拣、打包等任务的机器人性能,某机构公开发布了工业产品分拣场景中采集到的最大规模图像数据集。此前最大的工业图像数据集仅包含约100种物品,而名为ARMBench的某中心数据集则涵盖了超过190,000种物品。因此,该数据集可用于训练能够更好地适应新物品和新环境的“抓取和放置”机器人。

这项研究工作将在今年春天的国际机器人与自动化会议(ICRA)上发表的论文中详细介绍。ARMBench图像采集的场景涉及一个机械臂,它需要从装满物品的箱子中抓取单个物品,并将其转移到传送带上的托盘中。物品的多样性、其摆放方式以及与机器人系统的交互,使得这项任务具有独特的挑战性。

ARMBench包含了三个独立任务的图像集:

  1. 物体分割:识别同一箱子中不同产品的边界。
  2. 物体识别:确定参考数据库中的哪个产品图像与图像中高亮显示的产品相匹配。
  3. 缺陷检测:判断机器人是否出现错误,例如一次抓取了多个物品或在转移过程中损坏了物品。

数据集中的图像分为三类:

  • 抓取图像:机器人处理前,装有物品的箱子的俯视图。
  • 转移图像:机器人将物品转移到托盘过程中,从多个视角捕获的图像。
  • 放置图像:放置了所选物品的托盘的俯视图。

物体分割数据集包含超过50,000张图像,每张图像有1到50个手动分割的物体,平均约10.5个。高度杂乱的背景,加上物品的多样性(有些甚至是透明或反光的),使其成为一个具有挑战性且独特的基准。

物体识别数据集包含超过235,000个带有标签的“抓取活动”;每个抓取活动包含一张抓取图像和三张转移图像。此外,还有超过190,000种产品的参考图像和文字描述;在物体识别任务中,模型必须学习如何将这些参考产品之一与抓取和转移图像中高亮的物体进行匹配。这项任务面临的挑战包括区分外观相似的产品、匹配不同视角下的图像,以及融合图像和文本等多模态信息以进行预测。

缺陷检测数据集包括静态图像和视频。静态图像超过19,000张,是在转移阶段捕获的,用于训练缺陷检测模型,以判断机械臂是否意外损坏了物体或一次抓取了多个物体。4,000个视频记录了导致产品损坏的抓放活动。某些类型的产品损坏最好通过视频诊断,因为它们可能发生在转移过程中的任何时刻;相比之下,多抓取错误必然发生在转移开始时,在图像中即可见。数据集还包含超过100,000次无任何缺陷的抓放活动的图像和视频。

仓库环境中对缺陷检测的严苛精度要求,推动了对图像分类、异常检测以及视频中缺陷事件检测等多项关键计算机视觉技术的探索和改进。在论文中,介绍了构建ARMBench任务模型的几种方法,并报告了模型在这些任务上的性能,以便为其他研究人员提供性能基准。

计划继续扩展ARMBench数据集中的图像和视频数量,以及它们所描绘的产品范围。希望ARMBench能有助于提升机器人的实用性,从而将仓库工作人员(例如某中心履约中心的数十万员工)从重复性任务中解放出来。同时,也希望ARMBench数据的规模、多样性及其标注质量,能够使其不仅限于训练控制仓库机器人的模型,还能用于训练其他类型的计算机视觉模型。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/4 0:01:49

开源计量计费平台Lago:重新定义基于使用量的价值定价

在数字化服务日益普及的今天,传统订阅制计费模式已难以满足产品导向型企业的需求。固定价格无法准确反映用户获得的价值,导致企业收入损失和客户不满。Lago作为开源计量和基于使用量计费平台,通过创新的技术架构和灵活的定价模型,…

作者头像 李华
网站建设 2026/6/4 0:00:08

Lago开源计费平台:5步搭建基于使用量的智能计费系统

Lago开源计费平台:5步搭建基于使用量的智能计费系统 【免费下载链接】lago Open Source Metering and Usage Based Billing 项目地址: https://gitcode.com/GitHub_Trending/la/lago 在现代SaaS服务中,传统固定定价模式已无法满足用户对公平计费的…

作者头像 李华
网站建设 2026/6/4 0:01:15

智能制造-AI质检六大场景

AI在制造业质检中应用方向,涵盖了从外观到功能、从尺寸到装配、从声音到材料等多个维度的智能检测场景, AI在这些场景的应用,提升制造业质量控制效率和精准度。六大细分场景1.外观缺陷检测 使用机器视觉技术识别产品表面的瑕疵,如划痕、变形等…

作者头像 李华
网站建设 2026/6/4 0:01:25

Bazelisk终极指南:构建工具版本管理的完整解决方案

Bazelisk终极指南:构建工具版本管理的完整解决方案 【免费下载链接】bazelisk A user-friendly launcher for Bazel. 项目地址: https://gitcode.com/gh_mirrors/ba/bazelisk 你是否曾经遇到过这样的场景?在切换不同的Bazel项目时,每个…

作者头像 李华
网站建设 2026/6/3 5:49:36

Markdown引用格式标注TensorFlow论文参考文献

Markdown引用格式标注TensorFlow论文参考文献 在深度学习研究与工程实践中,一个常见的挑战是:如何确保实验环境的可复现性,同时在撰写论文或技术报告时准确追溯所使用的技术栈?尤其是在使用像 TensorFlow 这样的复杂框架时&#x…

作者头像 李华