news 2026/5/23 13:54:58

【论文自动阅读】CLARE:通过自主适配器路由与扩展实现VLA模型的持续学习

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【论文自动阅读】CLARE:通过自主适配器路由与扩展实现VLA模型的持续学习

快速了解部分

基础信息(英文):

1.题目: CLARE: Continual Learning for Vision-Language-Action Models via Autonomous Adapter Routing and Expansion
2.时间: 2026.01
3.机构: Technical University of Munich (TUM), Robotics Institute Germany
4.3个英文关键词: Continual Learning, Vision-Language-Action Models (VLA), Parameter-Efficient Fine-Tuning

1句话通俗总结本文干了什么事情

本文提出了一种名为CLARE的框架,让机器人能在不遗忘旧技能的前提下,通过自主添加微小的新模块来持续学习新任务,且不需要存储旧数据或依赖任务标签。

研究痛点:现有研究不足 / 要解决的具体问题

现有的视觉-语言-动作模型(VLA)在通过微调适应新任务时,容易发生“灾难性遗忘”(即学会新技能就忘了旧技能);现有的持续学习方法通常需要存储大量旧数据(回放)或依赖任务标识符(Oracle),这在真实机器人的长期运行中既不现实也不高效。

核心方法:关键技术、模型或研究设计(简要)

提出CLARE框架,通过在预训练VLA模型的特定层中插入轻量级的“适配器”(Adapters),并利用自动编码器判别器根据特征相似性自主决定何时扩展新模块以及推理时路由激活哪个模块。

深入了解部分

相比前人创新在哪里

  1. 完全自主:无需任务标识符(Task-ID)即可在推理时自动路由;2.无范例(Exemplar-free):不需要存储旧数据即可避免遗忘;3.动态扩展:仅在特征统计显示任务具有显著新颖性时才扩展参数,参数增长极低(约2%每任务)。

解决方法/算法的通俗解释

想象机器人的大脑是一个预训练好的通用模型。CLARE给这个大脑装上了“可插拔的技能卡”(适配器)。当遇到新任务时,它会先检查现有的“技能卡”是否适用(通过特征相似度判断),如果不适用就插一张新的。在工作时,它会自动扫描环境,找到最匹配的那张“技能卡”来使用,从而既学会了新东西,又没丢掉老本事。

解决方法的具体做法

  1. 模块化适配器:在Transformer的Feed-Forward层插入轻量级适配器,训练时仅更新适配器参数,冻结主干。
  2. 自主路由:为每个适配器配对一个自动编码器判别器,推理时激活重构误差最小(即特征最匹配)的适配器。
  3. 动态扩展策略:计算新任务特征与现有判别器的z-score,若高于阈值则新增适配器-判别器对,否则复用现有适配器。

基于前人的哪些方法

基于Vision-Language-Action (VLA) 模型(如基于Diffusion/Flow Matching的策略)、混合专家系统(Mixture-of-Experts, MoE)的思想、以及参数高效微调技术(如LoRA)。

实验设置、数据、评估方式、结论

  1. 数据:基于LIBERO benchmark(LIBERO-90预训练,LIBERO-10持续学习测试)。
  2. 设置:Franka机械臂在厨房环境执行10个连续长视野任务(如开抽屉、放物品等)。
  3. 评估指标:AUC(总体成功率)、FWT(新任务学习能力)、NBT(遗忘程度,越低越好)。
  4. 结论:CLARE在AUC和NBT指标上显著优于SeqFFT、SeqLoRA、PackNet、ER和LOTUS等基线方法,实现了高新任务性能且无灾难性遗忘。

提到的同类工作

  1. LOTUS:基于技能库和回放的方法;
  2. SDP (Sparse Diffusion Policy):需要任务标识符的手动路由扩散策略;
  3. EWC/PackNet:基于正则化或剪枝的持续学习方法;
  4. ER (Experience Replay):基于存储旧数据回放的方法。

和本文相关性最高的3个文献

  1. LOTUS: Continual imitation learning for robot manipulation through unsupervised skill discovery.
  2. PackNet: Adding a new chapter to a convolutional neural network for incremental learning.
  3. LoRA: Low-rank adaptation of large language models.

我的

研究持续学习的工作,在加上新任务训练时,也不让vla遗忘旧任务,而且参数增长量也较小。但是VLA选择的是DiT结构。而且无真机验证。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/19 18:17:10

SpringBoot插件化开发模式,真香!

01前言1.1 使用插件的好处1.1.1 模块解耦实现服务模块之间解耦的方式有很多,但是插件来说,其解耦的程度似乎更高,而且更灵活,可定制化、个性化更好。举例来说,代码中可以使用设计模式来选择使用哪种方式发送短信给下单…

作者头像 李华
网站建设 2026/5/20 23:37:02

一番赏抽赏小程序核心玩法拆解与技术运营分析

在潮玩赛道规模突破500亿元的背景下,一番赏抽赏小程序凭借“梯度稀缺性强仪式感”的核心优势,区别于普通盲盒,成为IP衍生品数字化变现的核心载体。其玩法设计紧扣“技术赋能公平性、运营驱动高粘性”,融合梯度赏级、社交裂变与合规…

作者头像 李华
网站建设 2026/5/20 14:44:44

当AI研究《消费者心理学》后,它开始预测客户离婚率

家人们,现在这AI的发展真是越来越让人摸不着头脑了!你能想象吗?当AI深入研究《消费者心理学》后,居然干起了预测客户离婚率的事儿,这背后到底藏着啥玄机?今天咱就来好好唠唠。 冲突:AI跨界预测…

作者头像 李华
网站建设 2026/5/20 16:09:02

毅硕HPC | OpenPBS构建高效稳定的HPC作业调度环境

当您的研发团队拥有数百个计算节点,却因为缺乏合理的资源分配导致任务排队混乱、高优先级作业被阻塞,甚至因为节点过载导致系统宕机——这不仅是硬件资源的浪费,更是科研进度的停滞。OpenPBS作为业界领先的开源调度器,正是为了解决…

作者头像 李华
网站建设 2026/5/20 17:15:23

渝黔分界处,藏着重庆的绿野仙踪

黑山谷景区位于重庆市万盛经济技术开发区黑山镇,是国家5A级旅游景区。景区全长约13公里,山顶与谷底最大高差达1200米,完整保存了同纬度地区罕见的亚热带和温带自然生态。这里集峻岭、峰林、幽峡、飞瀑、溶洞、森林于一体,素有“渝…

作者头像 李华
网站建设 2026/5/22 1:45:03

MyEMS开源能源管理系统助力纸浆制造行业生产

各位读者,大家好!我今天要为大家介绍的是MyEMS开源能源管理系统。当下,纸浆制造行业面临着能源管理方面的诸多挑战,如能耗高、碳排放压力大等问题,急需有效的解决方案。 MyEMS开源能源管理系统正是为助力纸浆制造行业…

作者头像 李华