news 2026/4/12 22:24:52

Seedream 3.0 填充:OneReward 使下一代掩码编辑成为可能

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Seedream 3.0 填充:OneReward 使下一代掩码编辑成为可能

概述

本文提出了一个新颖的强化学习框架 OneReward,用于综合处理图像生成中的多个编辑任务。

传统的图像编辑模型通常是专门针对个别任务(如内画(填充)、外画(增强)、对象移除和文本渲染)进行训练的,由于每个任务的数据分布和评估标准不同,限制了其通用性。

此外,传统的基于人类偏好的强化学习(RLHF)需要针对每个任务和评估维度建立不同的奖励模型,这对训练效率和一致性提出了挑战。

通过使用 VLM 作为唯一的奖励模型,本研究中的 OneReward 可以实现符合人类偏好的一致评价,同时区分任务和评价标准。
这样就能将不同的任务整合到一个统一的编辑模型中,创建一个兼具效率和性能的创新框架。

此外,应用该框架开发的 Seedream 3.0 Fill 在性能上优于最先进的商业和开源模型。

建议的方法

OneReward 的核心机制是使用单一 VLM 作为奖励模型,综合处理多个任务和多维评价标准。

OneReward 将任务 ID 和评价标准嵌入评价查询中,并确定哪个 VLM 更适合输入图像对。
这种基于比较的设计允许在保留不同评价维度之间不一致性的同时进行训练。

在学习过程中,现有的扩散模型被用作参考模型,而策略模型则与部分去噪生成的图像进行比较。
在此过程中,奖励模型使用二进制 "是/否 "输出来确定哪些图像符合人类偏好,并将这一概率作为强化学习的信号。

这样,该模型就能在多任务环境中同时学习多维偏好,并实现统一的性能提升,而无需额外的特定任务 SFT(监督微调)。

实验

作者将使用 OneReward 训练的 Seedream 3.0 Fill 的性能与最先进的模型(如 Adobe Photoshop、Ideogram 和 Flux Fill [Pro])进行了比较。

评估在四个主要任务中进行:图像填充、增强(有/无提示)、对象移除和文本渲染,从多个维度进行测量,包括可用率、文本一致性、结构一致性、美学质量和移除质量。
结果表明,Seedream 3.0 填充法在所有任务中的表现都优于现有方法,特别是在图像增强(无提示)中,可用率达到 87.54%,明显优于其他模型。

此外,在物体去除方面,它的去除质量高达 86.33%,生成的不需要的物体最少。
此外,在基于人工评估的 "好-同-坏 "测试中,与基本模型相比,带有 OneReward 的模型显著提高了 "好 "决策的比例。

这些实验表明,OneReward 可以通过单一奖励模型有效地完成各种编辑任务,从而实现统一的高性能图像编辑。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 22:17:23

Java游戏之飞机大战详解,新手小白也能创造,收藏这篇就够了

小游戏制作——飞机大战 java 实现耗时四天,通过借鉴学习别人,到自己写代码。比较费头发。但最终也还是肝了出来。本来还想弄一个 菜单栏,用该改变战机和子弹,但迫于时间有限。能先写到这里了。等过段时间,我再来完善…

作者头像 李华
网站建设 2026/4/9 21:24:57

Springboot基于SpringBoot的优选超市购物系统890fg(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。

系统程序文件列表项目功能:用户,超市,商品分类,商品信息开题报告内容基于Spring Boot的优选超市购物系统开题报告一、研究背景与意义1.1 研究背景随着互联网技术的飞速发展和消费者购物习惯的变化,线上购物已成为现代生活的重要组成部分。超市作为零售业…

作者头像 李华
网站建设 2026/4/10 15:03:05

区块链 Web3 项目的费用

开发一个区块链 Web3 项目的费用跨度较大,主要取决于你是选择自建联盟链、接入第三方商业链,还是开发公有链 DApp。国内市场环境下,费用主要由基础设施、开发人力、安全审计和合规备案四部分组成。一、 基础设施与底层链成本这是项目的“底座…

作者头像 李华
网站建设 2026/4/10 5:37:49

基于springboot + vue智能农田管理系统(源码+数据库+文档)

智能农田管理 目录 基于springboot vue智能农田管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue智能农田管理系统 一、前言 博主介绍&…

作者头像 李华