news 2026/1/3 21:31:20

端到端可学习的物品分词与生成式推荐

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
端到端可学习的物品分词与生成式推荐

摘要

现有生成式推荐多采用"两阶段"范式:先离线构造语义标识(Semantic ID),再以固定标识训练生成器,导致分词器与生成器目标失配、分布不一致。ETEGRec 将 RQ-VAE 物品分词器与 T5 式生成器统一到一个端到端框架中,并引入两类推荐导向对齐(SIA、PSA),通过交替优化稳定地联动两模块学习。在 Amazon-2023 三个子集上,ETEGRec 相比传统序列模型与主流生成式基线均取得稳定提升,消融实验验证了对齐与交替优化的有效性。

1. 背景与问题定义

1.1 两阶段生成式推荐的局限

解耦训练:分词器(构造语义 ID)与生成器(自回归预测)相互独立,优化目标不一致,难以互相适配。

分布失配与模式单一:固定的 token 序列使生成器面对单一的模式,易过拟合;语义空间与偏好空间缺乏耦合。

长度偏置:不等长标识会引入预测偏好偏差,需固定长度缓解。

1.2 任务设定与符号

给定用户历史交互序列

,目标是预测下一物品

。每个物品以固定长度

的层级 token 表示:

生成式推荐将任务转化为自回归地生成下一物品的语义 ID:

2. 方法总览

image

双 Encoder–Decoder 架构:

分词器

采用 RQ-VAE,将连续语义嵌入量化为

层 token;生成器

采用 T5 式 Seq2Seq,对历史 token 进行编码并自回归生成目标 token。

两类推荐导向对齐:

SIA(Sequence-Item Alignment)对齐编码器的"下一物品语义预测"与真实物品在码本空间上的分布;

PSA(Preference-Semantic Alignment)对齐解码器的"用户总体偏好表示"与物品重构语义。

交替优化:周期性冻结/更新

的参数,稳定推进端到端联合学习。

3. 方法细节(输入→运算→输出)

3.1 物品协同嵌入来源

以已训练的 SASRec 的物品嵌入作为协同语义输入

。该

兼具协同信号与部分语义信息,是分词器

的输入。

3.2 物品分词器

:RQ-VAE

输入:

编码:

多层残差量化(码本层数

,每层大小

):

设第

层码本

,令

。逐层选择:

残差更新:

量化表示:

解码与重构:

损失:

其中

为停止梯度,

为平衡系数。

输出:层级语义 ID

、量化向量

、重构语义

直观:第 1 层捕获粗粒度语义,后续层在残差上逐层细化;固定长度

减少长度偏置。

3.3 生成式推荐器

:T5 式 Seq2Seq

输入:将历史序列中的每个物品经

token 化,得到

查表嵌入并加位置编码,得

编码器:多层自注意力与前馈后输出

解码器:以 [BOS] 起始,掩蔽自注意力保证自回归;跨注意力以

为键值(K、V)。输出隐藏态

聚合了对

的全局关注,可视为"用户总体偏好摘要"。

逐层预测:第

个解码位置对应第

层码本分类

训练目标(Teacher Forcing):

推理:固定步长

的 beam search,自回归生成

,经唯一映射反查物品。

3.4 推荐导向对齐(核心创新)

SIA:序列-物品分布对齐

汇聚得到

分别送入同一分词器,得到各层分布

,用对称 KL 对齐:

作用:迫使编码器在"码本空间"直接预测与目标物品一致的分布,避免解码器绕过编码器。

PSA:偏好-语义向量对齐

为正样本对,采用双向 InfoNCE(批内负样本):

其中

为余弦相似度,

为温度,

为 mini-batch。

作用:将"用户总体偏好"锚定到"物品语义空间",保持两空间同构。

3.5 交替优化与"损失—参数—梯度"映射

阶段 A(优化分词器,冻结生成器):

更新

及 SIA 的 MLP。

仅影响分词器;

通过

的分布与

的分布对齐,反向至码本与分词器;

拉向

的方向,更新分词器(使重构语义更贴合偏好)。

阶段 B(优化生成器,冻结分词器):

更新

及 SIA 的 MLP。

反向经解码器→编码器;

更新编码器与 MLP(使

的分布靠近

的分布);

拉向

,主要更新解码器。

收敛策略:循环数个周期,直至分词器收敛后固定,再充分训练生成器。

4. 复杂度与推理

分词器:单物品 token 化复杂度约为

生成器:序列建模主耗时为自注意力

与前馈

;逐层分类与 SIA 为

;PSA 为

为批内负样本数)。

总体量级:与 TIGER、LETTER 相当。推理阶段可预缓存语义 ID,生成步长固定为

5. 实验与结果要点

image

image

image

image

5.1 整体表现(Overall Performance)

我们在三个公共推荐基准上评估了 ETEGRec。表 3 给出了总体结果,主要观察如下:

传统序列推荐模型。 FDSA 在三个数据集上整体表现更优,主要得益于其引入了额外的文本特征嵌入。FMLP-Rec 与 SASRec、BERT4Rec 的表现大致相当,说明全 MLP 架构同样能够有效建模行为序列。

生成式推荐模型。 TIGER 与 TIGER-SAS 在三个数据集上稳定优于 CID 和 SID,即便后者采用了参数规模更大的预训练 T5。其性能差异主要来自物品分词策略的不同:SID 使用数值型 token 索引物品,缺乏语义信息;CID 基于物品共现图的启发式分词难以有效捕获物品相似性。相比之下,TIGER 与 TIGER-SAS 通过 RQ-VAE 从粗到细地学习层级文本或协同语义,更有利于推荐任务。值得注意的是,TIGER-SAS 与 TIGER 表现接近,表明协同与文本语义均对效果有重要贡献。LETTER 在多数场景下最佳,因为其有效融合了协同与文本语义信息。

我们的方法。 与所有基线相比,ETEGRec 在全部数据集上持续取得最优结果,验证了方法的有效性。我们将性能提升归因于通过面向推荐的对齐实现的物品分词器与生成式推荐器的相互增强。

SIA 使编码器在码本空间的预测与目标一致;

PSA 将解码器的偏好表示锚定到物品语义;

交替优化缓解两模块的相互干扰并稳定收敛。

5.2 消融实验(Ablation Study)

为评估 ETEGRec 中各个技术组件的影响,我们在三个数据集上进行了消融研究,四个变体的结果见表:

w/o LSIA: 去除序列—物品对齐(SIA,式(15))。该变体在各数据集上均劣于完整 ETEGRec,表明在码本空间中对齐序列表示与物品表示有助于生成式推荐。

w/o LPSA: 去除偏好—语义对齐(PSA,式(16)),同样导致性能下降,说明 PSA 损失能够增强用户偏好建模。

w/o LSIA & LPSA: 同时去除两种对齐,效果劣于只去除其中一种,进一步表明 SIA 与 PSA 均有正向贡献,且二者叠加可带来更好的性能。

w/o AT: 直接联合优化框架内所有目标,不采用交替训练策略。结果显示性能显著下降,说明在训练过程中对分词器的频繁更新会干扰推荐器的学习;采用交替训练可在保持组件协同对齐的同时实现稳定且有效的训练。

w/o ETE: 不进行端到端联合优化,而是使用 ETEGRec 最终得到的物品 token 重新训练一个生成式推荐器。结果表明,ETEGRec 的改进不仅来源于更优的物品标识符,还得益于将分词器中编码的先验知识与生成式推荐器进行一体化融合。

6. 小结

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/31 12:03:42

开发者的AI破局指南:从困境到实战,3步掌握大模型应用开发

文章指出AI技术将取代大量岗位,开发者面临转型挑战。文章分析了开发者面临的三重障碍:硬件门槛高、启动策略复杂、存在"知识陷阱"。解决方案包括:使用CPU云实例降低硬件门槛,选择RAG作为入门方向,接受系统化…

作者头像 李华
网站建设 2026/1/3 19:53:23

OpenHarmony Linux 环境 SDK 使用说明(进阶--依赖库的解决方法)

OpenHarmony Linux 环境 SDK 使用说明(进阶–依赖库的解决方法) ​ 我们在移植三方库的时候,很多库是有依赖的。面对这种情况我们应该如何处理。下面以libzip为例讲解下如何为ohos编译带依赖的库。 编译libzip 源码准备 下载最新版本的 libzip 和 xz (l…

作者头像 李华
网站建设 2025/12/25 19:29:42

深入理解Golang并发模型与CSP理论

lang 在设计上另辟蹊径,其并发哲学的核心信条是:“不要通过共享内存来通信,而要通过通信来共享内存。” (Do not communicate by sharing memory; instead, share memory by communicating.) 这一理念源自通信顺序进程(Communicat…

作者头像 李华
网站建设 2025/12/18 21:18:50

48、Linux 命令操作与格式化输出全解析

Linux 命令操作与格式化输出全解析 在 Linux 系统的操作中,有许多实用的命令和操作符,它们能帮助我们更高效地完成各种任务。下面将详细介绍测试操作符、I/O 重定向、 echo 选项与转义序列、 printf 命令以及日期时间格式化等内容。 测试操作符 测试操作符常用于 tes…

作者头像 李华
网站建设 2025/12/18 21:18:32

43、高效Shell操作技巧与实践

高效Shell操作技巧与实践 1. 数据处理与日志记录 在处理数据时,我们经常需要将合适的数据通过管道输入到 while read 循环中,并根据需要使用 printf 进行输出。例如,要打印主机名 $HOSTNAME ,后面跟一个制表符,再跟上 last 命令输出的非空行,可以使用以下命令:…

作者头像 李华