JVET-AL0106-平芜编程栈

📄 提案名称：

EE2-2.4: Block-Vector Guided EIP (BV-EIP)
—— 基于块向量引导的外推滤波帧内预测

提案编号：

JVET-AL0106-v2
作者单位：未明确（推测为华为或联合团队）
平台基础：ECM-16.1（VVC 实验参考软件）

一、核心思想概述

本提案在现有EIP（Extrapolation filter-based Intra Prediction）模式基础上，引入一种新的子模式：

✅BV-EIP：Block-Vector guided EIP

该方法通过一个从帧间预测中提取的“块向量”（Block Vector, BV）来指导 EIP 滤波器参数的计算区域选择，从而提升对非局部纹理和运动相关结构的建模能力。

不同于传统 EIP 仅使用当前块邻近的左上角重建像素，BV-EIP 利用历史信息中的空间偏移关系，将参考区域扩展到更远但语义相关的区域。

二、技术背景回顾：什么是 EIP？

在 VVC / ECM 架构中，EIP 是一种高级帧内预测工具，其基本流程如下：

使用一个 15-tap 的线性外推滤波器：
pred(x,y)=∑i=014ci⋅t(x−dxi,y−dyi) \text{pred}(x, y) = \sum_{i=0}^{14} c_i \cdot t(x - \text{dx}_i, y - \text{dy}_i)pred(x,y)=i=0∑14ci⋅t(x−dxi,y−dyi)
滤波器系数cic_ici由最小二乘法拟合得到
训练样本来自当前编码单元（CU）周围的已重建邻域像素
预测按对角顺序进行，确保无数据依赖

原始 EIP 的局限在于：它只利用局部邻域（上方 + 左侧），难以捕捉长距离重复纹理或仿射变换类结构。

三、BV-EIP 方法详解

🔧 改进做法：引入“块向量”指导参考区域选择

1.什么是块向量（Block Vector, BV）？

它不是运动矢量（MV），而是来自Intra Translational Motion Prediction (IntraTMP)模块中的一个中间结果。
IntraTMP 是一种用于帧内预测的快速搜索机制，尝试在当前图像中寻找与当前块相似的区域（即自相似性匹配）。
在 rough searching 阶段会生成一组候选位移向量，称为“块向量”。

👉 举例：

当前 CU 位于(x=64, y=64)
IntraTMP 发现一个高度相似的块位于(x=80, y=48)
则块向量为：BV = (16, -16)

这个向量反映了图像内部的平移对称性。

2.如何利用 BV 来改进 EIP？

提案的核心创新是：

不再使用固定的邻近区域来训练 EIP 滤波器系数，而是根据块向量BV将参考区域“偏移”到另一个位置。

具体步骤如下：

步骤	描述
(1)	判断是否启用 BV-EIP 子模式： → 编码器决定是否为当前 CU 开启 BV-EIP → 若开启，则发送标志位`bv_eip_flag = 1`
(2)	获取块向量`BV(dx, dy)`： → 直接复用 IntraTMP 粗搜索阶段的结果 → 无需额外传输 MV 或索引
(3)	定义新的参考区域： → 原始参考区域 R₀ 为中心在`(x-1, y-1)`的方形区域 → 新参考区域 R₁ = R₀ + BV，即整体平移`(dx, dy)`
(4)	在新区域 R₁ 内滑动滤波器模板，构建自相关矩阵R\mathbf{R}R和互相关向量r\mathbf{r}r → 同 CCCM 方法求解：c=R−1r\mathbf{c} = \mathbf{R}^{-1} \mathbf{r}c=R−1r
(5)	使用该组系数进行正常 EIP 预测

✅ 关键点：

滤波器形状仍为 15-tap 方形模板（square shape only）
仅作为 EIP 的一种子模式存在
不改变预测顺序或编解码流程

3. 参考区域示意图还原（Figure 3）

虽然原文中 Figure 3 未能清晰显示，但我们可根据描述准确还原其结构。

文字描述关键句：

“Figure 3 illustrates the reference area in the BV-EIP method.”

并结合上下文可知：

当前 CU 是一个正方形块（如 8×8）
传统 EIP 的参考区域是紧邻左上的一片区域（记作 A）
BV-EIP 将此区域沿块向量方向移动到另一位置（记作 B）

🖼 图 3：BV-EIP 参考区域示意图（ASCII 还原版）

+---------------------------------------------------------+ | | | Reference Picture (Same Frame) | | | | +---------------------+ | | | Area A | | | | (Original Ref) | | | | +----+ | | | | | CU | | | | | +----+ | | | +---------------------+ | | ↑ | | (-w, -h) corner | | | | ↓ BV = (+dx, -dy) | | | | +---------------------+ | | | Area B | | | | (Shifted by BV) | | | | +-|-+ | | |O| ← Current CU | | +-|-+ | +-----------------------|-+ | | | Current Coding Unit (CU) | at (x, y) +---------------------------------------------------------+ Legend: CU : Current coding unit being predicted Area A: Traditional EIP reference region near top-left Area B: Proposed BV-EIP reference region shifted by block vector BV O : Position of current CU

🔍 示例说明

假设：

当前 CU 大小为 8×8，位于(x=64, y=64)
IntraTMP 粗搜索找到最相似块位于(x=72, y=56)→ 块向量BV = (8, -8)
传统参考区域大小为 16×16，中心位于(63, 63)
则新参考区域中心变为：(63+8, 63-8) = (71, 55)

➡️ 即从(71,55)周围采集样本用于训练 EIP 滤波器系数

这相当于告诉编码器：“你不用只看我身边这些点，可以去那个长得像我的地方学怎么预测我。”

四、语法设计与编解码一致性

✅ 信令机制

引入一个新语法元素：bv_eip_flag
- 0：关闭 BV-EIP，使用标准 EIP 流程
- 1：启用 BV-EIP，后续操作基于 BV 导出参考区域
该标志与其他 EIP 子模式共存（如 merge mode）
块向量本身不需编码传输，直接取自 IntraTMP 的中间结果

✅ 解码端如何同步？

由于：

IntraTMP 在解码端也可执行（用于其他 intra 预测优化）
块向量可完全复现
滤波器形状固定为 square
移动规则公开透明

因此，解码器可以完全重建相同的参考区域 R₁，无需任何额外比特。

✅ 实现了零信令开销下的性能增益潜力

五、技术优势总结

特性	说明
突破局部性限制	利用图像自相似性，访问远距离相关区域
复用已有信息	块向量来自 IntraTMP，无需新增计算或存储
低复杂度集成	仅修改参考区域位置，其余流程不变
保持兼容性	仍是 EIP 的子模式，不影响主框架
无需新增语法	仅需一个 flag 控制开关

六、完整流程框图（文字描述）

开始 ↓ 判断当前 CU 是否适合 EIP？ ↓ 若启用 EIP： ↓ 发送 eip_mode_flag ↓ 是否使用 BV-EIP 子模式？ ↓ 是 → 发送 bv_eip_flag = 1 ↓ 从 IntraTMP 获取块向量 BV(dx, dy) ↓ 定义原始参考区域 R₀（如 16×16 邻域） ↓ 平移得到新区域 R₁ = R₀ + BV ↓ 在 R₁ 中滑动 square filter shape ↓ 构建 R 矩阵和 r 向量 ↓ 求解滤波器系数 c₀~c₁₄ ↓ 按对角顺序生成预测值 否 → 使用传统 EIP 方法（基于邻近区域） ↓ 进入残差编码阶段

七、结论

本提案提出的BV-EIP 方法是一种轻量级但富有洞察力的增强型帧内预测技术。其核心做法是：

利用 IntraTMP 中产生的块向量（Block Vector），将 EIP 滤波器的训练区域从传统的左上邻域，平移到一个语义相关的远程区域，从而更好地捕捉图像内部的重复结构与几何相似性。

关键特征包括：

✅ 仅允许方形滤波器形状（square filter shape）
✅ 参考区域由块向量引导偏移
✅ 不增加信令负担（复用已有向量）
✅ 解码端可完全同步重建

这种方法有效拓展了 EIP 的感知范围，使其从“局部外推”进化为“非局部感知 + 局部预测”，为未来 AI 驱动的相似性预测提供了良好接口。

JVET-AL0106

📄 提案名称：

提案编号：

一、核心思想概述

二、技术背景回顾：什么是 EIP？

三、BV-EIP 方法详解

🔧 改进做法：引入“块向量”指导参考区域选择

1.什么是块向量（Block Vector, BV）？

2.如何利用 BV 来改进 EIP？

具体步骤如下：

3. 参考区域示意图还原（Figure 3）

文字描述关键句：

🖼 图 3：BV-EIP 参考区域示意图（ASCII 还原版）

🔍 示例说明

四、语法设计与编解码一致性

✅ 信令机制

✅ 解码端如何同步？

五、技术优势总结

六、完整流程框图（文字描述）

七、结论

RuoYi-Cloud-Plus工作流引擎：企业级流程自动化的智能解决方案

AI训练平台性能优化完整实战指南：从瓶颈定位到架构调优

重磅部署“人工智能+” 推动一二三产业向智能化跃迁

EmotiVoice在教育类APP中实现情感化朗读功能

Java 线程池（第十篇）：（收官篇）CompletableFuture 异步编排实战 —— 多任务并行、结果汇总、超时控制与线程池协作

EmotiVoice在冥想引导音频中的舒缓语气呈现

📄 提案名称：

提案编号：

一、核心思想概述

二、技术背景回顾：什么是 EIP？

三、BV-EIP 方法详解

🔧 改进做法：引入“块向量”指导参考区域选择

1.什么是块向量（Block Vector, BV）？

2.如何利用 BV 来改进 EIP？

具体步骤如下：

3. 参考区域示意图还原（Figure 3）

文字描述关键句：

🖼 图 3：BV-EIP 参考区域示意图（ASCII 还原版）

🔍 示例说明

四、语法设计与编解码一致性

✅ 信令机制

✅ 解码端如何同步？

五、技术优势总结

六、完整流程框图（文字描述）

七、结论

RuoYi-Cloud-Plus工作流引擎：企业级流程自动化的智能解决方案

AI训练平台性能优化完整实战指南：从瓶颈定位到架构调优

重磅部署“人工智能+” 推动一二三产业向智能化跃迁​

EmotiVoice在教育类APP中实现情感化朗读功能

Java 线程池（第十篇）：（收官篇）CompletableFuture 异步编排实战 —— 多任务并行、结果汇总、超时控制与线程池协作

EmotiVoice在冥想引导音频中的舒缓语气呈现

重磅部署“人工智能+” 推动一二三产业向智能化跃迁