news 2026/6/7 17:06:52

ISP模式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ISP模式

H.266 / VVC中,ISP 模式指的是:

ISP = Intra Sub-Partitioning(帧内子分区预测)

它是VVC 相比 HEVC 新增的一项重要帧内预测工具,目标是:
👉提升细长 CU、强方向纹理区域的帧内预测精度


一句话先抓重点 🧠

ISP 的核心思想:
不是“一个 CU 用一个预测”,
而是“一个 CU 沿方向切成多块,每块单独做帧内预测”。


一、ISP 在解决什么问题?

在 HEVC / 传统帧内预测里:

  • 一个 CU(如 8×16、4×16)

  • 整块只选一个 Intra Mode

  • 对于:

    • 竖直条纹
    • 横向边缘
    • 强方向纹理

👉预测不够贴合


二、ISP 的基本做法

1️⃣ 适用对象

  • 帧内 CU

  • 通常是非方形、细长 CU

  • 如:

    • 4×16
    • 8×32
    • 16×4

2️⃣ 分区方式(重点)

ISP 只做一维切分,而且方向与预测方向一致

ISP 类型子分区方式
ISP-H沿水平方向切(多条横条)
ISP-V沿垂直方向切(多条竖条)

示意(ISP-V):

+----+----+----+ | | | | | | | | | | | | +----+----+----+

3️⃣ 每个子分区怎么处理?

每一个子分区

  • 使用同一个 Intra Mode

  • 但:

    • 独立生成预测
    • 独立做残差、变换、量化
  • 参考像素:

    • 左 / 上边界
    • 以及前一个已重建的子分区

👉 子分区有因果顺序


三、ISP 的 RD 优势来源(为什么有效)

ISP 提升 RD 的原因主要有 3 点:

✅ 1️⃣ 缩短预测距离

  • 每个子分区只预测一小条
  • 插值误差明显下降

✅ 2️⃣ 更好贴合方向纹理

  • 特别适合:

    • 垂直结构 → ISP-V
    • 水平结构 → ISP-H

✅ 3️⃣ 残差能量更集中

  • 残差更“尖”
  • 变换效率更高

四、ISP 的代价(为什么复杂)

⚠️ 编码复杂度高

  • 同一个 CU:

    • 普通 Intra
    • ISP-H
    • ISP-V
      → 都要试 RD

⚠️ 解码复杂度增加

  • 顺序重建
  • 依赖前子分区像素

⚠️ 实现复杂

  • 参考样本管理更复杂
  • 管线不好做并行

五、ISP 与其他 Intra 工具的关系(工程里很关键)

ISP vs MIP

ISPMIP
思想子分区模型预测
擅长强方向纹理低频/平滑
是否可共存❌ 同一 CU 不能同时用

👉ISP 和 MIP 互斥


ISP vs Intra 多方向模式

  • ISP不是新方向
  • 是对已有方向预测的结构增强

六、在 VTM / ECM

常见规律(经验):

  • 16x4→ ISP-H 命中率高
  • 4x16 / 8x16→ ISP-V 命中率高
  • 大方块(32×32) → 很少选 ISP

七、标准层面的位置

  • ISP 定义在VVC 帧内预测工具集

  • 编码器可选工具(非强制)

  • 通过 flag 信令:

    • 是否启用 ISP
    • ISP-H / ISP-V

八、一句工程总结(给做编码的人)

ISP 本质是:
用“空间顺序 + 局部预测”
换取“RD 增益”,
代价是“复杂度 + 实现难度”。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/2 16:24:40

Qwen3-VL-4B Pro效果展示:建筑设计图楼层识别+房间功能推断+面积估算

Qwen3-VL-4B Pro效果展示:建筑设计图楼层识别房间功能推断面积估算 1. 这不是“看图说话”,而是建筑图纸的智能解读员 你有没有遇到过这样的情况:手头有一张扫描版的CAD打印图或PDF转成的JPG平面图,想快速知道这是几层楼、每个区…

作者头像 李华
网站建设 2026/5/31 0:04:22

Node-RED延时控制实战:delay与trigger的智能家居应用对比

1. 从零认识Node-RED延时控制 刚接触Node-RED时,我最困惑的就是delay和trigger这两个节点的区别。它们看起来都能实现延时功能,但实际用起来却大不相同。记得第一次做智能灯光控制时,我用delay节点设置了一个5秒关灯的延时,结果发…

作者头像 李华
网站建设 2026/5/24 4:10:35

AcousticSense AI生产环境:高并发音频流实时解析架构设计

AcousticSense AI生产环境:高并发音频流实时解析架构设计 1. 为什么传统音频分类在生产环境总是“卡壳”? 你有没有遇到过这样的场景:一个音乐平台想为新上传的十万首歌自动打上流派标签,结果跑了一整晚只处理了三千条&#xff…

作者头像 李华
网站建设 2026/6/4 4:09:17

VibeVoice Pro语音合成案例:盲文阅读器语音输出无障碍适配

VibeVoice Pro语音合成案例:盲文阅读器语音输出无障碍适配 1. 为什么盲文阅读器需要“会呼吸”的语音引擎? 你有没有想过,当视障用户指尖划过凸点文字时,他们真正等待的不是“一段播完的音频”,而是声音与触觉同步发…

作者头像 李华
网站建设 2026/5/22 4:59:18

Multisim14.0与NI Ultiboard接口配置手把手教程

以下是对您提供的博文内容进行 深度润色与结构重构后的技术文章 。整体风格已全面转向 真实工程师视角下的经验分享体 ,摒弃模板化表达、AI腔调和教科书式罗列,代之以 逻辑递进自然、语言简洁有力、细节扎实可信、教学感强且具实战温度 的技术叙事。全文严格遵循您的所…

作者头像 李华