ITU-T G.722 建议书深度研究报告：宽带语音编码的架构原理、演进历程与生态影响-平芜编程栈

ITU-T G.722 建议书深度研究报告：宽带语音编码的架构原理、演进历程与生态影响

1. 引言与执行摘要

在现代电信技术的宏大叙事中，ITU-T G.722 标准占据着一个独特而不可磨灭的历史地位。作为国际电信联盟（ITU-T，当时为 CCITT）于 1988 年 11 月正式批准的第一个宽带语音编码标准，G.722 的问世标志着全球通信网络从传统的窄带语音（Narrowband Voice）向高清语音（HD Voice）迈出了决定性的第一步。在此之前，公共交换电话网络（PSTN）长期受限于 300 Hz 至 3400 Hz 的音频带宽，这种限制不仅削减了人类语音的丰富度，也严重影响了语音的可懂度和临场感。G.722 标准的推出，通过引入 7 kHz 的音频带宽和 16 kHz 的采样率，彻底打破了这一桎梏，为后来的综合业务数字网（ISDN）、IP 语音（VoIP）以及现代统一通信（UC）奠定了质量基石。

本报告旨在对 ITU-T G.722 建议书进行全方位、详尽的技术剖析与行业应用研究。报告将深入探讨 G.722 从 20 世纪 80 年代诞生至今的技术演进路径，详细解析其核心的子带自适应差分脉冲编码调制（SB-ADPCM）算法架构，包括正交镜像滤波器（QMF）的数学原理与 ADPCM 预测器的设计细节。同时，本报告将系统性地梳理该标准的多种操作模式（64、56、48 kbit/s）及其在不同历史时期的应用背景，特别是其在辅助数据传输方面的设计初衷。

此外，本研究将把视线投向 G.722 在现代通信生态系统中的生存状态。尽管 Opus、EVS 和 AMR-WB 等现代编解码器在压缩效率和带宽适应性上表现出更优越的性能，但 G.722 凭借其极低的计算复杂度（Low Complexity）、微秒级的算法延迟（Algorithmic Delay）、完全免版税（Royalty-free）的许可优势以及无处不在的硬件兼容性，依然在 DECT 无线电话、企业级 VoIP 网络和广播评论系统中扮演着不可替代的角色。通过对丢包隐藏（PLC）、立体声扩展（Annex D）及超宽带扩展（Annex B）等后续增强标准的分析，本报告将展示 G.722 如何通过持续的标准化修补来适应分组交换网络的挑战。

2. 通信带宽的演进：从窄带到宽带的历史跨越

2.1 窄带 PSTN 的局限性与 G.711 的遗产

要理解 G.722 的革命性意义，首先必须审视其前身——G.711 标准及其所服务的 PSTN 网络环境。在 G.722 诞生之前的数十年里，全球电话网络的设计基准是传输 300 Hz 到 3400 Hz 的模拟语音信号。这一频带范围虽然足以承载人类语音的主要能量和语义信息，使得基本的通话成为可能，但它无情地切除了 50 Hz 到 300 Hz 的低频基音（Fundamental Frequency）以及 3400 Hz 以上的高频谐波。

低频的缺失导致声音听起来单薄、缺乏“体量感”和温暖度；而高频的截止则严重影响了辅音的清晰度，使得听者难以区分像 /s/ 和 /f/，或者 /m/ 和 /n/ 这样的摩擦音和鼻音。G.711 编解码器（即 PCM，脉冲编码调制）正是为这种窄带信道设计的，它使用 8 kHz 的采样率，通过 A-law 或 μ-law 的对数压缩算法，将语音编码为 64 kbit/s 的比特流。虽然 G.711 简单可靠，但它在本质上锁死了语音通信的质量上限。

2.2 ISDN 的兴起与宽带需求的诞生

20 世纪 80 年代，随着综合业务数字网（ISDN）概念的提出和标准化，电信网络开始向端到端的数字化转型。ISDN 的基本速率接口（BRI）提供了两个 64 kbit/s 的 B 信道和一个 16 kbit/s 的 D 信道。这一基础设施的升级为突破 3.4 kHz 的带宽限制提供了物理层的可能性。

在这一背景下，CCITT（ITU-T 的前身）的研究组 XVII 启动了宽带音频编码的研究项目。其目标是在保持 64 kbit/s 比特率（即占用一个 ISDN B 信道）的前提下，显著提升音频的主观质量。1988 年 11 月，G.722 标准正式获得批准。它将音频带宽扩展至 50 Hz - 7000 Hz，覆盖了人类语音频通过程中的绝大部分重要特征频段，从而实现了所谓的“宽带音频”（Wideband Audio）。这一飞跃不仅让语音听起来更加自然、清晰，更大大降低了听觉疲劳，使得长时间的电话会议成为可能。

2.3 G.722 在标准体系中的定位与混淆澄清

在 ITU-T 的宽带音频编码标准家族中，G.722 是开山之作，但并非唯一。在后续的几十年中，出现了多个名称相似但技术原理截然不同的标准，这在行业内经常引起混淆。对此进行清晰的界定至关重要：

G.722 (1988):本报告的主角。基于 SB-ADPCM 技术，工作在 48、56、64 kbit/s，主要面向固定线路 ISDN 和高质量 VoIP。其特点是低延迟、低复杂度，且已免版税。
G.722.1 (1999):基于 Polycom 的 Siren7 技术，采用改进的离散余弦变换（MDCT）。它主要针对更低的比特率（24 kbit/s 和 32 kbit/s）进行优化，虽然带宽也是 7 kHz，但其算法结构与 G.722 完全不同，引入了较长的帧延迟，主要用于视频会议系统。
G.722.2 (2002):也被称为 AMR-WB（自适应多速率宽带）。它基于代数码激励线性预测（ACELP）技术，专为移动通信网络（3G/4G/5G）设计。G.722.2 能够在 6.6 kbit/s 到 23.85 kbit/s 的极低带宽下工作，且具有极高的网络适应性，但其算法复杂度高且涉及昂贵的专利许可。

因此，当我们在现代 VoIP 环境中提到“G.722”时，除非特别说明，通常指代的是 1988 年发布的原始 G.722 标准。

3. 技术架构与核心算法原理

G.722 标准之所以能够经久不衰，很大程度上归功于其精妙的算法设计。不同于现代编解码器（如 MP3, AAC, Opus）广泛采用的感知频域变换（Perceptual Transform Coding）或语音生成模型（Source-Filter Model），G.722 采用的是波形编码技术的变种——子带自适应差分脉冲编码调制（Sub-Band Adaptive Differential Pulse Code Modulation, SB-ADPCM）。这种架构在保证高质量的同时，极大地降低了运算需求和系统延迟。

3.1 总体信号处理流程

G.722 编码器的输入期望是采样率为 16 kHz、量化精度为 14 比特的线性 PCM 信号。如果输入信号是传统的 8 kHz 采样信号，则必须先进行上采样；如果输入是模拟信号，则需通过高精度的模数转换器（ADC）并在 7 kHz 处进行抗混叠滤波。

整个编码过程可以分解为三个紧密耦合的阶段：

频带分裂（Sub-band Splitting）：利用正交镜像滤波器（QMF）将全频带信号（0-8 kHz）分割为低频子带（0-4 kHz）和高频子带（4-8 kHz）。
独立 ADPCM 编码：对两个子带分别应用不同配置的 ADPCM 编码器。
多路复用（Multiplexing）：将两个子带产生的量化码字合并为最终的 64 kbit/s 串行比特流。

解码过程则是上述步骤的逆运算：解复用、ADPCM 解码、上采样及 QMF 合成。

3.2 正交镜像滤波器（QMF）的数学与工程原理

G.722 系统的核心组件是正交镜像滤波器（Quadrature Mirror Filters）。这是一种专门设计的数字滤波器组，用于在频域上将信号一分为二，并在时域上进行抽取（Decimation）。

3.2.1 滤波与下采样

在编码器端，输入信号x [ n ] x[n]x[n]（16 kHz 采样）并行通过一个低通滤波器H L ( z ) H_L(z)HL(z)和一个高通滤波器H H ( z ) H_H(z)HH(z)。

低通滤波器的截止频率为 4 kHz，保留 0-4 kHz 的低频分量。
高通滤波器的截止频率同为 4 kHz，保留 4-8 kHz 的高频分量。

经过滤波后的信号带宽减半。根据奈奎斯特采样定理，这意味着我们可以安全地将采样率降低一半而不会丢失信息。因此，G.722 对滤波后的输出进行 2:1 的下采样（Downsampling），即每两个样本中丢弃一个。这使得每个子带的实际采样率变为 8 kHz。

3.2.2 混叠消除机制

在传统的滤波器设计中，实现完美的“砖墙式”截止是不可能的，因此在 4 kHz 的交界处不可避免地会发生频谱混叠（Aliasing）。QMF 的天才之处在于其滤波器系数的设计。G.722 使用了一组 24 阶的有限脉冲响应（FIR）滤波器。这些滤波器的相位和幅度响应满足特定的镜像对称关系（H H ( z ) = H L ( − z ) H_H(z) = H_L(-z)HH(z)=HL(−z)），使得在解码器端进行上采样（Interpolation）和合成滤波时，由下采样引入的混叠分量会与合成滤波器的镜像分量精确相消。这种设计允许系统在分割和重建频带的过程中，理论上实现完美的重构（Perfect Reconstruction），仅受限于量化噪声和计算精度。

3.2.3 延迟特性

QMF 滤波器是 G.722 算法延迟的主要来源。由于采用的是 FIR 滤波器，其群延迟是恒定的。G.722 的总算法延迟（包括编码和解码滤波器的群延迟）约为1.625 毫秒（对应约 24-26 个样本）15。这一数值在音频编码领域是极低的。作为对比，基于 MDCT 的编解码器（如 AAC-LD 或 G.722.1）通常具有 20-40 毫秒的帧延迟，而 Opus 即使在低延迟模式下也通常工作在 5-10 毫秒。这种微秒级的延迟特性使得 G.722 特别适合用于对延迟极度敏感的现场直播返送（IFB）和实时双向通话。

3.3 非对称子带比特分配策略

将信号分割为两个子带后，G.722 需要将总共 64 kbit/s 的带宽资源分配给这两个子带。人类听觉系统（Psychoacoustics）的研究表明，语音信号的大部分能量和语义信息（如基音、共振峰）都集中在 4 kHz 以下的低频部分；而 4 kHz 以上的高频部分虽然能量较小，但包含着决定语音清晰度（Intelligibility）和空间感的摩擦音及瞬态信息。

基于这一声学特性，G.722 采用了一种固定的非对称比特分配策略：

子带名称	频率范围	采样率 (下采样后)	量化位数	产生比特率	信号特征与作用
低频子带 (Lower Sub-band)	0- 4 kHz	8 kHz	6 bits/sample	48 kbit/s	承载语音核心能量、基音和主要共振峰，决定音质基础。
高频子带 (Higher Sub-band)	4- 8 kHz	8 kHz	2 bits/sample	16 kbit/s	承载辅音、摩擦音、空气感，决定语音的清晰度和自然度。
总计	0 - 8 kHz	-	8 bits/sample	64 kbit/s	完整宽带音频

这种 48:16 的比例分配既保证了低频部分的量化信噪比（SNR），又以极低的代价保留了高频信息。

3.4 ADPCM 编码器的内部构造

在每个子带内部，G.722 运行着独立的 ADPCM 编码循环。ADPCM（自适应差分脉冲编码调制）的核心思想是不直接量化信号本身，而是量化“预测误差”（Prediction Error）。

3.4.1 预测器（Predictor）

G.722 的每个子带编码器都包含一个自适应预测器。预测器根据过去的重建信号样本，猜测当前的信号值。

结构：预测器采用了由 2 个极点（Poles）和 6 个零点（Zeros）组成的自适应滤波器结构。这种二阶极点、六阶零点的设计在 G.721 标准中已被验证，能够极好地跟踪语音信号的统计特性。
自适应机制：预测系数不是固定的，而是根据梯度算法（Gradient Algorithm）逐样本更新的。这意味着预测器能够快速适应信号的变化，无论是平稳的元音还是突发的爆破音。

3.4.2 自适应量化器（Adaptive Quantizer）

预测误差（即实际信号减去预测信号）被送入量化器。

低频子带：使用一个 60 电平（接近 6 比特，保留 4 个电平用于信令防止全零等情况）的量化器。
高频子带：使用一个 4 电平（2 比特）的量化器。
步长适应：量化器的步长（Step Size）也是自适应的。通过检测输出码字的能量，算法会动态膨胀或收缩量化阶距。当信号变化剧烈时（如大声喊叫），步长变大以避免过载失真（Slope Overload）；当信号微弱时（如耳语），步长变小以减少颗粒噪声（Granular Noise）11。

这种双重自适应机制（预测器自适应+量化器自适应）赋予了 SB-ADPCM 极高的动态范围和抗噪性能，使其在仅有 8 位总深度（6+2）的情况下，能够达到接近 14 位线性 PCM 的听感质量。

4. 操作模式与数据嵌入机制

G.722 标准的一个独特之处在于其内建的灵活性，允许在传输语音的同时，通过“比特借用”来传输辅助数据。标准定义了三种基本的操作模式，这在 ISDN 时代具有重要的应用价值。

4.1 模式 1：纯语音模式 (64 kbit/s)

配置：低频子带使用完整的 6 比特/样本，高频子带使用 2 比特/样本。
总速率：48 + 16 = 64 48 + 16 = 6448+16=64kbit/s。
应用：这是默认且最常用的模式。在 VoIP、DECT 和大多数现代应用中，网络带宽通常不是瓶颈，因此几乎总是运行在此模式下以获得最佳音质。

4.2 模式 2：语音+数据模式 (56 kbit/s)

配置：在低频子带的 6 比特中，最低有效位（LSB）被剥离用于传输辅助数据。
语音速率：低频子带降级为 5 比特编码，产生5 × 8000 = 40 5 \times 8000 = 405×8000=40kbit/s。加上高频的 16 kbit/s，总语音速率为 56 kbit/s。
数据速率：剥离的 LSB 提供1 × 8000 = 8 1 \times 8000 = 81×8000=8kbit/s 的辅助数据通道。
历史背景：这种模式是为了适应某些传统的 56k 数字线路（如北美的某些 T1 子信道），或者是为了在同一信道内传输带内信令信息。

4.3 模式 3：语音+高速数据模式 (48 kbit/s)

配置：低频子带的两个最低有效位被剥离。
语音速率：低频子带降级为 4 比特编码，产生 32 kbit/s。加上高频，总语音速率为 48 kbit/s。
数据速率：剥离的 2 位提供2 × 8000 = 16 2 \times 8000 = 162×8000=16kbit/s 的辅助数据通道。
应用：允许在通话的同时进行相对高速的数据传输（如传真信号或控制信令）。

当前状态分析：随着 IP 网络的普及，信令通常通过带外协议（如 SIP）传输，不再需要在语音流中“偷”比特。因此，模式 2 和模式 3 在现代 VoIP 设备中已极少使用，绝大多数 G.722 实现均锁定在模式。

5. 实施规范与工程挑战

5.1 采样率与 RTP 封装的“8000 Hz”陷阱

在将 G.722 部署到 IP 网络（VoIP）时，开发者几乎都会遇到一个著名的陷阱：RFC 3551 对 G.722 的定义。根据 IETF RFC 3551 标准，G.722 被分配了静态载荷类型。然而，在 RTP 头部的时间戳时钟频率（Clock Rate）定义中，它被标记为 8000 Hz，而非其实际的采样率 16000 Hz。

原因：这是一个历史遗留错误（Historical Error）。早期的 RTP 规范为了保持与 G.711 等窄带编解码器的兼容性，错误地沿用了 8000 的值。
后果：如果开发者严格按照 RFC 的字面意思，使用 8000 Hz 的时钟来递增 RTP 时间戳，或者在 SDP 协商中声明 a=rtpmap:9 G722/8000 并按 8000 Hz 采样，将导致严重的互操作性问题（如播放速度减慢一半，音调变低）。
正确做法：事实上，所有标准的 VoIP 协议栈（如 PJSIP, WebRTC 引擎）和硬件话机都已达成默契：尽管 SDP 中写的是 8000，但实际编码、解码和时钟递增必须按 16000 Hz 进行。这是一个“为了错误而保持错误”的典型案例，旨在维持向后兼容性。

5.2 字节序（Endianness）问题

G.722 输出的是八位组（Octets）。但在处理输入的 14 位或 16 位线性 PCM 时，必须注意字节序问题。不同的硬件平台（如传统的 Motorola 处理器与现代的 Intel/ARM 架构）对多字节整数的存储顺序不同（大端 vs. 小端）。虽然 G.722 码流本身是按字节定义的，但输入输出接口的 PCM 数据如果字节序搞反，会导致完全的噪声。ITU-T G.191 软件工具库（STL）提供了参考代码，明确了比特流的打包顺序。

5.3 硬件资源需求

G.722 的计算复杂度极低，这使其在低成本硬件上极具吸引力。

MIPS 消耗：实现全双工 G.722 仅需约 10 MIPS 的定点运算能力。相比之下，G.729 需要约 20 MIPS，而现代的 Opus 在高质量模式下可能需要 50-100 MIPS 以上（浮点运算为主）。
存储需求：仅需约 20 KB 的程序存储器（ROM）和 2-3 KB 的数据存储器（RAM）用于维护预测器状态。
这意味着即使是极低成本的微控制器（MCU）或老旧的 DSP 芯片也能轻松运行 G.722，这是其在 DECT 电话和入门级 IP 话机中普及的关键经济因素。

6. 标准的扩展与增强

为了适应分组交换网络中不可避免的丢包问题，以及用户对更高音质的追求，ITU-T 在 G.722 基础标准发布后，陆续推出了一系列重要的附录和增补。

6.1 丢包隐藏（PLC）：附录 III 与 IV

原始 G.722 设计于电路交换时代，假设信道是可靠的。在 VoIP 网络中，一旦发生丢包，解码器中的 ADPCM 预测器状态就会与编码器失去同步，导致后续恢复的语音出现严重的金属音或爆破声。

附录 III (Appendix III)：提出了一种高质量的丢包隐藏算法。当检测到丢包时，它利用上一帧的存储信息，对基音周期进行分析，并外推（Extrapolate）波形，同时逐渐衰减能量。在恢复接收后，它还会对状态进行平滑重置，以减少状态失步的影响。这种算法增加了约 2.8 WMOPS 的复杂度，但显著提升了 MOS 分数。
附录 IV (Appendix IV)：提供了一种低复杂度的 PLC 算法。它仅进行简单的波形重复和静音处理，复杂度增加微乎其微（0.07 WMOPS），适用于极其廉价的硬件。
洞察：在现代 VoIP 系统中，支持 G.722 却不支持 PLC 是不可接受的。大多数高质量实现均默认集成了附录 III 级别的算法。

6.2 超宽带扩展：Annex B

2000 年代后期，随着 G.719 等全频带编解码器的出现，ITU-T 推出了G.722 Annex B，旨在将带宽扩展至 14 kHz（超宽带，Superwideband）。

分层架构：Annex B 采用嵌入式可扩展设计。它在核心的 64 kbit/s G.722 码流之上，增加了额外的增强层，将总比特率提升至 80 kbit/s 或 96 kbit/s。
兼容性：这种设计的精妙之处在于后向兼容性。传统的 G.722 解码器可以简单地剥离增强层，仅解码核心的 64k 部分，获得标准的 7 kHz 音频；而支持 Annex B 的解码器则能利用增强层重建 14 kHz 音频。尽管技术先进，但 Annex B 在市场上的采用率并不高，因为 Opus 等新型编解码器在同等码率下提供了更好的性能。

6.3 立体声支持：Annex D

Annex D 引入了对立体声信号的编码支持，主要针对网真（Telepresence）和高端视频会议系统，利用参数立体声编码技术在较低的额外带宽下传输空间信息。

7. 比较分析：G.722 在编解码器全景图中的位置

为了精准评估 G.722 的价值，我们需要将其放置在整个语音编码技术的光谱中进行横向对比。

7.1 G.722 vs. G.711：质的飞跃

这是最常见的升级路径。

音质对比：G.722 的 MOS 分通常在 4.5 左右（宽带标尺），而 G.711 为 4.1（窄带标尺）。主观上，G.722 提供了“就像在同一个房间说话”的临场感，而 G.711 则有明显的“电话罐头音”5。
资源对比：两者均占用 64 kbit/s 带宽。这意味着在企业内网中，从 G.711 升级到 G.722不需要增加任何网络带宽。这使得 G.722 成为企业通信升级的首选。

7.2 G.722 vs. G.729：带宽与质量的权衡

G.729是一种高压缩比编解码器，仅需 8 kbit/s。它主要用于卫星链路、拥塞的广域网或 2G 网络。
对比：G.722 的码率是 G.729 的 8 倍，但音质也是碾压级的。在带宽不再是主要瓶颈的今天（光纤、4G/5G），除了极特殊的窄带环境，G.722 几乎总是优于 G.729。G.729 的有损压缩特性使其不适合传输背景音乐或进行多次转码。

7.3 G.722 vs. Opus：老兵与新贵

Opus 是 IETF 推出的一统天下的现代编解码器。

维度	ITU-T G.722	IETF Opus	深度解析
带宽	50-7000 Hz (宽带)	20-20000 Hz (全频带)	Opus 上限更高，但 G.722 已满足人声需求。
码率	固定 64 kbps	动态 6-510 kbps	Opus 可根据网络抖动动态调整，适应性更强。
延迟	< 2 ms (算法)	5 ms- 26.5 ms	G.722 在极低延迟应用（如现场返送）中仍有微弱优势。
抗丢包	需配合 PLC，一般	内置极强的 FEC/PLC	Opus 在公网（Internet）传输中表现远超 G.722。
主要优势	硬件通用性，低计算量	音质，网络适应性	G.722 是存量设备之王，Opus 是未来之王。

8. 生态系统与关键应用场景

8.1 企业级 VoIP 与统一通信

G.722 是企业内网（LAN）事实上的高清语音标准。

硬件支持：Cisco, Poly, Yealink, Grandstream 等主流 IP 话机厂商均默认开启 G.722。
部署策略：典型的企业配置是“内网 G.722，外网 G.711”。当两个分机在同一办公楼通话时，协商使用 G.722；当呼叫 PSTN 外部号码时，网关将其转码为 G.711。这种策略最大化了内部沟通体验。

8.2 DECT 无线通信与 CAT-iq 标准

在家庭和办公无线电话领域，G.722 统治着高清市场。

CAT-iq (Cordless Advanced Technology - internet and quality)：这是 DECT 论坛推出的新一代无绳电话标准。CAT-iq 强制要求支持宽带语音，而 G.722 被选定为强制必选的编解码器。
功耗优势：DECT 手柄由电池供电，对功耗极度敏感。G.722 的低运算量意味着芯片可以运行在较低的频率下，从而延长电池寿命。这是 Opus 难以在低端 DECT 芯片上普及的原因之一。

8.3 广播评论与内容回传

在 IP 编解码器（如 Comrex Access, Tieline）普及之前，ISDN 是广播行业的生命线。

ISDN 绑定：体育评论员在现场使用 G.722 编解码器，通过一条 ISDN 线路将 7 kHz 的高质量解说传回电台总控。这比传统的 3.4 kHz 电话连线听起来专业得多，被称为“评论员级音频”（Commentary Grade Audio）1。
Turbo G.722：广播设备厂商 Comrex 开发了专有的“Turbo”模式，通过绑定两条 ISDN B 信道（128 kbps）来传输接近 15 kHz 的频响，但其核心技术仍源自 G.722 的子带编码思想。

8.4 WebRTC 与浏览器支持

尽管 WebRTC 标准强制要求支持 Opus 和 G.711，但 G.722 作为一个可选但广泛支持的编解码器，存在于 Chrome、Firefox、Safari 和 Edge 中。它在 WebRTC 客户端与传统 SIP 系统互通（SIP over WebSocket）时发挥着至关重要的桥梁作用，避免了服务器端的昂贵转码。

8.5 语音 AI 与自动识别 (ASR)

随着语音助手的兴起，G.722 找到了新的用途。相比于 G.711 或 G.729，G.722 提供的 7 kHz 频谱保留了更多的辅音特征。研究表明，使用 G.722 编码的语音作为 ASR 引擎的输入，其词错率（WER）显著低于窄带编码。这使得 G.722 成为智能客服中心（Contact Center AI）的首选接入格式。

9. 知识产权 (IPR) 与许可状态

G.722 标准之所以能在开源社区和低成本硬件中广泛普及，其知识产权状态起到了决定性作用。

专利过期：G.722 的核心专利主要由 Polycom（现 HP Poly）等公司持有，这些专利均已在多年前过期。
免版税 (Royalty-Free)：目前，G.722 被公认为是一个免版税的标准。任何厂商、开发者均可自由实现、分发和使用 G.722 编解码器，而无需向任何专利池支付费用。
对比：这一点与 G.729（曾长期收费，现已过期但法律风险一度很高）和 AMR-WB/G.722.2（至今仍需向 VoiceAge 等支付高昂许可费）形成了鲜明对比。免版税特性使得 G.722 成为 Asterisk, FreeSWITCH 等开源软交换平台的默认宽带配置。

10. 结论与未来展望

回顾过去三十余年，ITU-T G.722 标准无疑是电信工程领域的一座丰碑。它在 DSP 计算能力尚显匮乏的 80 年代，通过精妙的子带滤波和自适应量化设计，成功地将语音通信带入了宽带时代。它不仅定义了“高清语音”的标准，更通过其低延迟、低复杂度的特性，经受住了时间的考验。

展望未来，尽管 Opus 等基于变换编码和深度学习的新一代编解码器在公网传输、抗丢包和超高音质方面表现出更强的统治力，G.722 并不会迅速退出历史舞台。它将继续作为：

硬件兼容性的基石：全球数以亿计的存量 IP 话机和网关支持 G.722，这是任何新标准无法在短期内替代的。
低功耗设备的优选：在 DECT 和物联网语音设备中，其低算力需求依然极具吸引力。
内网通信的标配：在带宽充裕的企业内网，G.722 依然是实现零成本音质升级的最佳方案。

综上所述，G.722 已经从一个前沿的技术标准，沉淀为现代通信基础设施中不可或缺的底层协议，继续支撑着全球每天数以亿分钟的高清通话。

引用的著作

G.722 - Wikipedia, 访问时间为十二月 13, 2025， https://en.wikipedia.org/wiki/G.722
G.722 Wideband Audio Codec Overview | PDF | Telecommunications Standards - Scribd, 访问时间为十二月 13, 2025， https://www.scribd.com/document/334909973/Document-16
G.722 - Grokipedia, 访问时间为十二月 13, 2025， https://grokipedia.com/page/G.722
G.722 (09/2012) - ITU-T Recommendation database, 访问时间为十二月 13, 2025， https://www.itu.int/ITU-T/recommendations/rec.aspx?rec=11673
G.722 - Snom Service Hub, 访问时间为十二月 13, 2025， https://service.snom.com/display/wiki/G.722
The wonderful world of voice codecs - TeleDynamics Think Tank, 访问时间为十二月 13, 2025， https://info.teledynamics.com/blog/the-wonderful-world-of-voice-codecs
Comparison of G.711 and G.722 CODECs | AtlasIED, 访问时间为十二月 13, 2025， https://www.atlasied.com/transportation-resources/article/360000653386-Comparison-of-G-711-and-G-722-CODECs
Voice Codecs - GL Communications, 访问时间为十二月 13, 2025， https://www.gl.com/voice-codecs.html
g722 codec - Ozeki VoIP SIP SDK, 访问时间为十二月 13, 2025， https://voip-sip-sdk.com/p_7215-g722-codec.html
4 VoIP Codecs to Try If G.711 Won’t Give You Clear Calls - TechRepublic, 访问时间为十二月 13, 2025， https://www.techrepublic.com/article/voip-codecs/
G.722 on µPD7701x - Renesas, 访问时间为十二月 13, 2025， https://www.renesas.com/en/document/apn/g722-upd7701x
ITU-T Rec. G.722 (11/88) 7 kHz audio-coding within 64 kbit/s, 访问时间为十二月 13, 2025， https://www.itu.int/rec/dologin_pub.asp?lang=f&id=T-REC-G.722-198811-S!!PDF-E&type=items
Technical Explanation of the Comrex Turbo G.722 Encoding Algorithm, 访问时间为十二月 13, 2025， https://www.comrex.com/support/access-2usb/technical-explanation-of-the-comrex-turbo-g-722-encoding-algorithm/
G.722-Wideband Speech Coding | PDF | Information Age | Electrical Engineering - Scribd, 访问时间为十二月 13, 2025， https://www.scribd.com/presentation/527385740/G-722
G.722 Codec Technical Specifications - CodecPro, 访问时间为十二月 13, 2025， https://codecpro.com/codecs/codec_specifications/2/G722
G.722 (1988) App. III (11/2006) - ITU-T Recommendation database, 访问时间为十二月 13, 2025， https://www.itu.int/ITU-T/recommendations/rec.aspx?rec=9052&lang=en
A High-Quality Speech and Audio Codec With Less Than 10-ms Delay - ResearchGate, 访问时间为十二月 13, 2025， https://www.researchgate.net/publication/224446105_A_High-Quality_Speech_and_Audio_Codec_With_Less_Than_10-ms_Delay
A High-Quality Speech and Audio Codec With Less Than 10 ms Delay - arXiv, 访问时间为十二月 13, 2025， https://arxiv.org/pdf/1602.05526
G.722: a new CCITT coding standard for digital transmission of wideband audio signals, 访问时间为十二月 13, 2025， https://ptacts.uspto.gov/ptacts/public-informations/petitions/1459001/download-documents?artifactId=goqW_lHtnE-84iW8pPeTNBW015CW-3bMoklsyNDizLQoYBqBjcfPQWs
G.722 Wideband Audio Codec Support Across TDM and VoIP Platforms - GL Press Release, 访问时间为十二月 13, 2025， https://www.gl.com/press-release/g722-wideband-audio-codec-support-across-tdm-voip-platforms-press-release.html
VoIP codec list: bandwidth, quality, and licensing - Telnyx, 访问时间为十二月 13, 2025， https://telnyx.com/resources/voip-codec-list
The Best Voice Codecs for VoIP: Delivering High-Quality Audio in 2025 - Speechpath, 访问时间为十二月 13, 2025， https://speechpath.ie/best-voip-codecs-2025/
New stack part 1 - Opus: the killer codec - Simwood, 访问时间为十二月 13, 2025， https://simwood.com/2017/02/opus/
RingCentral HD Voice Overview, 访问时间为十二月 13, 2025， https://support.ringcentral.com/article-v2/HD-Voice-Overview.html?brand=RC_US&product=RingEX&language=en_US
Codec recommendations and G722 - General - VoIP.ms Community Forum, 访问时间为十二月 13, 2025， https://community.voip.ms/t/codec-recommendations-and-g722/352
Codecs used by WebRTC - Media - MDN Web Docs - Mozilla, 访问时间为十二月 13, 2025， https://developer.mozilla.org/en-US/docs/Web/Media/Guides/Formats/WebRTC_codecs
How Opus and G.722 codecs turbocharge AI interactions - Telnyx, 访问时间为十二月 13, 2025， https://telnyx.com/resources/voice-ai-hd-codecs
Wideband codecs and IPR - Wirevolution.com, 访问时间为十二月 13, 2025， https://wirevolution.com/2008/12/04/wideband-codecs-and-ipr/
Products Overview - VoiceAge, 访问时间为十二月 13, 2025， https://voiceage.com/Overview-lic.html