几何量子机器学习：利用对称性与自适应测量实现小样本条形码分类-平芜编程栈

1. 项目概述：当量子几何遇上条形码分类

在机器学习的浩瀚海洋里，我们总在寻找那把能更精准、更高效地切开数据迷雾的“新刀”。近年来，量子机器学习（QML）无疑是最具颠覆性的候选者之一。它不再满足于经典比特的0与1，转而利用量子比特的叠加与纠缠，试图在指数级庞大的希尔伯特空间中，为数据找到更本质的表达。而我最近深度参与的一个项目，正是站在这个交叉路口的一次有趣尝试：我们探究了几何量子机器学习（GQML）在条形码相似性测试这一具体任务上，是否真能带来实质性的优势。

简单来说，我们的任务是这样的：给你成千上万对由黑白像素组成的“条形码”图像（想象一下超市商品上的条码，但更抽象，是纯粹的二进制图案）。每一对条形码，要么来自一个高度相关的分布（比如，第二张图是第一张图经过某种全局变换的结果），要么就是完全独立、不相关的。我们的目标，是训练一个模型，让它能准确判断任意给定的一对条形码是“相关”还是“不相关”。这听起来像是一个经典的图像相似度比对问题，但难点在于，这种“相关性”并非局部的像素匹配，而是隐藏在数据分布深处的、全局性的统计关联。经典方法，尤其是依赖局部特征提取的模型，在这里很容易“抓瞎”。

我们工作的核心，是将对称性这一强有力的数学工具，系统地注入到量子机器学习模型中，这就是GQML的精髓。传统QML模型设计多少有些“黑箱”和试错的味道，而GQML通过约束模型结构使其与问题的内在对称性（例如，交换两个条形码的顺序不应改变判断结果）保持一致，相当于给模型戴上了“物理学家的眼镜”，让它能更直接地“看到”数据中真正重要的模式，而非去拟合噪声。我们对比了两种GQML架构：一种是基于参数化量子电路的变分模型（QNNU），另一种是我们重点发展的、基于对称性自适应测量的模型（QNNM）。同时，我们以经典的孪生神经网络（包括深度神经网络DNN和卷积神经网络CNN）作为基准。

结果令人振奋：在处理由特定相关分布生成的、规模达到1024像素（对应20个量子比特编码）的条形码对时，我们的QNNM模型仅需每个类别3个样本（总计6个训练样本）进行训练，就能在测试集上达到接近完美的分类准确率。而经典的DNN和CNN模型，即使训练精度能达到100%，其测试精度却始终在随机猜测水平（约50%）附近徘徊，表现出严重的过拟合。这意味着，对于这类依赖全局相关性的模式识别问题，具备对称性先验知识的量子模型，展现出了极其强大的从小样本中泛化的能力。这不仅仅是速度的提升，更是一种学习范式的优势——量子系统因其高维特性，能更自然地表达和捕捉经典数据中难以显式描述的复杂关联结构。

2. 核心思路：为什么对称性与自适应测量是关键

要理解我们工作的创新点，需要先拆解两个核心概念：几何量子机器学习（GQML）的对称性约束，以及从“训练幺正”到“训练测量”的范式转变。这不仅是技术路线的选择，更决定了模型能否触及问题的本质。

2.1 对称性：从数据先验到模型骨架

任何好的机器学习模型都应该尊重数据的固有结构。在我们的条形码相似性测试问题中，存在两种明显的对称性：

交换对称性：一对条形码(x1, x2)的标签，与它们的顺序(x2, x1)无关。判断它们是相关还是不相关，不应依赖于谁在前谁在后。
比特重映射对称性：对于每个条形码（一个二进制串），将其所有比特取反（0变1，1变0），其所属的“相关对”或“不相关对”的类别应当保持不变。这是因为我们关心的“相关性”是一种全局统计属性，而非具体的比特模式。

在经典机器学习中，我们可能会通过数据增强（如随机交换样本对、随机翻转像素）来让模型隐式地学习这些不变性。但在GQML中，我们可以做得更彻底、更优雅。我们将这些对称性用群论的语言形式化（例如，交换对称性对应Z2群，比特翻转对应特定的布尔电路变换群SΦ），然后将这些对称性直接编码到量子模型的每一个组件中：

初始态：选择在对称变换下不变的量子态作为起点。
特征映射：设计量子编码电路，使得对输入数据施加对称变换，等价于对编码后的量子态施加一个特定的酉变换。
模型电路（或测量算符）：要求所有可训练的参数化量子门（对于QNNU）或我们选择的测量观测量集合（对于QNNM），都与对称变换的表示对易。这意味着，无论输入数据如何被对称变换“扭曲”，模型内部的处理流程在对称性上是“齐次”的。
测量观测量：最终读取信息的算符本身也必须是对称不变的。

这样做的好处是巨大的归纳偏置。模型不需要从海量数据中费力地总结出“顺序不重要”这个规则，而是从一开始就被架构限制，根本不可能学到违反对称性的函数。这极大地缩小了假设空间，让模型能够集中有限的参数和训练数据，去学习那些在对称性约束下仍然存在的、真正用于区分的特征——也就是我们想要的“全局相关性”。

2.2 自适应测量：绕过“ barren plateaus”的捷径

传统的变分量子算法（VQA）或QNNU思路，其核心是训练一个参数化的量子电路W(θ)。优化过程通过调整θ来最小化损失函数，期望最终的电路能实现我们想要的分类功能。然而，这条路在实践中有个著名的“拦路虎”：** barren plateaus（贫瘠高原）**。随着系统规模（量子比特数）增大，损失函数的梯度会指数级地趋近于零，使得优化过程陷入停滞，模型根本无法有效训练。

我们的QNNM方案采取了一条截然不同的路径。我们不再费力地去优化一个复杂的、高维的酉变换电路，而是固定一个简单、高效的数据编码过程，然后将所有的“智能”转移到测量端。具体步骤如下：

对称性编码：使用一个固定的、满足对称性要求的量子电路U_φ(x)，将一对条形码x = (x1, x2)编码成一个多量子比特态|φ_x〉。这个编码过程是确定性的，没有可调参数。
构造特征向量：在编码后的态|φ_x〉上，测量一组精心挑选的、满足对称性要求的物理观测量{O1, O2, ..., OK}（例如，全局磁化强度、两体关联算符、交换算符等）。每个观测量会给出一个期望值〈φ_x| O_k |φ_x〉。对于每一个输入样本x，我们得到一个K维的经典特征向量φ(x) = [〈O1〉, 〈O2〉, ..., 〈OK〉]。
经典线性模型：我们建立一个简单的线性模型h(x) = α · φ(x)，其中α是一个K维的权重向量。训练过程就是在经典的计算机上，通过优化算法（我们使用了LASSO）来学习这个权重向量α，使得模型的输出h(x)能够最好地拟合样本标签y（相关为0，不相关为1）。

这个方案的巧妙之处在于：

将困难问题分解：将“在量子态空间中找到复杂决策边界”这个难题，分解为“用量子计算机高效生成一组丰富的特征”和“用经典线性模型学习这些特征的线性组合”两个相对简单的子问题。
规避训练难题：由于编码电路是固定的，且测量是线性的，我们完全避开了训练深层变分量子电路时常见的梯度消失和收敛困难问题。
可解释性：学习到的权重α直接告诉我们哪些物理观测量（即哪些类型的量子关联）对于区分两类数据是最重要的。例如，如果SWAP算符（交换两个子系统）的权重很大，那就意味着两类数据在“纠缠”或“互关联”特性上有显著差异。
与理论优势衔接：正如我们在论文中分析所指出的，对于我们所研究的、源于“forrelation”问题的特定数据分布，最优的决策边界恰好可以表示为某几个特定观测量（如SWAP算符与全局哈达玛门的组合）的线性组合。QNNM框架天然具备学习和表达这种线性组合的能力，而QNNU框架下的变分电路可能根本无法用有限深度和参数有效地逼近这个特定的算符。

注意：这里存在一个关键的认知转变。我们不是在训练一个“量子神经网络”去做复杂的非线性变换，而是在利用量子系统作为一个强大的特征提取器。量子力学的威力体现在它能够以指数级压缩的方式，计算出经典计算难以高效获取的、高阶的关联特征。而学习的部分，则交给了成熟、稳定的经典优化算法。这种“量子-经典混合”的思路，在实践中往往更可靠、更易实现。

3. 量子优势的根源：与计算复杂性理论的深刻联系

我们的工作不仅仅是展示了一个性能更好的模型，更重要的是，我们试图从计算复杂性理论的角度，去解释为什么量子模型在这里能赢，以及赢在哪里。这涉及到将我们的机器学习问题，与一个已知存在量子优势的判定问题——“forrelation问题”——联系起来。

3.1 从条形码到Forrelation：数据生成的秘密

我们数据集的核心机密在于其生成方式。我们并非随机收集条形码对，而是依据一个特定的、具有数学美感的概率分布来构造：

相关对（Class A）：首先生成一个随机的高斯向量˜x1，然后通过一个全局的哈达玛变换H⊗n生成与之相关的第二个向量˜x2 ≈ H⊗n ˜x1。随后对这两个连续向量进行截断和二值化，得到一对二进制条形码(x1, x2)。这个过程使得x1和x2在变换域中高度相关。
不相关对（Class B）：两个向量˜x1和˜x2独立地从同一个高斯分布中采样，然后分别进行截断和二值化。这样得到的(x1, x2)在统计上是独立的。

这个构造方法直接来源于Raz和Tal的工作，他们用它来证明BQP（有界错误量子多项式时间）复杂性类与PH（多项式层级）之间存在超多项式分离。简言之，存在一个量子算法（基于forrelation），只需常数次查询就能以高概率区分这两类分布；而任何经典的随机算法，在最坏情况下都需要至少Ω(√N)次查询（N是向量维度）。这是一个理论上被严格证明的量子优势范例。

3.2 量子算法如何利用这一优势

对于forrelation问题，最优的量子算法核心是计算一个量：F = |〈φ_x1| H⊗n |φ_x2〉|^2。这个量衡量了第一个条形码的量子态|φ_x1〉与第二个条形码的量子态经过哈达玛变换后的态H⊗n|φ_x2〉之间的重叠度（保真度）。

对于相关对，由于x2本身近似于H⊗n x1，那么H⊗n|φ_x2〉就会非常接近|φ_x1〉，从而导致F的值很大（接近1）。
对于不相关对，H⊗n|φ_x2〉几乎是一个随机向量，与|φ_x1〉的重叠度会指数小，F的值接近于0。

因此，F值本身就是一个完美的分类器！而计算F的量子电路，本质上就是先编码x1，然后作用哈达玛门，再编码x2的逆（伴随操作），最后再作用哈达玛门并测量。这个电路可以巧妙地改写为在联合态|φ_x1〉⊗|φ_x2〉上测量一个特定的观测量：O* = H⊗2n · (∏_i SWAP_{i,i+n})。这个观测量正是全局哈达玛门与所有对应量子比特对之间的交换算符的乘积。

3.3 GQML如何“学习”这个算法

现在回到我们的GQML模型。我们的对称性自适应测量模型（QNNM）的测量池中，就包含了像SWAP算符和全局H⊗2n这样的观测量。LASSO优化过程的任务，就是从一堆候选观测量中，挑选出那些对分类最重要的，并赋予它们合适的权重。对于forrelation数据，优化器会“发现”O*或其线性组合是区分两类数据的关键，从而自动为其分配一个很大的权重。模型通过数据驱动的方式，重新发现了理论上最优的量子算法！

相比之下，变分量子电路模型（QNNU）试图通过训练一个通用的酉变换W(θ)来逼近这个功能。然而，理论分析表明，O*这个特定的算符可能无法被我们选择的、受对称性约束的变分电路层有效表达。这就好比给你一盒乐高积木（特定的量子门集合），要求你拼出一个非常复杂的特定形状（O*），你可能根本拼不出来，或者需要极其大量的积木（极深的电路），而训练过程无法找到这个解。这解释了为什么QNNU在我们的实验中泛化能力很差。

而经典孪生神经网络（DNN/CNN）的问题则更深层。它们的设计（尤其是CNN）天生倾向于捕捉局部的空间特征和模式。Forrelation所定义的“相关性”是一种全局的、在傅里叶域（由哈达玛变换联系）中定义的关联，这种关联无法通过局部感受野的卷积核有效地捕获。因此，经典模型只能记住训练样本的表面特征，而无法提炼出那个普适的、基于F值的判别规则，导致严重的过拟合和糟糕的泛化。

实操心得：这个案例深刻地说明，在寻求量子机器学习优势时，问题与算法的匹配度至关重要。我们的优势并非来自一个“通用”的量子黑箱，而是源于我们选择了一个其内在数学结构（forrelation）恰好能被量子系统自然且高效表达的问题。在设计QML应用时，寻找或构造这类“量子友好”的问题，比盲目地将经典模型量子化更有希望取得成功。

4. 实验设计与实现细节

理论再优美，也需要实验的验证。我们的实验设计紧紧围绕着对比量子与经典方法，并探究优势产生的条件。以下是关键的实现细节和设计考量。

4.1 数据准备与量子编码

首先，我们生成数据集。对于给定的条形码像素数N（如16, 64, 1024），我们确定所需的量子比特数n = log2(N)。每个条形码用一个n比特的量子寄存器编码，因此一对条形码共需2n个量子比特。

生成连续向量：按照前述forrelation分布，生成N维的连续高斯向量对(˜x1, ˜x2)。
二值化：设定一个阈值（通常为0），将连续值转换为二进制0/1。˜x中大于阈值的元素对应条形码中的“黑”像素（值为1），否则为“白”像素（值为0）。这样就得到了二进制字符串x1, x2 ∈ {0,1}^N。
量子态编码：我们采用相位编码。对于一个二进制字符串x，我们将其编码为量子态：|φ_x〉 = (1/√N) Σ_{j=1}^{N} (-1)^{x[j]} |j〉其中x[j]是字符串的第j位，|j〉是计算基态。这个编码电路可以通过一系列受控Z门来实现：首先将所有量子比特置于|+〉态（哈达玛门作用在 |0〉上），然后对于字符串中每个为1的位j，在其对应的量子比特上作用一个相位翻转门（Z门），这个相位翻转可以通过一个以该比特为目标的、多控制Z门来实现（实际上需要用到二进制到计算基态的映射，通常通过一系列受控旋转门实现）。对于一对条形码，我们并行地制备两个这样的态|φ_x1〉⊗|φ_x2〉。

注意事项：相位编码是一种振幅编码，它能够将经典的N维二进制信息压缩到log2(N)个量子比特上，实现了指数级的压缩。然而，这也意味着从量子态中读取完整信息需要指数次测量。但对于我们只需要特定观测量期望值的任务来说，这种编码是高效且合适的。

4.2 量子模型（QNNM）实现

我们的核心模型QNNM的实现流程如下：

定义测量池：根据对称性要求（与交换算符和比特翻转算符对易），我们构造一个包含K=10个候选观测量的集合。这个集合可能包含：
- 全局算符：X⊗2n,Z⊗2n,H⊗2n
- 两体关联算符：Σ_i X_i X_{i+1},Σ_i Z_i Z_{i+1}
- 子系统交换算符：SWAP = Π_{i=1}^n SWAP_{i, i+n}
- 上述算符的乘积，如SWAP · H⊗2n
量子电路执行：对于每个训练样本(x1, x2)，运行以下流程：
- 在量子处理器或模拟器上，制备初始态|+〉⊗2n。
- 运行编码电路U_φ(x1) ⊗ U_φ(x2)，得到态|φ_x〉。
- 对于测量池中的每一个观测量O_k，我们需要估计其期望值〈φ_x| O_k |φ_x〉。这需要通过多次制备|φ_x〉并测量O_k来实现。对于可分解为泡利串的观测量，可以通过改变测量基（在计算基下测量，然后进行经典后处理）来估计。
构建经典数据集：将所有训练样本的K维特征向量φ(x)及其标签y收集起来，形成一个经典的训练集{(φ(x_m), y_m)}。
LASSO训练：在经典计算机上，使用LASSO回归求解优化问题：min_α (1/(2M)) Σ_m (α·φ(x_m) - y_m)^2 + λ ||α||_1其中λ是正则化系数，L1范数惩罚会促使不重要的观测量的权重α_k趋于零，实现特征选择。
推理：对于新样本，重复步骤2得到其特征向量φ(x_new)，然后计算h(x_new) = α* · φ(x_new)，根据阈值（如0.5）判断类别。

4.3 经典基线模型实现

我们实现了两种经典的孪生神经网络作为对比：

深度孪生网络（DNN）：两个共享权重的全连接子网络。每个子网络输入一个展平后的条形码向量（维度N），经过若干隐藏层（如3层，每层128个神经元，使用ReLU激活），输出一个低维特征向量。然后计算两个特征向量之间的欧几里得距离d = ||f_θ(x1) - f_θ(x2)||_2。这个距离通过一个可训练的缩放和偏置参数，映射到0/1标签。损失函数采用均方误差（MSE）。
卷积孪生网络（CNN）：两个共享权重的卷积子网络。由于条形码是2D图像（如32x32），我们使用了几层卷积层（带池化）来提取特征，然后接全连接层生成特征向量。同样计算特征向量间的欧氏距离并进行预测。

实操心得：在设置经典基线时，我们尝试了多种技巧以提升其性能，包括：更换损失函数为二元交叉熵、在网络中添加Dropout层以防止过拟合、使用余弦相似度替代欧氏距离、调整批处理大小和学习率等。然而，所有这些调整都未能显著改善经典模型在测试集上的泛化性能。这强有力地表明，性能差距不是由于超参数调优不足，而是源于模型架构本身在捕捉此类全局相关性上的根本性局限。

4.4 训练与评估协议

为了公平比较，我们严格控制了实验条件：

数据集划分：训练集规模M很小，从每个类别中抽取M/2个样本（M/2从1到10变化）。测试集固定为每个类别40个样本，总计80个样本。
多次随机化：对于每个训练集大小，我们随机抽取50组不同的训练样本，分别训练模型，最后汇报性能的平均值和标准差。这消除了因特定训练样本组合带来的偶然性。
量子模拟：由于实验涉及最多20个量子比特（1024像素），我们在经典计算机上使用量子电路模拟器（如Qiskit、PennyLane）进行仿真。这允许我们精确计算期望值，而无需考虑当前量子硬件的噪声。
评估指标：主要关注测试准确率，这是衡量泛化能力的黄金标准。同时监控训练损失，以观察模型是否能够拟合训练数据。

5. 结果分析与讨论：优势、局限与未来方向

实验数据清晰地讲述了一个故事。图4和图5（对应论文中的图表）的结果表明，QNNM在小样本泛化和系统规模扩展性上都表现出了显著优势。

5.1 性能对比解读

小样本学习：如图4(b)所示，当每个类别的训练样本少至3个（总计6个）时，QNNM的测试准确率就已接近100%。而DNN和CNN的测试准确率始终在50%-60%之间徘徊，仅略优于随机猜测。这意味着经典模型完全无法从极少的样本中学习到有效的判别规则，只是在死记硬背训练样本。
训练动态：图4(a)显示，所有模型都能将训练损失降到很低（甚至为0），达到100%的训练准确率。这再次印证了经典模型的过拟合——它们完美地记住了训练集，但毫无泛化能力。QNNM则同时实现了低训练损失和高测试准确率。
规模扩展性：如图5所示，随着条形码像素数增加（即编码所需的量子比特数n从4增加到10，总比特数从8到20），QNNM的优势始终保持稳定。经典模型的糟糕泛化能力并不随问题规模增大而改善或恶化，量子模型的优异性能也同样稳健。这表明我们所观察到的优势不是特定于某个尺度的偶然现象。

5.2 优势的根源与局限性

我们的优势来源于一个精心设计的“三重匹配”：

问题与数据分布的匹配：我们使用了源于forrelation问题的、具有特定全局相关性的数据分布。这种分布天然地“量子友好”。
数据与编码方式的匹配：相位编码|φ_x〉恰好是forrelation量子算法中使用的态。这种编码方式完美保留了数据中用于区分的关联信息。
模型与问题结构的匹配：GQML的对称性约束和自适应测量框架，恰好能够高效地学习和表达forrelation问题的最优判别算符O*。

然而，必须清醒认识到当前工作的局限性，这也是未来研究的方向：

“非神谕”数据加载的挑战：论文最后部分指出了一个关键点。forrelation问题的量子优势证明，依赖于一个“神谕”模型，即假设我们可以通过一次查询（oracle call）将数据x加载为量子态|φ_x〉。但在实际中，从经典内存中制备|φ_x〉可能需要O(N)甚至更多的量子门操作。一旦我们深入到这个“黑箱”内部，经典算法也可能通过模拟量子线路的步骤来解决问题，从而导致优势消失。事实上，已知的2-fold forrelation是可以在经典计算机上高效模拟的。我们真正的优势前景在于更复杂的、经典难解的变体，如4-fold forrelation。
从理论优势到实践优势：即使对于4-fold forrelation这类经典难解问题，要将理论上的查询复杂度优势转化为实际运行时间优势，还需要高效的量子数据加载电路和足够低的硬件噪声。当前含噪声中等规模量子（NISQ）设备还难以运行此类算法。
问题泛化：我们展示的优势是针对一个非常特定的、理论驱动的数据分布。一个核心的开放问题是：在现实世界的数据集（如图像、分子结构、金融时间序列）中，是否存在大量类似forrelation的、可被量子优势利用的全局关联模式？如何从真实数据中自动识别或构造这样的子问题？

5.3 对GQML及QML领域的启示

这项工作为几何量子机器学习乃至更广泛的量子机器学习领域提供了几个重要的启示：

对称性作为强有力的归纳偏置：GQML不是噱头。通过将问题领域的对称性硬编码到模型架构中，可以极大地提升模型的数据效率、可解释性和泛化能力。这为设计更高效的量子模型提供了系统性的指导原则。
“测量优先”的新范式：QNNM的成功凸显了“训练测量”可能比“训练幺正变换”更具实用性。它规避了变分量子电路训练中的诸多难题（如贫瘠高原、参数冗余、硬件噪声放大），并将学习负担部分转移到了更稳健的经典优化上。这种混合范式可能在NISQ时代更具可行性。
与复杂性理论结合的必要性：要寻找有保证的量子优势，必须与计算复杂性理论紧密结合。forrelation问题只是一个起点。未来需要探索更多存在于BQP而非PH中的问题，并将它们转化为有意义的机器学习任务。这需要物理学家、计算机科学家和领域专家的紧密合作。
对经典ML的反思：我们的工作也反过来启示经典机器学习。对于某些涉及全局、非局部关联的任务，传统基于局部归纳偏置（如CNN的平移不变性）的模型可能存在根本性局限。探索新型的、能捕捉长程依赖的经典架构（如Transformer、图神经网络）在此类任务上的表现，将是一个有趣的对照。

6. 常见问题与实操考量

在复现或深入理解这项工作时，你可能会遇到以下问题，这里提供一些思路和解答。

6.1 如何为我的问题设计对称性？

这是应用GQML的第一步。你需要仔细分析你的数据集和任务：

标签不变性：对输入数据施加哪些变换，其标签保持不变？例如，在图像分类中，可能是旋转、平移、颜色反转；在分子性质预测中，可能是原子索引的置换（分子对称群）。
形式化对称群：将这些变换用数学语言描述出来，形成一个群G。确定其在输入空间X上的表示V_g: X -> X。
提升到希尔伯特空间：找到该群在量子态空间上的酉表示U_g，使得U_g |φ_x〉正比于|φ_{V_g(x)}〉。这确保了编码的等变性。
构建等变层/测量：设计量子神经网络层或选择测量算符，使其与所有U_g对易[W, U_g] = 0。这可以通过使用群论中的舒尔引理，或直接使用群代数中的投影算符来构造。

6.2 在真实量子硬件上运行QNNM的挑战是什么？

测量开销：QNNM需要对多个观测量进行估计。每个观测量都需要通过多次重复制备和测量来获得期望值，这会导致电路运行次数的线性增长（乘以观测量的数量K）。需要通过可观测量的联合测量技术来缓解，即设计测量方案，使得一次测量设置能同时获取多个泡利算符的期望值。
编码电路的深度：相位编码电路U_φ(x)可能包含大量多控制Z门，在NISQ设备上深度较大，容易受噪声影响。需要研究更浅的、抗噪声的编码方案，或利用特定硬件连接拓扑优化的电路编译。
误差缓解：量子硬件噪声会污染测量结果。需要采用误差缓解技术，如零噪声外推、概率误差消除等，来提升估计值的准确性。
数据加载瓶颈：将经典大数据x高效加载到量子态是目前的一大挑战。需要探索近似编码、数据压缩或利用量子随机存取存储器（QRAM）等未来技术。

6.3 如何选择QNNM的测量池？

测量池的选择至关重要，它决定了模型的表现能力。

完备性：理想情况下，测量池应能张成对称性约束下所有可能的厄米算符空间。可以从群表示论出发，构造出该空间的一组基。
物理意义：优先选择具有明确物理意义的观测量，如总磁化强度（Σ Z_i）、两体关联函数（Σ X_i X_j）、纠缠熵相关的算符等。这有助于模型的可解释性。
硬件友好性：优先选择那些可以在目标硬件上通过有限次测量基变换就能估计的观测量，例如泡利字符串的乘积。
逐步扩充：可以从一个小的、包含全局和局部算符的池开始，根据LASSO训练后权重的大小，逐步添加或移除观测量，观察对性能的影响。

6.4 除了条形码，还有哪些潜在应用场景？

虽然本文聚焦于抽象的条形码，但其核心思想——学习全局相关性——具有广泛的应用潜力：

高能物理：判断两个粒子碰撞事件是否来自相同的物理过程（如相同的衰变道），这需要分析事件中所有粒子动量之间的复杂全局关联。
金融风控：识别两组市场数据（如多只股票的时间序列）之间是否存在隐藏的、非线性的联动关系，这可能预示着系统性风险或操纵行为。
分子相似性：比较两个分子的量子态（通过计算化学获得），判断它们是否具有相似的化学性质或反应活性，这需要比较整体的电子云分布，而非局部原子类型。
密码学：区分两组密文是否由同一密钥或相关密钥生成，这可能转化为一个类似forrelation的区分问题。

这项工作的价值在于提供了一个清晰的范例：通过将问题映射到具有可证明量子优势的计算任务上，并利用GQML框架构建高效的学习模型，我们能够在特定问题上实现从少量样本中学习复杂模式的卓越能力。它像一盏探照灯，指明了在充满噪声的NISQ时代，量子机器学习可能率先取得突破的一个方向——不是取代所有经典ML，而是在那些经典模型因归纳偏置不匹配而 fundamentally struggle 的、具有特定数学结构的任务上，发挥其独特价值。