DeepSeek总结的算法 X 与舞蹈链文章-平芜编程栈

原文地址The Algorithm X and the Dancing Links

算法 X 与舞蹈链

2013年4月28日

引言

在高德纳的一篇名为《Dancing Links》的论文[1]中，他展示了一种算法，可以通过回溯高效地解决像数独这样的谜题。

这个回溯算法因为缺乏更好的名字[1]，并且因为它非常简单且不是论文的重点，所以被简单地命名为算法 X。

其核心概念实际上是用于实现算法 X 的一种数据结构。这是一个稀疏矩阵，高德纳在其中使用了一些巧妙的技巧，使得删除/恢复列和行的操作变得高效且是原地操作。他将这些操作称为舞蹈链，以比喻这些操作过程中单元格的指针如何变化。

在这篇文章中，我们将更详细地描述我们试图解决的问题，然后介绍算法 X 的思想。接着，我们将描述这种数据结构，以及如何使用舞蹈链来实现该算法的主要步骤。

最后，我们将展示一个用 Python 实现的简单示例。

集合覆盖

数独谜题可以被建模为一个更一般的问题，即集合覆盖问题。

给定一个元素集合 U 和一个由若干集合组成的集合 S，其中每个集合覆盖 U 的某个子集。集合覆盖问题在于找到一个 S 的子集，使得每个元素恰好被一个集合覆盖。已知该问题是 NP 完全问题。

集合覆盖问题可以看作一个二进制矩阵，其中列代表需要覆盖的元素，行代表集合。单元格 i,j 中的条目 1 表示集合 i 覆盖元素 j。

目标是找到一个行的子集，使得对于每一列，恰好有一个条目为 1。

实际上，这是该问题常见整数线性规划公式的约束矩阵。

算法 X

高德纳的算法以递归方式对所有可能的解决方案进行穷举搜索，在搜索树的每个节点处，我们有一个代表子问题的子矩阵。

在给定节点，我们尝试向我们的解决方案添加一个给定的集合。然后，我们丢弃该集合覆盖的所有元素，同时也丢弃所有覆盖了这些元素中至少一个的其他集合，因为根据定义，一个元素不能被多个集合覆盖，所以我们确信这些其他集合不会在最终解中。然后，我们在剩余的子问题上重复此操作。

如果在任何时候，存在一个无法被任何集合覆盖的元素，我们就回溯，尝试选择另一个集合。另一方面，如果没有剩余元素，则我们当前的解决方案是可行的。

更正式地说，在回溯树的给定节点处，我们有一个二进制矩阵 M。我们首先选择某一列 j。对于每个满足 M[i][j] = 1 的行 i，我们尝试将 i 添加到当前解中，并递归处理一个子矩阵 M’，该子矩阵是通过从 M 中移除所有满足 M[i][j’] = 1 的列 j’，以及所有满足存在列 k 使得 M[i’][k] = M[i][k] = 1 的行 i’ 而构造的。

舞蹈链

上述算法的一个简单实现会在每个搜索树节点扫描整个矩阵以生成子矩阵，并存储一个新矩阵。

高德纳的见解是将二进制矩阵表示为一个双向链接的稀疏矩阵。正如我们稍后将看到的，这种结构允许我们撤销为递归所做的操作，因此我们可以始终使用此稀疏矩阵的单个实例。

稀疏矩阵的基本思想是为每个非零条目创建一个节点，并将其链接到同一列中的相邻单元格以及同一行中的相邻单元格。

在我们的例子中，我们的节点（图1中以绿色描绘）是双向链接的并形成一个循环链。我们还有每个列的一个头节点（蓝色），链接到该列的第一个和最后一个节点；以及一个单独的总头节点（黄色），连接第一列和最后一列的头节点。

以下是一个矩阵 (0 1 1 1) 的示例：

图1：稀疏矩阵示例

请注意，进出页面边界的指针是循环的。

对于每个节点，我们还有一个指向其所在列对应头节点的指针。

移除节点。从一个双向循环链表中移除或分离一个节点的已知方法是使其邻居相互指向：

node.prev.next=node.nextnode.next.prev=node.prev

恢复节点。高德纳告诉我们，假设自移除后我们没有触碰该节点，也可以将其恢复或重新连接到其原始位置：

node.prev.next=node node.next.prev=node

移除一列。对于我们的算法，移除一列只是将其对应的头节点从其他头节点中分离出来（不是从该列的节点中分离），因此我们称之为水平分离。

移除一行。要移除一行，我们希望将该行中的每个节点从其垂直邻居中分离，但我们不触及同一行中节点之间的链接，因此我们称之为垂直分离。

Python 实现

我们将展示这些思想在 Python 中的一个简单实现。完整代码可在 Github 上找到。

数据结构

我们的基本结构是表示单元格的节点和表示列的头节点（以及一个特殊的头哨兵节点）。我们需要所有四个方向的链接（左、上、右、下），但我们不需要显式声明它们，因为 Python 允许我们动态设置它们。我们将有一个额外的字段指向对应的头节点。主要区别在于，我们只垂直分离/附加节点，水平分离/附加头节点，因此我们有不同的方法：

classNode:def__init__(self,row,col):self.row,self.col=row,coldefdeattach(self):self.up.down=self.down self.down.up=self.updefattach(self):self.down.up=self.up.down=selfclassHead:def__init__(self,col):self.col=coldefdeattach(self):self.left.right=self.right self.right.left=self.leftdefattach(self):self.right.left=self.left.right=self

现在我们需要从常规的 Python 矩阵构建我们的稀疏矩阵。我们基本上为矩阵中每个为 1 的条目创建一个节点，为每列创建一个头节点，以及一个全局头节点。然后我们用辅助函数链接它们：

classSparseMatrix:defcreateLeftRightLinks(self,srows):forsrowinsrows:n=len(srow)forjinrange(n):srow[j].right=srow[(j+1)%n]srow[j].left=srow[(j-1+n)%n]defcreateUpDownLinks(self,scols):forscolinscols:n=len(scol)foriinrange(n):scol[i].down=scol[(i+1)%n]scol[i].up=scol[(i-1+n)%n]scol[i].head=scol[0]def__init__(self,mat):nrows=len(mat)ncols=len(mat[0])srow=[[]for_inrange(nrows)]heads=[Head(j)forjinrange(ncols)]scol=[[head]forheadinheads]# 列头节点的头节点self.head=Head(-1)heads=[self.head]+heads self.createLeftRightLinks([heads])foriinrange(nrows):forjinrange(ncols):ifmat[i][j]==1:node=Node(i,j)scol[j].append(node)srow[i].append(node)self.createLeftRightLinks(srow)self.createUpDownLinks(scol)

迭代器

我们在多个地方重复了以下代码：

it=node.leftwhileit!=node:# 做一些操作it=it.left

其中left最终可能被替换为right、up或down。所以我们使用迭代器进行抽象：

classNodeIterator:def__init__(self,node):self.curr=self.start=nodedef__iter__(self):returnselfdefnext(self):_next=self.move(self.curr)if_next==self.start:raiseStopIterationelse:self.curr=_nextreturn_nextdefmove(self):raiseNotImplementedError

这基本上使用特定的移动操作遍历链表。因此，我们可以为每个方向实现特定的迭代器：

classLeftIterator(NodeIterator):defmove(self,node):returnnode.leftclassRightIterator(NodeIterator):defmove(self,node):returnnode.rightclassDownIterator(NodeIterator):defmove(self,node):returnnode.downclassUpIterator(NodeIterator):defmove(self,node):returnnode.up

然后，我们之前的 while 循环块就变成了：

foritinLeftIterator(node):# 做一些操作

算法

我们的数据结构和语法糖迭代器设置好后，就可以实现我们的回溯算法了。

基本操作是覆盖和取消覆盖一列。覆盖包括移除该列以及其行列表中的所有行（记住，一列只能恰好被一行覆盖，因此我们可以从候选列表中移除其他行）。

classDancingLinks:defcover(self,col):col.deattach()forrowinDownIterator(col):forcellinRightIterator(row):cell.deattach()defuncover(self,col):forrowinUpIterator(col):forcellinLeftIterator(row):cell.attach()col.attach()...

当覆盖列col的一行时，我们从col右侧的列开始，到其左侧的列结束，因此，我们实际上并没有将来自col的单元格从其垂直邻居中分离。这是不必要的，因为我们已经从矩阵中“移除”了该列，这允许我们实现更优雅的代码。

重要的是，uncover要按cover的相反顺序执行操作，这样我们就不会弄乱矩阵中的指针。

算法的主要部分如下所示，这本质上是算法 X 的定义，当它找到解决方案时返回 True。

defbacktrack(self):# 让我们覆盖第一个未被覆盖的项col=self.smat.head.right# 没有剩余的列ifcol==self.smat.head:returnTrue# 没有集合能覆盖这个元素ifcol.down==col:returnFalseself.cover(col)forrowinDownIterator(col):forcellinRightIterator(row):self.cover(cell.head)ifself.backtrack():self.solution.append(row)returnTrueforcellinLeftIterator(row):self.uncover(cell.head)self.uncover(col)returnFalse