0


DPLL 算法(求解k-SAT问题)详解(C++实现)

  1. By
  2. C
  3. h
  4. e
  5. s
  6. i
  7. u
  8. m
  9. \text{By}\ \mathsf{Chesium}
  10. By Chesium

DPLL 算法,全称为 Davis-Putnam-Logemann-Loveland(戴维斯-普特南-洛吉曼-洛夫兰德)算法,是一种完备的,基于回溯(backtracking)的搜索算法,用于判定命题逻辑公式(为合取范式形式)的可满足性,也就是求解 SAT(布尔可满足性问题)的一种(或者一类)算法。

SAT 问题简介

何为布尔可满足性问题?给定一条真值表达式,包含逻辑变量(又称 变量命题变号原子,用小写字母

  1. a
  2. ,
  3. b
  4. ,
  5. a,b,\dots
  6. a,b,… 表示)、**逻辑与**(AND,记为
  7. \wedge
  8. ∧” )运算符、**逻辑或**(OR,记为
  9. \vee
  10. ∨” )运算符以及**非**(NOT,否定,记为“
  11. ¬
  12. \neg
  13. ¬”)运算符,如:
  14. (
  15. a
  16. ¬
  17. b
  18. (
  19. ¬
  20. (
  21. c
  22. d
  23. ¬
  24. a
  25. )
  26. (
  27. b
  28. ¬
  29. d
  30. )
  31. )
  32. )
  33. (
  34. ¬
  35. (
  36. ¬
  37. (
  38. ¬
  39. b
  40. a
  41. )
  42. c
  43. )
  44. d
  45. )
  46. (a\wedge\neg b\wedge(\neg(c\vee d\vee\neg a)\vee(b\wedge\neg d)))\vee(\neg(\neg(\neg b\vee a)\wedge c)\wedge d)
  47. (a∧¬b∧(¬(cd∨¬a)∨(b∧¬d)))∨(¬(¬(¬ba)∧c)∧d)

是否存在一组对这些变量的赋值(如把所有

  1. a
  2. a
  3. a
  4. d
  5. d
  6. d 均赋值为
  7. T
  8. r
  9. u
  10. e
  11. \mathrm{True}
  12. True ,将所有
  13. b
  14. b
  15. b
  16. c
  17. c
  18. c 赋值为
  19. F
  20. a
  21. l
  22. s
  23. e
  24. \mathrm{False}
  25. False ),使得整条式子最终的运算结果为
  26. T
  27. r
  28. u
  29. e
  30. \mathrm{True}
  31. True ?若可以,那么这个性质被称为这条逻辑公式的**可满足性**(satisfiability),如何快速高效地判断任意指定逻辑公式的可满足性是理论计算机科学中的一个重要的问题,也是第一个被证明为**NP-完全**(NP-completeNPC)的问题。

暴力方案

对于这个问题,我们能够很容易地想到一种“暴力”的判定方法:测试这些变量赋值的每种可能的排列方式(如全部赋为

  1. T
  2. r
  3. u
  4. e
  5. \mathrm{True}
  6. True 、其一为
  7. T
  8. r
  9. u
  10. e
  11. \mathrm{True}
  12. True 其他全为
  13. F
  14. a
  15. l
  16. s
  17. e
  18. \mathrm{False}
  19. False ……),若存在一种赋值排列使得公式的结果为
  20. T
  21. r
  22. u
  23. e
  24. \mathrm{True}
  25. True ,那么就可以说明这条公式是可满足的。但很显然,最坏情况下这种方法需要我们测试
  26. 2
  27. n
  28. 2^n
  29. 2n 种(
  30. n
  31. n
  32. n 为变量数)赋值排列,而用于检查每种赋值排列最终的运算结果也是不可忽略的。因此,随着公式规模的扩大,这种暴力算法所需的运算量会呈指数级飞快增长,这是我们不可接受的。

算法概述

但是根据现有计算复杂度理论,SAT问题是无法在多项式时间复杂度内解决的,DPLL算法也不例外。

DPLL算法是一种搜索算法,思想与DFS(Depth-first search,深度优先搜索)十分相似,或者说DPLL算法本身就属于DFS的范畴,其类似于上述我们设想的“暴力”算法:搜索所有可能的赋值排列。

具体地说,算法会在公式中选择一个变量(命题变号),将其赋值为

  1. T
  2. r
  3. u
  4. e
  5. \mathrm{True}
  6. True ,化简赋值后的公式,如果简化的公式是可满足的(递归地判断),那么原公式也是可满足的。否则就反过来将该变量赋值为
  7. F
  8. a
  9. l
  10. s
  11. e
  12. \mathrm{False}
  13. False ,再执行一遍递归的判定,若也不能满足,那么原公式便是不可满足的。

这被称为 分离规则 (splitting rule),因为其将原问题分离为了两个更加简单的问题。

概念说明

DPLL算法求解的是合取范式(Conjunctive normal form,CNF),这是指形如下式的逻辑公式:

  1. (
  2. a
  3. b
  4. ¬
  5. c
  6. )
  7. (
  8. ¬
  9. d
  10. x
  11. 1
  12. ¬
  13. x
  14. 2
  15. x
  16. 7
  17. )
  18. (
  19. ¬
  20. r
  21. v
  22. g
  23. )
  24. (
  25. a
  26. d
  27. ¬
  28. d
  29. )
  30. (a\vee b\vee\neg c)\wedge (\neg d\vee x_1\vee\neg x_2\vee\dots\vee x_7)\wedge (\neg r\vee v\vee g)\wedge\dots\wedge (a\vee d\vee\neg d)
  31. (ab∨¬c)∧(¬dx1​∨¬x2​∨⋯∨x7​)∧(¬rvg)∧⋯∧(ad∨¬d)

其由多个括号括住部分的逻辑与组成,每一个括号内又是许多变量或变量的否定(逻辑非)的逻辑或组成。可以证明,所有只包含逻辑与、逻辑或、逻辑非、逻辑蕴含和括号的逻辑公式均可化为等价的合取范式。下面,我们称整个范式为“公式”,称每个括号里的部分为该公式的子句(clause),每个子句中的每个变量或其否定为文字(literal)。

可以看出,要使整条公式结果为

  1. T
  2. r
  3. u
  4. e
  5. \mathrm{True}
  6. True ,其所有子句都必须为
  7. T
  8. r
  9. u
  10. e
  11. \mathrm{True}
  12. True ,也就是说,每个子句中都至少有一个文字为
  13. T
  14. r
  15. u
  16. e
  17. \mathrm{True}
  18. True ,这个结论下面会用到。

DPLL 算法中的化简步骤实际上就是移除所有在赋值后值为

  1. T
  2. r
  3. u
  4. e
  5. \mathrm{True}
  6. True 的子句,以及所有在赋值后值为
  7. F
  8. a
  9. l
  10. s
  11. e
  12. \mathrm{False}
  13. False 的文字。

化简步骤

这两个化简步骤是 DPLL 算法与我们“暴力”算法的主要区别,它们大大减少了搜索量,亦即加快了算法的运行速度。

第一个化简步骤:单位子句传播(Unit propagation)

我们称只含有一个(未赋值)变量的子句为单位子句(unit clause),根据上面的结论,要想让公式为

  1. T
  2. r
  3. u
  4. e
  5. \mathrm{True}
  6. True ,这个子句必须为
  7. T
  8. r
  9. u
  10. e
  11. \mathrm{True}
  12. True ,即这个变量对应的文字必须被赋值为
  13. T
  14. r
  15. u
  16. e
  17. \mathrm{True}
  18. True

比如下面的这条公式:

  1. (
  2. a
  3. b
  4. c
  5. ¬
  6. d
  7. )
  8. (
  9. ¬
  10. a
  11. c
  12. )
  13. (
  14. ¬
  15. c
  16. d
  17. )
  18. (
  19. a
  20. )
  21. (a\vee b\vee c\vee\neg d)\wedge(\neg a\vee c)\wedge(\neg c\vee d)\wedge(a)
  22. (abc∨¬d)∧(¬ac)∧(¬cd)∧(a)

其中最后一个子句就为单位子句,亦即我们要使文字

  1. (
  2. a
  3. )
  4. (a)
  5. (a)
  6. T
  7. r
  8. u
  9. e
  10. \mathrm{True}
  11. True

然后,我们要依次处理这个变量在其他子句中的出现,如果另一个子句中的一个文字与单位子句中的文字相同,如上面例子中的

  1. (
  2. a
  3. b
  4. c
  5. ¬
  6. d
  7. )
  8. (a\vee b\vee c\vee\neg d)
  9. (abc∨¬d) 子句,我们知道
  10. (
  11. a
  12. )
  13. (a)
  14. (a) 的值必须为
  15. T
  16. r
  17. u
  18. e
  19. \mathrm{True}
  20. True ,所以这个子句也肯定为
  21. T
  22. r
  23. u
  24. e
  25. \mathrm{True}
  26. True ,这意味着这个子句就不会对整个公式产生额外的约束(即
  27. b
  28. ,
  29. c
  30. ,
  31. d
  32. b,c,d
  33. b,c,d 的取值不会影响该子句的取值),我们完全可以忽略这个子句,那就删掉它吧。

再考虑上式中第二个子句,其中出现了

  1. (
  2. a
  3. )
  4. (a)
  5. (a) 的否定文字,我们知道它不可能为
  6. T
  7. r
  8. u
  9. e
  10. \mathrm{True}
  11. True 了,要让这个子句的值为
  12. T
  13. r
  14. u
  15. e
  16. \mathrm{True}
  17. True ,只能寄希望于
  18. c
  19. c
  20. c 的取值了,我们完全可以把
  21. ¬
  22. a
  23. \neg a
  24. ¬a 删除(因为有没有它不影响该子句的取值)。

而第上式中第三个子句不包含

  1. (
  2. a
  3. )
  4. (a)
  5. (a) 或其否定的出现,即
  6. a
  7. a
  8. a 的取值不影响这个子句的取值,我们保持其不变即可。

这样,上述公式便被化简为了:

  1. (
  2. c
  3. )
  4. (
  5. ¬
  6. c
  7. d
  8. )
  9. (
  10. a
  11. )
  12. (c)\wedge(\neg c\vee d)\wedge(a)
  13. (c)∧(¬cd)∧(a)

这个操作就被称为单位子句传播

概括:**对于所有只包含一个文字

  1. L
  2. \mathrm{L}
  3. L 的子句,对于公式剩余部分中的每个子句
  4. C
  5. \mathrm{C}
  6. C:**
  • 若 C \mathrm{C} C 包含 L \mathrm{L} L(非否定),则删除 C \mathrm{C} C。
  • 若 C \mathrm{C} C 包含 ¬ L \neg\mathrm{L} ¬L,则删除这个 ¬ L \neg\mathrm{L} ¬L。

经过一次操作,我们发现公式中又出现了一个新的单位子句

  1. (
  2. c
  3. )
  4. (c)
  5. (c) ,我们可以继续对其实施一遍单位子句传播,一直到整个公式中不存在任何一个单位子句对应的变量在其他子句中出现为止。

上式可被化简为:

  1. (
  2. c
  3. )
  4. (
  5. d
  6. )
  7. (
  8. a
  9. )
  10. (c)\wedge(d)\wedge(a)
  11. (c)∧(d)∧(a)

现在即使公式中每个子句都是单位子句,但是其分别对应的变量

  1. c
  2. ,
  3. d
  4. ,
  5. a
  6. c,d,a
  7. c,d,a 没有在除单位子句之外的子句中出现了,单位子句传播已经没有用了,我们要实施第二个化简步骤。

第二个化简步骤:孤立文字消去(Pure literal elimination)

如果一个变量在整个公式中只出现了一次,那么我们可以将其进行恰当的赋值,使其所在的子句为

  1. T
  2. r
  3. u
  4. e
  5. \mathrm{True}
  6. True 。具体地说,如果其出现的那一次是以否定形式出现的,那么就将变量赋值为
  7. F
  8. a
  9. l
  10. s
  11. e
  12. \mathrm{False}
  13. False ,这可使其对应文字为
  14. T
  15. r
  16. u
  17. e
  18. \mathrm{True}
  19. True ,即使其所在子句为
  20. T
  21. r
  22. u
  23. e
  24. \mathrm{True}
  25. True ,反正则将变量赋值为
  26. T
  27. r
  28. u
  29. e
  30. \mathrm{True}
  31. True ,最终也能使其所在的子句为
  32. T
  33. r
  34. u
  35. e
  36. \mathrm{True}
  37. True ,接下来就和上述单位子句传播中发现子句为
  38. T
  39. r
  40. u
  41. e
  42. \mathrm{True}
  43. True 时的处理方式相同——删掉这个子句。

一句话概括,就为:删除所有孤立变量所在的子句

对于以下的公式:

  1. (
  2. ¬
  3. r
  4. u
  5. )
  6. (
  7. r
  8. c
  9. ¬
  10. u
  11. )
  12. (
  13. ¬
  14. k
  15. r
  16. )
  17. (
  18. ¬
  19. d
  20. k
  21. )
  22. (\neg r\vee u)\wedge(r\vee \textcolor{red}{c}\vee\neg u)\wedge(\neg k\vee r)\wedge(\textcolor{blue}{\neg d}\wedge k)
  23. ru)∧(rc∨¬u)∧(¬kr)∧(¬dk)

其中标红的变量

  1. c
  2. c
  3. c 在整个公式中只出现了一次,我们可以将其赋值为
  4. T
  5. r
  6. u
  7. e
  8. \mathrm{True}
  9. True 使得其所在的子句
  10. (
  11. r
  12. c
  13. ¬
  14. u
  15. )
  16. (r\vee \textcolor{red}{c}\vee\neg u)
  17. (rc∨¬u)
  18. T
  19. r
  20. u
  21. e
  22. \mathrm{True}
  23. True ,我们可以将这个子句删除。同样的,标蓝的变量
  24. d
  25. d
  26. d 在整个公式中只出现了一次,且是以否定形式出现的,我们可以将其赋值为
  27. F
  28. a
  29. l
  30. s
  31. e
  32. \mathrm{False}
  33. False ,使其所在子句为
  34. T
  35. r
  36. u
  37. e
  38. \mathrm{True}
  39. True ,我们也可以将其删除。由此,公式被化简为了:
  40. (
  41. ¬
  42. r
  43. u
  44. )
  45. (
  46. ¬
  47. k
  48. r
  49. )
  50. (\neg r\vee u)\wedge(\neg k\vee r)
  51. ru)∧(¬kr)

再来看上面的例子:

  1. (
  2. c
  3. )
  4. (
  5. d
  6. )
  7. (
  8. a
  9. )
  10. (c)\wedge(d)\wedge(a)
  11. (c)∧(d)∧(a)

所有三个变量都是孤立出现的,我们可以把这三个子句全部删除,整个公式就为空了,由此我们能判断出原公式是可满足的。

以上就是这两个化简步骤。

算法流程

下面给出 DPLL 算法的伪代码,先前说过,DPLL 算法实质上是一个深度优先搜索算法,所以两者十分相似。

  1. 1
  2. A
  3. l
  4. g
  5. o
  6. r
  7. i
  8. t
  9. h
  10. m
  11. D
  12. P
  13. L
  14. L
  15. (
  16. C
  17. N
  18. F
  19. Φ
  20. )
  21. :
  22. =
  23. 2
  24. d
  25. o
  26. UP
  27. (
  28. Φ
  29. )
  30. u
  31. n
  32. t
  33. i
  34. l
  35. It changed nothing
  36. .
  37. 3
  38. d
  39. o
  40. PLE
  41. (
  42. Φ
  43. )
  44. u
  45. n
  46. t
  47. i
  48. l
  49. It changed nothing
  50. .
  51. 4
  52. i
  53. f
  54. Φ
  55. =
  56. t
  57. h
  58. e
  59. n
  60. 5
  61. r
  62. e
  63. t
  64. u
  65. r
  66. n
  67. t
  68. r
  69. u
  70. e
  71. .
  72. 6
  73. i
  74. f
  75. L
  76. Φ
  77. ,
  78. L
  79. =
  80. t
  81. h
  82. e
  83. n
  84. 7
  85. r
  86. e
  87. t
  88. u
  89. r
  90. n
  91. f
  92. a
  93. l
  94. s
  95. e
  96. .
  97. 8
  98. x
  99. C
  100. h
  101. o
  102. o
  103. s
  104. e
  105. V
  106. a
  107. r
  108. i
  109. a
  110. b
  111. l
  112. e
  113. (
  114. Φ
  115. )
  116. 9
  117. r
  118. e
  119. t
  120. u
  121. r
  122. n
  123. D
  124. P
  125. L
  126. L
  127. (
  128. Φ
  129. x
  130. t
  131. r
  132. u
  133. e
  134. )
  135. o
  136. r
  137. D
  138. P
  139. L
  140. L
  141. (
  142. Φ
  143. x
  144. f
  145. a
  146. l
  147. s
  148. e
  149. )
  150. \begin{aligned} &\mathtt{1}\quad \mathtt{\textcolor{red}{Algorithm}}\ \ \mathrm{DPLL}(\mathtt{CNF}\ \ \textcolor{green}{\Phi}):=\\ &\mathtt{2}\quad\qquad \mathtt{\textcolor{red}{do}}\ \ \text{UP}(\textcolor{green}{\Phi})\ \ \mathtt{\textcolor{red}{until}}\ \ \text{It changed nothing}.\\ &\mathtt{3}\quad\qquad \mathtt{\textcolor{red}{do}}\ \ \text{PLE}(\textcolor{green}{\Phi})\ \ \mathtt{\textcolor{red}{until}}\ \ \text{It changed nothing}.\\ &\mathtt{4}\quad\qquad \mathtt{\textcolor{red}{if}}\ \ \textcolor{green}{\Phi}=\varnothing\ \ \mathtt{\textcolor{red}{then}}\\ &\mathtt{5}\quad\qquad\qquad \mathtt{\textcolor{red}{return}}\ \ \mathrm{\textcolor{blue}{true}}.\\ &\mathtt{6}\quad\qquad \mathtt{\textcolor{red}{if}}\ \ \exists L\in\textcolor{green}{\Phi},L=\varnothing\ \ \mathtt{\textcolor{red}{then}}\\ &\mathtt{7}\quad\qquad\qquad \mathtt{\textcolor{red}{return}}\ \ \mathrm{\textcolor{blue}{false}}.\\ &\mathtt{8}\quad\qquad x\leftarrow\mathrm{ChooseVariable}(\textcolor{green}{\Phi})\\ &\mathtt{9}\quad\qquad \mathtt{\textcolor{red}{return}}\ \ \mathrm{DPLL}(\textcolor{green}{\Phi}_{x\to\mathrm{\textcolor{blue}{true}}}) \ \ \mathtt{\textcolor{red}{or}}\ \ \mathrm{DPLL}(\textcolor{green}{\Phi}_{x\to\mathrm{\textcolor{blue}{false}}}) \end{aligned}
  151. 1Algorithm DPLL(CNF Φ):=2do UP(Φ) until It changed nothing.3do PLE(Φ) until It changed nothing.4if Φ=∅ then5return true.6if L∈Φ,L=∅ then7return false.8xChooseVariable(Φ)9return DPLLxtrue​) or DPLLxfalse​)​

其中

  1. U
  2. P
  3. (
  4. Φ
  5. )
  6. \mathrm{UP}(\Phi)
  7. UP(Φ)
  8. P
  9. L
  10. E
  11. (
  12. Φ
  13. )
  14. \mathrm{PLE}(\Phi)
  15. PLE(Φ) 分别是指对公式
  16. Φ
  17. \Phi
  18. Φ 进行**单位子句传播**和**孤立文字消去**,
  19. C
  20. h
  21. o
  22. o
  23. s
  24. e
  25. V
  26. a
  27. r
  28. i
  29. a
  30. b
  31. l
  32. e
  33. (
  34. Φ
  35. )
  36. \mathrm{ChooseVariable}(\Phi)
  37. ChooseVariable(Φ) 是指在公式
  38. Φ
  39. \Phi
  40. Φ 中选取一个变量(未赋值),根据现有的研究,这个选取变量的策略(被称为**启发函数**(heuristic function))会大大影响 DPLL 算法的运行效率,根据变量选择策略不同,DPLL 算法也有许多变种,但这不在我们现在的讨论范围内,作为初学者,我们就让
  41. C
  42. h
  43. o
  44. o
  45. s
  46. e
  47. V
  48. a
  49. r
  50. i
  51. a
  52. b
  53. l
  54. e
  55. (
  56. Φ
  57. )
  58. \mathrm{ChooseVariable}(\Phi)
  59. ChooseVariable(Φ) 直接选择变量序列中的第一个变量。

  1. 9
  2. 9
  3. 9 行中的
  4. Φ
  5. x
  6. t
  7. r
  8. u
  9. e
  10. \Phi_{x\to\mathrm{true}}
  11. Φxtrue 是指将公式
  12. Φ
  13. \Phi
  14. Φ 中的变量
  15. x
  16. x
  17. x 赋值为
  18. T
  19. r
  20. u
  21. e
  22. \mathrm{True}
  23. True,并根据在化简规则中描述过的方式处理赋值变量(删除包含其肯定出现的子句,并删除其否定形式的文字)后的公式,
  24. Φ
  25. x
  26. f
  27. a
  28. l
  29. s
  30. e
  31. \Phi_{x\to\mathrm{false}}
  32. Φxfalse 也如此,只不过将两种操作反过来。

可以看出这是个递归程序,对于输入的非空的原始公式

  1. Φ
  2. 0
  3. \Phi_0
  4. Φ0​,其在两种情况下中止:
  • 公式 Φ \Phi Φ 为空,产生这种情况的原因只可能是:各个子句经过变量的赋值后值必为 T r u e \mathrm{True} True,不对 Φ \Phi Φ 中其他变量的赋值产生约束而全被删除。这意味着原始的 Φ 0 \Phi_0 Φ0​ 经过一部分(当然也可能是全部)变量的赋值后其所有子句的值都恒为 T r u e \mathrm{True} True, Φ 0 \Phi_0 Φ0​ 是可满足的。
  • 公式 Φ \Phi Φ 包含空子句,产生这种情况的原因只可能是:这个子句中所有文字均在经过赋值后值为 F a l s e \mathrm{False} False,因此这些文字均被删除了,那么这个子句便不可能值为 T r u e \mathrm{True} True,公式 Φ \Phi Φ 是不可满足的。(这并不代表 Φ 0 \Phi_0 Φ0​ 无法满足,因为这只是一种可能的赋值排列)

具体实现

接下来,我们就开始着手从零实现一个基础款(不带复杂的

  1. C
  2. h
  3. o
  4. o
  5. s
  6. e
  7. V
  8. a
  9. r
  10. i
  11. a
  12. b
  13. l
  14. e
  15. (
  16. Φ
  17. )
  18. \mathrm{ChooseVariable}(\Phi)
  19. ChooseVariable(Φ) 启发函数)的 DPLL 算法。

注意到,算法中涉及到大量的文字删除和子句删除操作,而且可能出现在文字列表和子句列表中间的任意位置(即不是简单地删除头或尾),而且处理各个子句、文字时遍历较多,而无需随机访问。我使用了链表(Linked list)来存储我们处理的公式。具体地说,我们使用一个二维链表来存储合取范式,它可以看作是子句的列表,而每个子句又可看作文字的列表。

每个文字有两个属性:变量编号(整数)和是否为否定文字(布尔值)。输入时我们将所有变量标识符离散化为变量编号。
用二维链表来存储合取范式
图1:用二维链表来存储合取范式
要删除一个文字时,我们只需将前一个文字的

  1. .
  2. n
  3. x
  4. t
  5. \mathrm{.nxt}
  6. .nxt 指针指向下一个文字,并将下一个文字的
  7. .
  8. p
  9. r
  10. v
  11. \mathrm{.prv}
  12. .prv 指针指向前一个文字即可,删除子句同理。

但是,我们发现算法过程中涉及到 找到特定逻辑变量的所有文字 的操作,如将某个变量赋值时就必须依次处理其所有文字,若只采取上述链表的结构,每次处理时就必须遍历所有子句、文字。我们可以通过再维护一个按变量名索引的二维链表,从而实现高效地遍历任意变量的所有文字。这看上去像是给上面的链表结构增加了许多“跳线”。对于合取范式:

  1. (
  2. a
  3. ¬
  4. c
  5. d
  6. )
  7. (
  8. d
  9. ¬
  10. b
  11. c
  12. ¬
  13. t
  14. )
  15. (
  16. ¬
  17. a
  18. b
  19. c
  20. )
  21. (a\vee\neg c\vee d)\wedge(d\vee\neg b\vee c\vee\neg t)\wedge(\neg a\vee b\vee c)
  22. (a∨¬cd)∧(d∨¬bc∨¬t)∧(¬abc)

我们就可以建立如下图的结构来存储:

在二维链表的基础上添加“跳线”以实现更高效的遍历
图2:在二维链表的基础上添加“跳线”以实现更高效的遍历
当然,其中仅仅画出了部分关键的指针结构,具体实现中天蓝色的“跳线”也是双向的,我们也可以通过增加一些额外的指针存储实现 通过文字找到其所在子句、通过文字找到其对应的文字列表。

除了图中的结构,通过在文字、子句的删除中维护一个“没有经过单位子句传播的单位子句”集合(或列表),以及一个 只有一个对应文字的变量 集合,我们可以不通过遍历找到所有单位子句和孤立变量以上述两个化简步骤。

但是,难题还在后头:这是个递归算法,涉及到对前几次历史版本的回溯。具体地说,在某种赋值(部分)组合下公式不可能满足,这时我们需要还原刚刚进行的化简操作和赋值操作,检查不同的赋值下公式能否满足,即进入另一个搜索分支。

如何进行回溯呢?最简单的就如伪代码中的,递归时直接通过调用函数中参数的复制传递复制一份整个公式结构的历史版本,这听上去虽然效率不高但实现简单,但事实上对于包含如此多指针的数据结构,要复制出完整、独立的一份必然涉及到大量指针的重定向,而这是十分困难且涉及到许多细节的,何况即使实现了,面对较大的递归层数,程序会占用很多内存,而且包含大量重复的冗余部分。

这里,我采用了一种基于 栈 和 增量存储 思想的数据结构。DPLL 算法可以看作一个在二叉树上进行 DFS 搜索的算法,程序在执行这种递归算法时会在函数(递归时就是自身)的调用中维护一个堆栈,存储每次函数调用中的局部变量。我仿照了这种结构,用栈来存储公式结构在一层层搜索的赋值中改变的部分。

具体地说,上面 图2 中的每一个箭头都是一个“指针栈”,存储着一系列的指针,标识该指针在递归过程中的一系列变化。在每一个搜索到的公式状态节点进行化简、赋值时,我们只访问、修改栈顶的指针,并用一个集合来标识在本次处理(化简、赋值)中修改过的指针栈,这些集合又用一个栈来维护。回溯至上一层时遍历栈顶的集合,将其中所有指针栈的栈顶释出,从而实现对历史公式版本的还原。上述数据结构可以看作一个简单的 部分可持久化链表组 ,当然这其中也有许多可供优化的地方。

实现代码

下面给出部分核心代码,完整代码可见:

“指针栈链表”实现部分:

  1. template <typename T>
  2. struct node {
  3. stack<node<T> *> prvPS, nxtPS;
  4. slist<T> *L;
  5. T *X = nullptr;
  6. node(slist<T> *l, T *x = nullptr, node<T> *_prv = nullptr,
  7. node<T> *_nxt = nullptr) {
  8. this->L = l;
  9. if (x != nullptr) this->X = new T(*x);
  10. this->init_upd(_prv, _nxt);
  11. }
  12. void __upd(node<T> *_prv, node<T> *_nxt) {
  13. if (_prv != nullptr) this->prvPS.push(_prv);
  14. if (_nxt != nullptr) this->nxtPS.push(_nxt);
  15. }
  16. void init_upd(node<T> *_prv, node<T> *_nxt) {
  17. if (_prv != nullptr)
  18. while (!this->prvPS.empty()) this->prvPS.pop();
  19. if (_nxt != nullptr)
  20. while (!this->nxtPS.empty()) this->nxtPS.pop();
  21. this->__upd(_prv, _nxt);
  22. }
  23. void upd(node<T> *_prv, node<T> *_nxt) {
  24. if (_prv != nullptr) {
  25. auto it = this->L->Recorder->ch.top().find(&(this->prvPS));
  26. if (it == this->L->Recorder->ch.top().end())
  27. this->L->Recorder->ch.top().insert(&(this->prvPS));
  28. else
  29. this->prvPS.pop();
  30. this->prvPS.push(_prv);
  31. }
  32. if (_nxt != nullptr) {
  33. auto it = this->L->Recorder->ch.top().find(&(this->nxtPS));
  34. if (it == this->L->Recorder->ch.top().end())
  35. this->L->Recorder->ch.top().insert(&(this->nxtPS));
  36. else
  37. this->nxtPS.pop();
  38. this->nxtPS.push(_nxt);
  39. }
  40. }
  41. bool isHead() { return this->L->begin() == this; }
  42. bool isTail() { return this->L->end() == this; }
  43. node<T> *prev() { return this->prvPS.top(); }
  44. node<T> *next() { return this->nxtPS.top(); }
  45. };
  46. template <typename T>
  47. struct slist {
  48. stack<node<T> *> beginPS, endPS;
  49. rmRecorder<T> *Recorder = nullptr;
  50. slist() {
  51. auto primNode = new node<T>(this);
  52. this->beginPS.push(primNode);
  53. this->endPS.push(primNode);
  54. }
  55. node<T> *begin() { return this->beginPS.top(); }
  56. node<T> *end() { return this->endPS.top(); }
  57. void regRec(rmRecorder<T> *rec) { this->Recorder = rec; }
  58. bool empty() { return this->begin() == this->end(); }
  59. bool single() {
  60. if (this->empty()) return false;
  61. return this->begin()->next() == this->end();
  62. }
  63. void add(T x) {
  64. if (this->empty()) {
  65. while (!this->beginPS.empty()) this->beginPS.pop();
  66. this->beginPS.push(new node<T>(this, &x, nullptr, this->end()));
  67. this->end()->init_upd(this->begin(), nullptr);
  68. } else {
  69. auto NewNode = new node<T>(this, &x, this->end()->prev(), this->end());
  70. this->end()->prev()->init_upd(nullptr, NewNode);
  71. this->end()->init_upd(NewNode, nullptr);
  72. }
  73. }
  74. void rm(node<T> *nd) {
  75. if (nd->L != this) return;
  76. if (nd == this->end()) return;
  77. if (nd == this->begin()) {
  78. auto it = this->Recorder->ch.top().find(&this->beginPS);
  79. if (it == this->Recorder->ch.top().end())
  80. this->Recorder->ch.top().insert(&this->beginPS);
  81. else
  82. this->beginPS.pop();
  83. this->beginPS.push(nd->next());
  84. } else {
  85. nd->prev()->upd(nullptr, nd->next());
  86. nd->next()->upd(nd->prev(), nullptr);
  87. }
  88. }
  89. T *front() { return this->begin()->X; }
  90. T *back() { return this->end()->prev()->X; }
  91. };
  92. template <typename T>
  93. struct rmRecorder {
  94. stack<set<stack<node<T> *> *>> ch;
  95. int layer = 0;
  96. rmRecorder() { this->nextLayer(); }
  97. void nextLayer() {
  98. this->ch.push(set<stack<node<T> *> *>());
  99. this->layer++;
  100. }
  101. void backtrack() {
  102. for (auto it = this->ch.top().begin(); it != this->ch.top().end(); it++)
  103. (*it)->pop();
  104. this->layer--;
  105. ch.pop();
  106. }
  107. };

数据结构部分:

  1. struct Literal {
  2. llu index; //
  3. bool neg;
  4. CNF *cnf;
  5. node<Clause> *cl;
  6. node<Occur> *oc;
  7. Literal(CNF *_cnf, string s, bool _neg);
  8. string str();
  9. void RemoveOccurrence();
  10. };
  11. struct Clause {
  12. slist<Literal> *lt;
  13. CNF *cnf;
  14. Clause(CNF *_cnf);
  15. string str();
  16. };
  17. struct Occur {
  18. node<Literal> *lit;
  19. Occur(node<Literal> *_lit) { this->lit = _lit; }
  20. };
  21. struct AvAtom {
  22. llu index;
  23. slist<Occur> *oc;
  24. CNF *cnf;
  25. AvAtom(CNF *_cnf, llu i);
  26. };
  27. struct CNF {
  28. map<string, llu> Dict;
  29. vector<string> Atoms;
  30. vector<ll> scheme;
  31. llu AtomN = 0;
  32. slist<Clause> CL;
  33. slist<AvAtom> AVA;
  34. vector<node<AvAtom> *> avAtoms;
  35. rmRecorder<Literal> Rec_Literal;
  36. rmRecorder<Clause> Rec_Clause;
  37. rmRecorder<Occur> Rec_Occur;
  38. rmRecorder<AvAtom> Rec_AvAtom;
  39. stack<list<ll>> Rec_assign;
  40. CNF() {
  41. this->CL.regRec(&this->Rec_Clause);
  42. this->AVA.regRec(&this->Rec_AvAtom);
  43. }
  44. void read();
  45. string str();
  46. string occurStr();
  47. string schemeStr();
  48. void removeLiteral(node<Clause> *cl, node<Literal> *lit);
  49. void removeClause(node<Clause> *cl);
  50. ll AssignLiteralIn(node<Clause> *cl, node<Literal> *unit);
  51. bool PureLiteralAssign();
  52. bool UnitPropagate();
  53. void nextLayer();
  54. void backtrack();
  55. bool containEmptyClause = false;
  56. bool DPLL(bool disableSimp);
  57. };
  58. void CNF::removeLiteral(node<Clause> *cl, node<Literal> *lit) {
  59. cout << "DEL literal \"" << lit->X->str() << "\" in \"" << cl->X->str()
  60. << "\"" << endl;
  61. lit->X->RemoveOccurrence();
  62. cl->X->lt->rm(lit);
  63. }
  64. void CNF::removeClause(node<Clause> *cl) {
  65. cout << "DEL Clause \"" << cl->X->str() << "\"" << endl;
  66. for (auto lit = cl->X->lt->begin(); lit != cl->X->lt->end();
  67. lit = lit->next())
  68. lit->X->RemoveOccurrence();
  69. this->CL.rm(cl);
  70. }
  71. void CNF::nextLayer() {
  72. this->Rec_Literal.nextLayer();
  73. this->Rec_Clause.nextLayer();
  74. this->Rec_Occur.nextLayer();
  75. this->Rec_AvAtom.nextLayer();
  76. this->Rec_assign.push(list<ll>());
  77. }
  78. void CNF::backtrack() {
  79. this->Rec_Literal.backtrack();
  80. this->Rec_Clause.backtrack();
  81. this->Rec_Occur.backtrack();
  82. this->Rec_AvAtom.backtrack();
  83. for (auto it = this->Rec_assign.top().begin();
  84. it != this->Rec_assign.top().end(); it++)
  85. this->scheme[*it] = 0;
  86. this->Rec_assign.pop();
  87. }

算法主体部分:

  1. ll CNF::AssignLiteralIn(node<Clause>*cl, node<Literal>*unit){this->scheme[unit->X->index]= unit->X->neg ?2:1;this->Rec_assign.top().push_back(unit->X->index);bool changed =false;for(auto it = cl->X->lt->begin(); it != cl->X->lt->end(); it = it->next())if(it->X->index == unit->X->index){if(it->X->neg == unit->X->neg){this->removeClause(cl);return1;}else{this->removeLiteral(cl, it);if(cl->X->lt->empty()){this->containEmptyClause =true;return2;}
  2. changed =true;}}return changed ?1:0;}bool CNF::UnitPropagate(){bool ok =false;for(auto it1 =this->CL.begin(); it1 !=this->CL.end(); it1 = it1->next())if(it1->X->lt->single()){
  3. node<Literal>*A = it1->X->lt->begin();for(auto it2 =this->CL.begin(); it2 !=this->CL.end();
  4. it2 = it2->next()){if(it1 == it2)continue;
  5. ll res =this->AssignLiteralIn(it2, A);if(res ==2)returnfalse;if(res) ok =true;}if(ok)returntrue;}returnfalse;}bool CNF::PureLiteralAssign(){for(llu i =0; i <this->AtomN; i++)if(this->avAtoms[i]->X->oc->single()){this->scheme[this->avAtoms[i]->X->index]=this->avAtoms[i]->X->oc->begin()->X->lit->X->neg ?2:1;this->Rec_assign.top().push_back(this->avAtoms[i]->X->index);this->removeClause(this->avAtoms[i]->X->oc->begin()->X->lit->X->cl);returntrue;}returnfalse;}bool CNF::DPLL(bool disableSimp =false){
  6. stack<ll> STACK;
  7. AvAtom *x;
  8. ll layerNow =-1, Status;
  9. STACK.push(0);while(!STACK.empty()){
  10. Status = STACK.top();
  11. STACK.pop();/***/ cout <<"=== NEW STATUS : "<< Status <<" ==="<< endl;while(layerNow >=abs(Status)){
  12. layerNow--;/***/ cout <<"BACKTRACK: -> "<< layerNow << endl;this->backtrack();}
  13. layerNow =abs(Status);/***/ cout <<"FORMULA: begin processing(layer="<< layerNow
  14. <<"):"<< endl;/***/ cout <<this->str();this->nextLayer();if(Status ==0){/***/ cout <<"INIT: skip assignments"<< endl;goto SIMPLIFICATION;}
  15. x =this->AVA.begin()->X;/***/ cout <<"ASSIGN: \""<< Atoms[x->index]<<"\" -> "<<(Status >0?"True":"False")<< endl;this->scheme[x->index]= Status >0?1:2;this->Rec_assign.top().push_back(x->index);for(auto it = x->oc->begin(); it != x->oc->end(); it = it->next()){if((Status <0)== it->X->lit->X->neg)this->removeClause(it->X->lit->X->cl);else{this->removeLiteral(it->X->lit->X->cl, it->X->lit);if(it->X->lit->X->cl->X->lt->empty()){this->containEmptyClause =true;break;}}}/***/ cout <<"FORMULA: finish assignments:"<< endl;/***/ cout <<this->str();
  16. SIMPLIFICATION:if(!disableSimp){while(this->UnitPropagate()){}/***/ cout <<"FORMULA: Unit-propagatated:"<< endl;/***/ cout <<this->str();while(this->PureLiteralAssign()){}/***/ cout <<"FORMULA: Pure-literal-assigned:"<< endl;/***/ cout <<this->str();}if(this->CL.empty()){/***/ cout <<"***FORMULA IS EMPTY: It can be satisfied."<< endl;/***/ cout <<"***ALGORITHM FINISHED."<< endl;returntrue;}if(this->containEmptyClause){/***/ cout <<"***FORMULA CONTAIN EMPTY CLAUSES: backtrack."<< endl
  17. << endl;this->containEmptyClause =false;continue;}
  18. STACK.push(abs(Status)+1);
  19. STACK.push(-abs(Status)-1);/***/ cout << endl;}/***/ cout <<"***The formula cannot be satisfied."<< endl;/***/ cout <<"***ALGORITHM FINISHED."<< endl;returnfalse;}

代码使用示例

最低 C++ 标准:C++ 11

输入格式:一行一个正整数

  1. n
  2. n
  3. n,表示合取范式包含
  4. n
  5. n
  6. n 个子句。接下来
  7. n
  8. n
  9. n 行,第
  10. i
  11. i
  12. i 行开头为一个正整数
  13. k
  14. i
  15. k_i
  16. ki 表示该子句包含
  17. k
  18. i
  19. k_i
  20. ki 个文字,随即有
  21. k
  22. i
  23. k_i
  24. ki 个以空格分隔的字符串,表示各个文字,若该字符串以
  1. ^

开头,则表示该文字为否定文字。

例如,下列合取范式:

  1. (
  2. a
  3. b
  4. )
  5. (
  6. ¬
  7. a
  8. ¬
  9. c
  10. )
  11. (
  12. b
  13. ¬
  14. t
  15. a
  16. ¬
  17. c
  18. )
  19. (
  20. c
  21. d
  22. )
  23. a
  24. \begin{aligned} &(a\vee b)\\ \wedge\ &(\neg a\vee\neg c)\\ \wedge\ &(b\vee\neg t\vee a\vee\neg c)\\ \wedge\ &(c\vee d)\\ \wedge\ &a \end{aligned}
  25. ​(ab)(¬a∨¬c)(b∨¬ta∨¬c)(cd)a

的输入代码就为:

  1. 5
  2. 2 a b
  3. 2 ^a ^c
  4. 4 b ^t a ^c
  5. 2 c d
  6. 1 a

包含头文件

  1. dpll.hpp

,保证其和

  1. slist.hpp

在同一文件夹下,即可创建

  1. CNF

对象,调用其

  1. .read()

方法以从标准输入输出中读入合取范式。接着便可通过调用方法

  1. .DPLL()

应用算法(加上参数

  1. true

可以使算法跳过化简步骤),许多调试信息都会一并输出出来。如果要获取一种可行的赋值方案(前提是公式可满足),可以在应用 DPLL 算法后输出

  1. .schemeStr()

方法生成的字符串,其样式如下:

  1. "a" -> True
  2. "b" -> _
  3. "c" -> False
  4. "t" -> _
  5. "d" -> True

每行表示一个变量的赋值,若赋值为下划线

  1. _

则说明其赋值为

  1. true

  1. false

均可。

我们对上述合取范式示例应用算法,输出应为:

  1. === NEW STATUS : 0 ===
  2. FORMULA: begin processing(layer=0):
  3. {
  4. |   ( a b )
  5. | ( ¬a ¬c )
  6. | ( b ¬t a ¬c )
  7. | ( c d )
  8. | a
  9. }
  10. INIT: skip assignments
  11. DEL Clause "a ∨ b"
  12. DEL literal "¬a" in "¬a ∨ ¬c"
  13. DEL Clause "b ∨ ¬t ∨ a ∨ ¬c"
  14. DEL literal "c" in "c ∨ d"
  15. FORMULA: Unit-propagatated:
  16. {
  17. |   ¬c
  18. | d
  19. | a
  20. }
  21. DEL Clause "a"
  22. DEL Clause "¬c"
  23. DEL Clause "d"
  24. FORMULA: Pure-literal-assigned:
  25. {
  26. }
  27. ***FORMULA IS EMPTY: It can be satisfied.
  28. ***ALGORITHM FINISHED.
  29. 1
  30. "a" -> True
  31. "b" -> _
  32. "c" -> False
  33. "t" -> _
  34. "d" -> True

从中可以清晰地看到算法执行的流程和经过各个化简步骤后公式的内容。这条公式经过一次化简后就足以判断其是否可满足了,我们通过

  1. .DPLL(true)

禁用化简步骤可以清晰地看到算法回溯的过程:

  1. === NEW STATUS : 0 ===
  2. FORMULA: begin processing(layer=0):
  3. {
  4. |   ( a b )
  5. | ( ¬a ¬c )
  6. | ( b ¬t a ¬c )
  7. | ( c d )
  8. | a
  9. }
  10. INIT: skip assignments
  11. === NEW STATUS : -1 ===
  12. FORMULA: begin processing(layer=1):
  13. {
  14. |   ( a b )
  15. | ( ¬a ¬c )
  16. | ( b ¬t a ¬c )
  17. | ( c d )
  18. | a
  19. }
  20. ASSIGN: "a" -> False
  21. DEL literal "a" in "a ∨ b"
  22. DEL Clause "¬a ∨ ¬c"
  23. DEL literal "a" in "b ∨ ¬t ∨ a ∨ ¬c"
  24. DEL literal "a" in "a"
  25. FORMULA: finish assignments:
  26. {
  27. |   b
  28. | ( b ¬t ¬c )
  29. | ( c d )
  30. | ( )
  31. }
  32. ***FORMULA CONTAIN EMPTY CLAUSES: backtrack.
  33. === NEW STATUS : 1 ===
  34. BACKTRACK: -> 0
  35. FORMULA: begin processing(layer=1):
  36. {
  37. |   ( a b )
  38. | ( ¬a ¬c )
  39. | ( b ¬t a ¬c )
  40. | ( c d )
  41. | a
  42. }
  43. ASSIGN: "a" -> True
  44. DEL Clause "a ∨ b"
  45. DEL literal "¬a" in "¬a ∨ ¬c"
  46. DEL Clause "b ∨ ¬t ∨ a ∨ ¬c"
  47. DEL Clause "a"
  48. FORMULA: finish assignments:
  49. {
  50. |   ¬c
  51. | ( c d )
  52. }
  53. === NEW STATUS : -2 ===
  54. FORMULA: begin processing(layer=2):
  55. {
  56. |   ¬c
  57. | ( c d )
  58. }
  59. ASSIGN: "c" -> False
  60. DEL Clause "¬c"
  61. DEL literal "c" in "c ∨ d"
  62. FORMULA: finish assignments:
  63. {
  64. |   d
  65. }
  66. === NEW STATUS : -3 ===
  67. FORMULA: begin processing(layer=3):
  68. {
  69. |   d
  70. }
  71. ASSIGN: "d" -> False
  72. DEL literal "d" in "d"
  73. FORMULA: finish assignments:
  74. {
  75. |   ( )
  76. }
  77. ***FORMULA CONTAIN EMPTY CLAUSES: backtrack.
  78. === NEW STATUS : 3 ===
  79. BACKTRACK: -> 2
  80. FORMULA: begin processing(layer=3):
  81. {
  82. |   d
  83. }
  84. ASSIGN: "d" -> True
  85. DEL Clause "d"
  86. FORMULA: finish assignments:
  87. {
  88. }
  89. ***FORMULA IS EMPTY: It can be satisfied.
  90. ***ALGORITHM FINISHED.
  91. 1
  92. "a" -> True
  93. "b" -> _
  94. "c" -> False
  95. "t" -> _
  96. "d" -> True

输出中间出现

  1. BACKTRACK

就说明算法执行了一次回溯,将公式还原回赋值、化简前的形态。

参考

标签: 算法 人工智能 c++

本文转载自: https://blog.csdn.net/weixin_42695737/article/details/123361318
版权归原作者 Chesium 所有, 如有侵权,请联系我们删除。

“DPLL 算法(求解k-SAT问题)详解(C++实现)”的评论:

还没有评论