文章目录
72. 编辑距离:
给你两个单词
word1
和
word2
, 请返回将
word1
转换成
word2
所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
- 插入一个字符
- 删除一个字符
- 替换一个字符
样例 1:
输入:
word1 = "horse", word2 = "ros"
输出:
3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
样例 2:
输入:
word1 = "intention", word2 = "execution"
输出:
5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')
提示:
0 <= word1.length, word2.length <= 500
word1
和word2
由小写英文字母组成
分析:
- 面对这道算法题目,二当家的再次陷入了沉思。
- 编辑距离算法在实际应用中还是很多的,比如一些命令的参数,当输入了错误的参数时,会提示最相似的命令。- 想要找最优解,一般就是贪心或者动态规划。
- 思考后会发现,完整串的编辑距离和子串的编辑距离有关系,所以考虑使用动态规划。
- 别急,这里还有一个问题,题目中可以对两个单词分别进行三种操作,所以相当于一共有六种操作,其中插入字符依赖较短字符串,而删除字符的操作就反向依赖了较长串,但是动态规划是从一个初识条件开始,朝着一个方向计算的,这里依赖着两种方向,这怎么办?
- 其实,我们可以将相同效果的操作合并处理:1. 对单词 A 删除一个字符和对单词 B 插入一个字符是等价的。例如当单词 A 为 doge,单词 B 为 dog 时,我们既可以删除单词 A 的最后一个字符 e,得到相同的 dog,也可以在单词 B 末尾添加一个字符 e,得到相同的 doge;2. 同理,对单词 B 删除一个字符和对单词 A 插入一个字符也是等价的;3. 对单词 A 替换一个字符和对单词 B 替换一个字符是等价的。例如当单词 A 为 bat,单词 B 为 cat 时,我们修改单词 A 的第一个字母 b -> c,和修改单词 B 的第一个字母 c -> b 是等价的。
- 这样一来,本质不同的操作实际上只有三种:1. 在单词 A 中插入一个字符;2. 在单词 B 中插入一个字符;3. 修改单词 A 的一个字符。
- 这样一来,我们就可以把原问题转化为规模较小的子问题。以样例1为例,我们用 A = horse,B = ros 作为例子,来看一看是如何把这个问题转化为规模较小的若干子问题的:1. 在单词 A 中插入一个字符:如果我们知道 horse 到 ro 的编辑距离为 a,那么显然 horse 到 ros 的编辑距离不会超过 a + 1。这是因为我们可以在 a 次操作后将 horse 和 ro 变为相同的字符串,只需要额外的 1 次操作,在单词 A 的末尾添加字符 s,就能在 a + 1 次操作后将 horse 和 ro 变为相同的字符串;2. 在单词 B 中插入一个字符:如果我们知道 hors 到 ros 的编辑距离为 b,那么显然 horse 到 ros 的编辑距离不会超过 b + 1,原因同上;3. 修改单词 A 的一个字符:如果我们知道 hors 到 ro 的编辑距离为 c,那么显然 horse 到 ros 的编辑距离不会超过 c + 1,原因同上。
- 那么从 horse 变成 ros 的编辑距离应该为 min(a + 1, b + 1, c + 1)。
- 因此,我们就可以使用动态规划来解决这个问题了。我们用 D[i][j] 表示 A 的前 i 个字母和 B 的前 j 个字母之间的编辑距离。
- 如上所述,当我们获得 D[i][j-1],D[i-1][j] 和 D[i-1][j-1] 的值之后就可以计算出 D[i][j]。1. D[i][j-1] 为 A 的前 i 个字符和 B 的前 j - 1 个字符编辑距离的子问题。即对于 B 的第 j 个字符,我们在 A 的末尾添加了一个相同的字符,那么 D[i][j] 最小可以为 D[i][j-1] + 1;2. D[i-1][j] 为 A 的前 i - 1 个字符和 B 的前 j 个字符编辑距离的子问题。即对于 A 的第 i 个字符,我们在 B 的末尾添加了一个相同的字符,那么 D[i][j] 最小可以为 D[i-1][j] + 1;3. D[i-1][j-1] 为 A 前 i - 1 个字符和 B 的前 j - 1 个字符编辑距离的子问题。即对于 B 的第 j 个字符,我们修改 A 的第 i 个字符使它们相同,那么 D[i][j] 最小可以为 D[i-1][j-1] + 1。特别地,如果 A 的第 i 个字符和 B 的第 j 个字符原本就相同,那么我们实际上不需要进行修改操作。在这种情况下,D[i][j] 最小可以为 D[i-1][j-1]。
- 一般题解到这里就结束了,但其实我们还可以继续优化空间。
- 由于动态规划中,我们比较两个子串,只依赖于各减少最后一个字符的子串的编辑距离,所以我们的动态规划数组是可以重复利用的,不需要二维数组,只需要一维数组即可,即滚动数组的方式。
题解:
rust:
二维数组(易懂)
implSolution{pubfnmin_distance(word1:String, word2:String)->i32{let l1 = word1.len();let l2 = word2.len();// 有一个字符串为空串if l1 ==0|| l2 ==0{return(l1 + l2)asi32;}// DP 数组letmut dp =vec![vec![0; l2 +1]; l1 +1];// 边界状态初始化(0..=l1).for_each(|i|{
dp[i][0]= i;});(0..=l2).for_each(|i|{
dp[0][i]= i;});// 计算所有 DP 值(1..=l1).for_each(|i|{(1..=l2).for_each(|j|{let insert1 = dp[i -1][j]+1;let insert2 = dp[i][j -1]+1;let replace1 =if word1.as_bytes()[i -1]!= word2.as_bytes()[j -1]{
dp[i -1][j -1]+1}else{// 两个字母相同,不用修改,所以操作次数不变
dp[i -1][j -1]};
dp[i][j]= insert1.min(insert2).min(replace1);});});return dp[l1][l2]asi32;}}
滚动数组(更加优化的内存空间)
implSolution{pubfnmin_distance(mut word1:String,mut word2:String)->i32{letmut l1 = word1.len();letmut l2 = word2.len();// 有一个字符串为空串if l1 ==0{return l2 asi32;}if l2 ==0{return l1 asi32;}// 让内层单词较短,可以让dp数组较小if l1 < l2 {let wt = word1;
word1 = word2;
word2 = wt;let lt = l1;
l1 = l2;
l2 = lt;}// DP 滚动数组letmut dp =(0..=l2).collect::<Vec<_>>();// 计算所有 DP 值
word1.bytes().enumerate().for_each(|(i1, c1)|{letmut pre = i1;
dp[0]= pre +1;
word2.bytes().enumerate().for_each(|(i2, c2)|{let tmp = dp[i2 +1];if c1 == c2 {
dp[i2 +1]= pre;}else{// dp[i2 + 1]:相当于向第一个单词插入一个字母// dp[i2]:相当于向第二个单词插入一个字母// pre: 相当于修改第一个单词一个字母
dp[i2 +1]= dp[i2 +1].min(dp[i2]).min(pre)+1;}
pre = tmp;});});
dp[l2]asi32}}
go:
funcminDistance(word1 string, word2 string)int{
l1 :=len(word1)
l2 :=len(word2)// 有一个字符串为空串if l1 ==0{return l2
}if l2 ==0{return l1
}// 让内层单词较短,可以让dp数组较小if l1 < l2 {
word1, word2 = word2, word1
l1, l2 = l2, l1
}// DP 滚动数组
dp :=make([]int, l2+1)for i :=1; i <= l2; i++{
dp[i]= i
}// 计算所有 DP 值for i1, c1 :=range word1 {
pre := i1
dp[0]= pre +1for i2, c2 :=range word2 {
tmp := dp[i2+1]if c1 == c2 {
dp[i2+1]= pre
}else{// dp[i2 + 1]:相当于向第一个单词插入一个字母// dp[i2]:相当于向第二个单词插入一个字母// pre: 相当于修改第一个单词一个字母if dp[i2+1]> dp[i2]{
dp[i2+1]= dp[i2]}if dp[i2+1]> pre {
dp[i2+1]= pre
}
dp[i2+1]+=1}
pre = tmp
}}return dp[l2]}
c++:
classSolution{public:intminDistance(string word1, string word2){int l1 = word1.length(), l2 = word2.length();// 有一个字符串为空串if(l1 ==0){return l2;}if(l2 ==0){return l1;}// 让内层单词较短,可以让dp数组较小if(l1 < l2){
string wt = word1;
word1 = word2;
word2 = wt;int lt = l1;
l1 = l2;
l2 = lt;}// DP 滚动数组int dp[l2 +1];for(int i =1; i <= l2;++i){
dp[i]= i;}// 计算所有 DP 值for(int i1 =0; i1 < l1;++i1){int pre = i1;
dp[0]= pre +1;for(int i2 =0; i2 < l2;++i2){constint tmp = dp[i2 +1];if(word1[i1]== word2[i2]){
dp[i2 +1]= pre;}else{// dp[i2 + 1]:相当于向第一个单词插入一个字母// dp[i2]:相当于向第二个单词插入一个字母// pre: 相当于修改第一个单词一个字母
dp[i2 +1]=min(min(dp[i2 +1], dp[i2]), pre)+1;}
pre = tmp;}}return dp[l2];}};
python:
classSolution:defminDistance(self, word1:str, word2:str)->int:
l1 =len(word1)
l2 =len(word2)# 有一个字符串为空串if l1 ==0:return l2
if l2 ==0:return l1
# 让内层单词较短,可以让dp数组较小if l1 < l2:
word1, word2 = word2, word1
l1, l2 = l2, l1
# DP 数组
dp =[x for x inrange(l2 +1)]# 计算所有 DP 值for i1 inrange(l1):
pre = i1
dp[0]= pre +1for i2 inrange(l2):
tmp = dp[i2 +1]if word1[i1]== word2[i2]:
dp[i2 +1]= pre
else:# dp[i2 + 1]:相当于向第一个单词插入一个字母# dp[i2]:相当于向第二个单词插入一个字母# pre: 相当于修改第一个单词一个字母
dp[i2 +1]=min(dp[i2 +1], dp[i2], pre)+1
pre = tmp
return dp[l2]
java:
classSolution{publicintminDistance(String word1,String word2){int l1 = word1.length(), l2 = word2.length();// 有一个字符串为空串if(l1 ==0){return l2;}if(l2 ==0){return l1;}// 让内层单词较短,可以让dp数组较小if(l1 < l2){String wt = word1;
word1 = word2;
word2 = wt;int lt = l1;
l1 = l2;
l2 = lt;}// DP 滚动数组int[] dp =newint[l2 +1];for(int i =1; i <= l2;++i){
dp[i]= i;}// 计算所有 DP 值for(int i1 =0; i1 < l1;++i1){int pre = i1;
dp[0]= pre +1;for(int i2 =0; i2 < l2;++i2){finalint tmp = dp[i2 +1];if(word1.charAt(i1)== word2.charAt(i2)){
dp[i2 +1]= pre;}else{// dp[i2 + 1]:相当于向第一个单词插入一个字母// dp[i2]:相当于向第二个单词插入一个字母// pre: 相当于修改第一个单词一个字母
dp[i2 +1]=Math.min(Math.min(dp[i2 +1], dp[i2]), pre)+1;}
pre = tmp;}}return dp[l2];}}
非常感谢你阅读本文~
欢迎【点赞】【收藏】【评论】三连走一波~
放弃不难,但坚持一定很酷~
希望我们大家都能每天进步一点点~
本文由 二当家的白帽子:https://le-yi.blog.csdn.net/ 博客原创~
本文转载自: https://blog.csdn.net/leyi520/article/details/132403173
版权归原作者 二当家的白帽子 所有, 如有侵权,请联系我们删除。
版权归原作者 二当家的白帽子 所有, 如有侵权,请联系我们删除。