文章目录

  • 1. 题目
  • 2. 解题
    • 2.1 动态规划
    • 2.2 Trie树

1. 题目

哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。
像句子"I reset the computer. It still didn’t boot!"已经变成了"iresetthecomputeritstilldidntboot"
在处理标点符号和大小写之前,你得先把它断成词语。
当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。
假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。

注意:本题相对原题稍作改动,只需返回未识别的字符数

示例:
输入:
dictionary = ["looked","just","like","her","brother"]
sentence = "jesslookedjustliketimherbrother"
输出: 7
解释: 断句后为"jess looked just like tim her brother",共7个未识别字符。(jess tim)提示:
0 <= len(sentence) <= 1000
dictionary中总字符数不超过 150000。
你可以认为dictionary和sentence中只包含小写字母。

来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/re-space-lcci
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

2. 解题

2.1 动态规划

  • dp[i] 表示包含 i 字符结尾的字符串 最少的未识别字符数,初始为 i+1(全部未识别)
  • 将 [ 0, i ] 区间切分,[ 0, j-1 ],[ j, i ] ,遍历所有的 j (j <= i)
  • 如果字典包含字符串 [ j, i ],dp[i]=min⁡(dp[i],dp[j−1])dp[i] = \min(dp[i], dp[j-1])dp[i]=min(dp[i],dp[j−1])
  • 如果字典不包含字符串 [ j, i ],dp[i]=min⁡(dp[i],dp[j−1]+i−j+1)dp[i] = \min(dp[i], dp[j-1]+i-j+1)dp[i]=min(dp[i],dp[j−1]+i−j+1)
  • 一旦 dp[i] == 0,可以终止内层循环
class Solution {public:int respace(vector<string>& dictionary, string sentence) {if(sentence.empty())return 0;int i, j, n = sentence.size();unordered_set<string> s;vector<int> dp(n,INT_MAX);for(auto& d : dictionary)s.insert(d);for(i = 0; i < n; ++i){dp[i] = i+1;if(s.count(sentence.substr(0,i+1))){dp[i] = 0;continue;}for(j = i; j > 0; --j){if(s.count(sentence.substr(j,i-j+1)))dp[i] = min(dp[i], dp[j-1]);elsedp[i] = min(dp[i], dp[j-1]+i-j+1);if(dp[i]==0)break;}}return dp[n-1];}
};

1156 ms 446.1 MB

2.2 Trie树

  • 在上面的思路下,将字典字符串反向插入trie树
  • 内层循环可以改为向前在trie树中查找存在的字符串最大长度,一旦不存在某个字符就不必再往前遍历了,因为肯定不存在,可以提高效率。
class trie
{public:trie* cur;trie* next[26] = {NULL};bool isEnd = false;void insert(string& s){cur = this;for(int i = s.size()-1; i >= 0; --i)//反向插入{if(cur->next[s[i]-'a'] == NULL){cur->next[s[i]-'a'] = new trie();}cur = cur->next[s[i]-'a'];}cur->isEnd = true;}
};class Solution {public:int respace(vector<string>& dictionary, string sentence) {if(sentence.empty())return 0;int i, j, n = sentence.size();unordered_set<string> s;trie *t = new trie(), *cur;for(auto& d : dictionary)t->insert(d);//字典插入trie树vector<int> dp(n,INT_MAX);for(i = 0; i < n; ++i){dp[i] = i+1;cur = t;for(j = i; j >= 0; --j)//从i处向前在trie树中查找单词{    if(cur->next[sentence[j]-'a'])//下一个字符存在{if(cur->next[sentence[j]-'a']->isEnd)//且是结束位置{if(j > 0)dp[i] = min(dp[i], dp[j-1]);elsedp[i] = 0;}else//不是结束位置,不匹配{if(j > 0)dp[i] = min(dp[i], dp[j-1]+i-j+1);elsedp[i] = min(dp[i], i-j+1);}}else//下一个字符不存在,可以结束了{if(j > 0)dp[i] = min(dp[i], dp[j-1]+i-j+1);elsedp[i] = min(dp[i], i-j+1);break;}if(dp[i]==0)   break;cur = cur->next[sentence[j]-'a'];}}return dp[n-1];}
};

120 ms 153.8 MB


我的CSDN博客地址 https://michael.blog.csdn.net/

长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!

程序员面试金典 - 面试题 17.13. 恢复空格(DP+Trie树)相关推荐

  1. 程序员面试金典 - 面试题 17.25. 单词矩阵(Trie树+DFS回溯,hard)

    1. 题目 给定一份单词的清单,设计一个算法,创建由字母组成的面积最大的矩形,其中每一行组成一个单词(自左向右),每一列也组成一个单词(自上而下). 不要求这些单词在清单里连续出现,但要求所有行等长, ...

  2. [Leetcode][程序员面试金典][面试题17.13][JAVA][恢复空格][动态规划][Trie][字符串哈希]

    [问题描述][中等] [解答思路] 1. 动态规划 动态规划流程 第 1 步:设计状态 dp[i] 表示字符串的前 i 个字符的最少未匹配数. 第 2 步:状态转移方程 假设当前我们已经考虑完了前 i ...

  3. 程序员面试金典 - 面试题 08.13. 堆箱子(DP)

    1. 题目 堆箱子.给你一堆n个箱子,箱子宽 wi.深 di.高 hi. 箱子不能翻转,将箱子堆起来时,下面箱子的宽度.高度和深度必须大于上面的箱子. 实现一种方法,搭出最高的一堆箱子.箱堆的高度为每 ...

  4. 程序员面试金典 - 面试题 17.08. 马戏团人塔(最长上升子序 DP/二分查找)

    文章目录 1. 题目 2. 解题 2.1 超时解 2.2 二分查找 1. 题目 有个马戏团正在设计叠罗汉的表演节目,一个人要站在另一人的肩膀上.出于实际和美观的考虑,在上面的人要比下面的人矮一点且轻一 ...

  5. 程序员面试金典 - 面试题 17.07. 婴儿名字

    题目难度: 中等 原题链接 今天继续更新程序员面试金典系列, 大家在公众号 算法精选 里回复 面试金典 就能看到该系列当前连载的所有文章了, 记得关注哦~ 题目描述 每年,政府都会公布一万个最常见的婴 ...

  6. 程序员面试金典 - 面试题 17.06. 2出现的次数(找递推规律)

    1. 题目 编写一个方法,计算从 0 到 n (含 n) 中数字 2 出现的次数. 示例: 输入: 25 输出: 9 解释: (2, 12, 20, 21, 22, 23, 24, 25)(注意 22 ...

  7. 程序员面试金典 - 面试题 17.22. 单词转换(BFS)

    1. 题目 给定字典中的两个词,长度相等. 写一个方法,把一个词转换成另一个词, 但是一次只能改变一个字符. 每一步得到的新词都必须能在字典中找到. 编写一个程序,返回一个可能的转换序列.如有多个可能 ...

  8. 程序员面试金典 - 面试题 17.15. 最长单词(排序+递归)

    1. 题目 给定一组单词words,编写一个程序,找出其中的最长单词,且该单词由这组单词中的其他单词组合而成. 若有多个长度相同的结果,返回其中字典序最小的一项,若没有符合要求的单词则返回空字符串. ...

  9. 程序员面试金典 - 面试题 17.07. 婴儿名字(并查集)

    1. 题目 每年,政府都会公布一万个最常见的婴儿名字和它们出现的频率,也就是同名婴儿的数量. 有些名字有多种拼法,例如,John 和 Jon 本质上是相同的名字,但被当成了两个名字公布出来. 给定两个 ...

最新文章

  1. Django进阶-auth集成认证模块
  2. 都说百度前端牛,来看看百度前端工程化之H5性能优化
  3. 假如我是超级卷王......
  4. 聊聊jump consistent hash
  5. ES6的新特性----Vue学习必备基础知识
  6. Python 计算机视觉(十二)—— OpenCV 进行图像分割
  7. JavaScript调用Web Services实现无刷新三联动
  8. eclipse导入maven项目
  9. 信息必填的php,php - {“成功”:0,“消息”:“必填字段丢失”}在本地主机上测试文件 - 堆栈内存溢出...
  10. Python 数据结构与算法——归并排序
  11. configure: error: gperf is needed
  12. Memcache和Redis区别:
  13. Box(-and-Whisker) Plot SPSS and Excel 箱图学习
  14. Java设计模式之工厂模式最详解(类图+源码)
  15. c语言中的三角函数公式,高中三角函数公式大全-必背基础知识点.doc
  16. redis 加锁新方法 - jedisCluster.set(key,value,NX,EX,expireSeconds);
  17. 中国有机微量矿物质天然饲料市场趋势报告、技术动态创新及市场预测
  18. 关于《后浪》的B站弹幕分析总结(四)——Python实现LDA内容主题挖掘及主题可视化
  19. 张宏系列又又双叒叕售罄了
  20. 基于微博的网络安全事件检测

热门文章

  1. 计算机系统遵循,自考《计算机系统结构》第10章精讲
  2. java后期发展方向_Java程序员的4个职业发展方向,该如何把握黄金5年?
  3. java 线程 状态 图_Java提高——多线程(一)状态图
  4. html如何制作滑块,网页制作html5实现滑块功能之type=quot;rangequot;属性-建站-建站教程-建站方法-米云建站 - 米云问答...
  5. Linux基础提高_系统性能相关命令
  6. Migrate Instance 操作详解 - 每天5分钟玩转 OpenStack(40)
  7. Sqlite学习笔记(五)SQLite封锁机制
  8. 分享Db4o的便捷封装类源码
  9. SharePoint 2013的100个新功能之搜索(一)
  10. 解决mysql表被crash的一次维护始末