一、前言(鸡汤(一段废。。话。。可以跳过啦))

同学们好!没想到我这个小小的公众号破千粉啦,对于大佬们而言或许不值一提,但是对我而言是一个莫大的鼓舞!更加坚定了我持续输出优质内容的决心。希望我们都能每天坚持前进30公里,一直坚持做正确的事情,而不是选择容易的事情,加油!?

二、原题描述

三、题目分析

今天这道题是一道字符串的题目。

["time", "me", "bell"]是待编码列表;

"time#bell#"是编码结果;

indexes = [0, 2, 5]对应的是三个单词在编码结果中的起始位置。表示从编码结果的这个下标开始,到#位置结束,所组成的单词就是单词列表中的单词。可以看以下图示:

题目要求的是编码结果的长度。可以想到最后的编码结果肯定是若干个单词之间用#分隔开来的。示例里的 “me” 由于是 “time” 的后缀,所以 “me” 这个单词不用出现在最后的编码结果里,所以我们只需要找到单词列表里,哪些单词是别的单词的后缀就可以了。这题很明显是用字典树来做的。为什么很明显呢?后面我们来解释。(当然啦本题也可以不用字典树,字符串反转并排序后,直接遍历一遍判断前缀也行啦,但是今天这道打卡题也是Trie的典型入门题,因此可以借由此题来学习一下Trie~)

字典树/Trie树/前缀树


字典树又名前缀树,Trie树,是一种存储大量字符串的树形数据结构,相比于HashMap存储,在存储单词(和语种无关,任意语言都可以)的场景上,节省了大量的内存空间。

下图演示了一个保存了8个单词的字典树的结构,8个单词分别是:"A", "to", "tea", "ted", "ten", "i", "in", "inn"。(蓝色节点表示单词的结尾字符)

怎么理解这棵树呢?你可以从根节点开始尝试走一下所有的路径,就会发现,每条从根节点到蓝色节点的路径都构成了单词。trie树里的每个节点只需要保存当前的字符就可以了(当然你也可以额外记录别的信息,比如记录一下如果以当前节点结束是否构成单词、构成的单词是什么等)

你注意到了吗?从根节点出发的路径,都是给定单词列表里某个/某些单词的前缀。反之,如果某个字符串没有出现在这棵树的路径上,那就肯定不是某个单词的前缀。上面说很明显这题是用字典树来做,原因就是:这类很明显是用字典树去做的题目,明显特征就是需要大量地判断某个字符串是否是给定单词列表中的前缀/后缀。为什么要说后缀也可以呢?因为把单词倒着插入,就可以搜后缀了~

trie节点的定义就很容易了(trie的根节点是一个空节点;另外本题单词只包含26个小写字母)

class TrieNode {    char val;    TrieNode[] children = new TrieNode[26];     // 这里可以添加其它你需要的信息,比如标识是否是单词的结尾字符        public TrieNode() {}    public TrieNode(char val) {        this.val = val;    }}

插入单词的操作如下:

public void insert(String word) {    TrieNode cur = root;    for (int i = 0; i < word.length(); i++) {        char c = word.charAt(i);        if (cur.children[c - 'a'] == null) {            cur.children[c - 'a'] = new TrieNode(c);        }        cur = cur.children[c - 'a'];    }}

你可以用以下题目做练习:208. 实现Trie(前缀树)

四、代码实现

那为什么这题我们要用字典树做呢?因为我们需要知道单词列表里,哪些单词是其它某个单词的后缀(如果是某个单词的后缀,那它就不需要出现在编码结果里了)。既然要求的是后缀,我们只要把单词的倒序插入字典树,再用字典树判断某个单词的逆序是否出现在字典树里就可以了。

比如示例中的["time", "me", "bell"]的逆序就是["emit", "em", "lleb"]。我们可以发现em是emit的前缀。所以"em"就可以忽略了。我们必须要先插入长的单词,否则会有问题,比如如果我先插入了"em",再插入"emit",会发现两个都可以插入进去,很显然是不对的,所以在插入之前需要先根据单词的长度由长到短排序。

class Solution {    public int minimumLengthEncoding(String[] words) {        int len = 0;        Trie trie = new Trie();        // 先对单词列表根据单词长度由长到短排序        Arrays.sort(words, (s1, s2) -> s2.length() - s1.length());        // 单词插入trie,返回该单词增加的编码长度        for (String word: words) {            len += trie.insert(word);        }        return len;    }}// 定义tireclass Trie {        TrieNode root;        public Trie() {        root = new TrieNode();    }    public int insert(String word) {        TrieNode cur = root;        boolean isNew = false;        // 倒着插入单词        for (int i = word.length() - 1; i >= 0; i--) {            int c = word.charAt(i) - 'a';            if (cur.children[c] == null) {                isNew = true; // 是新单词                cur.children[c] = new TrieNode();            }            cur = cur.children[c];        }        // 如果是新单词的话编码长度增加新单词的长度+1,否则不变。        return isNew? word.length() + 1: 0;    }}class TrieNode {    char val;    TrieNode[] children = new TrieNode[26];    public TrieNode() {}}

以上就ok啦,trie的基础应用,所以比较简单,稍微再难一点的题目一般都是和dfs结合~。

五、其它

trie树除了刷题还出现在什么地方呢?

搜索引擎

比如你在搜索引擎里输入 ”甜” ?,它会给你一系列以“甜”开头的搜索词供你选择。

区块链

trie树的进阶版,Merkle Patricia Tree(https://ethfans.org/toya/articles/588),它能够高效、安全地验证大型数据结构中的数据,我从别的地方摘抄了下摘要:

一种经过改良的、融合了默克尔树和前缀树两种树结构优点的数据结构,以太坊中,MPT是一个非常重要的数据结构,在以太坊中,帐户的交易信息、状态以及相应的状态变更,还有相关的交易信息等都使用MPT来进行管理,其是整个数据存储的重要一环。交易树,收据树,状态树都是采用的MPT结构。

https://www.cnblogs.com/whyaza/p/10034128.html

分词

常见的分词库,或多或少会用到字典树,或者其它类似的存储字符串的数据结构(比如“双数组trie树”)。原因就是因为它能提供良好的前缀查询(一些分词算法需要大量调用该方法)。

python有一个很著名的分词库叫作 jieba,里面就用到了字典树(虽说由于jieba源码里字典树实现得不够优雅,后来被替代了?)。这个库有Java版本叫作 jieba-analysis,但是已经很久不更新了,并且分词结果和python版本的不一致。❤️因此,我以学习为目的,重写了Java版本的jieba,名叫?jaba?(https://github.com/Soud95/Jaba)。得益于用了更高级的 AhoCorasickDoubleArrayTrie,分词速度比 jieba-analysis 要快一倍,而且保证了分词结果和python版 jieba 一致!欢迎大佬们star~~~如果star够多的话,会继续更新,并且发到maven仓库滴~~ ▄█▔▉●

另外还有IP路由、倒排索引等等应用场景,感兴趣的小伙伴们自行探索~~


锵锵锵![✅] 每日营业1/1

我的多篇题解被Leetcode官网评为“精选题解”

大佬们可以随手关注一下我的知乎专栏【甜姨的力扣题解】

Jaba感兴趣的请戳我的github链接:https://github.com/Soud95/Jaba

所以!还等啥呢!宝宝们快点 关注 + 在看 鸭 ٩(●˙ε˙●)۶

留言区

字典树实现_【Leetcode每日打卡】单词的压缩编码 Trie(字典树)入门相关推荐

  1. 【LeetCode】【HOT】208. 实现 Trie (前缀树)

    [LeetCode][HOT]208. 实现 Trie (前缀树) 文章目录 [LeetCode][HOT]208. 实现 Trie (前缀树) package hot;public class So ...

  2. 并查集c++代码_[Leetcode 每日精选](本周主题-并查集) 547. 朋友圈

    题目难度: 中等 原题链接 今天继续来做并查集的问题, 这道题仍然比较基础, 而且也是个比较接近现实的问题了. 大家在我的公众号"每日精选算法题"中的聊天框中回复 并查集 就能看到 ...

  3. b+树时间复杂度_前端大神用的学习笔记:线段树和树状数组

    全文篇幅较长,细心理解一定会有收获的♪(^∇^*). 1|0线段树 1|1一些概念     线段树是一种二叉搜索树,每一个结点都是一个区间(也可以叫作线段,可以有单点的叶子结点),有一张比较形象的图如 ...

  4. 怎么判断一个字符串的最长回文子串是否在头尾_【Leetcode每日打卡】最长回文串...

    干货预警:所有文章都会首发于我的公众号[甜姨的奇妙冒险],欢迎watch. 一.来历: 力扣从3月开始开启了每日一题打卡活动,于是跟风加入了打卡大军,这两天写评论.发题解,没想到反响还不错,收到了来自 ...

  5. pat根据中序遍历和先序遍历_[leetcode/lintcode 题解] 前序遍历和中序遍历树构造二叉树...

    [题目描述] 根据前序遍历和中序遍历树构造二叉树. 在线评测地址: 九章算法 - 帮助更多中国人找到好工作,硅谷顶尖IT企业工程师实时在线授课为你传授面试技巧​www.jiuzhang.com [样例 ...

  6. 计算字典的个数_[LeetCode] 440. 字典序的第K小数字

    题目链接: https://leetcode-cn.com/problems/k-th-smallest-in-lexicographical-order 难度:困难 通过率:28.4% 题目描述: ...

  7. LeetCode每日打卡 - 4的幂

    不使用循环来今天解题 public boolean isPowerOfFour(int n) {return n > 0 && (n & (n-1)) == 0 & ...

  8. LeetCode每日打卡 - 汉明距离总和

    有点慢,两层循环也可以完成,就是换个方向,外层遍历32大小的bits数组,里层遍历nums的数字每次右移一位,计算方法类似. class Solution {public int totalHammi ...

  9. LeetCode每日打卡 - 反转每对括号间的子串

    题解中有个更好的思路,stack存入的不是(的坐标,存入每次到左括号的字符串,拿到右括号就对其进行反转,更妙一些. import java.util.Stack; class Solution {pu ...

最新文章

  1. GridView单元格取值显示为nbsp;
  2. Python_地址中左斜线和右斜线的区别——Python系列学习笔记
  3. 串口通讯编程一日通2(Overlapped IO模型)
  4. 使用中断后不停止_仓鼠偷吃鼠粮,被发现后立刻停止,但鼠鼠满脸不情愿
  5. Velocity教程 (zhuan)
  6. java无法输出_这个java程序为什么不能输出结果?
  7. 强引用、软引用、弱引用、虚引用、终结器引用
  8. 黑马vue实战项目-(一)项目初始化登录功能开发
  9. 一份完整的数据分析师成长书单
  10. Spring ldap ODM
  11. 理解ASP.NET Core - 发送Http请求(HttpClient)
  12. 沈航-数理统计-17-18B-有答案
  13. 2022年最火副业;海外抖音 (TikTok) 搬运视频,一周赚一个月工资。
  14. 详解网络爬虫:网络爬虫是干什么的?有哪些应用场景?
  15. C语言写个简单的串口调试助手
  16. CGI实现文件的上传和下载
  17. java spu sku_SpringBoot电商项目实战 — 商品的SPU/SKU实现
  18. web前端 - Vue常见问题汇总及解决方案
  19. [POI2008]CLO-Toll
  20. maya导入abc文件到UE4

热门文章

  1. Python实战从入门到精通第五讲——数据结构与算法3之序列中出现最多的元素
  2. 深度学习福利入门到精通第一讲——LeNet模型
  3. TI-ONE 全程助力算法大赛,承包你的比赛平台和计算资源
  4. 机器学习算法总结之XGBoost(下) 实战与调参
  5. 8183微型计算机,佳木斯大学12年微机原理复习题..doc
  6. Leetcode每日一题:1025.divisor-game(除数博弈)
  7. 读书笔记——计算机组成原理
  8. 西瓜书+实战+吴恩达机器学习(一)机器学习基础(数据集划分、分类回归评估指标)
  9. UWP 流畅设计中的光照效果(容易的 RevealBorderBrush 和不那么容易的 RevealBackgroundBrush)...
  10. 第二十:如何把Jenkins+Allure2生成的报告发送邮件(重点超详细)