(给算法爱好者加星标,修炼编程内功)

作者:神奕

blog.csdn.net/lisonglisonglisong/article/details/45584721

【前言】在计算机科学中,trie,又称前缀树字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串。

与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。

一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。

让我们一起来学习下它吧。

一、什么是Trie树

Trie树,又叫字典树、前缀树(Prefix Tree)、单词查找树 或 键树,是一种多叉树结构。

如下图:

上图是一棵Trie树,表示了关键字集合{“a”, “to”, “tea”, “ted”, “ten”, “i”, “in”, “inn”} 。从上图可以归纳出Trie树的基本性质:

  • 根节点不包含字符,除根节点外的每一个子节点都包含一个字符。

  • 从根节点到某一个节点,路径上经过的字符连接起来,为该节点对应的字符串。

  • 每个节点的所有子节点包含的字符互不相同。

通常在实现的时候,会在节点结构中设置一个标志,用来标记该结点处是否构成一个单词(关键字)。

可以看出,Trie树的关键字一般都是字符串,而且Trie树把每个关键字保存在一条路径上,而不是一个结点中。

另外,两个有公共前缀的关键字,在Trie树中前缀部分的路径相同,所以Trie树又叫做前缀树(Prefix Tree)。

二、Trie树的优缺点

Trie树的核心思想是空间换时间,利用字符串的公共前缀来减少无谓的字符串比较以达到提高查询效率的目的。

优点

  1. ‍‍‍‍插入和查询的效率很高,都为O(m)O(m),其中 m" role="presentation" style=" box-sizing: border-box; outline: 0px; display: inline; line-height: normal; word-spacing: normal; overflow-wrap: break-word; float: none; direction: ltr; max-width: none; max-height: none; min-width: 0px; min-height: 0px; border-width: 0px; border-style: initial; border-color: initial; ">mm 是待插入/查询的字符串的长度。

  2. 关于查询,会有人说 hash 表时间复杂度是O(1)" role="presentation" style=" box-sizing: border-box; outline: 0px; display: inline; line-height: normal; word-spacing: normal; overflow-wrap: break-word; float: none; direction: ltr; max-width: none; max-height: none; min-width: 0px; min-height: 0px; border-width: 0px; border-style: initial; border-color: initial; ">O(1)O(1)不是更快?但是,哈希搜索的效率通常取决于 hash 函数的好坏,若一个坏的 hash 函数导致很多的冲突,效率并不一定比Trie树高。

  3. Trie树中不同的关键字不会产生冲突。

  4. Trie树只有在允许一个关键字关联多个值的情况下才有类似hash碰撞发生。

  5. Trie树不用求 hash 值,对短字符串有更快的速度。通常,求hash值也是需要遍历字符串的。

  6. Trie树可以对关键字按字典序排序。‍‍‍‍

缺点

  1. 当 hash 函数很好时,Trie树的查找效率会低于哈希搜索

  2. 空间消耗比较大。

三、Trie树的应用

1、字符串检索

检索/查询功能是Trie树最原始的功能。思路就是从根节点开始一个一个字符进行比较:

  • 如果沿路比较,发现不同的字符,则表示该字符串在集合中不存在。

  • 如果所有的字符全部比较完并且全部相同,还需判断最后一个节点的标志位(标记该节点是否代表一个关键字)。

struct trie_node{    bool isKey;   // 标记该节点是否代表一个关键字    trie_node *children[26]; // 各个子节点 };

2、词频统计

Trie树常被搜索引擎系统用于文本词频统计 。

struct trie_node{    int count;   // 记录该节点代表的单词的个数    trie_node *children[26]; // 各个子节点 };

思路:为了实现词频统计,我们修改了节点结构,用一个整型变量count来计数。对每一个关键字执行插入操作,若已存在,计数加1,若不存在,插入后count置1。

注意:第一、第二种应用也都可以用 hash table 来做。

3、字符串排序

Trie树可以对大量字符串按字典序进行排序,思路也很简单:遍历一次所有关键字,将它们全部插入trie树,树的每个结点的所有儿子很显然地按照字母表排序,然后先序遍历输出Trie树中所有关键字即可。

4、前缀匹配

例如:找出一个字符串集合中所有以ab开头的字符串。我们只需要用所有字符串构造一个trie树,然后输出以a->b->开头的路径上的关键字即可。

trie树前缀匹配常用于搜索提示。如当输入一个网址,可以自动搜索出可能的选择。当没有完全匹配的搜索结果,可以返回前缀最相似的可能。

5、作为其他数据结构和算法的辅助结构

如后缀树,AC自动机等。

四、Trie树的实现

这里为了方便,我们假设所有的关键字都由 a-z 的字母组成。

下面是 trie 树的一种典型实现:

#include #include using namespace std;#define ALPHABET_SIZE 26typedef struct trie_node{    int count;   // 记录该节点代表的单词的个数    trie_node *children[ALPHABET_SIZE]; // 各个子节点 }*trie;trie_node* create_trie_node(){    trie_node* pNode = new trie_node();    pNode->count = 0;    for(int i=0; i        pNode->children[i] = NULL;    return pNode;}void trie_insert(trie root, char* key){    trie_node* node = root;    char* p = key;    while(*p)    {        if(node->children[*p-'a'] == NULL)        {            node->children[*p-'a'] = create_trie_node();        }        node = node->children[*p-'a'];        ++p;    }    node->count += 1;}/** * 查询:不存在返回0,存在返回出现的次数 */ int trie_search(trie root, char* key){    trie_node* node = root;    char* p = key;    while(*p && node!=NULL)    {        node = node->children[*p-'a'];        ++p;    }    if(node == NULL)        return 0;    else        return node->count;}int main(){    // 关键字集合    char keys[][8] = {"the", "a", "there", "answer", "any", "by", "bye", "their"};    trie root = create_trie_node();    // 创建trie树    for(int i = 0; i < 8; i++)        trie_insert(root, keys[i]);    // 检索字符串    char s[][32] = {"Present in trie", "Not present in trie"};    printf("%s --- %s\n", "the", trie_search(root, "the")>0?s[0]:s[1]);    printf("%s --- %s\n", "these", trie_search(root, "these")>0?s[0]:s[1]);    printf("%s --- %s\n", "their", trie_search(root, "their")>0?s[0]:s[1]);    printf("%s --- %s\n", "thaw", trie_search(root, "thaw")>0?s[0]:s[1]);    return 0;}

对于Trie树,我们一般只实现插入和搜索操作。这段代码可以用来检索单词和统计词频。

- EOF -

推荐阅读  点击标题可跳转

1、Trie树的分析和理解

2、巧用 Trie 树实现搜索引擎关键词提示功能

3、字典树入门

觉得本文有帮助?请分享给更多人

推荐关注「算法爱好者」,修炼编程内功

点赞和在看就是最大的支持❤️

路径前缀是什么意思_Trie 树是什么样的数据结构?有哪些应用场景?相关推荐

  1. 【HDOJ6955】Xor sum(异或前缀和,01字典树)

    1006 Xor sum 题意: 给出一个长度为n的序列,求一个最短连续子序列满足异或和大于等于k.n<1e5. 思路: 参考CF665E,求序列a中有多少个异或和大于等于k的子序列,枚举所有的 ...

  2. 树型结构(数据结构)

    6.1树的基本概念 树型结构是区别于线性结构的另一大数据结构,它具有分支性和层次性. 树是由n(n>=0)个结点构成的有限集合.n=0的树称为空树:当n!=0时,树中的结点度应该满足下列条件: ...

  3. MySQL底层为什么要选用B+树作为索引的数据结构呢?

    文章目录 MySQL底层为什么要选用B+树作为索引的数据结构呢? MySQL 索引底层数据结构选型 哈希表(Hash) 二叉查找树(BST) 平衡二叉树(AVL树) 红黑树 B-树 B+树 参考 My ...

  4. 5 判断数据是否存在_Trie树实现:100亿URL中判断某个URL是否存在

    之前在头条看到一篇<如何在100亿URL中判断某一个URL是否存在>,里面介绍的是使用布隆算法bloomfilter,我们也知道bloomfilter只能保证URL不存在. 在这里介绍一个 ...

  5. php 数组转目录树,PHP根据路径数组转成一个目录树

    $paths = ['aa','aa/bb','ww/yyy','aa/kk','xx/oo/pp']; 根据这个数组,转成目录树的结构,如下: aa -bb -kk ww -yyy xx -oo – ...

  6. BZOJ4627 前缀和 + 权值线段树

    https://www.lydsy.com/JudgeOnline/problem.php?id=4627 题意:求序列中和在L到R之间的字串种数. 要求的是和的范围,我们可以考虑先求一个前缀和pre ...

  7. yxc_第二章 数据结构(二)_Trie树

    目录 一.基本概念 二.AcWing 835 Trie字符串统计 本题思路: 一.基本概念 接下来的案例类似于邻接矩阵,横轴表示str[ i ] - 'a'(省略了7~25),竖轴表示节点编号.红色的 ...

  8. 图片路径前缀有blob?图片渲染不出来?

    写bug 你们遇见过这种图片路径咩 就很奇葩吧哈哈因为我图片渲染不出来~ 好像我保存之后就有这个 数据库也是有这个前缀 我的代码是这样的: handleAvatarSuccess(response, ...

  9. 左上角到右下角的路径 oj_【机器人路径规划】快速扩展随机树(RRT)算法

    内容无关:最近的课题内容和机器人运动规划方法有关,我把学习的内容整理成为工具箱上传到了我的github仓库,稍后将会发一篇说明介绍使用方法. XM522706601/robotics_tutorial ...

最新文章

  1. eclipse项目导出错误处理
  2. 进BAT一线大厂,前端工程师如何做准备?
  3. [刘阳Java]_CSS数字分页效果
  4. Mybatis Generator 逆向生成器
  5. Atlas读写分离Mysql集群的搭建
  6. xor和路径(codevs 2412)
  7. 结合CKFinder,给CKEditor加上上传图片功能
  8. Word中MathType公式与LaTeX公式的转换
  9. android 涂鸦之图片叠加,android图像处理系列之七--图片涂鸦,水印-图片叠加...
  10. IOS--CALayer实现,界限、透明度、位置、旋转、缩放组合动画(转)
  11. JavaScript 字符串(String)对象
  12. 全球软件无线电市场(SDR)标明到2020年的显著增量美元机会
  13. 计算机控制面板设置密码,如何设置修改电脑的开机密码
  14. Frodo and pillows CodeForces - 760B (二分)
  15. 第16套题目 doc.计算机,计算机二级ms实操题excel难点汇总.doc
  16. StringBuffer的理解
  17. 微信小程序实现跑马灯效果(完整代码)
  18. 在linux环境中安装jieba模块
  19. Ant编译Java项目-QuickStart
  20. AST抽象语法树的基本思想

热门文章

  1. Mybatis最入门---代码自动生成(generatorConfig.xml配置)
  2. Spring MVC页面重定向
  3. Ajax实现异步操作实例_针对XML格式的请求数据
  4. 在SQL SERVER中实现Split功能的函数,并在存储过程中使用
  5. Java处理split分割【for循环】
  6. Python的reshape(-1,1)
  7. Vue绑定数据v-bind缩写:字段名 双向绑定v-model缩写:model 监听动作v-on缩写@ 记住:与数据相关用冒号 与动作相关用@
  8. TP的依赖注入:将类类型的对象作为参数注入到当前类中
  9. CRMEB v4目录结构说明
  10. PHP中error_reporting()详解