1、倒排索引是搜索引擎的核心。搜索引擎的主要目标是在查找发生搜索条件的文档时提供快速搜索。倒排索引是一种像数据结构一样的散列图,可将用户从单词导向文档或网页。它是搜索引擎的核心。其主要目标是快速搜索从数百万文件中查找数据。
2、传统的我们的检索是通过文章,逐个遍历找到对应关键词的位置。而倒排索引,是通过分词策略,形成了词和文章的映射关系表,这种词典+映射表即为倒排索引。有了倒排索引,就能实现o(1)时间复杂度的效率检索文章了,极大的提高了检索效率。

学术的解答方式:
倒排索引,相反于一篇文章包含了哪些词,它从词出发,记载了这个词在哪些文档中出现过,由两部分组成——词典和倒排表。
加分项:倒排索引的底层实现是基于:FST(Finite State Transducer)数据结构。
lucene从4+版本后开始大量使用的数据结构是FST。FST有两个优点:
1)空间占用小。通过对词典中单词前缀和后缀的重复利用,压缩了存储空间;
2)查询速度快。O(len(str))的查询时间复杂度。

Elasticsearch的倒排索引是什么?相关推荐

  1. ElasticSearch(五) 倒排索引与分词

    title: ElasticSearch(五) 倒排索引与分词 tags: ElasticSearch author: Clown95 倒排索引与分词 倒排索引 Elasticsearch 使用一种称 ...

  2. Elasticsearch之倒排索引

    搜索引擎 正排索引 - 文档Id到文档内容.单词的关联关系 文档ID 文档内容 1 elasticsearch是最流行的搜索引擎 2 php是世界上最好的语言 3 搜索引擎是如何诞生的 倒排索引 - ...

  3. 【Elasticsearch】倒排索引原理

    1.概述 转载:elasticsearch 倒排索引原理 本文写的不错. 网上看到的一篇文章,对Lucene的倒排索引是如何执行的,说的比较易懂,就转过来分享下. Elasticsearch是通过Lu ...

  4. Elasticsearch数据结构——倒排索引

    Elasticsearch--倒排索引 1.正向索引和反向索引 先介绍一下正向索引: 当用户发起查询时(假设查询为一个关键词),搜索引擎会扫描索引库中的所有文档,找出所有包含关键词的文档,这样依次从文 ...

  5. 关于elasticsearch索引,倒排索引简介

    参考文章:终于有人把elasticsearch原理讲通了! 小史是一个非科班的程序员,虽然学的是电子专业,但是通过自己的努力成功通过了面试,现在要开始迎接新生活了. 随着央视诗词大会的热播,小史开始对 ...

  6. ElasticSearch系列——倒排索引、删除映射类型、打分机制、配置文件、常见错误

    文章目录 1 倒排索引 2 删除映射类型 一 前言 二 什么是映射类型? 三 为什么要删除映射类型? 四 映射类型的替代方法 4.1 将映射类型分开存储在索引中 4.2 自定义类型字段回到顶部 五 没 ...

  7. Day123.ElasticSearch:CAP定理、集群搭建、架构原理及分片、倒排索引、面试题

    目录 一.CAP定理 二.ES集群 1.搭建集群: 2.head 插件安装 3.集群测试 4.核心概念 二.架构原理及分片 一. ElasticSearch 分片 二. 分片控制 三. 分片原理 1. ...

  8. ElasticSearch基础2之倒排索引原理和中文分词器es-ik

    正向索引与倒排索引 正向索引        正排表是以文档的ID为关键字,表中记录文档中每个字的位置信息,查找时扫描表中每个文档中字的信息直到找出所有包含查询关键字的文档.        这种组织方法 ...

  9. 为什么 ElasticSearch 比 MySQL 更适合复杂条件搜索

    熟悉 MySQL 的同学一定都知道,MySQL 对于复杂条件查询的支持并不好.MySQL 最多使用一个条件涉及的索引来过滤,然后剩余的条件只能在遍历行过程中进行内存过滤. 上述这种处理复杂条件查询的方 ...

最新文章

  1. python采集cpu信息
  2. Lucene:基于Java的全文检索引擎简介(转载)
  3. mysql 四舍五入
  4. ASP调用存储过程详解。
  5. compareHist函数 例子
  6. 最长回文子串python_最长回文子串(Python)
  7. 工程师男友如何反窃听?趣聊密码学入门科普
  8. 怎么看调用的接口_SpringCloud服务间调用
  9. linux环境下的c++编程
  10. Internet Explorer 10 的 User-Agent 字符串
  11. 麻瓜编程python爬虫微专业_微专业:Python Web开发工程师(零基础课程),麻瓜编程侯爵主讲 价值2400元...
  12. 彻底了解DVD:从入门到精通(三)[转]
  13. 有一种单身叫宁缺勿滥 -- 纪念百年神棍节
  14. PublikDemand:汇集群众力量 与大公司抗争到底
  15. ubuntu 18.04 install tensorflow-nightly-gpu and tfp-nightly
  16. Python网络编程(一)
  17. Python数据加密与解密相关操作(hashlib、hmac、random、base64、pycrypto)
  18. 【​观察】机遇和挑战并存 智能手环需要来一次华丽的蜕变
  19. Matlab顶级期刊配色工具Rggsci
  20. 将数字字符串转换为人民币大写,壹、贰、叁、肆、伍、陆、柒、捌、玖、拾

热门文章

  1. Android学习之碎片与活动之间的通信
  2. 快速排序思路(前后指针版),代码实现
  3. mysql 数据库之表操作
  4. 全面改革:解读 Vue 3.0 的变化
  5. 最全的“大数据”学习资源
  6. Vue.js 2.x笔记:指令(4)
  7. 《程序员代码面试指南》第一章 栈和队列 设计一个有getMin功能的栈
  8. Spring核心系列之ApplicationContext
  9. webstorm vue代码修改后不更新问题
  10. 关于Mysql的错误:No query specified