在Elasticsearch下,一个文档除了有数据之外,它还包含了元数据(Metadata)。每创建一条数据时,都会对元数据进行写入等操作,当然有些元数据是在创建mapping的时候就会设置,元数据在Elasticsearch下起到了非常大的作用。本文将对

身份元数据(Identity meta-fields)

身份元数据顾名思义就是能够唯一标识Document的,Elasticsearch中主要有四个身份元数据:

1、_index:文档所属的index,这个index相当于关系型数据库中的数据库概念,它是存储和索引关联数据的地方;

2、_uid:其由_type和_id组成;

3、_type:文档所属的mapping type,相当于关系型数据库中的表的概念;

4、_id:文档的id,这个可以由Elasticsearch自动生成,也可以在写入Document的时候由程序指定。它与_index和_type组合时,就可以在Elasticsearch中唯一标识一个文档。

如果想及时了解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoop

文档源元数据(Document source meta-fields)

文档源元数据主要有两个:

1、_source:这个字段标识文档的主体信息,也就是我们写入在

2、_size:这个字段存储着_source字段中信息的大小,单位是byte;不过这需要我们安装mapper-size插件。

索引元数据(Indexing meta-fields)

1、_all:这个字段索引了所有其他字段的值;

2、_field_names:存储着文档中所有值为非空的字段信息,这在快速查找/过滤值存在或者值为空的情况下非常有用;

3、_timestamp:存储着当前文档的时间戳信息,可以由程序指定,也可以由ElasticSearch自动生成,其值会影响文档的删除(如果启用了TTL机制);

4、_ttl:标识着当前文档存储的时长,超过了这个时长文档将会被标识为delete,之后会被ElasticSearch删除。

路由元数据(Routing meta-fields)

1、_parent:用于创建两个映射的父子之间的关系;

2、_routing:自定义路由值,可以路由某个文档到具体的分片(shard)。

其他元数据

_meta:特定于应用程序的元数据。

phoenix的元数据一般存在哪里_ElasticSearch文档元数据(Metadata)相关推荐

  1. 【情报百科】如何使用FOCA进行OSINT文档元数据分析?

    全文共2508字,29图 预计阅读时间:7分钟 FOCA(Fingerprinting Organizations with Collected Archives)是一种主要用于在其扫描的文档中查找元 ...

  2. PDF Explained(翻译)第七章 文档元数据和导航

    本文是对PDF Explained(by John Whitington)第七章< Document Metadata and Navigation>的摘要式翻译,并加入了一些自己的理解. ...

  3. office文档元数据分析与获取实践

    1.关于office元数据,百度了一圈,资料比较散,最后找到了<MSOffice系列办公文档取证分析研究>这篇文章,和我找的资料相符,这里就引用一下这篇文章里涉及的内容. 2.xlsx文件 ...

  4. c语言删除文件第一行_ElasticSearch 文档的删除和批量操作

    松哥原创的 Spring Boot 视频教程已经杀青,感兴趣的小伙伴戳这里-->Spring Boot+Vue+微人事视频教程 ElasticSearch 系列第七篇,和大家聊一聊索引的基本操作 ...

  5. es内嵌文档查询_ElasticSearch 文档的增删改查都不会?

    本文主要是介绍 ElasticSearch 的文档增删改查和批量操作,同时会介绍一些 REST API 返回状态码的具体含义. 我们先来看下这个表: 这个表包含了 Index.Create.Read. ...

  6. 批量修改 Word 、Excel、PPT 文档中的标题、作者、版本号、公司、创建时间等元数据

    概要:「我的ABC软件工具箱」提供了强大的修改 Office 文档元数据的功能,包括常见的作者.版本号.公司.创建时间.修改时间等这些信息.支持的文档格式有 Word .Excel.PPT,既能够对原 ...

  7. 批量清空 Word 、Excel、PPT 文档中的标题、作者、版本号、公司、创建时间等元数据

    概要:「我的ABC软件工具箱」提供了强大的清空 Office 文档元数据的功能,包括常见的作者.版本号.公司.创建时间.修改时间等这些信息.支持的文档格式有 Word .Excel.PPT,能够一键对 ...

  8. ElasticSearch什么是文档?索引一个文档

    什么是文档? 程序中大多的实体或对象能够被序列化为包含键值对的JSON对象,键(key)是字段(field)或属性(property)的名字,值(value)可以是字符串.数字.布尔类型.另一个对象. ...

  9. 使用poi写入doc文档中文档打不开_基于NodeJS和浏览器的PDF文档引擎——PDFKit

    介绍 PDFKit是一个用于Node和浏览器的PDF文档生成库,可以轻松创建复杂的多页面可打印文档.API包含可链接性,包括低级功能以及更高级功能的抽象.PDFKit API设计简单,因此生成复杂文档 ...

最新文章

  1. TCP/IP UDP用户数据报协议 运输层
  2. MySQL 8.0 新特性之统计直方图
  3. IDE-Android Studio -FAQ-使用习惯(不断更新 欢迎留言)
  4. keil3如何放大字体_keil3如何设置字体 keil字体放大快捷键
  5. swift textView字数限制,textView点击完成隐藏键盘
  6. Spring-第2天
  7. mysql查询班级作业提交情况_MySQL中查询获取每个班级成绩前三名的学生信息
  8. 漫画算法python版下载_用 Python 下载漫画
  9. css基础知识汇总3
  10. java ocr linux_linux (centos7)上装Tesseract-OCR最新版本(5.0)
  11. JavaScript练习(一)——跟随鼠标移动
  12. Web服务器性能/压力测试工具http_load、webbench、ab、Siege
  13. Pixel 3 的最佳照片功能
  14. Java实现支付功能(支付宝)
  15. 密码破解---实验七:本地系统密码破解
  16. 简洁的旅行青蛙个人主页纯静态HTML
  17. MacOS图标文件 .icns 一键生成脚本
  18. yum完全配置及createrepo详解
  19. Android Studio学习开发笔记--基础
  20. Java实现的小根堆

热门文章

  1. android studio 优化完以后开不了虚拟机,Android studio 打不开官方虚拟机 100%成功解决方法...
  2. macOS安装docker
  3. Python-使用tkinter实现的摇骰子小游戏
  4. Python中的匿名函数及递归思想简析
  5. Spark SQL 简介
  6. UI upload多文件上传
  7. ELMo代码详解(二)
  8. scikit-learn中随机森林使用详解
  9. Hiberate中Update和Merge的一个小的区别
  10. [深度学习-实践]GAN入门例子-利用Tensorflow Keras与数据集CIFAR10生成新图片