ElasticSearch 2 (27) - 信息聚合系列之故事开始

摘要

到目前为止,本书都在着重介绍搜索。对于搜索,我们有查询条件以及与查找到与条件匹配的集合。这个过程就和如大海捞针一样。

对于聚合,我们站在远处总观数据。与查看单个文档不同,我们想要对数据集合进行整体的分析和总结。

版本

elasticsearch版本: elasticsearch-2.x

内容

到目前为止,本书都在着重介绍搜索。对于搜索,我们有查询条件以及与查找到与条件匹配的集合。这个过程就和如大海捞针一样。

对于聚合,我们站在远处总观数据。与查看单个文档不同,我们想要对数据集合进行整体的分析和总结:

  • 大海里有多少针?
  • 针的平均长度是多少?
  • 所有长度的中位数是什么?按生产商分类结果会是怎样?
  • 每个月大海里面会掉进多少根针?

聚合还可以回答更为详细的问题:

  • 销量最好的针的生产商是哪个?
  • 存在不普通或异常的针吗?

聚合允许我们问一些更复杂的数据问题。尽管和搜索的功能完全不同,但它利用相同的数据结构,这使聚合能够快速运行 近乎实时,就像搜索一样。

这对报表和仪表盘是强大的支持,不须要对所有数据进行汇总(不太好用的 Hadoop任务要执行一个星期),我们可以实时看到数据,并做出快速响应。报表随着数据的变化而变化,而不是那些预先计算好却已经过时的无关信息。

最后,聚合操作是与查询请求并行执行的,这意味着对于相同数据、同一请求,我们可以搜索、过滤文档,同时又能完成分析工作。由于聚合是在用户搜索的背景下计算的,我们不仅仅是显示四星级酒店,而是显示与搜索条件相匹配的四星级酒店。

聚合的功能非常强大以至于很多公司建立庞大的 Elasticsearch 集群的目的只是为了分析。

参考

elastic.co: Aggregations

转载于:https://www.cnblogs.com/richaaaard/p/5311548.html

ElasticSearch 2 (27) - 信息聚合系列之故事开始相关推荐

  1. ElasticSearch 2 (38) - 信息聚合系列之结束与思考

    ElasticSearch 2 (38) - 信息聚合系列之结束与思考 摘要 版本 elasticsearch版本: elasticsearch-2.x 内容 本小节涵盖了许多基本理论以及很多深入的技 ...

  2. ElasticSearch 2 (37) - 信息聚合系列之内存与延时

    ElasticSearch 2 (37) - 信息聚合系列之内存与延时 摘要 控制内存使用与延时 版本 elasticsearch版本: elasticsearch-2.x 内容 Fielddata ...

  3. ElasticSearch 2 (34) - 信息聚合系列之多值排序

    ElasticSearch 2 (34) - 信息聚合系列之多值排序 摘要 多值桶(terms.histogram 和 date_histogram)动态生成很多桶,Elasticsearch 是如何 ...

  4. ElasticSearch 2 (36) - 信息聚合系列之显著项

    ElasticSearch 2 (36) - 信息聚合系列之显著项 摘要 significant_terms(SigTerms)聚合与其他聚合都不相同.目前为止我们看到的所有聚合在本质上都是简单的数学 ...

  5. ElasticSearch 2 (16) - 深入搜索系列之近似度匹配

    ElasticSearch 2 (16) - 深入搜索系列之近似度匹配 摘要 标准的全文搜索使用TF/IDF处理文档.文档里的每个字段或一袋子词.match 查询可以告诉我们哪个袋子里面包含我们搜索的 ...

  6. ElasticSearch 2 (21) - 语言处理系列之单词识别

    ElasticSearch 2 (21) - 语言处理系列之单词识别 摘要 一个英语单词相对容易识别:因为英语单词是被空格或(某些)标点符号隔开的.但在英语中也有反例:you're 这个词是一个单词还 ...

  7. ElasticSearch 2 (26) - 语言处理系列之打字或拼写错误

    ElasticSearch 2 (26) - 语言处理系列之打字或拼写错误 摘要 我们喜欢在对结构化数据(如:日期和价格)做查询时,结果只返回那些能精确匹配的文档.但是,好的全文搜索不应该有这样的限制 ...

  8. ElasticSearch 2 (20) - 语言处理系列之如何开始

    ElasticSearch 2 (20) - 语言处理系列之如何开始 摘要 Elasticsearch 配备了一组语言分析器,为世界上大多数常见的语言提供良好的现成基础支持. 阿拉伯语.亚美尼亚语,巴 ...

  9. 【ElasticSearch从入门到放弃系列 零】ElasticSearch看这一篇就够了

    大数据时代系统和业务每分每秒都产生成千上万的数据,其存储一定是不能通过关系型数据库了,当然因为数据的持久性也不能存储到内存型Nosql数据库Redis中,我们通常会将这些数据存储在能够不丢失数据的非关 ...

最新文章

  1. 阿里2018营收2502亿元,云计算业务增幅超100%
  2. vue-cli打包构建时常见的报错解决方案
  3. python 遍历_python中使用iterrows()对dataframe进行遍历的示例
  4. codeforces 496 div3(A-E1)(JAVA)
  5. VTK:几何对象之Arrow
  6. python如何让图片镜像翻转_98后常春藤学霸林之秋,一作拿下CVPR最佳论文提名,首次挑战图片翻转不变性假设...
  7. 数据挖掘--挖掘建模-时序模式-ARIMA模型
  8. 开源自动化部署工具_6种开源家庭自动化工具
  9. FireFox中国管理者的脑袋被驴踢了。
  10. WebKit编译小结
  11. 1.语音增强技术概述
  12. jQuery实现下拉菜单[代码+详细讲解+效果图]
  13. 北大青鸟 某百货商场当日他在消费积分最高的八名顾客,他们的积分分别是18,25,7,36,13,2,89,63.编写程序找出的积分及他在数组中的下标
  14. 华三防火墙应用二层和三层的配置实例
  15. 2023.02.09 草图大师厨房效果图1skp素材效果图
  16. 使用Python进行交易策略和投资组合分析
  17. 教授专栏37 | 黄昊: 发展虚拟资产, 须监管教育并行
  18. 最优灵活体系结构(Optimal Flexible Architecture,OFA)
  19. UI设计师必备10大工具
  20. 用python画枫叶-python-函数及练习

热门文章

  1. zabbix入门之添加监控项
  2. /etc/shadow文件
  3. Comet OJ - 2019 六一欢乐赛
  4. #0 scrapy爬虫学习中遇到的坑记录
  5. v-contextmenu的使用(右键菜单)
  6. 转:pysqlite笔记
  7. Hybrid框架UI重构之路:五、前端那点事儿(HTML、CSS)
  8. 后台返回数据打印是[object object]的,报错:SyntaxError: JSON.parse: expected property name or ‘}‘ at line 1 column
  9. vue eslint报错Expected linebreaks to be ‘LF‘ but found ‘CRLF‘
  10. Android 自定义环形圆形显示统计数据z