ElasticSearch 2 (27) - 信息聚合系列之故事开始
ElasticSearch 2 (27) - 信息聚合系列之故事开始
摘要
到目前为止,本书都在着重介绍搜索。对于搜索,我们有查询条件以及与查找到与条件匹配的集合。这个过程就和如大海捞针一样。
对于聚合,我们站在远处总观数据。与查看单个文档不同,我们想要对数据集合进行整体的分析和总结。
版本
elasticsearch版本: elasticsearch-2.x
内容
到目前为止,本书都在着重介绍搜索。对于搜索,我们有查询条件以及与查找到与条件匹配的集合。这个过程就和如大海捞针一样。
对于聚合,我们站在远处总观数据。与查看单个文档不同,我们想要对数据集合进行整体的分析和总结:
- 大海里有多少针?
- 针的平均长度是多少?
- 所有长度的中位数是什么?按生产商分类结果会是怎样?
- 每个月大海里面会掉进多少根针?
聚合还可以回答更为详细的问题:
- 销量最好的针的生产商是哪个?
- 存在不普通或异常的针吗?
聚合允许我们问一些更复杂的数据问题。尽管和搜索的功能完全不同,但它利用相同的数据结构,这使聚合能够快速运行 近乎实时,就像搜索一样。
这对报表和仪表盘是强大的支持,不须要对所有数据进行汇总(不太好用的 Hadoop任务要执行一个星期),我们可以实时看到数据,并做出快速响应。报表随着数据的变化而变化,而不是那些预先计算好却已经过时的无关信息。
最后,聚合操作是与查询请求并行执行的,这意味着对于相同数据、同一请求,我们可以搜索、过滤文档,同时又能完成分析工作。由于聚合是在用户搜索的背景下计算的,我们不仅仅是显示四星级酒店,而是显示与搜索条件相匹配的四星级酒店。
聚合的功能非常强大以至于很多公司建立庞大的 Elasticsearch 集群的目的只是为了分析。
参考
elastic.co: Aggregations
转载于:https://www.cnblogs.com/richaaaard/p/5311548.html
ElasticSearch 2 (27) - 信息聚合系列之故事开始相关推荐
- ElasticSearch 2 (38) - 信息聚合系列之结束与思考
ElasticSearch 2 (38) - 信息聚合系列之结束与思考 摘要 版本 elasticsearch版本: elasticsearch-2.x 内容 本小节涵盖了许多基本理论以及很多深入的技 ...
- ElasticSearch 2 (37) - 信息聚合系列之内存与延时
ElasticSearch 2 (37) - 信息聚合系列之内存与延时 摘要 控制内存使用与延时 版本 elasticsearch版本: elasticsearch-2.x 内容 Fielddata ...
- ElasticSearch 2 (34) - 信息聚合系列之多值排序
ElasticSearch 2 (34) - 信息聚合系列之多值排序 摘要 多值桶(terms.histogram 和 date_histogram)动态生成很多桶,Elasticsearch 是如何 ...
- ElasticSearch 2 (36) - 信息聚合系列之显著项
ElasticSearch 2 (36) - 信息聚合系列之显著项 摘要 significant_terms(SigTerms)聚合与其他聚合都不相同.目前为止我们看到的所有聚合在本质上都是简单的数学 ...
- ElasticSearch 2 (16) - 深入搜索系列之近似度匹配
ElasticSearch 2 (16) - 深入搜索系列之近似度匹配 摘要 标准的全文搜索使用TF/IDF处理文档.文档里的每个字段或一袋子词.match 查询可以告诉我们哪个袋子里面包含我们搜索的 ...
- ElasticSearch 2 (21) - 语言处理系列之单词识别
ElasticSearch 2 (21) - 语言处理系列之单词识别 摘要 一个英语单词相对容易识别:因为英语单词是被空格或(某些)标点符号隔开的.但在英语中也有反例:you're 这个词是一个单词还 ...
- ElasticSearch 2 (26) - 语言处理系列之打字或拼写错误
ElasticSearch 2 (26) - 语言处理系列之打字或拼写错误 摘要 我们喜欢在对结构化数据(如:日期和价格)做查询时,结果只返回那些能精确匹配的文档.但是,好的全文搜索不应该有这样的限制 ...
- ElasticSearch 2 (20) - 语言处理系列之如何开始
ElasticSearch 2 (20) - 语言处理系列之如何开始 摘要 Elasticsearch 配备了一组语言分析器,为世界上大多数常见的语言提供良好的现成基础支持. 阿拉伯语.亚美尼亚语,巴 ...
- 【ElasticSearch从入门到放弃系列 零】ElasticSearch看这一篇就够了
大数据时代系统和业务每分每秒都产生成千上万的数据,其存储一定是不能通过关系型数据库了,当然因为数据的持久性也不能存储到内存型Nosql数据库Redis中,我们通常会将这些数据存储在能够不丢失数据的非关 ...
最新文章
- 阿里2018营收2502亿元,云计算业务增幅超100%
- vue-cli打包构建时常见的报错解决方案
- python 遍历_python中使用iterrows()对dataframe进行遍历的示例
- codeforces 496 div3(A-E1)(JAVA)
- VTK:几何对象之Arrow
- python如何让图片镜像翻转_98后常春藤学霸林之秋,一作拿下CVPR最佳论文提名,首次挑战图片翻转不变性假设...
- 数据挖掘--挖掘建模-时序模式-ARIMA模型
- 开源自动化部署工具_6种开源家庭自动化工具
- FireFox中国管理者的脑袋被驴踢了。
- WebKit编译小结
- 1.语音增强技术概述
- jQuery实现下拉菜单[代码+详细讲解+效果图]
- 北大青鸟 某百货商场当日他在消费积分最高的八名顾客,他们的积分分别是18,25,7,36,13,2,89,63.编写程序找出的积分及他在数组中的下标
- 华三防火墙应用二层和三层的配置实例
- 2023.02.09 草图大师厨房效果图1skp素材效果图
- 使用Python进行交易策略和投资组合分析
- 教授专栏37 | 黄昊: 发展虚拟资产, 须监管教育并行
- 最优灵活体系结构(Optimal Flexible Architecture,OFA)
- UI设计师必备10大工具
- 用python画枫叶-python-函数及练习
热门文章
- zabbix入门之添加监控项
- /etc/shadow文件
- Comet OJ - 2019 六一欢乐赛
- #0 scrapy爬虫学习中遇到的坑记录
- v-contextmenu的使用(右键菜单)
- 转:pysqlite笔记
- Hybrid框架UI重构之路:五、前端那点事儿(HTML、CSS)
- 后台返回数据打印是[object object]的,报错:SyntaxError: JSON.parse: expected property name or ‘}‘ at line 1 column
- vue eslint报错Expected linebreaks to be ‘LF‘ but found ‘CRLF‘
- Android 自定义环形圆形显示统计数据z