2021年大数据ELK(十七):Elasticsearch SQL 订单统计分析案例
全网最详细的大数据ELK文章系列,强烈建议收藏加关注!
新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点。
目录
订单统计分析案例
一、案例介绍
二、创建索引
三、导入测试数据
四、统计不同支付方式的的订单数量
1、使用JSON DSL的方式来实现
2、基于Elasticsearch SQL方式实现
五、基于JDBC方式统计不同方式的订单数量
六、统计不同支付方式订单数,并按照订单数量倒序排序
七、只统计「已付款」状态的不同支付方式的订单数量
八、统计不同状态的订单总额、不同支付方式最高、最低订单金额
九、Elasticsearch SQL目前的一些限制
十、常见问题处理
1、elasticsearch.keystore AccessDeniedException
订单统计分析案例
一、案例介绍
有以下数据集:
订单ID |
订单状态 |
支付金额 |
支付方式ID |
用户ID |
操作时间 |
商品分类 |
id |
status |
pay_money |
payway |
userid |
operation_date |
category |
1 |
已提交 |
4070 |
1 |
4944191 |
2020-04-25 12:09:16 |
手机; |
2 |
已完成 |
4350 |
1 |
1625615 |
2020-04-25 12:09:37 |
家用电器;;电脑; |
3 |
已提交 |
6370 |
3 |
3919700 |
2020-04-25 12:09:39 |
男装;男鞋; |
4 |
已付款 |
6370 |
3 |
3919700 |
2020-04-25 12:09:44 |
男装;男鞋; |
我们需要基于按数据,使用Elasticsearch中的聚合统计功能,实现一些指标统计。
二、创建索引
PUT /order_idx/
{"mappings": {"properties": {"id": {"type": "keyword","store": true},"status": {"type": "keyword","store": true},"pay_money": {"type": "double","store": true},"payway": {"type": "byte","store": true},"userid": {"type": "keyword","store": true},"operation_date": {"type": "date","format": "yyyy-MM-dd HH:mm:ss","store": true},"category": {"type": "keyword","store": true}}}
}
三、导入测试数据
- 上传资料中的order_data.json数据文件到Linux
- 使用bulk进行批量导入命令
curl -H "Content-Type: application/json" -XPOST "node1:9200/order_idx/_bulk?pretty&refresh" --data-binary "@order_data.json"
四、统计不同支付方式的的订单数量
1、使用JSON DSL的方式来实现
这种方式就是用Elasticsearch原生支持的基于JSON的DSL方式来实现聚合统计。
GET /order_idx/_search
{"size": 0,"aggs": {"group_by_state": {"terms": {"field": "payway"}}}
}
统计结果:
"aggregations": {"group_by_state": {"doc_count_error_upper_bound": 0,"sum_other_doc_count": 0,"buckets": [{"key": 2,"doc_count": 1496},{"key": 1,"doc_count": 1438},{"key": 3,"doc_count": 1183},{"key": 0,"doc_count": 883}]}}
这种方式分析起来比较麻烦,如果将来我们都是写这种方式来分析数据,简直是无法忍受。所以,Elasticsearch想要进军OLAP领域,是一定要支持SQL,能够使用SQL方式来进行统计和分析的
2、基于Elasticsearch SQL方式实现
GET /_sql?format=txt
{"query": "select payway, count(*) as order_cnt from order_idx group by payway"
}
这种方式要更加直观、简洁
五、基于JDBC方式统计不同方式的订单数量
Elasticsearch中还提供了基于JDBC的方式来访问数据。我们可以像操作MySQL一样操作Elasticsearch。使用步骤如下:
1、在pom.xml中添加以下镜像仓库
<repositories><repository><id>elastic.co</id><url>https://artifacts.elastic.co/maven</url></repository>
</repositories>
2、导入Elasticsearch JDBC驱动Maven依赖
<dependency><groupId>org.elasticsearch.plugin</groupId><artifactId>x-pack-sql-jdbc</artifactId><version>7.6.1</version>
</dependency>
3、驱动
org.elasticsearch.xpack.sql.jdbc.EsDriver
4、JDBC URL
jdbc:es:// http:// host:port
5、开启X-pack高阶功能试用,如果不开启试用,会报如下错误
current license is non-compliant for [jdbc]
在node1节点上执行:
curl http://node1:9200/_license/start_trial?acknowledge=true -X POST
{"acknowledged":true,"trial_was_started":true,"type":"trial"}
试用期为30天
参考代码:
/*** 基于JDBC访问Elasticsearch*/
public class ElasticJdbc {public static void main(String[] args) throws Exception {Class.forName("org.elasticsearch.xpack.sql.jdbc.EsDriver");Connection connection = DriverManager.getConnection("jdbc:es://http://node1:9200");PreparedStatement ps = connection.prepareStatement("select payway, count(*) as order_cnt from order_idx group by payway");ResultSet resultSet = ps.executeQuery();while(resultSet.next()) {int payway = resultSet.getInt("payway");int order_cnt = resultSet.getInt("order_cnt");System.out.println("支付方式: " + payway + " 订单数量: " + order_cnt);}resultSet.close();ps.close();connection.close();}
}
注意:如果在IDEA中无法下载依赖,请参考以下操作:
在Idea的File -->settings中,设置Maven的importing和Runner参数,忽略证书检查即可。(Eclipse下解决原理类似,设置maven运行时参数),并尝试手动执行Maven compile执行编译。
具体参数:-Dmaven.multiModuleProjectDirectory=$MAVEN_HOME -Dmaven.wagon.http.ssl.insecure=true -Dmaven.wagon.http.ssl.allowall=true -Dmaven.wagon.http.ssl.ignore.validity.dates=true
六、统计不同支付方式订单数,并按照订单数量倒序排序
GET /_sql?format=txt
{"query": "select payway, count(*) as order_cnt from order_idx group by payway order by order_cnt desc"
七、只统计「已付款」状态的不同支付方式的订单数量
GET /_sql?format=txt
{"query": "select payway, count(*) as order_cnt from order_idx where status = '已付款' group by payway order by order_cnt desc"
}
八、统计不同状态的订单总额、不同支付方式最高、最低订单金额
统计不同状态的订单总额、不同支付方式最高、最低订单金额
GET /_sql?format=txt
{"query": "select userid, count(1) as cnt, sum(pay_money) as total_money from order_idx group by userid"
}
九、Elasticsearch SQL目前的一些限制
目前Elasticsearch SQL还存在一些限制。例如:不支持JOIN、不支持较复杂的子查询。所以,有一些相对复杂一些的功能,还得借助于DSL方式来实现。
十、常见问题处理
1、elasticsearch.keystore AccessDeniedException
Exception in thread "main" org.elasticsearch.bootstrap.BootstrapException: java.nio.file.AccessDeniedException: /export/server/es/elasticsearch-7.6.1/config/elasticsearch.keystore
Likely root cause: java.nio.file.AccessDeniedException: /export/server/es/elasticsearch-7.6.1/config/elasticsearch.keystoreat java.base/sun.nio.fs.UnixException.translateToIOException(UnixException.java:90)at java.base/sun.nio.fs.UnixException.rethrowAsIOException(UnixException.java:111)at java.base/sun.nio.fs.UnixException.rethrowAsIOException(UnixException.java:116)at java.base/sun.nio.fs.UnixFileSystemProvider.newByteChannel(UnixFileSystemProvider.java:219)at java.base/java.nio.file.Files.newByteChannel(Files.java:374)at java.base/java.nio.file.Files.newByteChannel(Files.java:425)at org.apache.lucene.store.SimpleFSDirectory.openInput(SimpleFSDirectory.java:77)at org.elasticsearch.common.settings.KeyStoreWrapper.load(KeyStoreWrapper.java:219)at org.elasticsearch.bootstrap.Bootstrap.loadSecureSettings(Bootstrap.java:234)at org.elasticsearch.bootstrap.Bootstrap.init(Bootstrap.java:305)at org.elasticsearch.bootstrap.Elasticsearch.init(Elasticsearch.java:170)at org.elasticsearch.bootstrap.Elasticsearch.execute(Elasticsearch.java:161)at org.elasticsearch.cli.EnvironmentAwareCommand.execute(EnvironmentAwareCommand.java:86)at org.elasticsearch.cli.Command.mainWithoutErrorHandling(Command.java:125)at org.elasticsearch.cli.Command.main(Command.java:90)at org.elasticsearch.bootstrap.Elasticsearch.main(Elasticsearch.java:126)at org.elasticsearch.bootstrap.Elasticsearch.main(Elasticsearch.java:92)
解决方案:
将/export/server/es/elasticsearch-7.6.1/config/elasticsearch.keystore owner设置为lanson
chown lanson /export/server/es/elasticsearch-7.6.1/config/elasticsearch.keystore
-
2021年大数据ELK(十七):Elasticsearch SQL 订单统计分析案例相关推荐
- 2021年大数据ELK(八):Elasticsearch安装IK分词器插件
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 安装IK分词器 一.下载Elasticsearch IK分词器 ...
- 2021年大数据ELK(六):安装Elasticsearch
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 安装Elasticsearch 一.创建普通用户 二.为普通用户 ...
- 2021年大数据ELK(五):Elasticsearch中的核心概念
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 Elasticsearch中的核心概念 一.索引 index 二 ...
- 2021年大数据ELK(二):Elasticsearch简单介绍
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 一.Elasticsearch简介 1.介绍 2.创始人 二.E ...
- 2021年大数据ELK(三):Lucene全文检索库介绍
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 一.什么是全文检索 1.结构化数据与非结构化数据 2.搜索结构化 ...
- 2021年大数据ELK(四):Lucene的美文搜索案例
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 美文搜索案例 一.需求 二.准备工作 1.创建IDEA项目 2. ...
- 2021年大数据ELK(一):集中式日志协议栈Elastic Stack简介
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 一.简介 二.ELK 协议栈介绍及体系结构 三.集中式日志协议栈 ...
- 2021年大数据ELK(十六):Elasticsearch SQL(职位查询案例)
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 职位查询案例 一.查询职位索引库中的一条数据 二.将SQL转换为DSL 三.职 ...
- 2021年大数据ELK(十五):Elasticsearch SQL简单介绍
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 Elasticsearch SQL简单介绍 一.SQL与Elasticsear ...
最新文章
- matlab simulink实例,simulink实例(有好多实例)..ppt
- mysql的聚合函数综合案例_MySQL常用聚合函数详解
- 塞内加尔将于5月启用全国首个大型数据中心
- go程序打包:针对不同OS打包成不同的可执行文件
- mysql 范围优化_如何优化mysql的范围查询
- CListCtrl::InsertColumn()和InsertItem()和SetItemText()
- 实例3 如何使用菜单控件
- component、constituent、element、ingredient的区别
- MySQL的jar包下载
- win7怎么设置显示计算机,教您win7怎么设置分辨率
- cesium制作飞机路线图
- RabbitMQ的流量控制策略
- PC端如何使用ITunes无线连接ios手机
- 剑指Offer(二):替换空格
- SaaS系统设计研发细节复盘
- 走近棒球运动·韩国职业棒球联盟·MLB棒球创造营
- PC端的阿里云盘搜索工具
- NIPS论文系列|复数域RNN,深层生成模型,DRL在MDP中的应用(已开源)
- springboot-使用Thymeleaf
- 游戏本天梯_给新生的游戏本推荐指南
热门文章
- 2021年大数据ELK(八):Elasticsearch安装IK分词器插件