大数据周会-本周学习内容总结0102
目录
01、ElasticSearch-学习总结
02、Springboot+ElasticSearch构建博客检索系统
01、将MySQL数据同步到ES中
02、SpringBoot集成ES
03、本周学习计划
第一次周会
大数据总监、搜狐四年-中国搜索
【mapReduce】sql
大数据代表:Hadoop、spark、es、flink
zookeeper、kafka、HBASE、集群规模太大,会出现小数据量不会出现的问题。
高考项目:上千万数据量。学习大数据官方文档,解决方案...
软件版本太多了,版本变化非常多,兼容性问题。
需要沉淀!发挥趋势:大数据+人工智能、大数据+xxx...需求较多。
深入项目中去,把问题研究透,就业优势会大一些。
log存储到hdfs或es
es同步:id号、时间戳
es安装kopf插件
01、ElasticSearch-学习总结
- ElasticSearch-学习笔记01【ElasticSearch基本介绍】【day01】
- ElasticSearch-学习笔记02【ElasticSearch索引库维护】
- ElasticSearch-学习笔记03【ElasticSearch集群】
- ElasticSearch-学习笔记04【Java客户端操作索引库】【day02】
- ElasticSearch-学习笔记05【SpringDataElasticSearch】
上周主要学习了这些内容并实际动手练习了其中的部分内容::
- es基本概念、es的安装、es中head插件的安装及使用(完成图形化界面的效果、完成索引数据的查看);
- 使用postman与es进行交互,练习了GET、PUT、POST、Delete等索引方法的使用;
- ik分词器的安装及使用;
- es集群的概念、简单搭建了集群,设置了mappings并进行了简单的数据插入测试;
- 学习了使用Java客户端操作es索引库
能够使用java客户端完成创建、删除索引的操作
能够使用java客户端完成文档的增删改的操作
能够使用java客户端完成文档的查询操作
能够完成文档的分页操作
能够完成文档的高亮查询操作
能够搭建Spring Data ElasticSearch的环境
能够完成Spring Data ElasticSearch的基本增删改查操作
能够掌握基本条件查询的方法命名规则
- 使用springdata与es进行交互,学习了springdata创建索引与增删索引文档的内容。
- 导入Spring Data ElasticSearch坐标;
- 创建applicationContext.xml配置文件,引入elasticsearch命名空间;
- 编写实体Article;
- 编写Dao;
- 编写Service;
- 配置applicationContext.xml;
- 配置实体(基于spring data elasticsearch注解配置索引、映射和实体的关系);
- 创建测试类SpringDataESTest。
索引库查询_queryString查询
02、Springboot+ElasticSearch构建博客检索系统
视频地址:
- Springboot + ElasticSearch 构建博客检索系统-慕课网
博客笔记:
- Springboot+ElasticSearch构建博客检索系统-学习笔记01
- Springboot+ElasticSearch构建博客检索系统-学习笔记02
01、将MySQL数据同步到ES中
开发技术栈:
input {jdbc {# 指定jdbc驱动包位置(不同版本处理不同,此处可直接将mysql驱动包放置logstash-core/lib/jars下,无需配置jdbc_driver_library)# "C:\\logstash-6.3.2\\mysql-connector-java-5.1.31.jar" /xxx/logstash-7.5.0/mysql-connector-java-5.1.31.jarjdbc_driver_library => "F:\\logstash\\logstash-6.3.2\\mysql-connector-java-5.1.31.jar"# 要使用的驱动包类,有过java开发经验的应该很熟悉这个了,不同的数据库调用的类不一样。jdbc_driver_class => "com.mysql.jdbc.Driver"# mysql数据库的连接信息jdbc_connection_string => "jdbc:mysql://127.0.0.1:3306/blog"# mysql用户jdbc_user => "root"# mysql密码jdbc_password => "root"# 定时任务,多久执行一次查询,默认一分钟,如果想要没有延迟,可以使用 schedule => "* * * * * *"# 定时任务,默认一分钟,"* * * * *"代表设置为无延迟schedule => "* * * * *"# *清空存储在logstash的上一次的sql_last_value记录*clean_run => true# 要执行的语句statement => "select * FROM t_blog WHERE update_time > :sql_last_value AND update_time < NOW() ORDER BY update_time desc"}
}output {elasticsearch {# es host : porthosts => ["127.0.0.1:9200"]# 索引index => "blog"# _id (取到mysql数据库记录的id)document_id => "%{id}"}
}
logstash -f ../config/mysql.conf
- -f:指定自己设置的配置文件
- config/mysql.conf:配置文件存储位置
使用kibana开发工具查看mysql数据是否成功同步到es中:
GET /blog/_stats
02、SpringBoot集成ES
SpringBoot框架内置Tomcat,使用idea时不需要再配置tomcat了。
RestStatusException{status=500} org.springframework.data.elasticsearch.RestStatusException: Elasticsearch exception [type=json_parse_exception, reason=Current token (VALUE_NUMBER_INT) not of boolean type
at [Source: org.elasticsearch.transport.netty4.ByteBufStreamInput@4fcc28b8; line: 1, column: 137]]; nested exception is ElasticsearchStatusException[Elasticsearch exception [type=json_parse_exception, reason=Current token (VALUE_NUMBER_INT) not of boolean type
at [Source: org.elasticsearch.transport.netty4.ByteBufStreamInput@4fcc28b8; line: 1, column: 137]]]
错误原因:当前最新版springboot 2.7.6相匹配的spring-boot-starter-data-elasticsearch支持的是elasticsearch 7.x.x版本,然而本门课程使用的是elasticsearch 6.3.2,解决方法:①升级elasticsearch到7.x.x版本;②使用过去的springboot版本,我尝试了2.2.0.RELEASE版本的springboot,这个错误就不再出现了,推荐此方法因为比较容易修改只需更新pom.xml。
03、本周学习计划
Hadoop
index和type同名,名字:type+版本号。
http请求,要求不高;tcp。
大数据周会-本周学习内容总结0102相关推荐
- 大数据周会-本周学习内容总结011
开会时间:2023.04.23 15:00 线下会议 目录 01[spark] 02[es同步mysql] 03[下周任务] 01[spark] 尚硅谷大数据技术Spark教程-笔记01[Spark( ...
- 大数据周会-本周学习内容总结08
目录 01[Hadoop] 1.1[MapReduce] 1.2[Yarn] 1.3[让用户自定义脚本在任意地方都可执行-配置方法] 02[下月学习内容] 老师指导 01[Hadoop] 尚硅谷大数据 ...
- 大数据周会-本周学习内容总结09
开会时间:2023.04.09 20:00 腾讯会议 目录 01[scala] 1.1[已学内容] 1.2[待学内容] 02[Saprk] 会议记录 01[scala] 1.1[已学内容] 尚硅谷大数 ...
- 大数据周会-本周学习内容总结014
开会时间:2023.05.21 15:00 线下会议 目录 01[fhzn项目] 02[Apache NiFi] 03[数据采集-调研] 3.1[数据采集,流程图.架构图.使用场景] 3.2[常见的数 ...
- 大数据周会-本周学习内容总结07
目录 01[hadoop] 1.1[编写集群分发脚本xsync] 1.2[集群部署规划] 1.3[Hadoop集群启停脚本] 02[HDFS] 2.1[HDFS的API操作] 03[MapReduce ...
- 大数据周会-本周学习内容总结04
目录 1.mysql数据同步到es 1.1.通过logstash同步数据 1.2.canal数据同步 1.3.通过logstash将本地文件导入es 2.git 1.mysql数据同步到es 1.1. ...
- 大数据周会-本周学习内容总结015
开会时间:2023.05.28 15:30 线下会议 目录 01[fhzny项目] 02[Spark] 03[调研-数仓构建] 3.1[数仓构建,流程图.架构图.使用场景] 场景选择 组件设计 构建流 ...
- 大数据周会-本周学习内容总结05
目录 00[陈师兄字节大厂经验分享] 01[MySQL数据同步ES] 1.1[Linux MySQL数据库数据同步Windows ES] 1.1.1[自动创建分片数为0的索引] 1.1.2[数据导入时 ...
- 大数据周会-本周学习内容总结010
开会时间:2023.04.16 19:00 线下会议 目录 01[scala] 02[zookeeper] 03[spark] 04[专利] 会议记录 01[scala] 尚硅谷大数据技术Scala教 ...
最新文章
- <关于并发框架>Java原生线程池原理及Guava与之的补充
- 手机端自适应布局demo
- PHP将json或对象转成数组
- jqgrid常用操作
- ADO.NET Entity Framework之ObjectQuery
- 隐藏ASP.NET MVC版本
- mysql按照日期先去重在分组_【巨杉数据库Sequoiadb】【咨询】【数据操作】【聚集查询】在执行聚集查询时,字符类型的字段能否按照实际内容进行分组去重...
- 2017CCPC秦皇岛 L题One-Dimensional MazeZOJ3992【模拟】
- 开源GIS(二十)——CAD数据添加属性转GIS数据
- java 数组 源码_Java数组转List的三种方式及对比
- 工业级Pass云平台SpringCloudAlibaba综合项目实战(一):序言
- 多媒体技术是指用计算机和相关设备,计算机多媒体技术基础知识
- 洛谷P1008 三连击
- 有秒计时的数字时钟(10分)
- 当前流行的智能硬件产品整理
- SQL 如何得到两个日期间的工作日(附假期表)
- 遇见王沥川的人生感悟_遇见王沥川的人生感悟
- 统计之 - 离均差平方和
- 六自由度方程组 matlab,采用Matlab的六自由度机器人三维运动学仿真_李庆.pdf
- 邯郸计算机学校排名2015,邯郸初中排名2021最新排名,邯郸初中排名前十的学校有哪些...