spark 读取elasticsearch数据
添加依赖
<dependency><groupId>org.elasticsearch</groupId><artifactId>elasticsearch-hadoop</artifactId><version>6.8.7</version>
</dependency>
案例测试
import com.hm.util.SparkHelper
import org.apache.spark.sql.{DataFrame, SparkSession}object ReadbyES {def main(args: Array[String]): Unit = {val spark: SparkSession = SparkHelper.getSparkSessionimport org.elasticsearch.spark.sql._val options = Map("es.nodes.wan.only" -> "true","es.nodes" -> "192.168.xx.1xx","es.port" -> "9200")val df: DataFrame = spark.read//指定输入数据源格式。.format("es")//为基础数据源添加输入选项。.options(options)//对于需要路径的数据源(例如,由本地或分布式文件系统支持的数据),将输入作为DataFrame加载。.load("hive_table/docs")df.show()}
}
spark 读取elasticsearch数据相关推荐
- Spark读取Hive数据的两种方式与保存数据到HDFS
Spark读取Hive数据的两种方式与保存数据到HDFS Spark读取Hive数据的方式主要有两种 1. 通过访问hive metastore的方式,这种方式通过访问hive的metastore元数 ...
- java读avro的流_0016-Avro序列化反序列化和Spark读取Avro数据
1.简介 本篇文章主要讲如何使用java生成Avro格式数据以及如何通过spark将Avro数据文件转换成DataSet和DataFrame进行操作. 1.1Apache Arvo是什么? Apach ...
- 0016-Avro序列化反序列化和Spark读取Avro数据
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看. 1.简介 本篇文章主要讲如何使用java生成Avro格式数据以及如何通过spark将Avro数据文件转换成DataSet和DataFra ...
- 24-java版Spark程序读取ElasticSearch数据
1.概述 新建一个maven项目 依赖如下 <?xml version="1.0" encoding="UTF-8"?> <project x ...
- logstash读取Elasticsearch数据保存为json,logstash接收log数据写入kafka生产者
[提前声明] 文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章 写作不易,转载请注明,谢谢! 代码案例地址: ?https://github.com/Mydreamandrea ...
- spark读取hbase数据
import org.apache.hadoop.hbase.HBaseConfiguration import org.apache.hadoop.hbase.mapreduce.TableInpu ...
- 17 记一次 spark 读取大数据表 OOM OutOfMemoryError: GC overhead limit exceeded
前言 // 呵呵 一天的车, 这就是过年吧!, 但是你还能看到 那一盏为你留的灯, 这可能就是羁绊吧 // 草稿箱 抽一波 呵呵 最近因为一次 测试造了一张 200w 数据记录的表 然后 业务上需要分 ...
- hive 分区_代码 | Spark读取mongoDB数据写入Hive普通表和分区表
版本: 一.原始数据及Hive表 MongoDB数据格式 Hive普通表 Hive分区表 二. IDEA+Maven+Java 依赖 代码 工具类 三. 错误解决办法 1. IDEA会获取不到Hive ...
- mongodb数据导入hbase,spark读取hbase数据分析
为什么80%的码农都做不了架构师?>>> 使用mavn管理相关依赖包pom.xml <project xmlns="http://maven.apache.or ...
最新文章
- Rocksdb Iterator实现:从DBIter 到 TwoLevelIter 的漫长链路
- 安卓gridview 网格,多行多列实现
- yii2表单数据检查怎么自定义输出错误_B端产品日记——表单设计
- Node 抓取非utf-8编码页面
- C语言基础排序算法-选择排序
- Windows 10 LTSC添加UWP支持
- html div p 区别,html中div br p三者有什么区别?
- webkit内核Android,Opera发布全新基于WebKit内核的安卓版浏览器
- mappedBy作用
- 人生感悟:欲望适度则为利,欲望过度则为害
- 2020农行研发中心面经
- 代理服务器与反向代理服务器
- 工程师高级职称计算机考试成绩查询,高级工程师职称查询
- 佳能相机G7 Mark Ⅱ (测光与对焦)
- Java8新特性学习第一天
- 读书札记:瑞士法郎的因素
- Jmeter性能测试环境搭建
- 使用po模型进行自动化测试
- 如何通过市场中性策略获利
- 电竞网咖用2.5G网卡,体验飞一般的感觉!
热门文章
- android 点赞动画_Android MotionLayout动画:续写ConstraintLayout新篇章
- Python安装Pytorch教程(图文详解)
- 计算机学业水平测试网,学业水平测试
- java bean jsonobject_利用JSONObject将json 字符串转换为java bean对象
- java 冒泡算法_关于java中的冒泡算法
- python中凯撒密码_python实现凯撒密码、凯撒加解密算法
- pythonweb项目源码下载_最新Python WEB开发在线教育项目之谷粒教育 软件源码齐全...
- 移动端html右滑空白,BootStrap.css 在手机端滑动时右侧出现空白的原因及解决办法...
- pulse 去马赛克软件_打马赛克就安全了吗?AI消除马赛克,上线三天收获近7000星...
- ggplot2作图详解:ggplot图形对象