添加依赖

<dependency><groupId>org.elasticsearch</groupId><artifactId>elasticsearch-hadoop</artifactId><version>6.8.7</version>
</dependency>

案例测试

import com.hm.util.SparkHelper
import org.apache.spark.sql.{DataFrame, SparkSession}object ReadbyES {def main(args: Array[String]): Unit = {val spark: SparkSession = SparkHelper.getSparkSessionimport org.elasticsearch.spark.sql._val options = Map("es.nodes.wan.only" -> "true","es.nodes" -> "192.168.xx.1xx","es.port" -> "9200")val df: DataFrame = spark.read//指定输入数据源格式。.format("es")//为基础数据源添加输入选项。.options(options)//对于需要路径的数据源(例如,由本地或分布式文件系统支持的数据),将输入作为DataFrame加载。.load("hive_table/docs")df.show()}
}

spark 读取elasticsearch数据相关推荐

  1. Spark读取Hive数据的两种方式与保存数据到HDFS

    Spark读取Hive数据的两种方式与保存数据到HDFS Spark读取Hive数据的方式主要有两种 1. 通过访问hive metastore的方式,这种方式通过访问hive的metastore元数 ...

  2. java读avro的流_0016-Avro序列化反序列化和Spark读取Avro数据

    1.简介 本篇文章主要讲如何使用java生成Avro格式数据以及如何通过spark将Avro数据文件转换成DataSet和DataFrame进行操作. 1.1Apache Arvo是什么? Apach ...

  3. 0016-Avro序列化反序列化和Spark读取Avro数据

    温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看. 1.简介 本篇文章主要讲如何使用java生成Avro格式数据以及如何通过spark将Avro数据文件转换成DataSet和DataFra ...

  4. 24-java版Spark程序读取ElasticSearch数据

    1.概述 新建一个maven项目 依赖如下 <?xml version="1.0" encoding="UTF-8"?> <project x ...

  5. logstash读取Elasticsearch数据保存为json,logstash接收log数据写入kafka生产者

    [提前声明] 文章由作者:张耀峰 结合自己生产中的使用经验整理,最终形成简单易懂的文章 写作不易,转载请注明,谢谢! 代码案例地址: ?https://github.com/Mydreamandrea ...

  6. spark读取hbase数据

    import org.apache.hadoop.hbase.HBaseConfiguration import org.apache.hadoop.hbase.mapreduce.TableInpu ...

  7. 17 记一次 spark 读取大数据表 OOM OutOfMemoryError: GC overhead limit exceeded

    前言 // 呵呵 一天的车, 这就是过年吧!, 但是你还能看到 那一盏为你留的灯, 这可能就是羁绊吧 // 草稿箱 抽一波 呵呵 最近因为一次 测试造了一张 200w 数据记录的表 然后 业务上需要分 ...

  8. hive 分区_代码 | Spark读取mongoDB数据写入Hive普通表和分区表

    版本: 一.原始数据及Hive表 MongoDB数据格式 Hive普通表 Hive分区表 二. IDEA+Maven+Java 依赖 代码 工具类 三. 错误解决办法 1. IDEA会获取不到Hive ...

  9. mongodb数据导入hbase,spark读取hbase数据分析

    为什么80%的码农都做不了架构师?>>>    使用mavn管理相关依赖包pom.xml <project xmlns="http://maven.apache.or ...

最新文章

  1. Rocksdb Iterator实现:从DBIter 到 TwoLevelIter 的漫长链路
  2. 安卓gridview 网格,多行多列实现
  3. yii2表单数据检查怎么自定义输出错误_B端产品日记——表单设计
  4. Node 抓取非utf-8编码页面
  5. C语言基础排序算法-选择排序
  6. Windows 10 LTSC添加UWP支持
  7. html div p 区别,html中div br p三者有什么区别?
  8. webkit内核Android,Opera发布全新基于WebKit内核的安卓版浏览器
  9. mappedBy作用
  10. 人生感悟:欲望适度则为利,欲望过度则为害
  11. 2020农行研发中心面经
  12. 代理服务器与反向代理服务器
  13. 工程师高级职称计算机考试成绩查询,高级工程师职称查询
  14. 佳能相机G7 Mark Ⅱ (测光与对焦)
  15. Java8新特性学习第一天
  16. 读书札记:瑞士法郎的因素
  17. Jmeter性能测试环境搭建
  18. 使用po模型进行自动化测试
  19. 如何通过市场中性策略获利
  20. 电竞网咖用2.5G网卡,体验飞一般的感觉!

热门文章

  1. android 点赞动画_Android MotionLayout动画:续写ConstraintLayout新篇章
  2. Python安装Pytorch教程(图文详解)
  3. 计算机学业水平测试网,学业水平测试
  4. java bean jsonobject_利用JSONObject将json 字符串转换为java bean对象
  5. java 冒泡算法_关于java中的冒泡算法
  6. python中凯撒密码_python实现凯撒密码、凯撒加解密算法
  7. pythonweb项目源码下载_最新Python WEB开发在线教育项目之谷粒教育 软件源码齐全...
  8. 移动端html右滑空白,BootStrap.css 在手机端滑动时右侧出现空白的原因及解决办法...
  9. pulse 去马赛克软件_打马赛克就安全了吗?AI消除马赛克,上线三天收获近7000星...
  10. ggplot2作图详解:ggplot图形对象