Spark操作Kudu dataFrame操作kudu

一、DataFrameApi读取kudu表中的数据

虽然我们可以通过上面显示的KuduContext执行大量操作,但我们还可以直接从默认数据源本身调用读/写API。要设置读取,我们需要为Kudu表指定选项,命名我们要读取的表以及为表提供服务的Kudu集群的Kudu主服务器列表。

  • 代码示例
/*** 使用DataFrameApi读取kudu表中的数据* @param sparkSession* @param kuduMaster* @param tableName*/
def getTableData(sparkSession: SparkSession, kuduMaster: String, tableName: String): Unit = {//定义map集合,封装kudu的master地址和要读取的表名val options = Map("kudu.master" -> kuduMaster,"kudu.table" -> tableName)sparkSession.read.options(options).kudu.show()
}

二、 DataFrameApi写数据到kudu表中

客快物流大数据项目(四十六):Spark操作Kudu dataFrame操作kudu相关推荐

  1. 客快物流大数据项目(四十四):Spark操作Kudu创建表

    Spark操作Kudu创建表 Spark与KUDU集成支持: DDL操作(创建/删除) 本地Kudu RDD Native Kudu数据源,用于DataFrame集成 从kudu读取数据 从Kudu执 ...

  2. 客快物流大数据项目(四十九):开发环境初始化

    目录 开发环境初始化 一.配置开发环境的HADOOP_HOME 二.​​​​​​​将hadoop.

  3. 客快物流大数据项目(四十八):Spark操作Kudu 修改表

    Spark操作Kudu 修改表 代码示例 /*** 添加列* @param kuduContext*/ def addColumn(kuduContext: KuduContext): Unit ={ ...

  4. 客快物流大数据项目(五十六): 编写SparkSession对象工具类

    编写SparkSession对象工具类 后续业务开发过程中,每个子业务(kudu.es.clickhouse等等)都会创建SparkSession对象,以及初始化开发环境,因此将环境初始化操作封装成工 ...

  5. 客快物流大数据项目(四十七):Spark操作Kudu Native RDD

    目录 Spark操作Kudu Native RDD Spark操作Kudu Native RDD Spark与Kudu的集成同时提供了kudu RDD 代码示例 val columnsList = L ...

  6. 客快物流大数据项目(四):大数据项目为什么使用Docker

    目录 大数据项目为什么使用Docker 一.场景一 二.场景二

  7. 客快物流大数据项目(二十八):大数据服务器环境准备

    目录 大数据服务器环境准备 一.服务器规划 二.Linux虚拟机环境搭建

  8. 客快物流大数据项目(五十四):初始化Spark流式计算程序

    目录 初始化Spark流式计算程序 一.SparkSql参数调优设置 1.设置会话时区

  9. 客快物流大数据项目(二十四):OGG安装部署

    目录 OGG安装部署 一.配置Oracle11gR2数据库 1.Oracle11gR2打开归档模式 2.Oracle开启辅助日志和补充日志

最新文章

  1. 核逼近(Kernel Approximation)
  2. C语言static 具体分析
  3. 【物联网智能网关-15】WAV播放器(WinForm+WavPlay库实例)
  4. 【UAV】光流模块、测量速度、快速入门及安装使用
  5. SQL语言之数据定义语言(Oracle)
  6. 记-PHPExcel下载
  7. android传输注册数据异常,android数据传值再获取的问题
  8. boost::mpl模块实现vector_c相关的测试程序
  9. python数据挖掘工程师待遇_数据挖掘工程师岗位的具体职责
  10. 拆半查找的递归和非递归算法
  11. php bean,php框架Phpbean说明
  12. 关于Java Collections Framework的一些总结(2)
  13. 工欲善其事,必先利其器之sublime
  14. 分析“HTTP500内部服务器错误”解决方法
  15. AI实现五子棋机器人(一)
  16. 车牌字符识别中ctc loss损失函数理解
  17. 联想电脑EasyCamera无法打开摄像头
  18. 基于增强现实的室内导航系统如何设计架构
  19. Arduino单片机(二).Arduino系列单片机的介绍
  20. 如何运营出一个有吸引力的微信公众号?

热门文章

  1. 2022-2028年中国第五代移动通信技术(5G)市场研究及前瞻分析报告
  2. 程序连接不上mysql数据库文件_数据库问题(程序连接mysql错误)
  3. Redis 笔记(09)— 过期时间 expire(设置、查询、取消过期时间)
  4. Redis 笔记(07)— sorted set 类型(添加、删除有序集合元素、获取分数范围内成员、按score排序、返回集合元素个数)
  5. 2022-2028年中国汽车铝合金冲压件行业市场运营模式及未来发展潜力报告
  6. 2022-2028年中国激光全息膜行业市场现状调研及市场需求潜力报告
  7. 谷歌BERT预训练源码解析(二):模型构建
  8. Tomcat 1099端口占用重启无效,查不到进程,改换端口无效解决方案
  9. Xilinx Zynq FPGA Boards板
  10. CentOS7:Thrift的安装