客快物流大数据项目(四十六):Spark操作Kudu dataFrame操作kudu
Spark操作Kudu dataFrame操作kudu
一、DataFrameApi读取kudu表中的数据
虽然我们可以通过上面显示的KuduContext执行大量操作,但我们还可以直接从默认数据源本身调用读/写API。要设置读取,我们需要为Kudu表指定选项,命名我们要读取的表以及为表提供服务的Kudu集群的Kudu主服务器列表。
- 代码示例
/*** 使用DataFrameApi读取kudu表中的数据* @param sparkSession* @param kuduMaster* @param tableName*/
def getTableData(sparkSession: SparkSession, kuduMaster: String, tableName: String): Unit = {//定义map集合,封装kudu的master地址和要读取的表名val options = Map("kudu.master" -> kuduMaster,"kudu.table" -> tableName)sparkSession.read.options(options).kudu.show()
}
二、 DataFrameApi写数据到kudu表中
客快物流大数据项目(四十六):Spark操作Kudu dataFrame操作kudu相关推荐
- 客快物流大数据项目(四十四):Spark操作Kudu创建表
Spark操作Kudu创建表 Spark与KUDU集成支持: DDL操作(创建/删除) 本地Kudu RDD Native Kudu数据源,用于DataFrame集成 从kudu读取数据 从Kudu执 ...
- 客快物流大数据项目(四十九):开发环境初始化
目录 开发环境初始化 一.配置开发环境的HADOOP_HOME 二.将hadoop.
- 客快物流大数据项目(四十八):Spark操作Kudu 修改表
Spark操作Kudu 修改表 代码示例 /*** 添加列* @param kuduContext*/ def addColumn(kuduContext: KuduContext): Unit ={ ...
- 客快物流大数据项目(五十六): 编写SparkSession对象工具类
编写SparkSession对象工具类 后续业务开发过程中,每个子业务(kudu.es.clickhouse等等)都会创建SparkSession对象,以及初始化开发环境,因此将环境初始化操作封装成工 ...
- 客快物流大数据项目(四十七):Spark操作Kudu Native RDD
目录 Spark操作Kudu Native RDD Spark操作Kudu Native RDD Spark与Kudu的集成同时提供了kudu RDD 代码示例 val columnsList = L ...
- 客快物流大数据项目(四):大数据项目为什么使用Docker
目录 大数据项目为什么使用Docker 一.场景一 二.场景二
- 客快物流大数据项目(二十八):大数据服务器环境准备
目录 大数据服务器环境准备 一.服务器规划 二.Linux虚拟机环境搭建
- 客快物流大数据项目(五十四):初始化Spark流式计算程序
目录 初始化Spark流式计算程序 一.SparkSql参数调优设置 1.设置会话时区
- 客快物流大数据项目(二十四):OGG安装部署
目录 OGG安装部署 一.配置Oracle11gR2数据库 1.Oracle11gR2打开归档模式 2.Oracle开启辅助日志和补充日志
最新文章
- 核逼近(Kernel Approximation)
- C语言static 具体分析
- 【物联网智能网关-15】WAV播放器(WinForm+WavPlay库实例)
- 【UAV】光流模块、测量速度、快速入门及安装使用
- SQL语言之数据定义语言(Oracle)
- 记-PHPExcel下载
- android传输注册数据异常,android数据传值再获取的问题
- boost::mpl模块实现vector_c相关的测试程序
- python数据挖掘工程师待遇_数据挖掘工程师岗位的具体职责
- 拆半查找的递归和非递归算法
- php bean,php框架Phpbean说明
- 关于Java Collections Framework的一些总结(2)
- 工欲善其事,必先利其器之sublime
- 分析“HTTP500内部服务器错误”解决方法
- AI实现五子棋机器人(一)
- 车牌字符识别中ctc loss损失函数理解
- 联想电脑EasyCamera无法打开摄像头
- 基于增强现实的室内导航系统如何设计架构
- Arduino单片机(二).Arduino系列单片机的介绍
- 如何运营出一个有吸引力的微信公众号?
热门文章
- 2022-2028年中国第五代移动通信技术(5G)市场研究及前瞻分析报告
- 程序连接不上mysql数据库文件_数据库问题(程序连接mysql错误)
- Redis 笔记(09)— 过期时间 expire(设置、查询、取消过期时间)
- Redis 笔记(07)— sorted set 类型(添加、删除有序集合元素、获取分数范围内成员、按score排序、返回集合元素个数)
- 2022-2028年中国汽车铝合金冲压件行业市场运营模式及未来发展潜力报告
- 2022-2028年中国激光全息膜行业市场现状调研及市场需求潜力报告
- 谷歌BERT预训练源码解析(二):模型构建
- Tomcat 1099端口占用重启无效,查不到进程,改换端口无效解决方案
- Xilinx Zynq FPGA Boards板
- CentOS7:Thrift的安装