如果我们的Mysql服务器性能不咋滴,但是硬盘很够,如何才能做各种复杂的聚合操作?答案就是使用spark的计算能力的,我们可以将mysql数据源接入到spark中。

读取

val mysqlDF = spark

.read

.format("jdbc")

.option("driver","com.mysql.jdbc.Driver")

.option("url","jdbc:mysql://localhost:3306/ttable")

.option("user","root")

.option("password","root")

.option("dbtable","(select * from ttt where userId >1 AND userId < 10) as log")//条件查询出想要的表

//.option("dbtable","ttable.ttt")//整张表

.option("fetchsize","100")

.option("useSSL","false")

.load()

分区读取

spark

.read

.format("jdbc")

.option("url", url)

.option("dbtable", "ttt")

.option("user", user)

.option("password", password)

.option("numPartitions", 10)

.option("partitionColumn", "userId")

.option("lowerBound", 1)

.option("upperBound", 10000)

.load()

实际会生成如下查询语句,(所有分区会一直查询,直到整张表数据查询完为止)

SELECT * FROM ttt WHERE userId >= 1 and userId < 1000

SELECT * FROM ttt WHERE userId >= 1000 and userId < 2000

SELECT * FROM ttt WHERE userId >= 2000 and userId < 3000

...

写入

mysqlDF.createTempView("log")

spark

.sql("select * from log")

.toDF()

.write

.mode(SaveMode.Overwrite)

.format("jdbc")

.option("driver","com.mysql.jdbc.Driver")

.option("url","jdbc:mysql://localhost:3306/ttable")

.option("dbtable","a")

.option("user","root")

.option("password","root")

.option("fetchsize","100")

.option("useSSL","false")

.save()

spark编程mysql数据源_Spark - 直接操作数据源 MySQL相关推荐

  1. spark mysql 交互_Spark - 直接操作数据源 MySQL

    如果我们的Mysql服务器性能不咋滴,但是硬盘很够,如何才能做各种复杂的聚合操作?答案就是使用spark的计算能力的,我们可以将mysql数据源接入到spark中. 读取 val mysqlDF = ...

  2. mysql binary mode_mysql二进制文件操作语法(mysql binary log operate statements)

    在 mysql 配置文件中配置 log-bin,重启 mysql my.cnf (on Linux/unix) or my.ini (on Windows) 例子: [client] ... [mys ...

  3. mysql管理工具dg_C#操作SqlServer MySql Oracle通用帮助类Db_Helper_DG(默认支持数据库读写分离、查询结果实体映射ORM)...

    1 /*********************************************************2 * CopyRight: QIXIAO CODE BUILDER.3 * V ...

  4. 视频教程-MySQL数据库应用快速入门培训课程-MySQL

    MySQL数据库应用快速入门培训课程 5年JAVA 开发经验,2年系统架构经验,PMP项目管理资格认证,ACP 项目管理认证,工作过程同时参与性能.自动化测试工作,负责测试部门的测试架构,项目服务器运 ...

  5. Spark SQL 编程API入门系列之SparkSQL数据源

    不多说,直接上干货! SparkSQL数据源:从各种数据源创建DataFrame 因为 spark sql,dataframe,datasets 都是共用 spark sql 这个库的,三者共享同样的 ...

  6. 「Spark从入门到精通系列」4.Spark SQL和DataFrames:内置数据源简介

    来源 |  Learning Spark Lightning-Fast Data Analytics,Second Edition 作者 | Damji,et al. 翻译 | 吴邪 大数据4年从业经 ...

  7. mysql多数据源切换_Springboot项目实现Mysql多数据源切换的完整实例

    一.分析AbstractRoutingDataSource抽象类源码 关注import org.springframework.jdbc.datasource.lookup.AbstractRouti ...

  8. 2 数据源配置_Quick BI支持哪些数据源(配置操作篇)

    Quick BI 潜心打造了核心技术底座(OLAP分析引擎),实现了SQL解析.SQL调度.SQL优化.查询加速等基础能力,支撑Quick BI的数据分析和查询加速.OLAP分析引擎包括数据源连接.数 ...

  9. spring boot 入门_SpringBoot入门建站全系列(三十)Mybatis多数据源进行数据库操作

    SpringBoot入门建站全系列(三十)Mybatis多数据源进行数据库操作 一.概述 多数据源,就是有多个数据库的配置. 多数据源配置并不麻烦,使用起来和单数据源基本相同,但是,重要的是事务的控制 ...

最新文章

  1. Apache 基金会发布2018财年年报:Java 项目占大半
  2. 爱鲜蜂签约神策数据 让精细化运营落地企业
  3. UVa 11388 - GCD LCM
  4. NLP word2vec paper
  5. 堆栈的初始化,主要是为ss和SP赋初值
  6. 面向串口编程java_Java串口编程例子
  7. 网络限流linux,DockOne微信分享(一九八):容器网络限流实践
  8. Harmony OS — ToastDialog提示对话框
  9. SQLite 入门教程(四)增删改查,有讲究 (转)
  10. 随机过程第2讲——马尔可夫过程的应用
  11. 【Mac 系统下载 解压 ImageNet-1k(ILSVRC2012、IN1K)数据集】
  12. ros理论与实践—bilibili视频学习笔记
  13. bzoj 1864 三色二叉树
  14. Excel 2010 编辑公式
  15. 深度学习培训完可以找工作吗?深度学习可以做什么?
  16. 浏览器支持的视频和音频格式
  17. L1-003 个位数统计 (15 分)
  18. 强力推荐90个优秀外国英文网站
  19. 泛域名证书ACME 阿里云域名
  20. ping 域名显示 Ping request could not find host 但是nsloo

热门文章

  1. opencart导入导出export/import功能插件
  2. Objective-C中的一些特殊的数据类型
  3. ASP-JSP-NET 清空IE缓存
  4. 活用"端口碰撞技术"---远程管理的好方式
  5. BCH DEVCON 黑客马拉松即将登陆旧金山!
  6. 多个SSH Key自动化配置
  7. Windows 7怎么关闭自动播放功能?
  8. dubbo的provider和consumer的demo
  9. 不同网段使用同一台网络打印机
  10. python 文件的操作