性能优化参数

针对Spark SQL 性能调优参数如下:

代码示例

import java.util.List;import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.sql.api.java.JavaSQLContext;
import org.apache.spark.sql.api.java.Row;
import org.apache.spark.sql.hive.api.java.JavaHiveContext;public class PerformanceTuneDemo {public static void main(String[] args) {SparkConf conf = new SparkConf().setAppName("simpledemo").setMaster("local");conf.set("spark.sql.codegen", "false");conf.set("spark.sql.inMemoryColumnarStorage.compressed", "false");conf.set("spark.sql.inMemoryColumnarStorage.batchSize", "1000");conf.set("spark.sql.parquet.compression.codec", "snappy");JavaSparkContext sc = new JavaSparkContext(conf);JavaSQLContext sqlCtx = new JavaSQLContext(sc);JavaHiveContext hiveCtx = new JavaHiveContext(sc);List<Row> result = hiveCtx.sql("SELECT foo,bar,name from pokes2 limit 10").collect();for (Row row : result) {System.out.println(row.getString(0) + "," + row.getString(1) + "," + row.getString(2));}}}

Beeline 命令行设置优化参数

beeline> set spark.sql.codegen=true;
SET spark.sql.codegen=true
spark.sql.codegen=true
Time taken: 1.196 seconds

重要参数说明

spark.sql.codegen Spark SQL在每次执行次,先把SQL查询编译JAVA字节码。针对执行时间长的SQL查询或频繁执行的SQL查询,此配置能加快查询速度,因为它产生特殊的字节码去执行。但是针对很短(1 - 2秒)的临时查询,这可能增加开销,因为它必须先编译每一个查询。

spark.sql.inMemoryColumnarStorage.batchSize

When caching SchemaRDDs, Spark SQL groups together the records in the RDD in batches of the size given by this option (default: 1000), and compresses each batch. Very small batch sizes lead to low compression, but on the other hand very large sizes can also be problematic, as each batch might be too large to build up in memory.

Spark SQL性能优化相关推荐

  1. spark sql 性能优化

    一 设置shuffle的并行度 我们可以通过属性spark.sql.shuffle.partitions设置shuffle并行度 二 Hive数据仓库建设的时候,合理设置数据类型,比如你设置成INT的 ...

  2. 高效sql性能优化极简教程

    一,sql性能优化基础方法论 对于功能,我们可能知道必须改进什么:但对于性能问题,有时我们可能无从下手.其实,任何计算机应用系统最终队可以归结为: cpu消耗 内存使用 对磁盘,网络或其他I/O设备的 ...

  3. 做 SQL 性能优化真是让人干瞪眼

    很多大数据计算都是用 SQL 实现的,跑得慢时就要去优化 SQL,但常常碰到让人干瞪眼的情况. 比如,存储过程中有三条大概形如这样的语句执行得很慢: select a,b,sum(x) from T ...

  4. SQL性能优化案例分析

    这段时间做一个SQL性能优化的案例分析, 整理了一下过往的案例,发现一个比较有意思的,拿出来给大家分享. 这个项目是我在项目开展2期的时候才加入的, 之前一期是个金融内部信息门户, 里面有个功能是收集 ...

  5. 如何进行正确的SQL性能优化

    在SQL查询中,为了提高查询的效率,我们常常采取一些措施对查询语句进行SQL性能优化.本文我们总结了一些优化措施,接下来我们就一一介绍. 1.查询的模糊匹配 尽量避免在一个复杂查询里面使用 LIKE ...

  6. Oracle SQL性能优化的40条军规

    Oracle SQL性能优化的40条军规 1. SQL语句执行步骤 语法分析> 语义分析> 视图转换 >表达式转换> 选择优化器 >选择连接方式 >选择连接顺序 & ...

  7. SQL性能优化前期准备-清除缓存、开启IO统计

    如果需要进行SQl Server下的SQL性能优化,需要准备以下内容: 一.SQL查询分析器设置: 1.开启实际执行计划跟踪. 2.每次执行需优化SQL前,带上清除缓存的设置SQL. 平常在进行SQL ...

  8. 想让DBA瞬间崩溃,那就让他去做SQL性能优化

    本文分享自华为云社区<做 SQL 性能优化真是让人干瞪眼>,作者: 石臻臻的杂货铺 . 很多大数据计算都是用 SQL 实现的,跑得慢时就要去优化 SQL,但常常碰到让人干瞪眼的情况. 比如 ...

  9. SQL性能优化常见措施(Lock wait timeout exceeded)

    SQL性能优化常见措施 目 录 1.mysql中explain命令使用 2.mysql中mysqldumpslow的使用 3.mysql中修改my.ini配置文件记录日志 4.mysql中如何加索引 ...

最新文章

  1. 马斯克矩阵模拟错了?这个试验证明人类不是「缸中之脑」
  2. unity3D打包发布Apk详细步骤
  3. 深度探索C++ 对象模型(5)-Initialization list(2)
  4. tp5 批量更新多条记录_tp5批量导入数据库
  5. 数据库系统工程师考点分析
  6. 1599元!荣耀Play6T Pro今日首销:史上最薄5G手机!
  7. FreeSync是什么
  8. Revit二次开发示例:ModelessForm_ExternalEvent
  9. Java关系操作符简写
  10. 第29月第13天 程序员职业规划
  11. java做求立方体,Java工具集-数学(立方体操作工具类)
  12. 【必修】人工智能原理 学习笔记(二)chapter 2 产生式系统
  13. LCL三相pwm整流器(逆变器)
  14. 网络安全协议—SSL
  15. 工地泥浆流出大量邵阳抽泥浆罐车清理路面泥巴
  16. GD32 汽车诊断协议 J1850-VPW 测试
  17. C++ 使用Poco库实现日志操作
  18. CRC-16 CCITT
  19. 蒙特卡罗MCNP学习汇总(五)---高级几何建模
  20. 期货手续费标准和保证金比例

热门文章

  1. 小度智能音响拆解 芯片_打磨小度智能音箱:深度拆解,发掘升级潜能
  2. 服务器,linux系统配置端口号的坑!!!服务器防火墙配置!!!
  3. 2019自考00018计算机应用基础,全国2019年4月自考00018《计算机应用基础》试题及答案...
  4. 开单大师(开源可定制的房产管理系统) v3.6.9学习版
  5. android各层调用关系,架构流程
  6. 如何制作HTML5 SVG描边文字
  7. 使用 jQuery Mobile 与 HTML5 开发 Web App (十二) —— jQuery Mobile 页面事件与 deferred
  8. 小记 cin/get/getline
  9. MergeSort 归并排序
  10. 【AI视野·今日Robot 机器人论文速览 第八期】Wed, 16 Jun 2021