【云驻共创】GaussDB(DWS)云数仓工作负载管理流程体验
文章目录
- 前言
- 一、GaussDB(DWS)工作负载管理介绍
- 1.工作负载管理满足的主要业务场景
- 2.工作负载管理概览
- 二、GaussDB(DWS)工作负载队列介绍与使用
- 1.工作负载队列机制介绍
- 2.并发管控能力
- 3.CPU管控
- 4.内存管控
- 5.空间管控
- 6.异常规则
- 7.工作负载队列案例
- 8.创建工作负载队列
- 9.并发管控测试
- 9.存储空间管控测试
- 三、GaussDB(DWS)工作负载计划介绍与使用
- 1.工作负载计划适用场景
- 2.启动工作负载计划
- 3.导入导出工作负载计划
- 四、GaussDB(DWS)模式空间管理介绍与使用
- 1.修改Schema空间限额
- 总结
前言
GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统。
相关使用文档地址:https://support.huaweicloud.com/mgtg-dws/dws_01_0018.html
本文主要介绍的内容如下:
- GaussDB(DWS)工作负载管理介绍
- GaussDB(DWS)工作负载队列介绍与使用
- GaussDB(DWS)工作负载计划介绍与使用
- GaussDB(DWS)模式空间管理介绍与使用
一、GaussDB(DWS)工作负载管理介绍
1.工作负载管理满足的主要业务场景
1、数据库多用户间的资源隔离
通过资源隔离达成多用户间执行业务不干扰
2、集群的负载控制
资源(CPU、内存、空间、并发)可控,保证集群不过载
2.工作负载管理概览
二、GaussDB(DWS)工作负载队列介绍与使用
1.工作负载队列机制介绍
2.并发管控能力
- 全局并发量:是指GaussDB(DWS)上允许同时运行的作业数量。
- 局部并发量:又称队列并发量,是指各个队列上允许运行的最大作业并发量。
- 短查询并发:简单作业并发数,可以通过短查询开关进行控制,默认不限制。
3.CPU管控
- GaussDB的CPU资源管理通过控制组(cgroup)实现,cgroup是Linux内核提供的一种可以限制单个进程或者多个进程所使用资源的机制, 可以对CPU,内存等资源实现精细化的控制。
- GaussDB支持两层的cgroup架构,包含Class控制组和Workload控制组,支持四个维度隔离:
- GaussDB与其他程序之间隔离
- 后台线程与作业线程之间隔离
- 多租户之间隔离
- 作业之间隔离
- GaussDB支持CPU核数隔离,通过指定cgroup能够使用的CPU核,实现控制组CPU核的隔离。
4.内存管控
- 默认GaussDB(DWS)使用的内存占主机Linux系统可用内存的80%。
- DN实例最大可用内存:max_process_memoryDN=(RAM*0.8)*0.7/(DN_CNT+1)
- CN实例最大可用内存:max_process_memoryCN = max_process_memoryDN/2
- 实例动态内存:max_dynamic _memory = max_process_memory- cstore_used_memory-max_shared_memory-udf_reserved_memory
5.空间管控
集群磁盘空间管控
- CM检查数据盘空间占用率,超过阈值后设置集群只读default_transaction_read_only=on
- 只读情况下仅允许只读作业运行,发生写入操作即报错退出
用户空间管控
- 支持永久/临时/算子三个维度表空间管理
- 采用单实例空间管控(CN/DN实例各自管控自身磁盘空间),防止空间倾斜
- 语法:CREATE/ALTER USER…PERM/TEMP/SPILL SPACE
schema空间管控
- 支持schema空间管理
- 语法:CREATE/ALTER SCHEMA…PERMSPACE
单DN单SQL空间管控
- 避免单SQL在单DN上插入数据过大,引发DN数据倾斜
6.异常规则
类型 | 说明 |
---|---|
blocktime | 作业的阻塞时间,单位为秒。包括全局并发排队以及局部并发排队的总时间。 |
elapsedtime | 已经被GaussDB(DWS)执行的作业,从开始执行到当前所消耗的时间,单位为秒。 |
allcputime | 作业在所有datanode上执行时所耗费的cpu总时间,单位为秒。 |
cpuskewpercent | 作业在datanode上执行时的cpu时间的倾斜率,有效范围为1~100。cpuskewpercent的分析依赖于qualificationtime设置。 |
spillsize | 作业在DN上下盘数据量,单位MB |
broadcastsize | 作业在DN上大表广播数据量,单位MB |
mem_limit | 作业在DN上使用内存量,支持设置KB、MB、GB |
异常动作:
- Abort:退出操作。
7.工作负载队列案例
8.创建工作负载队列
9.并发管控测试
1、创建测试用户
create user report_user password 'report_user_12#$'
create user budget_user passwod 'budget_use_12#$'
2、用户队列绑定
3、模拟耗时队列
select pg sleep()
9.存储空间管控测试
create table test (id int primary KEY,content text);
CREATE FUNCTION gen_test_data() RETURNS BOOLEANAS$BODY$DECLARE iINTEGER;BEGINi=1;FOR iin 0..200000 LOOPINSERT INTO test VALUES (i,'abcdefghijkabcdefghijksafwr23498vj..');END LOOP;RETURN TRUE;END;$BODY$LANGUAGE plpgsql;
select gen_test_data();
三、GaussDB(DWS)工作负载计划介绍与使用
1.工作负载计划适用场景
工作负载计划用于自动化的、周期性的对工作负载队列中的资源进行变更,以便实现灵活的负载管理,适应不同的业务需求;以queue_simple和queue_complex为例,每天的0:00-06:00之间交易量大大降低,开始进行批量分析,此时需要重新配置队列的资源占比。
2.启动工作负载计划
3.导入导出工作负载计划
对于有多套集群或者有镜像测试环境的集群,可以在在一套集群中进行配置和测试后将配置导出,然后再导入生产集群或其他集群使用
四、GaussDB(DWS)模式空间管理介绍与使用
GaussDB(DWS)存储资源管理上还提供了Schema级别的空间管控能力,一方面可以实现单实例上的空间管控,避免数据库只读和磁盘满的情况出现;另一方面将空间管控和用户、队列解耦,实现了空间管控和权限的分离,降低用户使用空间管控的难度。
当一个Schema存在空间限制时,在业务执行过程中,如果该Schema下的表数据之和超过空间限制,则会导致业务报错"out of schemas' perm space limit"
。
1.修改Schema空间限额
总结
本文讲解GaussDB(DWS)云数仓主要有四部分:GaussDB(DWS)工作负载管理介绍、GaussDB(DWS)工作负载队列介绍与使用、GaussDB(DWS)工作负载计划介绍与使用、GaussDB(DWS)模式空间管理介绍与使用。
在使用GaussDB(DWS)云数仓之前需要了解sql语法和消息队列,并发等知识点。
GaussDB(DWS)实时数仓的特点主要有:
- 快:实时数仓时序数据单机入库性能支持每秒10万条数据、每秒60万条流数据持续计算入库,并可线性扩展。
- 易:支持基于SQL完成复杂流式计算语义定义,简化开发。以Druid监控的一个场景为例,仅用150行SQL代码实现了原有1900行Druid脚本同样的功能。
- 简:实现了1 = N。在一个平台内,同时实现Flink/Spark Streaming(流数据处理)+Druid(流数据预聚合)+InfluxDB(时序数据处理),简化了开发和运维工作。
- 省:时序数据经过实时数仓的自适应压缩算法,可达40:1的压缩比,将多维度行列存储优化,数据冷热温自动分区,极大地减少存储空间,节省用户成本。
GaussDB(DWS)的形态主要有:
- 云数仓:高性价比,支持冷热数据分析,存储、计算弹性伸缩,无限算力、无限容量,并按需、按量计价。适用于“库、仓、市、湖”一体化的融合分析业务,是OLAP分析场景的首选。
- IoT数仓:在云数仓基础上,提供高效的时序计算和IoT分析能力,支持实时和历史数据关联,内置时序算子,最高40x压缩。适用于物联网IoT等实时分析场景。
- 实时数仓:在大规模数据查询和分析能力基础上,提供高并发、高性能、低时延、低成本的事务处理能力。适用于HTAP混合负载场景,“一库两用,生产即分析”,支持单机部署和集群部署两种部署方式。
本文整理自华为云社区【内容共创】活动第19期。
查看活动详情:https://bbs.huaweicloud.com/blogs/370132
相关任务详情:任务16.送一套环境,教您掌握工作负载管理,玩转云数仓
【云驻共创】GaussDB(DWS)云数仓工作负载管理流程体验相关推荐
- 【云驻共创】华为云之锁与权限为您的数仓保驾护航
文章目录 前言 1.锁的介绍 2.权限的介绍 一.DWS锁机制介绍&排查处理方法 1.华为云数仓DWS的概念 2.事务隔离性问题分析 3.数据库并发场景 4.锁机制 4.1 MVCC介绍 4. ...
- 【云驻共创】华为云AI之用Python定制我的《本草纲目女孩》
文章目录 前言 一.华为云ModelArts-Notebook介绍 1.华为云ModelArts-Notebook 1.1 Jupyter Notebook是什么 1.2 JupyterLab是什么 ...
- 【云驻共创】华为云HCIA-IoT V2.5培训系列内容之物联网概览
文章目录 前言 一.物联网发展简史与概述 1.物联网的发展简史 1.1 物联网的起源 1.2 物联网的发展 1.3 物联网大事件 1.3.1 NB-IOT标准的引进 1.3.2 工信部宣布5G商用 1 ...
- 【云驻共创】华为云IoTDA服务下的设备管理流程实操
文章目录 一.当今社会发展趋势 1.社会背景 2.什么是物联网(IoT) 3.什么是华为云(IoTDA) 二.为什么需要设备发放 1.传统模式-存在问题 2.设备发放模式-问题改进 三.设备接入服务的 ...
- 【云驻共创】华为云AI之《情感专家》在线分析影评情感基调
文章目录 前言 一.Word Embedding 二.BERT原理 1.Pre-training预训练 2.Deep Bidirectional Transformers 3.BERT中的双向表示 4 ...
- 【云驻共创】华为云IoT数据分析流程实操
文章目录 一.数据分析的发展 1.数据分析概念 1.1 数据分析的背景 1.2 数据分析的目的 1.3数据分析的定义 2.物联网数据分析概念 3.华为云IoT数据分析优势 二.华为云IoT数据分析服务 ...
- 【云驻共创】华为云之手把手教你搭建IoT物联网应用充电桩实时监控大屏
文章目录 前言 1.什么是充电桩 2.什么是IOT 3.什么是端.边.云.应用协同 4.什么是Astro轻应用 一.玩转lOT动态实时大屏(线下实际操作) 1.Astro轻应用说明 1.1 场景说明 ...
- 【云驻共创】华为云云原生之Kubernetes网络架构原理深度剖析(上)
文章目录 前言 一.Kubernetes诞生背景 1.云原生的概念 2.云原生架构 3.Kubernetes(k8s) 二.Kubernetes基本网络模型剖析 1.概念厘清 1.1 二层桥接 VS ...
- 【云驻共创】非标装备制造企业如何破除交付困境
文章目录 前言 一.制造业的生产关系 1.OEM的概念 2.EU的概念 3.EPC/SI的概念 二.数字化的现状及趋势 1.IT和OT 2.数字化设备 三.非标装备企业的现状 1.非标装备企业的现状- ...
最新文章
- Tomcat官方文档关于数据源配置的内容
- 搭建卷积神经网络怎么确定参数_AI入门:卷积神经网络
- 嵌入式操作系统的主要特点都有哪些
- 【Linux进程、线程、任务调度】四多核下负载均衡 中断负载均衡,RPS软中断负载均衡 cgroups与CPU资源分群分配 Linux为什么不是硬实时 preempt-rt对Linux实时性的改造
- python timeit用法_十大Python开发技巧
- wps vba模块压缩包_01_创建第一个VBA小程序:你好,世界
- 【翻译自mos文章】使用aum( Automatic Undo Management) 时遇到 ORA-01555错误--- 原因和解决方式。...
- 携程到底有没有杀熟?
- linux反向连接如何免密码,编写受密码保护的反向Shell(Linux x64)
- 软考中级-软件设计师|下午题攻略
- 将阳历转换为阴历php,php将阳历转换为阴历
- JAVA 实现AES加密解密
- 由“外”向“内”,安踏破解运动科技“卡脖子”难题
- Chrome 插件配置
- Android JNI开发三: SO库的使用
- exadata的exacli
- 网页上显示word和Excel
- MyBatis----回顾mybatis自定义和环境搭建+完善自定义Mybatis的注解开发
- 戴尔服务器720dx格式化硬盘,《图解戴尔iDRAC服务器远程控制设置》.docx
- 舒亦梵:4.24非农周大数据即将来临,黄金行情将是怎样
热门文章
- 2001年考研数学一真题pdf
- [IE编程] IE网页截图技术总结
- 用DirectDraw实现屏幕截图
- 有哪些学生党必备的 App?学生党必备软件推荐,简单实用!
- 音悦Tai-音悦商城项目(专辑页面以及商品购买页面)
- 从微信公众平台#183;小程序内测邀请函看应用号动向
- 基于openCV和PythonSMTP的天眼系统
- 安卓手机玩游戏卡顿怎么解决_手机玩游戏卡顿怎么办?如何让手机流畅玩游戏?...
- 如何使用天天模拟器调试Android程序
- 易数一键备份还原软件的备份数据存放在什么目录下呢?