资源管理

为了节省Doris集群内的计算、存储资源,Doris需要引入一些其他外部资源来完成相关的工作,如Spark/GPU用于查询,HDFS/S3用于外部存储,
Spark/MapReduce用于ETL, 通过ODBC连接外部存储等,因此我们引入资源管理机制来管理Doris使用的这些外部资源。

基本概念

一个资源包含名字、类型等基本信息,名字为全局唯一,不同类型的资源包含不同的属性,具体参考各资源的介绍。

资源的创建和删除只能由拥有 admin 权限的用户进行操作。一个资源隶属于整个Doris集群。拥有 admin 权限的用户可以将使用权限usage_priv 赋给普通用户。可参考HELP GRANT或者权限文档。

具体操作

资源管理主要有三个命令:CREATE RESOURCE,DROP RESOURCE 和 SHOW RESOURCES,分别为创建、删除和查看资源。这三个命令的具体语法可以通过MySQL客户端连接到 Doris 后,执行 HELP cmd 的方式查看帮助。

CREATE RESOURCE语法CREATE [EXTERNAL] RESOURCE "resource_name"                                  PROPERTIES ("key"="value", ...);

在创建资源的命令中,用户必须提供以下信息:

resource_name 为 Doris 中配置的资源的名字。
PROPERTIES 是资源相关参数,如下:
type:资源类型,必填,目前仅支持 spark与odbc_catalog。
其他参数见各资源介绍。
DROP RESOURCE该命令可以删除一个已存在的资源。具体操作见:HELP DROP RESOURCESHOW RESOURCES该命令可以查看用户有使用权限的资源。具体操作见:HELP SHOW RESOURCES

支持的资源

目前Doris能够支持

Spark资源 : 完成ETL工作。
ODBC资源:查询和导入外部表的数据
下面将分别展示两种资源的使用方式。

Spark

#参数
#Spark 相关参数如下:

spark.master: 必填,目前支持yarn,spark://host:port。spark.submit.deployMode: Spark 程序的部署模式,必填,支持 cluster,client 两种。spark.hadoop.yarn.resourcemanager.address: master为yarn时必填。spark.hadoop.fs.defaultFS: master为yarn时必填。其他参数为可选,参考http://spark.apache.org/docs/latest/configuration.html。

如果Spark用于ETL,还需要指定以下参数:

working_dir: ETL 使用的目录。spark作为ETL资源使用时必填。例如:hdfs://host:port/tmp/doris。

broker: broker 名字。spark作为ETL资源使用时必填。需要使用ALTER SYSTEM ADD BROKER 命令提前完成配置。

broker.property_key: broker读取ETL生成的中间文件时需要指定的认证信息等。
#示例
创建 yarn cluster 模式,名为 spark0 的 Spark 资源。

CREATE EXTERNAL RESOURCE "spark0"
PROPERTIES
("type" = "spark","spark.master" = "yarn","spark.submit.deployMode" = "cluster","spark.jars" = "xxx.jar,yyy.jar","spark.files" = "/tmp/aaa,/tmp/bbb","spark.executor.memory" = "1g","spark.yarn.queue" = "queue0","spark.hadoop.yarn.resourcemanager.address" = "127.0.0.1:9999","spark.hadoop.fs.defaultFS" = "hdfs://127.0.0.1:10000","working_dir" = "hdfs://127.0.0.1:10000/tmp/doris","broker" = "broker0","broker.username" = "user0","broker.password" = "password0"
);
#ODBC

参数

ODBC 相关参数如下:

type: 必填,且必须为odbc_catalog。作为resource的类型标识。

user: 外部表的账号,必填。

password: 外部表的密码,必填。

host: 外部表的连接ip地址,必填。

port: 外部表的连接端口,必填。

odbc_type: 标示外部表的类型,当前doris支持mysql与oracle,未来可能支持更多的数据库。引用该resource的ODBC外表必填,旧的mysql外表选填。

driver: 标示外部表使用的driver动态库,引用该resource的ODBC外表必填,旧的mysql外表选填。

具体如何使用可以,可以参考ODBC of Doris

示例

创建oracle的odbc resource,名为 odbc_oracle 的 odbc_catalog的 资源。

CREATE EXTERNAL RESOURCE `oracle_odbc`
PROPERTIES (
"type" = "odbc_catalog",
"host" = "192.168.0.1",
"port" = "8086",
"user" = "test",
"password" = "test",
"database" = "test",
"odbc_type" = "oracle",
"driver" = "Oracle 19 ODBC driver"
);

Doris之资源管理相关推荐

  1. 干货!一文看Doris在作业帮实时数仓中的应用实践

    数据驱动未来.在大数据生态中,数据分析系统在数据创造价值过程中起着非常关键的作用,直接影响业务决策效率以及决策质量.Apache Doris作为一款支持对海量大数据进行快速分析的MPP数据库,在数据分 ...

  2. 知乎基于 Apache Doris 的 DMP 平台架构建设实践|万字长文详解

    导读:知乎基于业务需求搭建了 DMP 平台,本文详细的介绍了 DMP 的工作原理及架构演进过程,同时介绍了 Apache Doris 在 DMP 平台的应用实践,本文对大家了解 DMP 工作方式很有帮 ...

  3. 知乎基于 Apache Doris 的 DMP 平台架构建设实践

    1. DMP 业务背景 DMP 平台是大家老生常谈的话题.在早期广告系统出现之后就拥有了类似的 DMP 平台,比如:腾讯的广点通.阿里巴巴的达摩盘等都是业界做的比较好的 DMP 平台典型.而知乎搭建属 ...

  4. 日增百亿数据,查询结果秒出, Apache Doris 在 360商业化的统一 OLAP 应用实践

    导读: 360商业化为助力业务团队更好推进商业化增长,实时数仓共经历了三种模式的演进,分别是 Storm + Druid + MySQL 模式.Flink + Druid + TIDB 的模式 以及 ...

  5. Apache Doris 在拈花云科的统一数据中台实践,One Size Fits All

    作者|NearFar X Lab 团队 洪守伟.陈超.周志银.左益.武超 整理|SelectDB 内容团队 导读: 无锡拈花云科技服务有限公司(以下简称拈花云科)是由中国创意文旅集成商拈花湾文旅和北京 ...

  6. 【C++】拷贝控制与资源管理

    1. 拷贝控制与资源管理 管理类外资源的类必须定义拷贝控制成员.如P447中所见,这种类需要通过析构函数来释放对象所分配的资源.一旦一个类需要析构函数,那么几乎可确定它也需要一个拷贝构造函数和一个拷贝 ...

  7. 计算机在人力资源管理中的应用论文,计算机人事管理论文

    计算机人事管理论文 1.计算机在人事管理中的应用 目前,计算机已广泛应用于劳资管理.人事档案管理等方面,大大减轻了员工的负担,并且很大程度地提高了人事管理工作的效率,使人事管理工作更加科学化.系统化. ...

  8. LomoX 桌面UI框架更新,增加资源管理

    修改: 1.增加lxoption工具类,提供启动的兼容,兼容旧版的,并支持注册资源启动 (蔡东赟) 兼容启动项目: main.lx //资源包默认现在用 qrc:/pack/main.html 后面评 ...

  9. “解决方案资源管理器”中不能自动选择正在编辑的文档

    本来正在编辑的文档应该在"解决方案资源管理器"中自动选中的,但是我的VS2005机器好像没有这个功能,后来发现 "工具->选贤"里边的"项目和解 ...

最新文章

  1. 2021广西高考成绩几点可以查询,高考完多久分数能出来广西 2021年广西高考分数查询公布时间...
  2. python3读取excel数据-Python3将爬取的数据存储到Excel
  3. 【错误记录】编译 Linux 内核报错 ( /bin/sh: 1: bison: not found )
  4. 第四范式入围Forrester Wave™:预测分析与机器学习中国市场评测报告 位列领导者行列...
  5. python即时标记_python基础教程总结15——1.即时标记
  6. flash位图技术研究篇(3):移动缓冲区域
  7. Visio 2003 sp3下载
  8. 绿色版Mysql数据库快速搭建
  9. 数列随机分组matlab,MATLAB如何随机分组数据
  10. html取消select下拉,jquery取消选择select下拉框
  11. 使用 Swift 语言编程的优缺点
  12. C++程序启动时报“0xC000007B”无法启动的问题排查
  13. 精通正则表达式的 12 个有用资源
  14. 《数据可视化技术》 太平洋汽车销售分析
  15. 玩转步进电机控制,自定义中文编程
  16. Gameia HDU 6105
  17. 〖Python 数据库开发实战 - Python与Redis交互篇⑩〗- 综合案例 - 新闻管理系统 - 发表新闻
  18. OneNav简约PHP导航源码
  19. 悟透JavaScript(李站老师)-编程的快乐
  20. c语言c++通讯录管理系统代码

热门文章

  1. 直接插入排序_【真题讲解】15软专真题:直接插入排序
  2. PCL中的采集器之一OpenNI
  3. 发布一个MsBuild任务组件-可用于同时发布多个网站
  4. MHA高可用 MHA+Keepalive
  5. 新开博了,欢迎大家来做客!
  6. c++类的嵌套(1)
  7. 第五章 shell学习之文件的排序、合并和分割
  8. 1流明等于多少lux_要想投影仪画质清晰,投影仪流明和对比度不得不看
  9. Nagios_快速配置
  10. 隆冬寒骨,风吹十一豪迈