streamsets data collector新增upsert 4 mysql

目录

  • 1.背景简介
  • 2.部署步骤
    • 2.1 cm界面操作
    • 2.2上传驱动包
    • 2.3 上传插件
    • 2.4选择pipeline
    • 2.5 pipeline配置
  • 3.启动界面

1.背景简介

由于sdc缺少由kudu到mysql的upsert操作,前期通过spark-sql定制化开发了一套数据同步程序,但是由于spark-sql同步大量数据,效率十分低下,现基于sdc源码定制化了支持mysql的upsert数据的导入插件。

2.部署步骤

2.1 cm界面操作


找到如上图的位置添加如下相应配置
sdc-security.policy 的 Data Collector 高级配置代码段(安全阀):

// custom stage library directory
grant codebase "file:///opt/cloudera/parcels/STREAMSETS_DATACOLLECTOR-3.8.1/user-libs/-" {permission java.security.AllPermission;
};// user-defined external directory
grant codebase "file:///opt/sdc-extras/-" {permission java.security.AllPermission;
};

sdc-env.sh 的 Data Collector 高级配置代码段(安全阀):

export USER_LIBRARIES_DIR="/opt/cloudera/parcels/STREAMSETS_DATACOLLECTOR-3.8.1/user-libs"export STREAMSETS_LIBRARIES_EXTRA_DIR="/opt/sdc-extras"

其中容易遗忘的一步:(登录sdc所在服务器执行如下命令)

chown -R sdc:sdc /opt/sdc-extras

2.2上传驱动包



2.3 上传插件

上传插件(/home/tianjun/opensource/yjp-bi-sdc/target/yjp-bi-sdc-1.0-SNAPSHOT.tar.gz)
到上面指定的sdc目录(/opt/cloudera/parcels/STREAMSETS_DATACOLLECTOR-3.8.1/user-libs/)

2.4选择pipeline


2.5 pipeline配置

2.5.1 Origin端


2.5.2 destinations端

3.启动界面

streamsets自定义插件部署方案相关推荐

  1. Office插件部署

    VSTO为我们提供了使用托管代码来开发office扩展到桥梁,它大大提供了开发office扩展到效率缩短了开发周期,并且提供了部署方案. 本文重点是介绍office插件的部署,因此这里就不介绍offi ...

  2. kong笔记——自定义插件 目录及部署

    kong笔记 目录导航 简述 本文目标: 了解kong插件的基本信息 手动部署自定义插件 注意:本文不涉及自定义插件的开发,仅仅说明自定义插件的目录结构与部署方式 目录结构 基本插件模块 两个必须的文 ...

  3. 在AWS Lambda上部署EC2编译的FFmpeg工具——自定义层的方案

    大纲 1 确定Lambda运行时环境 1.1 Lambda系统.镜像.内核版本 1.2 运行时 1.2.1 Python 1.2.2 Java 2 环境准备 2.1 创建EC2实例 3 编译FFmpe ...

  4. 在AWS Lambda上部署标准FFmpeg工具——自定义层的方案

    大纲 1 确定Lambda运行时环境 1.1 Lambda系统.镜像.内核版本 1.2 运行时 1.2.1 Python 1.2.2 Java 2 打包FFmpeg 3 创建Lambda的Layer ...

  5. 纯java的方式实现自定义自动化部署java项目

    纯java的方式实现自定义自动化部署java项目 前言 使用第三方的服务或插件实现部署所存在的问题 自动化部署java项目 java项目部署方式 流程 代码实现 打包 使用 java 执行 cmd 进 ...

  6. TarsGo新版本发布,支持protobuf,zipkin和自定义插件

    本文作者:陈明杰(sandyskies) Tars是腾讯从2008年到今天一直在使用的后台逻辑层的统一应用框架,目前支持C++,Java,PHP,Nodejs,Golang语言.该框架为用户提供了涉及 ...

  7. 边缘计算设备与部署方案

    1. 边缘计算设备 边缘计算设备,是相对于云计算而言的.不同于云计算的中心式服务,边缘服务是指在靠近物或数据源头的一侧,采用网络.计算.存储.应用核心能力为一体的开放平台,就近提供最近端服务.其应用程 ...

  8. 【Flink】flink on k8s 部署方案

    1. HDFS部署 (k8s) hdfs的作用是用户保存flink的检查点与保持点 但是大数据集群目前还是建议单独使用CDH或者HDP部署 目前文中的这种hdfs on k8s方式做高可用不太方便 1 ...

  9. AI 框架部署方案之模型部署概述

    0 概述 模型训练重点关注的是如何通过训练策略来得到一个性能更好的模型,其过程似乎包含着各种"玄学",被戏称为"炼丹".整个流程包含从训练样本的获取(包括数据采 ...

最新文章

  1. 0001 手工构建第一个C#应用程序
  2. 翻译:MariaDB DATABASE()
  3. 吴恩达深度学习课程deeplearning.ai课程作业:Class 4 Week 3 Car detection
  4. npm查看指定包的所有版本
  5. Visual Studio 2017 新功能(下)
  6. 【免费毕设】ASP.NET 城市酒店入住信息管理系统 (源代码+lunwen)
  7. plsql创建中文表头_不安装oracle连接plsql,Oracle instantclient安装详解
  8. Ubuntu安装时出现“failed to load ldlinux.c32”[已解决]
  9. 【群友问题讨论】java类对象数组一些知识盲区
  10. neko vm 数据包装翻译
  11. 2016.06工作日志
  12. pytorch提供的maskrcnn训练自己的数据
  13. 俄罗斯天才少女也选华为,22岁拿下世界编程冠军,同天队友也宣布加盟
  14. ViewPager简单介绍(二)ViewPager+Fragment
  15. 2020前端知识体系(图谱)
  16. 七月集训(6)滑动窗口+动态规划
  17. java 工作流表单设计器 设计方案
  18. 中国大学mooc医学计算机与信息素养答案,医学计算机与信息素养
  19. 华北电力大学计算机科学,华北电力大学计算机科学与技术系介绍
  20. 物流运输行业商业供应商管理平台:优化供应链关系,助力企业进入数字化快车道

热门文章

  1. 印象笔记,幕布, Effie 哪个适合 up 主?
  2. 超级产品:解秘国潮对服装类企业的柔性供应链改造
  3. MDK编译全过程及数据存储
  4. 郑州轻工业大学oj1023C语言答案,郑州轻工业学院(ZZULI) OJ系统第1431题 读数字 解题报告...
  5. gyp: No Xcode or CLT version detected! 错误提示
  6. 求三角形的外接圆圆心个半径
  7. php记事,PHP记事(2)
  8. Java训练work3.Exer2---跳跃最大长度
  9. Micro-cap导入元件库
  10. python有中文无法保存_解决python3爬虫无法显示中文的问题