简介: Kettle是一款开源的ETL工具,纯java实现,可以运行于Windows, Unix, Linux上运行,提供图形化的操作界面,可以通过拖拽控件的方式,方便地定义数据传输的拓扑。Kettle支持丰富的数据输入输出源,数据库支持Oracle,MySql,DB2等,也支持业界各种开源的大数据系统,例如HDFS, HBase, Cassandra, MongoDB等。本文将介绍如何利用MaxCompute的插件无缝对接阿里云的大数据计算平台——MaxCompute。

本示例使用的工具及驱动版本

Kettle

8.2.0.0-342

MaxCompute JDBC驱动

v3.2.8

Setup

  1. 下载并安装Kettle
  2. 下载MaxCompute JDBC driver
  3. 将MaxCompute JDBC driver置于Kettle安装目录下的lib子目录(data-integration/lib)
  4. 启动spoon

Job

我们可以通过Kettle + MaxCompute JDBC driver来实现对MaxCompute中任务的组织和执行。

首先需要执行以下操作:

  1. 新建Job
  2. 新建Database Connection
    JDBC连接串格式为:jdbc:odps:<maxcompute_endpoint>?project=<maxcompute_project_name>
    JDBC driver class为:com.aliyun.odps.jdbc.OdpsDriver
    Username为阿里云AccessKey Id
    Password为阿里云AccessKey Secret
    JDBC更多配置见:https://help.aliyun.com/document_detail/161246.html

之后,可以根据业务需要,通过SQL节点访问MaxCompute。下面我们以一个简单的ETL过程为例:

Create table节点的配置如下:

需要注意:

  1. 这里Connection需要选择我们配置好的
  2. 不要勾选Send SQL as single statement

Load from OSS节点配置如下:

需要注意的点同Create table节点。有关更多Load的用法,见:https://help.aliyun.com/document_detail/157418.html

Processing节点配置如下:

需要注意的点同Create table节点。

原文链接
本文为阿里云原创内容,未经允许不得转载。

Kettle on MaxCompute使用指南相关推荐

  1. [JDBC] Kettle on MaxCompute 使用指南

    简介: Kettle是一款开源的ETL工具,纯Java实现,可以在Windows.Unix和Linux上运行,提供图形化的操作界面,可以通过拖拽控件的方式,方便地定义数据传输的拓扑 .基本讲介绍基于K ...

  2. MaxCompute安全管理指南-基础篇

    背景及目的 方便和辅助MaxCompute的project owner或安全管理员进行project的日常安全运维,保障数据安全. MaxCompute有安全模型,DataWorks也有安全模型,当通 ...

  3. 【干货索引】阿里云大数据计算服务MaxCompute与生态系统的融合

    摘要: MaxCompute大家都不陌生,之前产品名称叫ODPS,之后随国际化而更名.从支持阿里集团内部99%数据业务到计算能力对外输出,帮助政府.互联网公司.金融等进行大数据项目服务,使得数据变现. ...

  4. 阿里巴巴大数据计算平台MaxCompute(原名ODPS)全套攻略(持续更新20171127)

    概况介绍 大数据计算服务(MaxCompute,原名ODPS,产品地址:https://www.aliyun.com/product/odps)是一种快速.完全托管的TB/PB级数据仓库解决方案.Ma ...

  5. 大数据全攻略:10年老兵带你看尽MaxCompute大数据运算挑战与实践

    大数据计算服务(MaxCompute,原名ODPS)是一种快速.完全托管的TB/PB级数据仓库解决方案.MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决 ...

  6. 阿里云数加大数据计算服务MaxCompute文章索引(持续更新201705)

    概况介绍: 10年老兵带你看尽MaxCompute大数据运算挑战与实践 什么是阿里云数加大数据计算服务MaxCompute? 一分钟了解阿里云产品:大数据计算服务MaxCompute概述 数加平台如何 ...

  7. 阿里云大数据计算服务MaxCompute(下篇)

    关于阿里云大数据计算服务MaxCompute的详细内容: 阿里云大数据计算服务MaxCompute使用教程 (MaxCompute(原ODPS)是一项大数据计算服务,它能提供快速.完全托管的PB级数据 ...

  8. MaxCompute studio与权限那些事儿

    背景知识 MaxCompute拥有一套强大的安全体系,来保护项目空间里的数据安全.用户在使用MaxCompute时,应理解权限的一些基本概念: 权限可分解为三要素,即主体(用户账号或角色),客体(表/ ...

  9. sqoop 增量导入mysql_sqoop增量导入数据库

    Sqoop(Tunnel通道系列) Sqoop基于社区Sqoop 1.4.6版本开发,增强了对MaxCompute的支持,可以将数据从MySQL等关系数据库导入或导出到MaxCompute表中,也可以 ...

最新文章

  1. 程序员的共鸣 - 读《卓有成效的程序员》
  2. canvas象棋 画图
  3. 部署在SAP ABAP服务器上的SAP UI5应用,resource root的计算逻辑
  4. iOS: 在Object-C中监听javascript事件( Javascript communicating back with Objective-C code)
  5. Cortex-M3 I-Code,D-Code,系统总线及其他总线接口
  6. 【主机】计算机缓存机制
  7. 降本增效促提升---豪越创新企业后勤管理模式
  8. 显微镜C接口_显微分析设备聚焦离子束扫描电子显微镜
  9. 使用夜神模拟器完美破解(反编译)微信小程序以及问题汇总
  10. 【OpenCV C++】照片修改像素(尺寸大小)
  11. 高效程序员的7个技能
  12. 刚刚,中国电子学会给阿里云飞天颁发了15年来首个特等奖
  13. 【算法基础六】敲代码遇到VScode多行与单行注释的快捷操作
  14. excel poi 加背景图_java 在Excel中插入图片 POI实现
  15. 1.1 Tekton学习笔记之基本概念
  16. 搭建DNS服务,正向解析和反向解析搭建DNS服务器
  17. 久等了,铁威马TOS 5内测招募来了
  18. itchat自动回复
  19. 京东2017实习生招聘在线笔试编程题
  20. 【fcgi如何处理http post上传文件】

热门文章

  1. JAVA入门级教学之(数据转换规则)
  2. php 远程图片合拼,php获取远程图片的三种方式
  3. web td不对齐_珍稀干货!阿里 Web 音视频开发趟坑指南
  4. toad dba suite for oracle 12,Toad DBA Suite 和Toad Development Suite的区别
  5. Java基础学习需要掌握哪些内容?
  6. Java的面试汇总,有这些还担心不通过?
  7. electron增加导航按钮_Electron发布6.0 Released版本
  8. c 定义结构体时提示应输入声明_C++|了解结构体的内存对齐(成员声明的顺序影响占用空间大小)...
  9. 【LeetCode笔记】剑指 Offer 13-. 机器人的运动范围 (Java、dfs)
  10. python十点半游戏代码_Python实现Pig Latin小游戏实例代码