课程介绍
     ETL (Extract,Transformation,Load)工具是构建数据仓库、进行数据整合工作所必须使用的工具。目前市面有多种商业 ETL 工具,如Informatica,Datastage等。目前市场上开源且实用的 ETL 工具比较少,Kettle 就是这不多的开源 ETL 工具之一。 本课程将主要讲解开源 ETL 工具 Kettle 的基本使用和二次开发方法,并结合实际项目案例,讲解 Kettle 如何在实际中应用,以及应用中可能会出现的问题。针对目前大数据的应用情况,本课程也将结合大数据,讲述 Kettle 如何支持 Hadoop、HBase、MongoDB、MapReduce 等大数据技术。除了Kettle 的使用,在本课程的后几个课时,将讲述 Kettle 的二次开发: 包括 Kettle 代码阅读指导, Kettle API 的说明以及使用方法, Kettle 插件的开发方法。

课程内容
第一周:ETL 的概念,Kettle 的概念、功能、操作
第二周:Kettle 资源库、日志、运行方式
第三周:输入步骤(表输入、文本文件输入、XML 文件输入...)
第四周:输出步骤(表输出、更新、删除、文本文件输出、XML文件输出...)
第五周:转换步骤(过滤、字符串处理、拆分字段、计算器...)
第六周:转换步骤(字段选择、排序、增加校验列、去除重复记录...)
第七周:应用步骤、流程步骤(处理文件、执行程序、发送邮件、空操作、阻塞步骤、中止等...)
第八周:查询步骤、连接步骤(数据库查询、流查询、合并记录、记录集连接、笛卡尔...)
第九周:脚本步骤(Javascript,Java Class、正则表达式...)
第十周:作业项(拷贝、移动、ftp、sftp…)
第十一周:Kettle 的参数和变量、Kettle 集群
第十二周:Kettle 代码编译、代码结构、应用集成、各种配置文件
第十三周:插件开发 - 步骤、作业项 
第十四周:作业设计技巧、错误处理、调试转换、循环和分支
第十五周:大数据插件(Hadoop 文件输入/输出,HBase输入/输出,MapReduce输入/输出,MongoDB输入/输出)

目标人群
1. ETL 工程师,Java 开发工程师,
2. 经常要做数据处理的 DBA
3. 有一定数据库基础 和 Java 基础的学生。

课程预期目标  
1. 理解 Kettle 软件的基本功能。
2. 能使用 Kettle 完成基本的数据处理工作。
3. 了解 Kettle 软件的一些高级功能
4. 对有Java 开发经验的同学,对 Kettle 代码结构有一定了解,能开发一些 Java 的基本插件。
下载地址:http://feixueteam.net/thread-363-1-1.html

炼数成金深入BI - Kettle 篇相关推荐

  1. python数据内容_炼数成金:Python数据分析内容分享

    相信看这篇文章的每一位朋友,都有过努力学习 炼数成金:Python数据分析     这个课程.提升自我的想法, 可是学习是一件非常反人性的事情,大多数人都是晚上想想千条路,早上醒来走原路.  也相信很 ...

  2. 炼数成金Tensorflow学习笔记之2.2_变量

    炼数成金Tensorflow学习笔记之2.2_变量 代码及分析 代码及分析 import tensorflow as tfx = tf.Variable([1, 2]) a = tf.constant ...

  3. 炼数成金数据分析课程---8、数据清洗

    炼数成金数据分析课程---8.数据清洗 一.总结 一句话总结: 数据分析课程的实质是:介绍库中的函数:介绍py的3个常用的数据分析库(numpy,pandas,scipy)的函数的操作 实例:其实找几 ...

  4. 炼数成金数据分析课程---16、机器学习中的分类算法(交叉内容,后面要重点看)...

    炼数成金数据分析课程---16.机器学习中的分类算法(交叉内容,后面要重点看) 一.总结 一句话总结: 大纲+实例快速学习法 主要讲解常用分类算法(如Knn.决策树.贝叶斯分类器等)的原理及pytho ...

  5. 炼数成金数据分析课程---17、机器学习聚类算法(后面要重点看)

    炼数成金数据分析课程---17.机器学习聚类算法(后面要重点看) 一.总结 一句话总结: 大纲+实例快速学习法 主要讲解常用聚类算法(比如K-means等)的原理及python代码实现:后面学习聚类的 ...

  6. 炼数成金数据分析课程---7、数据分析简介

    炼数成金数据分析课程---7.数据分析简介 一.总结 一句话总结: 我终于知道他们是要做一些什么样的工作了 1.我们导入了数据,是否可以立即进行数据分析? 需要对数据做预处理:比如去除脏数据这些 2. ...

  7. 炼数成金数据分析课程---13、回归分析

    炼数成金数据分析课程---13.回归分析 一.总结 一句话总结: 大纲+实例快速学习法 主要内容是回归分析的原理及编程实现 1.回归分析是什么? 通过建立模型来研究变量之间相互关系的密切程度.结构状态 ...

  8. 炼数成金邀请码:YY96

    dataguru 炼数成金 邀请码 YY96 学费减免 dataguru 炼数成精  邀请码 YY96 学费减免 炼数成金邀请码,使用邀请码报名课程可以减免50%固定学费哦! http://edu.d ...

  9. 炼数成金Tensorflow学习笔记之2.4_Tensorflow简单示例

    炼数成金Tensorflow学习笔记之2.4_Tensorflow简单示例 代码及分析 代码及分析 # -*- coding: utf-8 -*- """ Created ...

  10. 炼数成金 优惠码 C183

    最近想学点大数据的分析,找到了炼数成金这个网站,感觉很不错,报名了一个课程,最近炼数成金正在搞活动,使用优惠码立即减一半学费,分享出我的优惠码 所有课程都可以使用!!!!!!!!!! 优惠码:C183

最新文章

  1. 程序员关注的高质量公众号
  2. java thumbnailator 做图片处理
  3. java读取codetable_解析Java对象的equals()和hashCode()的使用
  4. JQuery动画之淡入淡出动画
  5. Tomcat整体介绍
  6. BP神经网络和支持向量机在R语言中的实现
  7. 判断手机上是否安装某个APP(iOS)
  8. 【信息系统项目管理师】项目管理十大知识领域速记
  9. html文件恢复工具,小飞文件恢复工具
  10. 2020牛客寒假算法基础集训营4 - G 音乐鉴赏-全概率公式
  11. SCSI硬盘接口是什么
  12. 计算机应用基础模拟三答案,《计算机应用基础》模拟试卷三(含答案)
  13. cocos creator android 真机调试配置密匙
  14. Vmware+移动硬盘,实现最简单环境的便携WinToGo
  15. Zynq FPGA低时延H.264设计方案(编码+解码< 1ms)
  16. 分布式机器学习的集群方案介绍之HPC实现
  17. 损失函数——均方误差(Mean Squared Error,MSE)
  18. 微信公众号订阅号留言点赞采集抓取爬虫
  19. python编程midi键盘按键错乱_键盘按键错乱超简单解决教程
  20. 2073:【例2.16 】三角形面积

热门文章

  1. 学校计算机科室管理制度,学校科室管理制度资料.doc
  2. 梅特勒托利多xk3124电子秤说明书_梅特勒托利多称重仪表XK3124 B520
  3. android 如何编译.so,Android源码中编译自己的so库
  4. python 模拟键盘输入组合键_Python Selenium keys快捷键和键盘操作|send_keys输入按键,SHIFT,CTRL+组合键...
  5. c语言中d1的分辨率是,高分一号(GF-1)、高分一号B、C、D星 卫星介绍
  6. 腾讯互娱2021年游戏客户端开发工程师暑期实习生面试经历
  7. 北京与洛杉矶时差16小时,飞机飞行时间是12小时40分钟。请输入从洛杉矶起飞的日期与时间,计算出到达北京的日期与时间。
  8. 华为HCNA实验学习
  9. 用ARCGIS做DEM地形分析
  10. 如何简单通俗地解释什么是云计算?