不多说,直接上干货!

PDI(Kettle) 都能做什么?

可以说凡是有数据整合、转换、迁移的场景都可以使用PDI,他代替了完成数据转换任务的手工编码,降低了开发难度。

同时,我们可以在自己实际业务里,使用它来实现数据的剖析、清洗、校验、抽取、转换和加载等各类常见的ETL类工作。

比如,除了ODS/DW类比较大型的应用外,Kettle实际还可以为中小企业提供灵活的数据抽取和数据处理的功能。Kettle除了支持各种关系型数据库,HBase MongoDB这样的NoSQL数据源外,它还支持Excel、Access这类小型的数据源。并且通过这些插件扩展,kettle可以支持各类数据源。

另外,Kettle的数据处理功能也很强大,除了选择、过滤、分组、连接和排序这些常用的功能外,Kettle里的Java表达式、正则表达式、java脚本、Java类等功能都非常灵活而强大,都非常适合于各种数据处理功能。

欢迎大家,加入我的微信公众号:大数据躺过的坑        人工智能躺过的坑

同时,大家可以关注我的个人博客:

http://www.cnblogs.com/zlslch/  和     http://www.cnblogs.com/lchzls/     http://www.cnblogs.com/sunnyDream/

详情请见:http://www.cnblogs.com/zlslch/p/7473861.html

人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。

目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获

对应本平台的讨论和答疑QQ群:大数据和人工智能躺过的坑(总群)(161156071)

大数据用kettle还是python_Kettle学习系列之Kettle能做什么?(三)相关推荐

  1. 0基础学习大数据你需要了解的学习路线和方向

    现在大数据这么火,各行各业想转行大数据,那么问题来了,该往哪方面发展,哪方面最适合自己? 首先从字面来了解一下大数据 大数据 (巨量数据集合(IT行业术语)) 大数据(big data),指无法在一定 ...

  2. 2016年大数据Spark“蘑菇云”行动代码学习之AdClickedStreamingStats模块分析

    2016年大数据Spark"蘑菇云"行动代码学习之AdClickedStreamingStats模块分析     系统背景:用户使用终端设备(IPAD.手机.浏览器)等登录系统,系 ...

  3. 大数据新手的0基础学习路线,从菜鸟到高手的成长之路

    大数据作为一个新兴的热门行业,吸引了很多人,但是对于大数据新手来说,按照什么路线去学习,才能够学习好大数据,实现从大数据菜鸟到高手的转变.这是很多想要学习大数据的朋友们想要了解的. 今天我们就来和大家 ...

  4. 什么是java的元数据_学习大数据,为什么要先学习Java?

    是新朋友吗?记得先点蓝字关注我哦- 今日课程菜单 Java全栈开发 | Web前端+H5 大数据开发 | 数据分析  人工智能+Python | 人工智能+物联网 来源:小职(z_zhizuobiao ...

  5. 什么是大数据?零基础如何学习大数据?(附学习路线)

    其实简单的来说,大数据就是通过分析和挖掘全量的非抽样的数据辅助决策. 大数据可以实现的应用可以概括为两个方向,一个是精准化定制,第二个是预测.比如像通过搜索引擎搜索同样的内容,每个人的结果却是大不相同 ...

  6. 大数据第二阶段Python基础编程学习笔记(待完善)

    大数据第二阶段Python基础编程学习笔记(待完善) 第一章 Python基础语法 3.8 1-1Python概述 python基础部分: ●Python基础语法: 标识符,关键字,变量,判断循环.. ...

  7. 中诚信征信“企业征信之大数据征信及风控应用系列沙龙”顺利起航

    -大数据"风暴"登陆上海 上海2018年8月17日电 /美通社/ -- 8月17日下午,由中诚信征信主办的"企业征信之大数据征信及风控应用"系列沙龙活动在上海· ...

  8. 大数据工程师技能要求的学习路线图

    一.大数据相关工作介绍 大数据方向的工作目前主要分为三个主要方向: 1. 大数据工程师 2. 数据分析师 3. 大数据科学家 4. 其他(数据挖掘等) 二.大数据工程师的技能要求 附上大数据工程师技能 ...

  9. PMP学习系列5:PMBOK(5th)第三章-项目管理过程

    PMP学习系列5:PMBOK(5th)第三章-项目管理过程 一.引言 1.概述 过程的定义:A process is a set of interrelated actions and activit ...

  10. 大数据技术导论|datawhale组队学习

    学习链接:https://datawhalechina.github.io/juicy-bigdata/#/README Task01阅读第一.二章 第一章 主要介绍了大数据的概念.应用以及其关键技术 ...

最新文章

  1. java 头尾 队列_记一次腾讯面试,我挂在了最熟悉不过的队列上
  2. 「软件」2.0时代已经到来,你需要这样的开发工具
  3. C#文件和文件夹输入输出流代码
  4. C# 向TIM或者QQ自动发送中文消息【微信也是可用的】 附测试GIF
  5. oracle function详解,Oracle 函数 Function 解析
  6. 【学术软件】ETPS(English Text Processing Software)
  7. PHP中exec()函数执行系统命令失败
  8. 惠普台式计算机系统系统修复,惠普电脑系统如何恢复【方法步骤】
  9. HttpReports 2.0 发布了 !!!
  10. 字符串左侧补0_(48)C++面试之最长不含重复字符的子字符串(动态规划)
  11. qt通过代码创建滚动区域,添加滚动区域到窗口
  12. sudo echo x **.** 时 base: : Permission denied
  13. mac m1 nvm 安装node版本失败
  14. java获取上周任意一天的日期
  15. 计算机 pps,计算机及其基本功能.pps
  16. 深入理解java虚拟机
  17. 数据处理-倾斜摄影OSGB合并根节点
  18. win10提高开机速度的设置教程 电脑五秒开机优化步骤
  19. server r2 系统更新文件清理
  20. VC/MFC得到电脑的默认打印机、设置默认打印机、遍历电脑打印机

热门文章

  1. 2018 中国短视频开发者创意大赛震撼来袭,万元现金大奖邀你来战!
  2. 报错:'utf-8' codec can't decode byte 0xb0 in position 0: invalid start byte
  3. 数据决策力是驱动企业发展的原动力
  4. chrome plugins
  5. EditPlus+NAnt构建轻巧的.NET开发环境
  6. H3CTE讲师分享H3C认证培训实验9 IP基础
  7. Nissi商城序章(二):制定开发/设计规约
  8. sql查询时取日期部分内容(年月日时分秒)、增加时间
  9. 安徽考区计算机水平考试试卷,安徽考区计算机水平考试试卷2011.6
  10. 六石管理学:从再生人有没有优势,谈软件开发