看完这章你会学习到以下内容:
1. 尤其在用Excel或者其他非数据库文件传入数据时候,如何做到数据类型同步?
2. 两张表的合并要添加那些字段作为辅助说明?
2.1 ETL时间,数据更新时间 以及 Source_data 数据来源


数据源一 : Excel表格
一共有以下几个字段

数据源二: MySQL数据 - srcsales数据库的sales_data表

第一步: 首先在目标数据库里建立目标表。
因此,我们要在MySQL上面找到相应的创建表和插入语句,操作与Oracle数据库相似。

选中表然后右击,转储SQL文件的仅数据和结构,导出SQL文件到ORACLE数据库

在打开来自MySQL数据库的创建表语句,修改无用字段,并更改数据类型

第二步:修改结果如下,全部转化成Varchar2和Number 数据类型。
注意:尽量将所属字段的长度设置大一倍,因为不同的数据库类型字符类型和存储不一,如果少了,则读取不成功。

这个就是以MySQL数据库创建表的数据类型,类似其他数据来源,CSV/Excel等可能格式存在不统一,因此,这里建议统一按照数据库格式
第三步:在Kettle的Excel输入空间上,就直接更改数据类型!
长度和精度就按照获取来自头部数据类型后,默认便可。

然后字段的名字,或许里面可以能一一对应(英文对照中文)
但是,Excel表里面的所有字段名字都转换为跟数据库的一致!

目的:就是在最后表输出的时候,能自动地匹配得到相应的字段,而不需要手动映射。

第四步:两个数据源都需要去重,但前提必须要排序。
因此 先排序后去重!

如果不排序,则会出现以下提示或者报错信息。

第五步:然后两个数据源都增加一个默认字段,数据来源Source_DATA.请注意:这个名称一定要和最后在ODS层建立的字段名字一致(可以忽略大小写),要不然会出现SOURCE_DATA无法识别。

第六步:因为两张表都是上下形式叠加的,就像SQL语句里面的Union all。
数据来源要指定紧接上一步的操作,而不是刚输入进来的数据源

最后一步,设置T,表输出。
这里就包括,输出到那一个数据库下那一张表(前提已经要建立好)。
注意: 第一次输入的话,就勾选裁剪表(确保在输入进去前,先清空所有的数据)
然后选择获取字段,将多余的标志字段删去,原本用作标识共同连接的

把表字段和流字段下的d,用del键删除即可。
之所以要删除原因:因为在ODS层建立的目标表并没有建立这一列。

kettle增加字段报错_【Kettle 多文件】Excel/MySQL文件传入解决方案相关推荐

  1. kettle增加字段报错_【实战】使用 Kettle 工具将 mysql 数据增量导入到 MongoDB 中

    每一个成功人士的背后,必定曾经做出过勇敢而又孤独的决定. 放弃不难,但坚持很酷~ 最近有一个将 mysql 数据导入到 MongoDB 中的需求,打算使用 Kettle 工具实现.本文章记录了数据导入 ...

  2. mysql中大数据表alter增加字段报错:1034 Incorrect key file for table 'table_name'; try to repair it...

    mysql中大数据表alter增加字段报错:"1034 Incorrect key file for table 'table_name'; try to repair it" 现 ...

  3. mysql语句delete报错_「delete语句」MySQL——DELETE语句中的坑 - seo实验室

    delete语句 在网上搜索了一个mysql数据库删除重复数据的sql,原文是这样的: DELETE FROM people WHERE peopleName IN ( SELECT peopleNa ...

  4. viz::viz3d报错_我可以在Excel中获得该Viz吗?

    viz::viz3d报错 Have you ever found yourself in the following situation? 您是否遇到以下情况? Your team has been ...

  5. mysql 2003报错_为什么不建议在 MySQL 中使用 UTF-8?

    正文 记得去年我在往MySQL存入emoji表情 时,一直出错,无法导入.后来找到办法 -- 通过把 utf8 改成 utf8mb4 就可以了,并没有深究. 一年后,我看到一篇文章讲到emoji文字占 ...

  6. mysql floor报错_【学习笔记】MYSQL的floor报错原理分析总结

    网上关于floor报错的文章很多,但都是利用语句,介绍原理的文章大多一笔带过,不过我终于找到一篇像样的原理文章,于是参考着来理解原理,参考的这个链接说的很详细了,但我仍然还有些不明白的地方,所以就研究 ...

  7. ubuntu安装mysql报错_在Ubuntu上安装mysql数据库和遇到的问题

    如果上面没有成功,而出现了这样的问题的话: Mysql ERROR 1045 (28000): Access denied for user 'root'@'localhost'(using pass ...

  8. mysql赋予权限的时候报错_想要远程连接MySQL,赋予root权限没用啊?一直报语法错误...

    转载,希望对你有帮助: 1. 3306端口是不是没有打开? 使用nestat命令查看3306端口状态: ~# netstat -an | grep 3306 tcp        0      0 1 ...

  9. Kettle闪退,以及Kettle资源库connect报错小解

    Kettle闪退 ####### A fatal error has been detected by the Java Runtime Environment: # # SIGSEGV (0xb) ...

  10. 达梦数据库修改字段长度_解决达梦数据库新增大字段报错问题

    使用达梦数据库穿件新表后往新表中增加TEXT类型字段报错,错误信息如下: 错误号: -3243 错误消息: 第1 行附近出现错误: 表[TABLE_2]中不能同时包含聚集KEY和大字段 ------- ...

最新文章

  1. pandas使用replace函数替换dataframe中的值:replace函数使用正则表达式对dataframe中的值进行替换
  2. 人工智能写出第一篇文章:我真的没想要消灭你们,人类!
  3. Science Robotics近日刊登CMU重大突破,无需手术,普通人就能用意念操控机械臂!...
  4. linux 特殊符号(转)
  5. window7开放端sqlserver端口
  6. 【mysql】str_to_date()字符串转化为日期类型
  7. Kali学习笔记31:目录遍历漏洞、文件包含漏洞
  8. Create new SAP DDL view and click finish in wizard
  9. qq文件对方接收后一定会有提示吗_为什么微信、QQ不推出已读功能?因为它敢出网友就敢卸载...
  10. kubevirt在360的探索之路(k8s接管虚拟化)
  11. 为什么存取周期大于存取时间_为什么开放存取很重要
  12. matplotlib输出图形到网页_pytorch使用matplotlib和tensorboard实现模型和训练的可视化...
  13. UTCformat 转换UTC时间并格式化成本地时间
  14. BZOJ2301[HAOI2011] Problem b
  15. 中国高技术产业统计年鉴(1995-2021年)
  16. Lattice系列内存时序
  17. PIXI 宝物猎人(7)
  18. 2019年南京大学计算机研究生复试分数线,2019南京大学研究生分数线汇总(含2016-2019历年复试)...
  19. 分析与思考 黄奇帆的复旦经济课 读书笔记
  20. iptables场景一(上)

热门文章

  1. Linux应用的c编程main函数参数argc,argv说明
  2. Numpy包简单介绍
  3. 2017 Multi-University Training Contest - Team 4 hdu6071 Lazy Running
  4. CSS兼容性问题总结及解决方法
  5. Appium解决每次启动时都安装setting和unlock app方法
  6. 浅谈assert()函数的用法
  7. 《大道至简——软件工程实践者的思想》阅读笔记之一
  8. android api 中文 (74)—— AdapterView.AdapterContextMenuInfo
  9. HCIP-RS-GRE
  10. mysql数据库登录历史_mysql数据库查看历史记录