Kettle刚用的时候发现了很多问题,网上的资料也不多,简单记录一下遇到的一些问题,和一些使用技巧。

问题

1)kettle读取excel格式固定,一个excel输入节点,字段填写后是按顺序把第n列的数据给第n个字段,不是按表头去赋值的,也就是说自动获取表头字段不能随意地改变顺序、删除。

2)excel输入要注意选择sheet,不选他会把所有sheet都读入,有些sheet可能数据连格式都不一样。

3)js脚本输入字段是中文,想要使用这个字段需要先赋值给英文变量,比如输入有个“姓名”需要先写

var name = 姓名;

技巧

1)输入中有“自定义常量数据”节点,可以供其他节点当参数。

2)查询里面有“模糊匹配”节点,这个东西真的好用,他可以计算两个字符串的相似程度,比如excel有个字段公司名称,但是人手动输入可能与数据库中存的标准名称差几个无关紧要的字,比如:
数据库中存的:神马街道搓澡股份有限公司
有些人就填写:神马街道搓澡公司
以前我会去匹配一些没用字符串然后去掉,去匹配比如去掉街道以及公司等,用:%搓澡%去匹配,但是效果极差,而且去掉多了容易出现匹配了两个以上的情况。
模糊匹配里选择算法Pair letters Similarity效果比较好,计算结果是0~1的小数,数字越大相似度越高,可以设置阈值0.6~1来增加匹配正确性。
匹配源数据不要太多,能少则少,不然匹配速度慢。

记录使用Kettle导入excel数据心得相关推荐

  1. Kettle把Excel数据导入数据库

    目录 一.使用Kettle导入Excel 二.表输出 三.作业 一.使用Kettle导入Excel 1.双击"转换": 2.点击页签"核心对象",展开" ...

  2. sql server 导入excel数据表

    sql server 导入excel数据表 之前谈到过在sql server中对用户的购买记录做过关联分析,数据来源是来自sql server数据库,但有的时候,数据源来自于其他文件,比如excel文 ...

  3. php导入excel先检查,php 如何在导入Excel数据时检查Mysql数据库内容是否存在,避免重复录入?:怎么样筛选excel表格重复的数据库...

    php 如何在导入Excel数据时检查Mysql数据库内容是否存在,避免重复录入? 如果不想每询一次以提前做一个统询 $sql=mysql_query("select distinct Co ...

  4. MySQL批量导入Excel数据

    1.确定需要导入数据的表名称以及字段,然后在新建的Excel表中,按照表字段正确排序:(注:(Excel文件的名称最好和数据库的名称一致,sheet表的名字最好和表名称一致,方便需要导入多张表数据时一 ...

  5. 【Python处理EXCEL】基础操作篇:在Python中导入EXCEL数据

    一.前期准备 此篇使用两种导入excel数据的方式,形式上有差别,但两者的根本方法实际上是一样的. 首先需要安装两个模块,一个是pandas,另一个是xlrd. 在顶部菜单栏中点击文件,再点击设置,然 ...

  6. php 表格导入excel插件,BootStrap Fileinput插件和表格插件相结合实现导入Excel数据的文件上传、预览、提交的步骤...

    这篇文章主要介绍了BootStrap Fileinput插件和Bootstrap table表格插件相结合实现文件上传.预览.提交的导入Excel数据操作步骤,需要的朋友可以参考下 bootstrap ...

  7. python实现自动导入excel数据到MySQL中

    最近工作遇到了把excel数据自动导入到MySQL的需求,在考虑了kettle后,不太容易实现导入excel数据自动生成表的问题,于是乎,把解决方法转移到了python,结果python确有实现办法, ...

  8. ASP导入Excel数据提示:外部数据库驱动程序(1)中的意外错误 解决办法

     ASP导入Excel数据提示:外部数据库驱动程序(1)中的意外错误 解决办法 最近拿起很久以前写的ASP导入excel数据程序测试时,发现好好的程序出现运行问题,之前都是好好的.真是怪事. 怎么 ...

  9. mysql如何批量导入excel_MySQL批量导入Excel数据

    1.确定需要导入数据的表名称以及字段,然后在新建的Excel表中,按照表字段正确排序:(注:(Excel文件的名称最好和数据库的名称一致,sheet表的名字最好和表名称一致,方便需要导入多张表数据时一 ...

  10. c 导入oracle数据库,c导入excel数据到数据库

    报表工具如何实现多次导入Excel 很多人在开发报表的时候会遇到将多张表样相同的excel导入到模板,然后提交至数据库中.但问题是很多情况,在线导入不支持一次性选择多个excel,一次只能选择一个ex ...

最新文章

  1. java 发送邮件 菜鸟_Java发送邮件的方法
  2. mysql一个死锁分析
  3. 虚拟多Mac地址工具Multimac
  4. Visual Studio 2005中C++的变化
  5. jquery 插件闭包
  6. dj电商-模型类设计-1.x-订单模块表
  7. 99+好友共同关注,公众号推荐
  8. mysql undo log回收_MySQL5.7 可以回收(收缩)undo log回滚日志物理文件空间
  9. C#中的字符与字符串
  10. php如何上传txt文件,并且读取txt文件
  11. 教你如何防止网站被挂马!
  12. duilib入门简明教程 -- 前言(1)
  13. Enterprise Library 2.0 发布了...
  14. 为什么发烧友更偏爱头戴式蓝牙耳机呢?五款高音质音乐蓝牙耳机推荐
  15. C语言枚举类 口袋中有红、黄、蓝、白、黑5种颜色的球若干个
  16. 几种常用的文件加密方法
  17. android 网络运营商的名字显示规则(锁定屏幕,下拉列表)
  18. Android开发基础规范(一)
  19. 习题 8-13 外星人聚会(Meeting with Aliens, UVa10570)
  20. 现有的自动生成电路的软件有哪些?

热门文章

  1. 2022最新软件测试面试题,看完还怕拿不到offer?
  2. antd使用g2plot统计图表(7)
  3. 2021宿州市地区高考成绩排名查询,2021年宿州所有小学名单及排名,宿州最好的小学有哪些...
  4. Word2010邮件合并(附带照片)
  5. 夜神模拟器ADB版本不一致问题
  6. ArcMap进行标记符号制作
  7. 【云计算学习教程】云应用是什么?典型的云应用有哪些?
  8. linux redis玂家链接不上,Unicode编码的熟悉与研究过程(内附全部汉字编码列表)...
  9. html的px和屏幕什么关系,Html字体大小的设置单位PT与PX区别
  10. 计算机配置路径,计算机基础~Windows工作路径、相对路径、绝对路径