kettle版本7.1,java版本必须是1.8

实例1:text文件只有一列

1.同时读取多个文件

使用Text file input工具

若是读取单个文档,直接输入:路径加文件名即可

若是读取多个文件,输入文件所在目录,然后在第二个框输入你文件名对应的正则表达式,之后再点击add,验证是否添加成功,去下方点击show filenames看看有没有你要添加的文件。

读取所有文件可以用“.*.*”  也可以用“.*\.*”。PS:你直接输入“*”是不行的,读取特定条件的文件可用“zhang.*\.txt”,此句就是把以zhang开头,后缀是txt文件输入

2.row flatter功能

作用:通过增加列减少记录条数

读取文件内容如图:

你在Text file input 中的filed字段下输入text,String他就会把每一行自动读取并把空白行消除。你再使用row flatter

他就会把text的所有按照你target field的字段重新分配到各个字段下。

3.Regex Evaluation使用

把一个字段里面的信息分解

指明需要分解的字段。

图中的Regular expression意思是:冒号前面是“Published”或者是“Expected”,冒号是另外一个String就行

输出如图,只要满足Regular expression,result返回Y,否则返回N

4.Replace in string

将文档中的一个字符串替换

这个意思就是从price字段里面搜索,把Our price全部替换为空。

5.select value

作用之一:替换元数据的类型和格式

由于你从TXT文档读的数据全是String所以使用这个把其类型改为Number,并改其格式

上面五个操作执行完后输出如图:

实例2:txt文件有多列数据,并且有的列占了很多的位置

数据如图:

kettle读txt文件并处理相关推荐

  1. pythontxt文件怎么读_python怎么读txt文件

    python怎么读txt文件? 首先,在桌面上建立一个txt文档,在上面输入以下内容:你好. Hello. abcdefg 啊不错的风格 查看文件的属性,获取文件的绝对路径:D:\HintSoft\H ...

  2. matlab读int16读文件_Matlab文件操作及读txt文件(fopen,fseek,fread,fclose)

    Matlab 文件操作及读 txt 文件 (fopen,fseek,fread,fclose) matlab 文件操作 文件操作是一种重要的输入输出方式,即从数据文件读取数据或将 结果写入数据文件. ...

  3. C++读txt文件,存入vector容器中

    经常需要用到读txt文件里的数据,总结一个模板希望以后可以直接套用. //C++ 读txt文件 #include <iostream> #include <sstream> # ...

  4. 逐行读txt文件(读写文件try catch finally 处理空行,编码格式,文件流释放问题,处理读到重复问题)

    实现功能如下: Java逐行读取.txt文件里面的数据到一个list集合里面,再加工. 处理编码格式问题, 处理读到空行的问题, 处理读到数据重复问题, 处理文件流释放不合理问题. /*** 测试逐行 ...

  5. python读取txt文件如何按数字分隔_python 读txt文件,按‘,’分割每行数据操作

    按行读取TXT文件 fname = './新建文件夹/yob2010.txt' //文件夹路径 with open(fname,'r+',encoding='utf-8') as f: for lin ...

  6. python读取txt每行中分隔符内容_python 读txt文件,按‘,’分割每行数据操作

    python 读txt文件,按','分割每行数据操作,文件,字符串,目录,路径,列表 python 读txt文件,按','分割每行数据操作 易采站长站,站长之家为您整理了python 读txt文件,按 ...

  7. fclose用法matlab,matlab文件操作及读txt文件(fopen,fseek,fread,fclose

    matlab文件操作及读txt文件(fopen,fseek,fread,fclose) matlab文件操作 文件操作是一种重要的输入输出方式,即从数据文件读取数据或将结果写入数据文件.MATLAB提 ...

  8. 如何解决Kettle读取txt文件时出现的中文乱码问题?

    使用Kettle的[文本文件输入]读取txt文件时,其中的两个中文字段无法正确识别,其预览效果如下: 出现中文乱码自然想到是文件编码的问题,该txt文件的编码方式为:UTF-8 将该文件的编码方式改为 ...

  9. python读txt文件 数组-python将txt等文件中的数据读为numpy数组的方法

    实际中,很多数据都是存为txt文件.csv文件等,但是在程序中处理的时候numpy数组或列表是最方便的.本文简单介绍读入txt文件以及将之转化为numpy数组或列表的方法. 1 将txt文件读为lis ...

  10. matlab怎么读txt文件字符串,Matlab中读取txt文件的几种方法

    一.纯数据文件(没有字母和中文,纯数字) a=importdata('*.txt');%%%*为所存的文件名 a1=a.data;%%%文件中的数字 a2=a.textdata;%%%文件中的非数字 ...

最新文章

  1. 数据结构|-常见数据结构整理
  2. html中绝对定位的父级,父元素相对定位,子元素绝对定位
  3. 华为2018届校招技术岗笔试题及个人解答
  4. 都21世纪20年代了,还有人问我学网络安全干嘛,你自己看吧
  5. matplotlib.pyplot绘制函数图像希腊字母latex效果设置
  6. 求出100~200之间的素数
  7. TransmittableThreadLocal 解决 线程池线程复用 无法复制 InheritableThreadLocal 的问题
  8. SAP Cloud Connector里点击Check按钮的可达性roundtrip实现
  9. netflix_Netflix Archaius用于物业管理–基础知识
  10. PaperNotes(15)-图神经网络、PyG极简版入门笔记
  11. uboot之源码目录分析
  12. solution for python can not import local module
  13. RHEL 8 - 配置基于安装 ISO 文件的 YUM Repo
  14. makefile--嵌套执行(四)
  15. GitHub不让盗版Windows用户登录?
  16. 截止到2011年,在五大学科国际奥赛获得金牌最多的中学们
  17. [微服务]API 路由管理--Gateway网关
  18. python 图灵完备_图灵完备到底是个什么鬼?
  19. 《机器学习的数学》出版了,彻底解决程序员学机器学习的数学问题
  20. ISTQB基础级备考攻略

热门文章

  1. matlab中的hold on/off、grid on/off 命令使用方法
  2. 【Linux应用层】防火墙iptables命令
  3. torch.optim.Adam优化
  4. c语言如何文件指针指向开头,fseek设置好文件指针 在C语言中fseek()的功能
  5. C语言文件指针偏移的使用(点阵字库txt文件取字)
  6. C#多线程和线程池 【转】
  7. delphi第三方组件总述
  8. Android studio开发一:三个页面简单实现QQ登录界面的延时跳转
  9. 算法帝国:华尔街交易怪兽的核武器缔造史
  10. 土方回填施工方案范本_土方回填施工方案范本