kettle读txt文件并处理
kettle版本7.1,java版本必须是1.8
实例1:text文件只有一列
1.同时读取多个文件
使用Text file input工具
若是读取单个文档,直接输入:路径加文件名即可
若是读取多个文件,输入文件所在目录,然后在第二个框输入你文件名对应的正则表达式,之后再点击add,验证是否添加成功,去下方点击show filenames看看有没有你要添加的文件。
读取所有文件可以用“.*.*” 也可以用“.*\.*”。PS:你直接输入“*”是不行的,读取特定条件的文件可用“zhang.*\.txt”,此句就是把以zhang开头,后缀是txt文件输入
2.row flatter功能
作用:通过增加列减少记录条数
读取文件内容如图:
你在Text file input 中的filed字段下输入text,String
他就会把每一行自动读取并把空白行消除。你再使用row flatter
他就会把text的所有按照你target field的字段重新分配到各个字段下。
3.Regex Evaluation使用
把一个字段里面的信息分解
指明需要分解的字段。
图中的Regular expression意思是:冒号前面是“Published”或者是“Expected”,冒号是另外一个String就行
输出如图,只要满足Regular expression,result返回Y,否则返回N
4.Replace in string
将文档中的一个字符串替换
这个意思就是从price字段里面搜索,把Our price全部替换为空。
5.select value
作用之一:替换元数据的类型和格式
由于你从TXT文档读的数据全是String所以使用这个把其类型改为Number,并改其格式
上面五个操作执行完后输出如图:
实例2:txt文件有多列数据,并且有的列占了很多的位置
数据如图:
kettle读txt文件并处理相关推荐
- pythontxt文件怎么读_python怎么读txt文件
python怎么读txt文件? 首先,在桌面上建立一个txt文档,在上面输入以下内容:你好. Hello. abcdefg 啊不错的风格 查看文件的属性,获取文件的绝对路径:D:\HintSoft\H ...
- matlab读int16读文件_Matlab文件操作及读txt文件(fopen,fseek,fread,fclose)
Matlab 文件操作及读 txt 文件 (fopen,fseek,fread,fclose) matlab 文件操作 文件操作是一种重要的输入输出方式,即从数据文件读取数据或将 结果写入数据文件. ...
- C++读txt文件,存入vector容器中
经常需要用到读txt文件里的数据,总结一个模板希望以后可以直接套用. //C++ 读txt文件 #include <iostream> #include <sstream> # ...
- 逐行读txt文件(读写文件try catch finally 处理空行,编码格式,文件流释放问题,处理读到重复问题)
实现功能如下: Java逐行读取.txt文件里面的数据到一个list集合里面,再加工. 处理编码格式问题, 处理读到空行的问题, 处理读到数据重复问题, 处理文件流释放不合理问题. /*** 测试逐行 ...
- python读取txt文件如何按数字分隔_python 读txt文件,按‘,’分割每行数据操作
按行读取TXT文件 fname = './新建文件夹/yob2010.txt' //文件夹路径 with open(fname,'r+',encoding='utf-8') as f: for lin ...
- python读取txt每行中分隔符内容_python 读txt文件,按‘,’分割每行数据操作
python 读txt文件,按','分割每行数据操作,文件,字符串,目录,路径,列表 python 读txt文件,按','分割每行数据操作 易采站长站,站长之家为您整理了python 读txt文件,按 ...
- fclose用法matlab,matlab文件操作及读txt文件(fopen,fseek,fread,fclose
matlab文件操作及读txt文件(fopen,fseek,fread,fclose) matlab文件操作 文件操作是一种重要的输入输出方式,即从数据文件读取数据或将结果写入数据文件.MATLAB提 ...
- 如何解决Kettle读取txt文件时出现的中文乱码问题?
使用Kettle的[文本文件输入]读取txt文件时,其中的两个中文字段无法正确识别,其预览效果如下: 出现中文乱码自然想到是文件编码的问题,该txt文件的编码方式为:UTF-8 将该文件的编码方式改为 ...
- python读txt文件 数组-python将txt等文件中的数据读为numpy数组的方法
实际中,很多数据都是存为txt文件.csv文件等,但是在程序中处理的时候numpy数组或列表是最方便的.本文简单介绍读入txt文件以及将之转化为numpy数组或列表的方法. 1 将txt文件读为lis ...
- matlab怎么读txt文件字符串,Matlab中读取txt文件的几种方法
一.纯数据文件(没有字母和中文,纯数字) a=importdata('*.txt');%%%*为所存的文件名 a1=a.data;%%%文件中的数字 a2=a.textdata;%%%文件中的非数字 ...
最新文章
- 数据结构|-常见数据结构整理
- html中绝对定位的父级,父元素相对定位,子元素绝对定位
- 华为2018届校招技术岗笔试题及个人解答
- 都21世纪20年代了,还有人问我学网络安全干嘛,你自己看吧
- matplotlib.pyplot绘制函数图像希腊字母latex效果设置
- 求出100~200之间的素数
- TransmittableThreadLocal 解决 线程池线程复用 无法复制 InheritableThreadLocal 的问题
- SAP Cloud Connector里点击Check按钮的可达性roundtrip实现
- netflix_Netflix Archaius用于物业管理–基础知识
- PaperNotes(15)-图神经网络、PyG极简版入门笔记
- uboot之源码目录分析
- solution for python can not import local module
- RHEL 8 - 配置基于安装 ISO 文件的 YUM Repo
- makefile--嵌套执行(四)
- GitHub不让盗版Windows用户登录?
- 截止到2011年,在五大学科国际奥赛获得金牌最多的中学们
- [微服务]API 路由管理--Gateway网关
- python 图灵完备_图灵完备到底是个什么鬼?
- 《机器学习的数学》出版了,彻底解决程序员学机器学习的数学问题
- ISTQB基础级备考攻略
热门文章
- matlab中的hold on/off、grid on/off 命令使用方法
- 【Linux应用层】防火墙iptables命令
- torch.optim.Adam优化
- c语言如何文件指针指向开头,fseek设置好文件指针 在C语言中fseek()的功能
- C语言文件指针偏移的使用(点阵字库txt文件取字)
- C#多线程和线程池 【转】
- delphi第三方组件总述
- Android studio开发一:三个页面简单实现QQ登录界面的延时跳转
- 算法帝国:华尔街交易怪兽的核武器缔造史
- 土方回填施工方案范本_土方回填施工方案范本