kettle(4.1 TSV文件的抽取)
一、创建转换
二、配置控件
1、文本文件输入
先点击“浏览”,选择要抽取的TSV文件
再点击“增加”
单击“内容”选项卡,清除分隔符处默认分隔符“;” 并单击“Insert TAB”按钮,在分隔符处插入一个制表符;取消勾选“头部”复选框。
单击“预览记录”按钮,查看文件tsv_extract.tsv的数据是否成功抽取到文本文件输入流中。
2、表输出
单击“新建”按钮,配置数据库连接,配置完成后单击“确认”按钮。
单击目标表右侧的“浏览”按钮,获取目标表,即tsv 单击“数据库字段”选项卡,再单击“输入字段映射”按钮,弹出“映射匹配”对话框,将“源字段”选项框的字段和“目标字段”选项框对应的字段进行映射匹配。
三、执行结果
kettle(4.1 TSV文件的抽取)相关推荐
- kettle案例4.1.1--抽取文本数据---TSV文件的抽取
kettle案例4.1–抽取文本数据-TSV文件的抽取 在数据清洗中,数据抽取主要是从一个或多个数据源中获取所需的数据.数据抽取的数据源可以是文本数据.Web数据以及数据库数据. 4.1 抽取文本数据 ...
- 抽取文本数据(TSV文件的抽取)
将一个TSV文件运用Kettle工具进行抽取并保存至数据库中的数据表TSV中.实现将一个保存在本地的TSV文件进行抽取 1.数据准备与查看数据 2.在Kettle新建转换,添加"文本输入&q ...
- 第四章 Tsv文件的抽取
目录 一.Tsv介绍 二.案例介绍 三.案例实现 1.建立转换 2.配置控件 四.运行结果 一.Tsv介绍 TSV是Tab-separated values的缩写,即制表符分隔值.使用制表符分隔数据字 ...
- 4.1TSV文件的抽取
通过Kettle工具抽取TSV文件tsv_extract.tsv中的数据保存至数据库extract中的数据表tsv中. 1.数据准备 现有一个名为tsv_extract.tsv的TSV文件,该文件的内 ...
- 数据清洗基础—Kettle 数据转换与清洗、数据抽取操作
实验一:数据清洗基础-Kettle 数据转换与清洗.数据抽取操作 1 实验题目:Kettle 数据转换与清洗.数据抽取操作 2实验目和要求 2.1熟悉 Kettle 的开发环境,并掌握 Kettle ...
- Kettle使用_25 改变文件编码压缩与邮件
Kettle使用_25 改变文件编码压缩与邮件 需求:通过Kettle实现文本文件编码的改写(GBK到UTF-8),复制后压缩并记录执行日志,最后将该压缩文件以附件形式发送出去. 解决方法:通过获取文 ...
- Kettle使用_12 CSV文件仅并发运行与复制数量
Kettle使用_12 CSV文件仅并发运行与复制数量 需求: 通过并行方式完成customers-100.txt(该文件有2.4万条记录)的文本输出. 解决方法:结合CSV文本输入和文件文本输出组件 ...
- Kettle使用_11 CSV文件输入输出复制数量
Kettle使用_11 CSV文件输入输出复制数量 需求: 通过并行方式完成customers-100.txt(该文件有2.4万条记录)的文本输出. 解决方法:结合CSV文本输入和文件文本输出组件解决 ...
- 提取tsv数据并转化成json——致找不出怎么提取tsv文件中数据的五小时
这里使用的python3.6,pycharm2017profession(不知道其他版本是否适合) 接下来进入正题: 导入tsv.re.json库 首先,由于python3.6没有tsv库,所以使用命 ...
最新文章
- 运行程序报“应用程序配置不正确”或者缺少运行库造成程序不可移植的问题...
- abp angular 和mvc_使用.net core ABP和Angular模板构建博客管理系统(实现自己的业务逻辑)...
- arraylist转int数组_五千字的数组拓展,面试官对我竖起大拇指喊停
- 【APICloud系列|21】使用APICloud敏捷式开发总结,回顾开发一个完整APP过程。
- JAVA爬取亚马逊的商品信息
- 安装配置rsync服务端
- gradle下载慢的解决方案
- NLP自然语言处理 之 jieba中文处理
- 为 SmartDNS 配置广告过滤
- Win10企业版激活方法
- ImageNet Classification with Deep Convolutional Neural Networks(AlexNet论文翻译(附原文))
- 那些关于程序员的段子
- 文件重命名的快捷键是什么F2
- bzoj 3620: 似乎在梦中见过的样子 kmp算法+暴力
- 有源晶振和无源晶振的比较
- 60个英文阅读网站推荐
- 曼珠沙华——三途河畔的接引之花(一)
- Excel - 单元格的引用 (如:A1、$A$1)
- poj1061 青蛙的约会(扩展欧几里德)
- python+pyhyper实现识别图片中的车牌号