一、创建转换

二、配置控件

1、文本文件输入

先点击“浏览”,选择要抽取的TSV文件

再点击“增加”

单击“内容”选项卡,清除分隔符处默认分隔符“;”     并单击“Insert TAB”按钮,在分隔符处插入一个制表符;取消勾选“头部”复选框。

单击“预览记录”按钮,查看文件tsv_extract.tsv的数据是否成功抽取到文本文件输入流中。

 2、表输出

单击“新建”按钮,配置数据库连接,配置完成后单击“确认”按钮。

单击目标表右侧的“浏览”按钮,获取目标表,即tsv 单击“数据库字段”选项卡,再单击“输入字段映射”按钮,弹出“映射匹配”对话框,将“源字段”选项框的字段和“目标字段”选项框对应的字段进行映射匹配。

三、执行结果

kettle(4.1 TSV文件的抽取)相关推荐

  1. kettle案例4.1.1--抽取文本数据---TSV文件的抽取

    kettle案例4.1–抽取文本数据-TSV文件的抽取 在数据清洗中,数据抽取主要是从一个或多个数据源中获取所需的数据.数据抽取的数据源可以是文本数据.Web数据以及数据库数据. 4.1 抽取文本数据 ...

  2. 抽取文本数据(TSV文件的抽取)

    将一个TSV文件运用Kettle工具进行抽取并保存至数据库中的数据表TSV中.实现将一个保存在本地的TSV文件进行抽取 1.数据准备与查看数据 2.在Kettle新建转换,添加"文本输入&q ...

  3. 第四章 Tsv文件的抽取

    目录 一.Tsv介绍 二.案例介绍 三.案例实现 1.建立转换 2.配置控件 四.运行结果 一.Tsv介绍 TSV是Tab-separated values的缩写,即制表符分隔值.使用制表符分隔数据字 ...

  4. 4.1TSV文件的抽取

    通过Kettle工具抽取TSV文件tsv_extract.tsv中的数据保存至数据库extract中的数据表tsv中. 1.数据准备 现有一个名为tsv_extract.tsv的TSV文件,该文件的内 ...

  5. 数据清洗基础—Kettle 数据转换与清洗、数据抽取操作

    实验一:数据清洗基础-Kettle 数据转换与清洗.数据抽取操作 1 实验题目:Kettle 数据转换与清洗.数据抽取操作 2实验目和要求 2.1熟悉 Kettle 的开发环境,并掌握 Kettle ...

  6. Kettle使用_25 改变文件编码压缩与邮件

    Kettle使用_25 改变文件编码压缩与邮件 需求:通过Kettle实现文本文件编码的改写(GBK到UTF-8),复制后压缩并记录执行日志,最后将该压缩文件以附件形式发送出去. 解决方法:通过获取文 ...

  7. Kettle使用_12 CSV文件仅并发运行与复制数量

    Kettle使用_12 CSV文件仅并发运行与复制数量 需求: 通过并行方式完成customers-100.txt(该文件有2.4万条记录)的文本输出. 解决方法:结合CSV文本输入和文件文本输出组件 ...

  8. Kettle使用_11 CSV文件输入输出复制数量

    Kettle使用_11 CSV文件输入输出复制数量 需求: 通过并行方式完成customers-100.txt(该文件有2.4万条记录)的文本输出. 解决方法:结合CSV文本输入和文件文本输出组件解决 ...

  9. 提取tsv数据并转化成json——致找不出怎么提取tsv文件中数据的五小时

    这里使用的python3.6,pycharm2017profession(不知道其他版本是否适合) 接下来进入正题: 导入tsv.re.json库 首先,由于python3.6没有tsv库,所以使用命 ...

最新文章

  1. 运行程序报“应用程序配置不正确”或者缺少运行库造成程序不可移植的问题...
  2. abp angular 和mvc_使用.net core ABP和Angular模板构建博客管理系统(实现自己的业务逻辑)...
  3. arraylist转int数组_五千字的数组拓展,面试官对我竖起大拇指喊停
  4. 【APICloud系列|21】使用APICloud敏捷式开发总结,回顾开发一个完整APP过程。
  5. JAVA爬取亚马逊的商品信息
  6. 安装配置rsync服务端
  7. gradle下载慢的解决方案
  8. NLP自然语言处理 之 jieba中文处理
  9. 为 SmartDNS 配置广告过滤
  10. Win10企业版激活方法
  11. ImageNet Classification with Deep Convolutional Neural Networks(AlexNet论文翻译(附原文))
  12. 那些关于程序员的段子
  13. 文件重命名的快捷键是什么F2
  14. bzoj 3620: 似乎在梦中见过的样子 kmp算法+暴力
  15. 有源晶振和无源晶振的比较
  16. 60个英文阅读网站推荐
  17. 曼珠沙华——三途河畔的接引之花(一)
  18. Excel - 单元格的引用 (如:A1、$A$1)
  19. poj1061 青蛙的约会(扩展欧几里德)
  20. python+pyhyper实现识别图片中的车牌号

热门文章

  1. spooling 技术工作原理
  2. Prometheus实战--Uber背书的存储解决方案M3
  3. 用 Appium 自动收取蚂蚁森林能量
  4. Ceph RBD 入门系列(一) : 块设备的基本使用及librbd在各个应用场景的位置
  5. 激活windiws10家庭版
  6. HiC|高通量染色体构象捕获技术
  7. 【经验】怎么把Word文字下面的红线去掉?
  8. 学术届职称与凡人修仙传等级对应关系
  9. UI设计年薪20W?为什么UI设计能这么火呢?
  10. 按钮自动发光用html怎么弄,HTML+CSS+JS发光开关按钮