1。在前面的博客中使用程序导入数据,但是当数据量太大了,会非常的慢,因为他是一行一行读取的,然后put上去的,我尝试put2亿条数据结果用了一天

2。现在要用改进板的,使用hbase自带的工具ImportTsv
ImportTsv是Hbase提供的一个命令行工具,可以将存储在HDFS上的自定义分隔符(默认\t)的数据文件,通过一条命令方便的导入到HBase表中,对于大数据量导入非常实用,其中包含两种方式将数据导入到HBase表中:
第一种是使用TableOutputformat在reduce中插入数据;
第二种是先生成HFile格式的文件,再执行一个叫做CompleteBulkLoad的命令,将文件move到HBase表空间目录下,同时提供给client查询。

3。下面开始使用一下试试
使用程序

package sparksql.test.files;import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;

【Hbase】HBase数据快速导入之ImportTsv相关推荐

  1. 千万条数据快速导入MySQL

    千万级数据快速导入MySQL 每次导入1条 每次导入10000条 每次导入100000条 项目需要将约千万量级的信息导入表中.MySQL语句是通过Python动态生成的. 每次导入1条 每导入1条数据 ...

  2. [DJANGO] excel十几万行数据快速导入数据库研究

    先贴原来的导入数据代码: 8 import os os.environ.setdefault("DJANGO_SETTINGS_MODULE", "www.setting ...

  3. 几万条数据的excel导入到mysql_excel十几万行数据快速导入数据库研究(转,下面那个方法看看还是可以的)...

    先贴原来的导入数据代码: 8 import os os.environ.setdefault("DJANGO_SETTINGS_MODULE", "www.setting ...

  4. HBase数据快速导入之ImportTsvBulkload

    2019独角兽企业重金招聘Python工程师标准>>> 导入数据最快的方式,可以略过WAL直接生产底层HFile文件 (环境:centos6.5.Hadoop2.6.0.HBase0 ...

  5. linux中将hdfs数据导入hbase,将数据文件导入到HBase中

    假设有一个TSV格式的数据文件test.dat(TSV是指数据文件中的每个字段是以制表符隔开的) 首先,将test.dat上传到hdfs上,具体的命令如下: hadoop fs -copyFromLo ...

  6. wu-easy-excel-starter 数据快速导入导出

    wu-easy-excel-starter wu-easy-excel-starte是一个简单的Excel数据封装框架,具有以下优势 使用简单,只需一个注解即可搞定 支持数据自动分割成多个sheet ...

  7. 如何把excel的数据快速导入到数据库

    1.安装Navicat 2.创建数据库和表结构(创建表,和表里需要的字段) 3.创建和数据库对应的Excel表(注意:数据库的名字和字段名必须和Excel的名字和字段名对应) 4.回到Navicat, ...

  8. 单列文本数据快速导入表格

    文本数据导入Excel似乎是个老生常谈,方法也有很多,例如 使用文本编辑器打开文本文件,拷贝粘贴到Excel然后分类 Power Query中的[从文本/CSV]如下图所示. 但是这个需求略有不同,文 ...

  9. Excel数据快速导入mysql的几个办法

    有时候需要批量插入一批数据到数据库,有很多种办法,这里我用到过三种办法: 1.通过Excel直接生成insert语句 =CONCATENATE("insert into aisee_ping ...

最新文章

  1. Nauuo and Chess
  2. 在C#中如何定义一个变长的结构数组?如果定义好了,如何获得当前数组的长度?...
  3. 5种IO模式形象的比喻
  4. php 获取文件扩展名的方法,PHP获取文件扩展名的4种方法,_PHP教程
  5. jQuery点击图片弹出大图遮罩层
  6. 剑指offer刷题感想
  7. 浅析.Net 在 winform及wpf中涉及界面交互的多线程类的封装
  8. 2018北京ICPC B. Heshen's Account Book(模拟)
  9. eclipse打包成jar_SpringBoot系列(三)- 用 jar的方式运行springboot项目
  10. oracle中日期转换格式,oracle日期格式转换 to_date()
  11. Matlab中Simulink小白入门初学教程
  12. CSDN-怎么设置被粉丝关注之后的自动回复
  13. bzoj 2959: 长跑
  14. UVM-phase机制
  15. 十二星座 谁是 “小笨猪” ?
  16. python万年历节气_用Python精确计算100年内二十四节气日期
  17. 七夕快到了,用python给女朋友画张素描吧
  18. matlab光学几何光学模拟,matlab在几何光学仿真 实验中的应用.doc
  19. Idea没有自动更新target目录
  20. Python爬虫神器pyppeteer,对 js 加密降维打击

热门文章

  1. 4188元起!华为P40系列国行版发布:买它?
  2. 英特尔:把基带卖给苹果 完全是高通逼的
  3. 一亿像素!小米CC9 Pro明日正式首卖:2799元起
  4. 它来了,带着曝光图又来了!疑似小米MIX4谍照流出
  5. 阿里飞天大数据平台正式亮相:国内最大计算平台
  6. 小鹏吃相难看,消费者难做“鹏”友
  7. 程序员的10个谎言,你听过几个?
  8. 2020解决连不上GitHub github.com port 443: Timed out
  9. c++ 使用正则匹配url
  10. 我的内核学习笔记14:内核设备树学习