说明

BulkLoad将数据批量导入HBase中。支持通过命令行和API两种操作方式。

命令行包含如下两个步骤:

ImportTsv

CompleteBulkLoad

准备工作

在HDFS创建临时目录

hdfs dfs -mkdir /tmp/bulkload

创建本地文件user

[root@ctrl ~]# cat user

10000001,Sam,18

10000002,Jack,24

10000003,Kitty,25

[root@ctrl ~]#

上传到HDFS上

hdfs dfs -put user /tmp/bulkload/

HBase上创建表

hbase shell

>create 'user','info'

ImportTsv

export HBASE_HOME=/opt/hbase

export HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath`

${HADOOP_HOME}/bin/hadoop jar ${HBASE_HOME}/lib/hbase-server-0.98.11-hadoop2.jar importtsv \

-Dimporttsv.separator=, \

-Dimporttsv.columns=HBASE_ROW_KEY,info:name,info:age \

-Dimporttsv.bulk.output=hdfs://myns1/tmp/bulkload/outputdir \

user hdfs://myns1/tmp/bulkload/user

经验

错误信息

Exception in thread "main" java.lang.reflect.InvocationTargetException

at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)

……

at org.apache.hadoop.util.RunJar.main(RunJar.java:212)

Caused by: java.lang.IllegalArgumentException: Wrong FS: hdfs://tmp/core/partitions_b0daea82-fbea-4bf2-b752-689d9249895c, expected: hdfs://myns1

at org.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java:643)

at org.apache.hadoop.fs.FileSystem.makeQualified(FileSystem.java:463)

……

at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:72)

at org.apache.hadoop.util.ProgramDriver.run(ProgramDriver.java:145)

at org.apache.hadoop.util.ProgramDriver.driver(ProgramDriver.java:153)

... 10 more

原因分析

如果出现这种错误,是因为HDFS中配置的临时目录在本地文件系统上,而此时要求是在HFS上。解决办法是将core-site.xml中的临时文件目录改为HDFS上的目录:

1

2

3

4

5

hadoop.tmp.dir

/tmp/core

Abase for other temporary directories.

本地目录是:file:///abc/def,HDFS目录是: /abc/def,不能配置成hdfs://xxx/abc/def,否则运行MR会出错。

CompleteBulkLoad

方法一

export HBASE_HOME=/opt/hbase

export HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath`

${HADOOP_HOME}/bin/hadoop jar ${HBASE_HOME}/lib/hbase-server-0.98.11-hadoop2.jar completebulkload hdfs://myns1/tmp/bulkload/outputdir user

方法二

bin/hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles hdfs://myns1/tmp/bulkload/outputdir user

检查最终结果

hbase shell

>scan 'user'

参考文档

java hdfs导入hbase_使用BulkLoad批量导入数据到HBase中相关推荐

  1. java 导入excel表格(批量导入),下载excel模板,导出表格

    1.导入excel表格(批量导入) 如图,给id=83和id=84的老师导入工作时间. 导入的excel模板如下 注意导入excel表格时关于日期时间类的的数据要设置对应的格式. 后台接口 /*** ...

  2. python加数据库_用python批量插入数据到数据库中

    既然使用python操作数据库必不可少的得使用pymysql模块 可使用两种方式进行下载安装: 1.使用pip方式下载安装 pip install pymysql 2.IDE方式 安装完成后就可以正常 ...

  3. JAVA编码(27)——执行批量导入Excel文件并进行解析

    1.建立web工程引入jar包:commons-fileupload.jarcommons-lang-1.0.1.jarjspsmartupload.jarpoi-2.5-final-20040302 ...

  4. mysql导入多个txt_MySQL批量导入Excel、txt数据

    我想Excel是当今最大众化的批量数据管理软件了吧,所以我们会经常涉及到将Excel中数据导入到MySQL中的工作.网上有一些关于直接将Excel导入MySQL的教程,不知道是我安装的office不对 ...

  5. SQLlite数据导入到mySQL_如何批量导入数据到Sqlite数据库

    做android和ios开发的一般都用Sqlite数据库,有的时候数据需要批量导入,那么如何导入呢? 在这里,介绍2种方法供大家参考. 一.用sqlite命令 以windows系统为例,linux下命 ...

  6. python批量导入网页信息_python批量导入数据进Elasticsearch的实例

    ES在之前的博客已有介绍,提供很多接口,本文介绍如何使用python批量导入.ES官网上有较多说明文档,仔细研究并结合搜索引擎应该不难使用. 先给代码 #coding=utf-8 from datet ...

  7. c excel批量导入mysql数据库_Excel批量导入数据库

    在上个系统中需要用到Excel整体导入的功能整体的核心思路如下: 1.首先将需要导入的Excel上传至服务器 2.为了避免文件名重复,重命名上传的Excel文件 3.将上传的Excel文件读入Data ...

  8. 文本导入ORACLE快速,Oracle批量导入文本文件快速的方法(sqlldr实现)

    前言 最近做项目的时候需要导入一批3000多万条的POI数据到Oracle数据库,简单的插入导入速度太慢,使用sqlldr 批量导入3000多万条数据花了20分钟左右,速度还可以,现在分享给大家,具体 ...

  9. matlab 将txt导入excel,[转载]MATLAB  批量导入excel和txt文件的方法

    将一个文件目录下所有的文件名字全部倒入到一个文件中,除了使用ls函数以外,还可以使用 file=dir('C:UsersAdministratorDesktopMATLAB数据的导入导出以及试验的数据 ...

最新文章

  1. 微信如何解绑小程序_微信小程序该如何运营推广
  2. 非线性回归模型(part1)--神经网络
  3. HDU2030 汉字统计【文本处理】
  4. Flex里[Exclude]标签的作用:对外忽略/隐藏内部某对象
  5. 对文档的编辑过多_Wizard 开源文档管理系统1.0发布啦
  6. ps抠头发丝教程图解:ps抠图抠头发丝的方法
  7. 机器学习十大算法---3. SVM
  8. 电脑蓝牙模式接收手机文件
  9. 开机时HP Hotkey UWP Service占用内存过高
  10. 使用ISO镜像制作适用于OpenStack的云镜像
  11. 律师向公安部举报称微软黑屏是最大***行为
  12. 和在java和c语言中的那些事
  13. C#语言 Asp.net旅游网站在线旅游信息网站(旅游系统旅游网站)旅游管理系统旅游景区旅游网站
  14. 新版方正教务系统爬虫
  15. 移动端框架 - Bootstrap
  16. sql trace基础
  17. 炒股如何办理开户手续
  18. 达梦数据库安装ODBC驱动及无法正常启动解决办法
  19. 计算机的桌面图标都没有了怎么办,电脑桌面图标都没了怎么办?
  20. java中的native方法性能到底怎么样?

热门文章

  1. 查找nginx安装的路径
  2. 决策树——排序算法的理论下界
  3. dubbo ---- 入门
  4. 用极大化思想解决最大子矩形问题
  5. oracle 数据结构
  6. 介绍struct bus_type非常好的
  7. 大数据_Flink_数据处理_运行时架构5_slot和任务调度---Flink工作笔记0020
  8. 技术研究院003---六种方式,教你在SpringBoot初始化时搞点事情!
  9. C++基础部分_C++文件操作_二进制文件的读操作---C++语言工作笔记079
  10. 大数据之-Hadoop之HDFS_hadoop集群中的安全模式_原理---大数据之hadoop工作笔记0074