keyloadtool_phoenix 利用CsvBulkLoadTool 批量带入数据并自动创建索引
需要先创建表:
CREATE TABLE IF NOT EXISTS population (
state CHAR(2) NOT NULL, city VARCHAR NOT NULL, population BIGINT
CONSTRAINT my_pk PRIMARY KEY (state, city));
在phoenix 目录下执行
hadoop jar /home/phoenix-4.6.0-HBase-1.0-bin/phoenix-4.6.0-HBase-1.0-client.jar org.apache.phoenix.mapreduce.CsvBulkLoadTool -t POPULATION -i /datas/us_population.csv
-t :tableName
-i: input file 文件必须在hdfs文件上。
后查询表数据是空。
问题: ERROR mapreduce.CsvBulkLoadTool: Error Wrong FS: file:/home/hadoop/tmp/partitions_101bd67a-ec2c-4808-bc9f-bf4cd6ea74b9, expected: hdfs://node11:9000 occurred submitting CSVBulkLoad
参数意义:
-a,--array-delimiter Array element delimiter (optional)
-c,--import-columns Comma-separated list of columns to be
imported
-d,--delimiter Input delimiter, defaults to comma
-e,--escape Supply a custom escape character, default is
a backslash
-g,--ignore-errors Ignore input errors
-h,--help Show this help and quit
-i,--input Input CSV path (mandatory)
-it,--index-table Phoenix index table name when just loading
this particualar index table
-o,--output Output path for temporary HFiles (optional)
-q,--quote Supply a custom phrase delimiter, defaults
to double quote character
-s,--schema Phoenix schema name (optional)
-t,--table Phoenix table name (mandatory)
-z,--zookeeper Supply zookeeper connection details
(optional)
原文:http://www.cnblogs.com/zhanggl/p/5191912.html
keyloadtool_phoenix 利用CsvBulkLoadTool 批量带入数据并自动创建索引相关推荐
- SqlServer 利用游标批量更新数据
SqlServer 利用游标批量更新数据 Intro 游标在有时候会很有用,在更新一部分不多的数据时,可以很方便的更新数据,不需要再写一个小工具来做了,直接写 SQL 就可以了 Sample 下面来看 ...
- mysql 存储过程 批量导入数据_sql 利用存储过程批量导入数据
什么是 存储过程(stored procedure)是一组为了完成特定功能的sql语句集,是利用sql server所提供的transact-sql语言所编写的程序.经编译后存储在中.存储过程是数据库 ...
- 使用navicat for mysql 创建外键foreign keys时,总会自动创建索引indexs
使用navicat for mysql 创建外键foreign keys时,总会自动创建索引indexs.如果删除这个索引就会提示错误error 1553:cann't drop index-:nee ...
- Python读取多个excel文件(删除字段、数据格式转换、dataframe多表合并)并写入ElasticSearch实战(自动创建索引、写入ElasticSearch、探索性数据分析)
Python读取多个excel文件(删除字段.数据格式转换.dataframe多表合并)并写入ElasticSearch实战(自动创建索引.写入ElasticSearch.探索性数据分析) 目录
- sublime中利用正则批量修改数据
需求如下: 将这些知识点前面的字母和数字去掉 如果利用php脚本逐条更改,因为数据量太大,可能会造成数据拥堵,或者服务器崩溃. 在此使用sublime编辑器打开该表的sql文件,正则查询到这些前缀,批 ...
- 2批量批量查询数据插入数据_你还在利用复制批量插入数据吗?一个oracle命令助你批量插入数据...
大家好,我是RomMr,一个务实的科技人! 你还在用复制.粘贴的办法批量修改数据库数据吗?今天就和大家分享一个可以直接调用文档的命令来帮助大家批量修改,插入数据. 1.start 和 @ 命令 当我们 ...
- 多表利用DIH批量导入数据并建立索引注意事项
如果希望同时对多个表进行全文检索,那我们该如何处理呢?利用DIH导入数据并建立索引时.schema.xml中配置了uniqueKey为id <uniqueKey>id</unique ...
- 利用存储过程批量生成数据
又是一个快下班的时候,工作紧张有序的进行着.现场反馈了一个问题,数据大于2000条的时候,导出excel报错,导出格式是每20条数据一个sheet的格式.如图: 如何来模拟这么多数据来进行验证呢?公司 ...
- mysql利用存储过程批量插入数据
-- 如果存在此存储过程则删掉 DROP PROCEDURE IF EXISTS proc_initData; -- 定好结束符为"$" DELIMITER $ -- 创建 CRE ...
最新文章
- VS 2010 通过 Architecture创建UML类图设计
- OpenglES2.0 Android:画矩形
- jquery.min.js一引入到工程中显示红叉,或其他.js文件显示红叉
- ActiveMQ死信产生的原因及使用方案
- mac nginx映射ip和端口_步骤四、nginx反向代理
- 基于JAVA+SpringMVC+Mybatis+MYSQL的集市预约管理系统
- 07-02 测试报告-allure
- 如何滚动更新 Service?- 每天5分钟玩转 Docker 容器技术(102)
- mysql云上迁移_MySQL迁移上云最佳实践
- matlab滤除100hz,关于滤波器滤波的问题,要求滤除3000Hz以上,但滤除后只剩下1000Hz以内的...
- 如何安装.nupkg文件?
- windows C++多线程(四):_beginthread的使用
- 破解Photoshop CC
- Vm虚拟机Deepin安装教程---kalrry
- 电脑可以上网但打不开微信公众号
- JAVA编程学习记录(内部类)
- Contrast Preserving Decolorization
- 华清远见重庆中心——HTML和CSS基础阶段技术总汇
- 家用路由器技术深入剖解
- 关于Android开发中如何使用dp表示长宽
热门文章
- python数字字符串乘以2_Python基础(2)_数字和字符串类型
- oracle与db2 市场占有率,oracle 与 DB2 的区别
- BugkuCTF-Reverse题Timer(阿里CTF)
- 软件数控编程_这么多CNC数控编程软件, 你觉得哪个好?
- 华为5g鸿蒙折叠,华为5G折叠概念新机:内折叠+麒麟9000+鸿蒙OS 这才是华为的实力...
- android 部分区域点击,Android编程实现ListView中item部分区域添加点击事件功能
- 初识C++之指针与引用
- python队列精灵对战_python队列Queue
- 机械系统计算机控制试卷及答案,机械系统设计试题及答案
- linux操作系统网络,网络安装linux操作系统