hive分区对应hadoop_hive分区表信息如何导入mysql 表?
在日志分析大作业中, 有要求把hive数据导入mysql的,
hive数据文件如下:
[root@cdh-1 sqoop]# hadoop fs -ls -R /user/hive/warehouse/sogouquery/
Found 1 items
drwxr-xr-x - root supergroup 0 2016-07-17 09:27 /user/hive/warehouse/sogouquery/year=2016
[root@cdh-1 sqoop]# hadoop fs -ls -R /user/hive/warehouse/sogouquery/
drwxr-xr-x - root supergroup 0 2016-07-17 09:27 /user/hive/warehouse/sogouquery/year=2016
drwxr-xr-x - root supergroup 0 2016-07-17 09:28 /user/hive/warehouse/sogouquery/year=2016/month=7
drwxr-xr-x - root supergroup 0 2016-07-17 09:27 /user/hive/warehouse/sogouquery/year=2016/month=7/day=1
-rwxr-xr-x 1 root supergroup 93273 2016-07-17 09:20 /user/hive/warehouse/sogouquery/year=2016/month=7/day=1/kafkadate0.1468772436053.Done
drwxr-xr-x - root supergroup 0 2016-07-17 09:28 /user/hive/warehouse/sogouquery/year=2016/month=7/day=2
-rwxr-xr-x 1 root supergroup 93273 2016-07-17 09:20 /user/hive/warehouse/sogouquery/year=2016/month=7/day=2/kafkadate1.1468772440741.Done
drwxr-xr-x - root supergroup 0 2016-07-17 09:28 /user/hive/warehouse/sogouquery/year=2016/month=7/day=3
-rwxr-xr-x 1 root supergroup 93273 2016-07-17 09:20 /user/hive/warehouse/sogouquery/year=2016/month=7/day=3/kafkadate0.1468772445986.Done
Done文件信息如下:
00:00:56 7098052750676105 [9aiyy] 5 2 www.9aiyy.com/html/pic/yz/25460/
00:00:56 2512392400865138 [拳皇2003人物出招表] 1 23 zhidao.baidu.com/question/42150698.html?fr=qrl3
00:00:56 4691862369525524 [朝鲜能不能打败韩国] 2 1 club.cqvip.com/topic.asp?k=13,10,0,194069
00:00:56 07276358834409019 [夜晚文化晚会主持稿] 30 37 www.99admin.com/article/2006-12-04/24727.html
......
现在有一个疑问, 就是在mysql创建对应表时, mysql表字段中要不要包含hive分区表year, month,day字段, 即用
CREATE TABLE `sogouquery`
(`time` varchar(10),
`userid` varchar(30),
`query` varchar(2000),
`pagerank` int,
`clickrank` int,
`site` varchar(2000),
`year` int,
`month` int,
`day` int
)
还是
CREATE TABLE `sogouquery`
(`time` varchar(8),
`userid` varchar(30),
`query` varchar(2000),
`pagerank` int,
`clickrank` int,
`site` varchar(2000)
),
用sqoop命令 bin/sqoop export --connect "jdbc:mysql://cdh-2:3306/test" --username root --password 123456 --table sogouquery -m 1 --export-dir '/user/hive/warehouse/sogouquery/year=2016/month=7/day=3/kafkadate1.1468746179357.Done' --input-fields-terminated-by '\t' 测试过
如果mysql表不包含year,month,day三个字段可以把从数据hive导入mysql,但是这样就无法实现按年月日查询,因为根本就没这三个日期字段.
如果包含year,month,day三个字段从hive导入mysql时报" Can't export data, please check failed map task logs", 不知道大家是怎样解决的?
hive分区对应hadoop_hive分区表信息如何导入mysql 表?相关推荐
- 硬盘重新分区后有一个分区表信息丢失的数据恢复
硬盘重新分区后有一个分区表信息丢失的数据恢复 华山剑客 特别说明: 1.因为这个案例的数据恢复的全过程是通过QQ的远程协助完成的,对方(以下称"网友")对某些软件的操作不是很熟练( ...
- csv导入mysql linux_如何将CSV文件导入MySQL表
如何将CSV文件导入MySQL表 我有一个未规范化的事件-来自客户端的日记CSV,我试图将它加载到MySQL表中,以便将其重构为正常的格式.我创建了一个名为"CSVImport"的 ...
- mysql数据库-1.文件导入mysql表secure_file_priv报错问题解决 mysql select outfile不能导出亲测
1.问题 Mac系统,将文件导入mysql表中,报错secure_file_priv选项未设置. 执行导入文件到表mobile_attribute_jxl命令时: load data infile ' ...
- oracle分区表分区导出,Oracle分区表数据的导入与导出
Oracle分区表的使用在一定程度上提高了对表数据的存储及处理性能,在查询性能和数据存储安全上体现了其特有的优势,因此很好的利用分区表,在一定程度上有利于数据库性能的优化.而Oracle分区表数据的导 ...
- mysql可视化导入csv文件_我们如何将数据从.CSV文件导入MySQL表?
实际上,CSV也是一个文本文件,其中的值由逗号分隔,换句话说,我们可以说该文本文件带有CSV(逗号分隔的值).在将数据从.CSV文件导入到MySQL表时,我们需要将FIELDS SEPARATED O ...
- hive分区对应hadoop_hive修改分区类型
但修改分区字段类型时会报错如下: CREATE EXTERNAL TABLE tmp.tmp_table_name(col_name string) PARTITIONED BY (dt string ...
- hive ,从hdfs把数据文件load导入到表
hive> load data inpath 'hdfs://ns1/abc/sales_info/hello/sales_info.txt' overwrite into table sale ...
- linux下导入mysql表乱码_在linux下导入.sql文件,数据库中文乱码
现象描述 我是在aix下面导入如下SQL语句时,数据库中显示乱码. insert into CONFERENCE(CONFERENCEID,SUBCONFERENCEID,ACCESSNUMBER,A ...
- php将excel数据导入mysql表中_【PHP】将EXCEL表中的数据轻松导入Mysql数据表
在网络上有不较多的方法,在此介绍我已经验证的方法. 方法一.利用EXCEL表本身的功能生成SQL代码 ①.先在"phpmyadmin"中建立数据库与表(数据库:excel,数据表: ...
最新文章
- SpringBoot-web开发(四): SpringMVC的拓展、接管(源码分析)
- 如何自动化安装字体(命令行批量)
- 设置css3动画的顺序,CSS3 “瓷砖”顺序飘落的动画
- linux centos/redhat mysql8.0安装(汇总贴)
- 一个IT时代的终结:109岁的IBM将分拆为两家公司
- linux c 守护线程,关于守护线程
- Python中修饰器的定义与使用
- vim配置c语言开发环境变量,gcc配置和vim编程
- PicoDet的学习笔记
- 【图论】最小生成树学习笔记
- 通信原理实践(四)——模拟通信系统性能分析
- html5 localStorage
- CCF推荐期刊/会议历年发表论文数据库:CCF Rec-Paper DB
- cmd下载ftp文件
- matlab 进行时域分析实验报告,控制系统时域分析实验报告.doc
- TDA4VM PDK应用笔记
- Unity Cinemachine之第三人称摄像机CinemachineFreeLook属性详解
- Cisco配置发送日志到日志服务器
- 参考文献名称怎么复制_[Zotero+Word]Zotero+Word2016参考文献中英文混排,解决et al和等的问题...
- 知道创宇区块链安全实验室|UmbNetwork 攻击事件分析