在生产上,一般对数据清洗之后直接放到HDFS上,再将目录加载到分区表中,之后通过hive去查询分析数据;

1、准备数据

order_created.txt

用 tab分割

10703007267488 2014-05-01 06:01:12.334+01

10101043505096 2014-05-01 07:28:12.342+01

10103043509747 2014-05-01 07:50:12.33+01

10103043501575 2014-05-01 09:27:12.33+01

10104043514061 2014-05-01 09:03:12.324+01

order_created.txt 存放位置

[root@zjj101 soft]# pwd
/root/soft[root@zjj101 soft]# ls
data docker hadoop-2.7.2 hive-1.2.1 myconf order_created.txt tmp

2、在hdfs上创建准备放数据的目录

准备放到这里:

/user/hive/warehouse/order_partition/

[root@zjj101 soft]# hadoop fs -mkdir /user/hive/warehouse/order_partition/event_time=2014-05-02

3、查看数据是否上传成功

4、关联元数据再查询

-- 刚刚给数据放到hdfs上面了,但是元数据没有,所有需要修复一下再执行查询语句,否则的话是查询不到的
msck repair table order_partition;--  执行查询语句
select *
from order_partition
where event_time = '2014-05-02';

总结:

1、准备数据

将txt文件上传到hdfs中(可借助工具Xftp、Xshell),或者通过sqoop将mysql数据导入到hdfs

2、使用hive读取hdfs上的数据,将SQL语句转变成MapReduce任务来执行,进行数据分析。

大数据之 将txt文件上传到HDFS并用Hive查询相关推荐

  1. 通过Java程序将“/你的名字拼音缩写/input1/shixun1.txt”文件上传到HDFS的“/你的名字拼音缩写/java/input1/”目录下;通过Java程序将HDFS上的“/你的名字拼音

    题目: 通过Java程序将"/你的名字拼音缩写/input1/shixun1.txt"文件上传到HDFS的"/你的名字拼音缩写/java/input1/"目录下 ...

  2. java android上传文件_Java-Android-如何将txt文件上传到网站?

    我想将txt文件上传到网站,我承认我没有对其进行任何详细的研究,但是我看了一些示例,并希望就我是否朝着正确的方向提出更多的经验性意见. . 这是我到目前为止的内容: DefaultHttpClient ...

  3. php 上传多个txt文件上传,一个多文件上传的例子(原创)

    一个多文件上传的例子(原创) 更新时间:2006年10月09日 00:00:00   作者: //filename:multi_upload.php if($ifupload) { $path=Add ...

  4. html5 txt文件上传,JavaScript html5利用FileReader实现上传功能

    本文实例为大家分享了H5利用FileReader上传文件的具体代码,供大家参考,具体内容如下 1. Html部分 文件上传演练 Browse... 2. JS部分 var result = docum ...

  5. 文件传服务器上全是乱码,解决txt文件上传oss服务器乱码的问题

    今天上传txt文件下载下来却乱码,搞了一下午,发现还挺复杂.记录一下. 1.首先服务器只接受utf-8格式的文件,所以首先想到的就是转码问题. 这是网上很容易就找到的判断文件编码的代码.判断出来之后如 ...

  6. FTP压缩文件上传到HDFS大小不一致的问题说明(FTP传输模式)

    1.问题:将ftp文件服务器上的压缩文件通过内存流直接写入HDFS内,却发现文件不一致,MD5SUM校验也不一致. 2.分析: FTP的传输有两种方式:ASCII传输模式和二进制数据传输模式. 1)A ...

  7. 大数据之-Hadoop之HDFS的API操作_文件上传---大数据之hadoop工作笔记0056

    然后我们HDFS的java的api操作. 比如我们有个需求从mysql中把数据上传到完全分布式的集群中的,hdfs中 比如这里首先我们演示,把e盘下的banzhang.txt文件上传到完全分布式集群h ...

  8. spring boot 整合web开发之文件上传、静态资源访问、异常处理、返回JSON数据

    目录 springboot 整合web开发 返回json数据 静态资源访问 文件上传 全局异常 1.返回json数据 springboot默认的是jackson-databind做为json处理器.也 ...

  9. 前端大文件上传和下载(分片上传)

    前端大文件上传和下载(分片上传) 一.问题 日常业务中难免出现前端需要向后端传输大型文件的情况,这时单次的请求不能满足传输大文件的需求,就需要用到分片上传 业务需求为:用户可以上传小于20G的镜像文件 ...

最新文章

  1. Python会消亡吗?
  2. 统计应用计算机基础,计算机基础应用试题及答案参考
  3. spring中的Aware
  4. Traceroute笔记
  5. boost::mpl模块实现erase相关的测试程序
  6. 儿童节礼包!10 后都开始学编程了,你需要这个阿里技术电子书大全
  7. 【深度学习】——纠错error: Unable to find vcvarsall.bat:关于安装pycocotools
  8. Java 8 map(),flatMap()示例
  9. centos7下编译openjdk11
  10. ubuntu for win10 里运行apache+php
  11. WAS6.1在JDK1.5环境下JSP无法编译问题
  12. .net的commandname领悟
  13. cass道路设计教程_cass道路曲线设计
  14. android icloud照片恢复软件,iCloud照片怎么恢复到手机 iCloud照片恢复到手机方法【详细步骤】...
  15. 基于LMS自适应滤波器的QPSK信号均衡器matlab仿真
  16. 《程序员》2011年12期精彩内容:企业开发的困境与变局
  17. Android 9.0 Wifi连接AP过程
  18. python3爬虫记(一)------------------利用 requests 和 lxml 爬取小说
  19. matlab编程画分段函数,matlab画分段函数 求程序
  20. 蒟蒻君的刷题日记Day12(线段树专题T4):P8082 [COCI2011-2012#4] KEKS 线段树版题解

热门文章

  1. 九齐ny3p系列语音芯片替代国产方案KT148A性价比更高420秒长度
  2. dotnet core 2.1 使用阶梯编译
  3. 下载vue模板框架并使用
  4. excel怎么设置自动计算_电气自动计算表,excel函数输入数据秒出精准结果,超好用...
  5. hive内置函数大全
  6. 智慧军营日常办公管理系统软件
  7. OpenCV中的图像变换——傅里叶变换
  8. NX/UG二次开发—CAM—用户自定义刀轨(UDOP)+ 螺旋铣用例教程 + 源码
  9. 【打印机设置】实验室打印机 DocuCentre 2020 彩色打印设置
  10. 解决AD22拼版导出Gerber时DFM无法正确识别板框