1、配置源和目标的数据连接

源(oracle):

目标(Hive 2.1.1),需要事先将hive的驱动程序导入HHDI的lib目录中。

Hive2.1.1需要的jar包如下:可根据自身情况更换hadoop和hive的jar包。

hadoop-common-2.6.0.jar

hive-common-2.1.0.jar

hive-jdbc-2.1.0.jar

hive-metastore-2.1.0.jar

hive-serde-2.1.0.jar

hive-service-2.1.0.jar

hive-service-rpc-2.1.0.jar

hive-shims-2.1.0.jar

2、创建一个导出文本任务,将Oracle的表数据导出到一个文本文件中

配置源表查询语句来抽取源表中的数据,可以增加Where条件缩小抽取的范围。

数据被导出为一个txt文件到HHDI服务所在机器的磁盘中,后缀名为批次号,例如:O_RECORD_BLOODGLUCOSE.20170301

3、将导出的文本文件上传到Hive所在主节点机器的目录中,如果该Hive节点的目录和HHDI服务器的目录做了路径映射,则可以省略这个步骤。

此处选择的是SFTP方式

Hive的主节点为192.168.1.195,SFTP服务已经启用

上传的源文件和目标文件的配置

4、创建一个执行SQL任务,在Hive服务器上执行建表和导入文本数据的命令

采用LOAD DATA命令将本地文件导入Hive

5、创建一个作业流程,将上面创建的几个转换任务编入流程,注意顺序

6、手工执行该作业流程,将oracle的数据导出并导入hive。

除此之外还可以通过CDATA的Hive驱动来从数据库直接导入数据到Hive,详情可查看另外一篇文章:

HHDI(www.haohedi.com)让ETL变得简单!

oracle导出到hive,从Oracle导出数据并导入到Hive相关推荐

  1. spark sql读取hive底层_[大数据]spark sql读写Hive数据不一致

    在大数据公司中,任何一家公司都不会只使用一个框架吧?! skr,skr~~ 那我们今天就来聊一段 Hive 与 Spark的爱恨情仇 就像 在一些场景中,需要将外部的数据导入到Hive表中,然后再对这 ...

  2. Hadoop+hive+flask+echarts大数据可视化项目之hive环境搭建与系统数据的分析思路

    Hadoop+hive+flask+echarts大数据可视化项目(四) --------------hive环境搭建与系统数据的分析思路---------------- 关注过Hadoop+hive ...

  3. hive插入多条数据sql_30分钟入门 Hive SQL(HQL 入门篇)

    Hive SQL 几乎是每一位互联网分析师的必备技能,相信每一位面试过大厂的童鞋都有被面试官问到 Hive 优化问题的经历.所以掌握扎实的 HQL 基础尤为重要,既能帮分析师在日常工作中"如 ...

  4. 存在的hive插入数据_往hive表中插入数据以及导出数据

    转载:https://blog.csdn.net/qq_26442553/article/details/80380590 转载:https://blog.csdn.net/weixin_436817 ...

  5. Sqoop安装部署和数据的导入导出案例详解

    目录 一.概述 二.Sqoop的工作机制 三.Sqoop1与Sqoop2架构对比 四.Sqoop安装部署 五.Sqoop的数据导入 1. 列举出所有的数据库 2. 准备表数据 3. 导入数据库表数据到 ...

  6. 如何在 MySQL / MariaDB 中导入导出数据,导入导出数据库文件、Excel、CSV

    文章目录 本教程将详细讲解 1. MySQL / MariaDB 数据库数据「导出」 2. MySQL / MariaDB 数据库数据「导入」 3. 使用「卡拉云」一键导入导出 MySQL / Mar ...

  7. sqoop从mysql导入hdfs_sqoop 从mysql导入数据到hdfs、hive

    1.上传sqoop安装包 2.安装和配置 在添加sqoop到环境变量 将数据库连接驱动拷贝到$SQOOP_HOME/lib里 3.使用 第一类:数据库中的数据导入到HDFS上 sqoop import ...

  8. HIVE的安装配置、mysql的安装、hive创建表、创建分区、修改表等内容、hive beeline使用、HIVE的四种数据导入方式、使用Java代码执行hive的sql命令

    1.上传tar包 这里我上传的是apache-hive-1.2.1-bin.tar.gz 2.解压 mkdir -p /home/tuzq/software/hive/ tar -zxvf apach ...

  9. sqoop 导入到hive字段全是null_Sqoop 一点通

    sqoop 是什么? sqoop 主要用于异构数据: 1. 将数据从hadoop,hive 导入.导出到关系型数据库mysql 等; 2. 将关系型数据库 mysql 中数据导入.导出到 hadoop ...

最新文章

  1. lucas定理 FOJ 2020 组合
  2. 面试题整理6 栈的压入、弹出序列
  3. 洛谷P1462 通往奥格瑞玛的道路 二分答案+最短路SPFA
  4. web压测工具http_load原理分析
  5. python语言语句块标记是_Python的基本语法——语句块
  6. mysql自增字段AUTO_INCREMENT重排或归零
  7. Js时间相关处理函数
  8. java股票公式源码_通达信公式转java
  9. r9270公版bios_华硕R9270显卡开机不显示故障维修
  10. matlab矩阵除法——记忆技巧
  11. 联想l430主板图纸_【有图】Thinkpad L430升级内存,点亮,成功实现双通道!附详细教程及评测!!!...
  12. Issue during builing Android app with ant under Win7
  13. C语言编写的学生考勤信息管理系统
  14. 经络是怎样分类命名的?十二经脉的分布和循行
  15. 6.25考试整理:江城唱晚不老梦棠梨煎雪——题解
  16. 基于Rust-vmm实现Kubernetes运行时
  17. C#时间格式转换为时间戳
  18. python编写判断素数的函数并找出前五个摩尼森数_五十八、如何对一个数进行分解质因数...
  19. 高性能平台设计——美团旅行结算平台实践
  20. 2020 第十一届蓝桥杯java C组 省赛真题

热门文章

  1. 一文了解GPU并行计算CUDA
  2. C语言的数据类型详解及应用
  3. Linux下PCIe驱动开发与学习
  4. 设置TextBox控件的高度文档翻译
  5. linux系统tuyyt工具,yyt_hac's web
  6. windows鼠标,物理位移与屏幕位移的计算方法(鼠标加速度)
  7. Boost.Asio基本原理
  8. TongWeb的licence信息错误
  9. Excel地图可视化不好用?试试这款工具
  10. Compressing Wav file to MP3(代码实现:将Wav格式压缩成Mp3 )