一、测试数据库连接

 sqoop list-databases \--connect jdbc:oracle:thin:@ip:port:数据库 \--username aml \--password aml

二、代码样例

#!/bin/bashwhile read line
dohdfs dfs -rmr /user/hive/warehouse/aml.db/$lineecho "********** 开始导入表 $line ************"sqoop import \--connect jdbc:oracle:thin:@ip:port:数据库 \--username 用户名 --password 密码 \--query "select * from "$line" where 1=1 and \$CONDITIONS" \--hive-import  --delete-target-dir --hive-overwrite \--hive-database aml --hive-table $line \--target-dir /user/hive/warehouse/aml.db/$line \-null-string '\\N' -null-non-string '\\N' \-m 1
done < table_list.txt--oracle 采集配置
sqoop import \                 # 导入模式    关系型数据库-> hdfs(hive)
--driver oracle.jdbc.driver.OracleDriver \            #驱动类
--connect jdbc:oracle:thin:@ip:port:数据库 \       #源数据库url
--username datacenter \               #账号
--password sjzx_ljp0411 \              #密码
--query "select * from $source_tab_name where \$CONDITIONS and $where_str " \  #要采集的数据集
--target-dir /tmp/sqoop/${source_ID}/t_${tab_name}_tmp \      #hdfs的临时目录 可自动创建
--delete-target-dir \               #数据采集前是否删除目录并新建
--hive-import \                 #导入hive
--hive-overwrite \                #数据写入模式为覆盖
--null-string '\\N' \               #替换为String类型的null为\\n
--null-non-string '\\N' \              #替换为非String类型的null为\\n
--fields-terminated-by "\t" \             #指定hive表的分隔符
--hive-drop-import-delims \              #去除列值中 \n \r 等特殊字符
--hive-table ods_${source_ID}.t_${tab_name}_tmp \        #指定hive表名
--hive-partition-key bus_date \             #插入为分区表时分区字段
--hive-partition-value ${bus_date} \           #分区的值
-m 1                    #指定maptask数量 = 并行度
``

`


sqoop导数到各个数据库,可以套用相关推荐

  1. flume和sqoop导数据的区别

    flume和sqoop导数据的区别? flume 产生数据就开始读数据,并把数据上传到HDFS上 sqoop导数据比flume慢一天,且只能为离线数据的导入 T+1 模式(导入为前一天的数据) 周期性 ...

  2. sqoop 导数据从 mysql 到 hdfs,load 进 hive

    sqoop 从 mysql 导数据到 hive 命令: sqoop import --connect 'jdbc:mysql://127.0.0.1:8066/int_vst_wx' --userna ...

  3. sqoop导数据出现问题

    执行下面命令的时候报错 ./sqoop import \ --connect jdbc:mysql://mini1:3306/userdb \ --username root \ --password ...

  4. SQOOP抽取各类型数据库脚本示例

    ------------MySQL------------ 导入到HDFS sqoop import --connect jdbc:mysql://localhost:3306/wht --usern ...

  5. Oozie 调用sqoop导数据出现NoClassDefFoundError问题

    异常 Exception in thread "main" java.lang.NoClassDefFoundError: Could not initialize class o ...

  6. Hue中Sqoop导数报错Could not load db driver class: com.mysql.jdbc.Driver

    前言 在Hue上面测试一个很简单的Sqoop import --connect jdbc:mysql://10.169.xx.xxx/test --username root --password r ...

  7. sqoop从mysql导入数据到hdfs_利用Sqoop将数据从数据库导入到HDFS

    基本使用 如下面这个shell脚本: #Oracle的连接字符串,其中包含了Oracle的地址,SID,和端口号 CONNECTURL=jdbc:oracle:thin:@20.135.60.21:1 ...

  8. Hadoop和关系型数据库间的数据传输工具——Sqoop

    Hadoop和关系型数据库间的数据传输工具--Sqoop 一.Sqoop简介以及使用 1.1.产生背景 基于传统关系型数据库的稳定性,还是有很多企业将数据存储在关系型数据库中:早期由于工具的缺乏,Ha ...

  9. sqoop 导入mysql blob字段,Sqoop导入的数据格式问题

    Sqoop简单介绍 Sqoop是用来在Hadoop平台和其他结构性存储(比如关系型数据库)之间解决大量数据传输问题的工具.也就是说可以从Oracle,MySQL,PostgreSQL等数据库中将数据传 ...

  10. sqoop从musql导入到hive中数据缺失

    sqoop从musql导入到hive中数据缺失 sqoop是大数据架构中常用的数据导入导出组件之一,只要简单的设置一些参数就可以将数据库的数据快速导入数据仓库中. 但在实际使用过程中,常常会碰到一些问 ...

最新文章

  1. ARMV8/ARMV9的执行状态的切换
  2. 完全删除垃圾Q+!!!
  3. 小学用计算机画画 说课,小学教师说课稿:《画画美丽的自然景色》
  4. python- 常见算法 python内置模块
  5. 服务器怎样共享文件夹共享文件夹,服务器怎样共享文件夹共享文件夹
  6. 基于.NET Standard的分布式自增ID算法--美团点评LeafSegment
  7. php 7 class 初始化 销毁_在 PHP 中使用和管理 Session
  8. elementui 嵌套表单验证_elementUI 表单嵌套表格验证,日期选择器联动限制等写法
  9. SAP License:GB01中替代字段释放
  10. 物联网架构成长之路(18)-接阿里云OSS服务
  11. JAVA的图形性能,慢在哪里之分析
  12. Doc2Vec 模型参数
  13. 我去面试没带简历,你让我走人?
  14. linux 查看硬盘序列号、设备序列号、系统安装时间
  15. 程序猿怎样变身IT讲师
  16. 通过phpmyadmin修改帝国CMS的管理员密码
  17. Spring初窥门径
  18. 关于html 背景图片的引用格式
  19. 保时捷卡宴Cayenne升级原厂360全景影像系统,行车更安全
  20. 眼镜选款新方法,用AR+Scene技术实现3D虚拟试戴

热门文章

  1. 文件夹访问被拒绝,您需要权限来执行操作
  2. 《电脑十万个为什么》 第四卷 第一章
  3. 最新wifi大师小程序独立版3.0.8源码
  4. 河南的抗疫英雄(C语言嘞)
  5. 苏宁易购:前后端分离架构的落地思考
  6. python 面向对象 烤地瓜实例
  7. PIPI1091 编程课奖励(滚动数组+dp)
  8. PIPIOJ 1169: PIPI倒水
  9. Spark数据分析及处理
  10. Win10下Flutter开发环境搭建这一篇足矣