Sqoop 是传统数据库与 Hadoop 之间数据同步的工具,它是 Hadoop 发展到一定程度的必然产物,它主要解决的是传统数据库和Hadoop之间数据的迁移问题。
Sqoop 是连接传统关系型数据库和 Hadoop 的桥梁。它包括以下两个方面:
1、 将关系型数据库的数据导入到 Hadoop 及其相关的系统中,如 Hive和HBase。
2、 将数据从 Hadoop 系统里抽取并导出到关系型数据库。
Sqoop 的核心设计思想是利用 MapReduce 加快数据传输速度。也就是说 Sqoop 的导入和导出功能是通过 MapReduce 作业实现的。
所以它是一种批处理方式进行数据传输,难以实现实时的数据进行导入和导出。

  1、sqoop 名字的来源:SQL-to-Hadoop

  2、我们可以把它看做成连接传统数据库和Hadoop的桥梁

    1)把关系型数据库中的数据(MySQL)导入到hadoop或者与其相关的系统比如HDFS 、hive 、Hbase

    2)把hadoop中的数据抽取出来,导入到关系型数据库中

  3、它的设计思想就是:利用MapReduce加快数据传输速度

本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6116321.html,如需转载请自行联系原作者

Sqoop 是什么?(二)相关推荐

  1. 大数据开发之Sqoop详细介绍

    备注: 测试环境 CDH 6.3.1 Sqoop 1.4.7 文章目录 一.Sqoop概述 二.Sqoop 工具概述 三.Sqoon工具详解 3.1 codegen 3.2 create-hive-t ...

  2. 五十八、Sqoop的常用参数及命令

    上一篇文章我们讲述了Sqoop的安装已经一些基本操作,本文我们主要来看看它常用的一些参数和命令.Sqoop是一个非常简单的传输工具,我们进行简单的讲述,不在这上面浪费过多的时间,本文是Sqoop部分的 ...

  3. [Hadoop]Sqoop 1.4.2中文文档(一)之数据导入

    一.Sqoop Help $ sqoop help usage: sqoop COMMAND [ARGS]Available commands:codegen Generate code to int ...

  4. Sqoop 同步Parquet partition Hive表

    一.import (mysql to hive) 1.同步textfile类型(不支持Orc或Parquet) way 1 (同步到hive表) sqoop import \--connect jdb ...

  5. sqoop1.4.2数据导入

    一.Sqoop Help Java代码   $ sqoop help usage: sqoop COMMAND [ARGS] Available commands: codegen           ...

  6. 尚硅谷4.0数仓项目整体设计要点记录

    项目部署 虚拟机环境配置下载 整体设计 日志划分 业务日志批量更新,用户行为日志实时更新 虚拟机 虚拟机登录 root root sudo systemctl start/status mysqld ...

  7. 大数据基础(二)hadoop, mave, hbase, hive, sqoop在ubuntu 14.04.04下的安装和sqoop与hdfs,hive,mysql导入导出

    hadoop, mave, hbase, hive, sqoop在ubuntu 14.04.04下的安装 2016.05.15 本文测试环境: hadoop2.6.2 ubuntu 14.04.04 ...

  8. Sqoop(二)常用命令及常数解析

    本文转自:https://www.cnblogs.com/yfb918/p/10855154.html 一.常用命令列举 二.命令及参数详解 1.数据库连接 2.import 3.export 4.h ...

  9. Hadoop2异常分析(二):Sqoop导出数据错误

    sqoop错误: Error during import: No primary key could be found for table tab1. Please specify one with  ...

  10. 大数据之Sqoop 二

    五.Sqoop一些常用命令及参数 5.1.常用命令列举 这里给大家列出来了一部分Sqoop操作时的常用参数,以供参考,需要深入学习的可以参看对应类的源代码. 序号 命令 类 说明 1 import I ...

最新文章

  1. Go 学习笔记(50)— Go 标准库之 net/url(查询转义、查询参数增/删/改/查、解析URL)
  2. 使用OpenVINO ToolKit 实时推断
  3. mysql 事物状态有几种_mysql第三章 事务以及日志
  4. linux top交叉编译_ARM Linux交叉编译工具链的制作
  5. 【FFMPEG源码终极解析】 avformat_open_input (一)
  6. 2020年A股IPO市场全景回顾与2021年前景展望报告
  7. oracle unused 语法_Oracle教程之设置为unused 后如何恢复 ?
  8. 树莓派3代linux,树莓派 3B 入门 ARMv8 Arch Linux
  9. python五位回文数_蓝桥杯,特殊回文数,Python
  10. android仿今日头条App、多种漂亮加载效果、选择器汇总、记事本App、Kotlin开发等源码...
  11. C#泛型-小心使用静态成员变量
  12. Atitit knowmng file list知识管理文档索引 目录时索引 part1
  13. html表单电子邮件验证验证,详解JavaScript表单验证(E-mail 验证)
  14. 力克亮相CISMA 2017,以工业4.0思维应对时尚变革
  15. 30款前端特效源码分享
  16. 微信登录显示网页无法连接服务器地址,手机微信登陆不了?
  17. html5在线俄罗斯方块,html5网页版俄罗斯方块小游戏代码
  18. phpword 模板替换文字和图片
  19. Mybatis的批量插入数据库的两种方法及代码自动生成工具的使用方法
  20. oRbIt 的专栏 用天文方法计算二十四节气(下)

热门文章

  1. atitit 图像处理机器视觉专业博硕连读课程表.xlsx
  2. Atitit 游戏引擎---物理系统(1)------爆炸效果
  3. atitit.软件设计模式大的总结attialx总结
  4. atitit.404错误的排查流程总结vOa6
  5. atitit.压缩算法 ZLib ,gzip ,zip 最佳实践 java .net php
  6. paip.mysql 全文索引查询空白解决
  7. paip.提升中文分词准确度---新词识别
  8. paip.c++ qt 图片处理 检测损坏的图片
  9. 剖析 |数据现代化-富国银行的数据转型之路
  10. 最新消息!阿里宣布延迟复工,字节跳动、腾讯......等企业也再次延迟!