Question

Datastage是否有专门的组件支持Hive呢?

Answer

在最新的IBM Information Server 11.5.0.1中,新增了一些组件和功能,其中比较重要的就是Hive Connector。在之前的版本中,Datastage产品对Hive的支持主要通过ODBC connector或者JDBC connector来实现,使用ODBC / JDBC connector连接Hive存在一些局限性

qConnector的如下的选项不受支持:

oGenerate SQL at Runtime

oIsolation levels

oAuto-commit

oCreate functionality with different file formats

qHive中的partition table不受支持

q在通用的Connector里处理一些Hive特定的功能比较难

q新的Hive Connector较之使用通用的ODBC / JDBC connector有如下优势

q支持多种Hive

Cloudera Hive

Cloudera Impala

HortonWorks

BigInsights

q提供了对Hive一些特定功能的支持

Generation of HiveQL at runtime

Generation of the table DDL specific to Hive

DML generation as per the syntax of HiveQL

Hive specific table formats [AVRO, Parquet, ORC etc]

Partitioned tables

q用户可以使用Generate SQL选项,不必使用 HQL/SQL 语句

q支持partitioned table的读写

q处理Hive特定的功能比较容易

Hive Connector 配置

q底层使用 JDBC 协议,配置相对简单

q使用Datadirect JDBC driver for Hive – 在Information Server安装包默认提供

q创建或修改配置文件isjdbc.config (IS_HOME/Server/DSEngine)

q配置文件中的如下内容用于指定 class path 和driver Java classes:

CLASSPATH=

CLASS_NAMES=

qisjdbc.config示例

CLASSPATH=/opt/IBM/InformationServer/ASBNode/lib/java/IShive.jar;

CLASS_NAMES=com.ibm.isf.jdbc.hive.HiveDriver;

Note : Details about the Kerberos configuration would be provided in the subsequent slides

Hive Connector - Repository View and Palette

Hive Connector 支持Source context / read mode,Target context / write mode,Request context / Lookup mode,下面分别进行介绍

Source context or Read mode

Hive Connector 可以配置成Source context (或 read mode) 用于从Hive中读取数据.

q可以生成 Select 语句

q支持Partitioned Reads

q提供对额外的 Hive 选项的支持

q支持Before or After SQL

q支持 number of rows returned by the stage限制

q支持从文件中读取SQL

Target context or write mode

qHive Connector 可以配置成Target context (或 write mode) 用于向Hive中insert数据. 可以使Hive和ETL job无缝集成

q支持写入partitioned table.

q支持多种 Table action modes [ 包括 Create, Append, Truncate and Replace ]

q目前不支持Update

q在生成Create table语句的时候,支持生成 HiveQL 或HQL 格式的DDL

q支持Insert操作的 Generate SQL

q支持User – defined SQL 选项,可以从文件中读取SQL语句

q支持Before / After SQL statements

q支持额外的 Hive 选项

Request context or Lookup mode

q支持Normal以及 Sparse模式

Hive Connector的使用限制

q目前向 partitioned table中的insert操作是逐条执行的,没有批量模式

q 在 Big Integrate 环境中, Keytab 文件的localization目前不被支持

q 不支持向Hive表中Load数据

workaround:

可以使用 File Connector向Hive表中load数据. 用File connector将数据load到文件,然后在创建一个Hive表关联这个文件

q 只支持Insert的写模式

Hive Connector Troubleshooting

q确保 isjdbc.config配置正确

q在读取partitioned table时,确保 placeholder ([[part-value]]) 正确设置

qHive connector的debugging与其他的connector类似,使用CC_MSG_LEVEL参数可以获取更详细的Hive connector日志ex : CC_MSG_LEVEL=1 / 2

q 其他troubleshooting技巧和问题,请参考

http://www.ibm.com/support/knowledgecenter/SSZJPZ_11.5.0/com.ibm.swg.im.iis.conn.hive.usage.doc/topics/hivecc_troubleshooting.html

其他关于Hive connector的配置,使用介绍,请参考Information Server KnowledgeCenter相关章节

http://www.ibm.com/support/knowledgecenter/SSZJPZ_11.5.0/com.ibm.swg.im.iis.conn.hive.usage.doc/topics/hive_connector_top_of_nav.html

了解更多Information Server11.5的新功能,请参考Information Server 11.5.0.1 Release Notes

http://www-01.ibm.com/support/docview.wss?uid=swg21996106

[{"Product":{"code":"SSZJPZ","label":"InfoSphere Information Server"},"Business Unit":{"code":"BU053","label":"Cloud & Data Platform"},"Component":"Not Applicable","Platform":[{"code":"PF002","label":"AIX"},{"code":"PF016","label":"Linux"},{"code":"PF033","label":"Windows"}],"Version":"11.5.0.1;11.5","Edition":"","Line of Business":{"code":"LOB10","label":"Data and AI"}}]

datastage配置jdbc_Datastage 11.5新功能介绍----Hive Connector相关推荐

  1. Windows 11 企业版新功能介绍

    很多用户都升级了Windows 11企业版,那么Windows 11元有哪些新功能呢? 生产力和协作功能 新的安全功能 基于云的管理和云配置(Cloud Config) 通用打印 应用兼容性      ...

  2. Ableton Live 11 mac新功能

    Ableton Live 11 Suite新功能介绍 一.用新设备创建 Meet Wavetable,Echo,Drum Buss和Pedal:Live的乐器和效果可能带来全新的声音效果. 1.Mee ...

  3. CentOS以及Oracle数据库发展历史及各版本新功能介绍, 便于构造环境时有个对应关系...

    CentOS版本历史 版本 CentOS版本号有两个部分,一个主要版本和一个次要版本,主要和次要版本号分别对应于RHEL的主要版本与更新包,CentOS采取从RHEL的源代码包来构建.例如CentOS ...

  4. 昆石VOS2009/VOS3000 2.1.6.00 新功能介绍

    昆石VOS2009/VOS3000 2.1.6.00 新功能介绍 VOS 2009/VOS 3000 各种安装包/安装激活教程: http://51voip.org/catalog.asp?cate= ...

  5. SQL 2014新功能介绍系列3 - 备份还原篇

    大数据催生了云计算和移动互联的世界.微软新的战略方针"cloud first,mobilefirst"也表明公司正在全面转向云计算中转型.在最新发布的SQLServer 2014与 ...

  6. Java 17 新功能介绍(LTS)

    点赞再看,动力无限.Hello world : ) 微信搜「 程序猿阿朗 」. 本文 Github.com/niumoo/JavaNotes 和 未读代码博客 已经收录,有很多知识点和系列文章. Ja ...

  7. 熊猫tv新功能介绍_熊猫简单介绍

    熊猫tv新功能介绍 Out of all technologies that is introduced in Data Analysis, Pandas is one of the most pop ...

  8. 负载均衡SLB新功能介绍

    摘要: 随着网络的各个核心部分业务量的提高,访问量和数据流量的快速增长,其处理能力和计算强度也相应地增大,使得单一的服务器设备根本无法承担.通过负载均衡扩展现有网络设备和服务器的带宽.增加吞吐量.加强 ...

  9. 今天在webcasts上看sql server 2008的新功能介绍,无意中发现在连接sql server 数据库时,还有一个...

    今天在webcasts上看sql server 2008的新功能介绍,无意中发现在连接sql server 数据库时,还有一个 Failover Partner的选项.以前都没注意过,它的主要功能就是 ...

最新文章

  1. 二叉树 2.0 -- 非递归遍历
  2. OSU!(bzoj 4318)
  3. 1.01 与 37.8
  4. Fedora 17 install VMWare tool
  5. Windows Azure NotificationHub+Firebase Cloud Message 实现消息推动(付源码)
  6. eslint quo_Quo Vadis JUnit
  7. from表单iframe原网页嵌入
  8. 软件测试:web渗透测试怎样入门!讲透了...
  9. 面试题:+=(python中列表+=操作)
  10. 基于javaweb+jsp的在线购书商城系统(java+jsp+mysql+servlert+ajax)
  11. 账龄分析表excel模板_做账不用在苦恼表格制作,企业财务管理全套Excel模板给你!领取...
  12. USB SERVER网络远程管理U盾
  13. UART协议就应该这么理解
  14. Sparx Systems发布Enterprise Architect 16
  15. 中征征信java_征信接口调用,解析(xml)
  16. android 盒子 红白机 模拟器,安卓FC模拟器
  17. OpenAI又放大招:连接文本与图像的CLIP,在ImageNet上效果媲美ResNet50
  18. fasttext文本分类python实现_一个使用fasttext训练的新闻文本分类器/模型
  19. 树莓派强制更改root密码
  20. Python 同时插入两张图片在同一页PPT,并循环多张图片

热门文章

  1. java及历史版本下载
  2. 计算机打开查看方式默认是什么样,如何设置电脑文件夹默认查看方式
  3. android-sdk下载安装
  4. 笔记本英雄联盟界面服务器停止运行,关于LOL选完大区(主界面)后马上闪退的正确解决方法...
  5. 基于51单片机的LED呼吸灯设计(定时器)
  6. C语言-vs的常用快捷键
  7. 技术分享 | Goby IP库初探
  8. 1~n中与n互质数的个数(欧拉函数)
  9. 男人应该多吃的10种健康食物
  10. vb程序设计教程第4版龚沛曾 实验答案解析