使用Ranger对Hive数据进行脱敏
Ranger支持对Hive数据的脱敏处理(Data Masking),它对select
的返回结果进行脱敏处理,对用户屏蔽敏感信息。
备注:
该功能针对HiveServer2的场景(如beeline/jdbc/Hue等途径执行的select),对于使用Hive Client(如hive -e 'select xxxx')不支持。
接下来介绍如何在E-MapReduce中使用该功能的步骤。
1.Hive组件配置Ranger
参见文档: Enable Hive Ranger Plugin
2. 配置Data Mask Policy
在Ranger UI的emr-hive
的service页面可以对用户访问Hive数据进行脱敏处理。
- 支持多种脱敏处理方式,比如显示开始的4个字符/显示最后的4个字符/Hash处理等
配置Mask Policy时不支持通配符
(如policy中table/column不能配置为*)- 每个policy只能配置一个列的mask策略,多个列需要配置各自的mask policy
配置Policy流程:
最后保存即可。
3. 测试数据脱敏
场景:
用户test在select表testdb1.testtbl中列a的数据时,只显示最开始的4个字符。
流程:
a) 配置policy
在上面一节的最后一个截图,其实就是配置了该场景的一个policy,可参考上图(其中脱敏方式选择了show first 4)。
b) 脱敏验证
test用户使用beeline连接HiveServer2,执行select a from testdb1.testtbl
如上图所示,test用户执行select命令后,列a显示的数据只有前面4个字符是正常显示,后面字符全部用x
来脱敏处理。
使用Ranger对Hive数据进行脱敏相关推荐
- hive插件 ranger_Apache Ranger及Hive权限控制
一.Ranger概述 1.Ranger简介 Apache Ranger提供一个集中式安全管理框架, 并解决授权和审计.它可以对Hadoop生态的组件如HDFS.Yarn.Hive.Hbase等进行细粒 ...
- hive数据导入导出
Hive数据导入导出的几种方式 一,Hive数据导入的几种方式 首先列出讲述下面几种导入方式的数据和hive表. 导入: 本地文件导入到Hive表: Hive表导入到Hive表; HDFS文件导入到H ...
- Springboot 日志、配置文件、接口数据如何脱敏?老鸟们都是这样玩的!
一.前言 核心隐私数据无论对于企业还是用户来说尤其重要,因此要想办法杜绝各种隐私数据的泄漏.下面陈某带大家从以下三个方面讲解一下隐私数据如何脱敏,也是日常开发中需要注意的: 配置文件数据脱敏 接口返回 ...
- Hive数据导入——数据存储在Hadoop分布式文件系统中,往Hive表里面导入数据只是简单的将数据移动到表所在的目录中!...
转自:http://blog.csdn.net/lifuxiangcaohui/article/details/40588929 Hive是基于Hadoop分布式文件系统的,它的数据存储在Hadoop ...
- Hive数据导入Elasticsearch
Elasticsearch Jar包准备 所有节点导入elasticsearch-hadoop-5.5.1.jar /opt/cloudera/parcels/CDH-5.12.0-1.cdh5.12 ...
- python应用中调用spark_在python中使用pyspark读写Hive数据操作
1.读Hive表数据 pyspark读取hive数据非常简单,因为它有专门的接口来读取,完全不需要像hbase那样,需要做很多配置,pyspark提供的操作hive的接口,使得程序可以直接使用SQL语 ...
- hive向mysql导数据_导入Hive数据导MySQL
导入Hive数据到MySQL 1. UDF 使用UDF比较方便,代码在http://svn.apache.org/repos/asf/hive/trunk/contrib/src/java/org/a ...
- 把hive数据导出至mysql
##################环境########################################### 软件 版本 备注 Ubuntu 19.10 sqoop 1.4.7 ...
- hive数据类型转换
博客地址:http://www.iteblog.com/ 文章标题:<Hive数据类型转换> 本文链接:http://www.iteblog.com/archives/892 Hadoop ...
最新文章
- ​机器学习中必要的数学基础!
- 苹果营收和股价双双创历史新高!库克:iPhone 11系列卖得很好
- 大型对冲基金正训练AI交易 5年后AI在量化中将成主流
- 写了一个 SSO 单点登录的代码示例给胖友!
- NTP时间服务器安装
- 【渝粤教育】国家开放大学2018年春季 0471-21T畜牧学 参考试题
- mysql主从复制实施流程_MySQL主从复制认识及实施操作
- FD.io VPP 20.05 官方文档 总目录:用户文档+开发文档+命令行
- sklear中IsolationForest的使用场景
- 常见图片格式与调色算法
- qt4--qt5引用头文件区别
- 前端基础学习之CSS选择器
- SLAM--单目尺度漂移(相似变换群Sim3)
- 【 PID 算法 】PID 算法基础
- 欠阻尼衰减振荡Matlab语言,欠阻尼振荡曲线的衰减系数怎么求
- 电桥测量电路Multisim仿真AD电路原理图PCB
- matlab 矩阵平方怎么表示,MATLAB中如何输x的平方
- 快速上手Total Commander的经验分享
- 腾达路由器怎么设置网站服务服务器,腾达(Tenda)-无线路由器如何设置上网?
- C++11 decay