基础知识 - 指数机制
目录
1.前言(如何实现差分隐私)
2.指数机制
3.指数机制满足ε-差分隐私定义
1.前言(如何实现差分隐私)
差分隐私是通过随机化的方式来干扰正常的查询,或是对数据集做一些处理. 那么最常规的干扰查询/处理数据的手法,就是加噪音。
一般情况下,数据库的查询可分为两类:数值查询和非数值查询。
1.数值查询:小明的高数考了多少分?
2.非数值查询:小明分最高的是哪一门课?
应对这两种查询,分别有拉普拉斯机制和指数机制。
2.指数机制
对于非数值查询,需要用指数机制来干扰
在拉普拉斯机制中,我们首先对数据库进行查询,然后在查询结果之上添加一定的噪声使其满足差分隐私的要求。因此,返回的数据通常只是“接近准确”的。那么差分隐私能否允许我们得到真实的结果(实用程序)呢?在这种情况下,指数机制应运而生。
综上:指数机制适用于回答具有任意实用程序和任意非数字范围查询
指数机制是为我们希望选择“最佳”响应的情况而设计的,但直接在计算数量上添加噪声可能完全破坏其价值。例如在拍卖中设定价格,其目标是最大化收益,如果在最优价格上添加少量正噪声(为了保护投标的隐私)可能会大大减少由此产生的收入。为了理解接下来我们举个例子:
假设我们有最够充足的南瓜,想要卖给Alice,Bob,Charlie。他们每个人出价每个南瓜1元或者2元,我们想要定下价格,让我们受益最大。假设我们有一个出价的数据表:
如果我们定价为1元,这个价格在每个人的预算内,那我们能够获得3元(1+1+1);如果我们定价2元,那只有Charlie能买得起,那我们能够获得2元。我们用效用函数(utility function)描述以上信息:
效用函数的值取决于出价表和定价。如果我们想最大化效用,我们应该定价1元。
但是这个定价可能会暴露隐私,假如我们知道Alice比较穷,只出得起1元,Charlie比较富,能出2元,但是不知道Bob的出价情况。但是通过最大化的收益和定价就能推断出Bob的出价。指数机制就能够保证出价者的隐私。
效用函数:
效用函数 :
效用函数的映射关系为:数据库 不同情况 (类比上面的price) 效用得分 (类比上面utility)
在上面的例子,查询 是“南瓜的单价是多少?”,可能的定价 是 ,效用得分是收益,对于出价数据库,,
效用函数的全局敏感度和局部敏感度:
效用函数 的全局敏感度:
对于任意的数据库D和D'效用得分差距的上限,也就是对于所有相邻数据集,某一数据库 ,其相对拥有最大的效用函数值a,某一数据库 其相对拥有最小的效用函数值b,则效用函数 的全局敏感度 = a-b
效用函数 的局部敏感度:
对于一个已知的数据库,我们要对运用指数机制进行差分隐私保护。那么对于数据库和任意与相邻的数据库效用得分差距的上限,也就是数据库的最大效用函数值a和最小效用函数值b,某一与相邻的数据库 有最大效用函数值c, 某一与相邻的数据库有最小效用函数值d,则效用函数 的局部敏感度为|a-d|和|b-c|中的较大值
指数机制:
设随机化算法输入为数据集,输出为一个实体对象,为可用性函数,为函数的敏感度,若以正比于的概率从输入中选择并输出,则算法是满足 - 差分隐私的
直接的说就是,以更高的概率选择效用得分更高的输出
应用案例:
假设某基地正在举办一场体育比赛,可以选择的项目有{足球,排球,篮球,网球}四个项目,参与者们对这些项目进行投票,现在要确定一个项目是的整个决策过程满足 - 差分隐私,以每个选项的得票数量作为可用性函数,在给定隐私预算情况下,可以计算选择各个项目的输出概率:
上述案例中,当=0时,提供完全的隐私保护但数据可用性为0,随着大,选择出期望结果的可能性也越大。
3.指数机制满足ε-差分隐私定义
基础知识 - 指数机制相关推荐
- 基础知识 - 拉普拉斯机制
目录 1.前言(如何实现差分隐私) 2.拉普拉斯噪声 3.拉普拉斯机制 4.拉普拉斯噪声满足ε-差分隐私定义 5.拉普拉斯噪声的生成 1.前言(如何实现差分隐私) 差分隐私是通过随机化的方式来干扰正常 ...
- Nand Flash基础知识与坏块管理机制的研究
概述 Flash名称的由来,Flash的擦除操作是以block块为单位的,与此相对应的是其他很多存储设备,是以bit位为最小读取/写入的单位,Flash是一次性地擦除整个块:在发送一个擦除命令后,一次 ...
- linux挂载fc存储有超级坏块_Nand Flash基础知识与坏块管理机制的研究
欢迎FPGA工程师加入官方微信技术群 点击蓝字关注我们FPGA之家-中国最好最大的FPGA纯工程师社群 概述 Flash名称的由来,Flash的擦除操作是以block块为单位的,与此相对应的是其他很多 ...
- Windows_Program_Via_C_Translate_Win32编程的背景知识/基础知识_包括基本输入输出机制介绍...
Some Basic Background Story of The Win32 APIs Win32 API背景故事/背景知识 The Win32 application programming i ...
- 炒股票新手入门基础知识 跟桥博士炒股票入门课程认识MSCI和纳斯达克指数
炒股票新手入门基础知识学习,跟着桥博士<股票入门基础知识>课程来认识MSCI和纳斯达克指数,新手炒股入门,从认识股票知识开始. 1.炒股新手入门基础知识--股票指数MSCI 炒股票新手入门 ...
- 数理基础(高等代数)------sympy三角、指数、对数、幂函数、极限、求导、微分、积分等基础知识
sympy基础知识 1.sympy import sympy print(sympy.pi.evalf())#圆周率π print(sympy.E)#e print(sympy.I)#虚数i prin ...
- SQL Server基础知识概念要点详细讲解
SQL Server基础知识概念要点详细讲解 目录 基础概念 1.网状模型数据库 2.层次模型数据库 3.关系模型数据库 知识点实例总结 基础概念 SQL语言中,between and表示包括两边参数 ...
- 2020年信息系统项目管理师真题讲解:基础知识1/3
2020年信息系统项目管理师真题讲解:基础知识,共75题真题,本实体解析分三篇文章,本篇为第一篇 1.( )使系统的描述及信息模型的表示与客观实体相对应,符合人们的思维习惯,有利于系统开发过程中用 ...
- 最容易理解的计算机网络 基础知识概论(下)
文章目录 1.计算机网络的分类 1.1按照传输介质分类 1.2按照网络的使用者进行分类 1.3按照网络的规模和作用范围进行分类. 2.计算机网络的性能指标 2.1 带宽 2.2 时延 2.2.1网络时 ...
最新文章
- R语言tidyr包gather()函数实战详解:数据收缩、从宽表到窄表
- 《DBA修炼之道:数据库管理员的第一本书》——1.4节评估DBA的工作邀请
- 了解Android中的meta-data及其应用
- 编写微信小程序常用到的界面参数
- linux的/etc/hosts的作用
- python itertools模块位置_Python高效编程之itertools模块详解
- 快速开发基于 HTML5 网络拓扑图应用之 DataBinding 数据绑定篇
- 软件工程实践小队Scrum Meeting
- 【数据库系统设计】SQL语言实验
- 优酷响应式在消费场景的落地之 iOS 篇
- 51nod 1273 旅行计划——思维题
- 2022年五一建模比赛A题#五一建模
- 用R软件绘制中国分省市地图
- 计算机联锁控制系统的软件应具备信号操作功能,N6_计算机联锁控制系统原理-软件原理.ppt...
- caffe源码学习:Blobs
- 键盘可以实现向计算机输入数据判断,计算机应用基础_学习指南.docx
- CentOS7 防火墙开放端口配置
- Excel竟然可以批量解锁二维码内容的操作
- 从零开始VCS+Verdi 安装过程
- 你所不知清楚的3D建模师的现状