目录

1.前言(如何实现差分隐私)

2.指数机制

3.指数机制满足ε-差分隐私定义


1.前言(如何实现差分隐私)

差分隐私是通过随机化的方式来干扰正常的查询,或是对数据集做一些处理. 那么最常规的干扰查询/处理数据的手法,就是加噪音。

一般情况下,数据库的查询可分为两类:数值查询和非数值查询。

1.数值查询:小明的高数考了多少分?

2.非数值查询:小明分最高的是哪一门课?

应对这两种查询,分别有拉普拉斯机制指数机制


2.指数机制

对于非数值查询,需要用指数机制来干扰

在拉普拉斯机制中,我们首先对数据库进行查询,然后在查询结果之上添加一定的噪声使其满足差分隐私的要求。因此,返回的数据通常只是“接近准确”的。那么差分隐私能否允许我们得到真实的结果(实用程序)呢?在这种情况下,指数机制应运而生。

综上:指数机制适用于回答具有任意实用程序和任意非数字范围查询

指数机制是为我们希望选择“最佳”响应的情况而设计的,但直接在计算数量上添加噪声可能完全破坏其价值。例如在拍卖中设定价格,其目标是最大化收益,如果在最优价格上添加少量正噪声(为了保护投标的隐私)可能会大大减少由此产生的收入。为了理解接下来我们举个例子:

假设我们有最够充足的南瓜,想要卖给Alice,Bob,Charlie。他们每个人出价每个南瓜1元或者2元,我们想要定下价格,让我们受益最大。假设我们有一个出价的数据表:

如果我们定价为1元,这个价格在每个人的预算内,那我们能够获得3元(1+1+1);如果我们定价2元,那只有Charlie能买得起,那我们能够获得2元。我们用效用函数(utility function)描述以上信息:

效用函数的值取决于出价表和定价。如果我们想最大化效用,我们应该定价1元。

但是这个定价可能会暴露隐私,假如我们知道Alice比较穷,只出得起1元,Charlie比较富,能出2元,但是不知道Bob的出价情况。但是通过最大化的收益和定价就能推断出Bob的出价。指数机制就能够保证出价者的隐私。

效用函数:

效用函数 

效用函数的映射关系为:数据库  不同情况 (类比上面的price) 效用得分                                                                                                                    (类比上面utility)

在上面的例子,查询  是“南瓜的单价是多少?”,可能的定价  是 ,效用得分是收益,对于出价数据库

效用函数的全局敏感度和局部敏感度:

效用函数  的全局敏感度:

对于任意的数据库D和D'效用得分差距的上限,也就是对于所有相邻数据集,某一数据库  ,其相对拥有最大的效用函数值a,某一数据库  其相对拥有最小的效用函数值b,则效用函数  的全局敏感度 = a-b

效用函数  的局部敏感度:

对于一个已知的数据库,我们要对运用指数机制进行差分隐私保护。那么对于数据库和任意与相邻的数据库效用得分差距的上限,也就是数据库的最大效用函数值a和最小效用函数值b,某一与相邻的数据库 有最大效用函数值c, 某一与相邻的数据库有最小效用函数值d,则效用函数  的局部敏感度为|a-d|和|b-c|中的较大值

指数机制:

设随机化算法输入为数据集,输出为一个实体对象为可用性函数,为函数的敏感度,若以正比于的概率从输入中选择并输出,则算法是满足 - 差分隐私的

直接的说就是,以更高的概率选择效用得分更高的输出

应用案例:

假设某基地正在举办一场体育比赛,可以选择的项目有{足球,排球,篮球,网球}四个项目,参与者们对这些项目进行投票,现在要确定一个项目是的整个决策过程满足 - 差分隐私,以每个选项的得票数量作为可用性函数,在给定隐私预算情况下,可以计算选择各个项目的输出概率:

上述案例中,当=0时,提供完全的隐私保护但数据可用性为0,随着大,选择出期望结果的可能性也越大。


3.指数机制满足ε-差分隐私定义

基础知识 - 指数机制相关推荐

  1. 基础知识 - 拉普拉斯机制

    目录 1.前言(如何实现差分隐私) 2.拉普拉斯噪声 3.拉普拉斯机制 4.拉普拉斯噪声满足ε-差分隐私定义 5.拉普拉斯噪声的生成 1.前言(如何实现差分隐私) 差分隐私是通过随机化的方式来干扰正常 ...

  2. Nand Flash基础知识与坏块管理机制的研究

    概述 Flash名称的由来,Flash的擦除操作是以block块为单位的,与此相对应的是其他很多存储设备,是以bit位为最小读取/写入的单位,Flash是一次性地擦除整个块:在发送一个擦除命令后,一次 ...

  3. linux挂载fc存储有超级坏块_Nand Flash基础知识与坏块管理机制的研究

    欢迎FPGA工程师加入官方微信技术群 点击蓝字关注我们FPGA之家-中国最好最大的FPGA纯工程师社群 概述 Flash名称的由来,Flash的擦除操作是以block块为单位的,与此相对应的是其他很多 ...

  4. Windows_Program_Via_C_Translate_Win32编程的背景知识/基础知识_包括基本输入输出机制介绍...

    Some Basic Background Story of The Win32 APIs Win32 API背景故事/背景知识 The Win32 application programming i ...

  5. 炒股票新手入门基础知识 跟桥博士炒股票入门课程认识MSCI和纳斯达克指数

    炒股票新手入门基础知识学习,跟着桥博士<股票入门基础知识>课程来认识MSCI和纳斯达克指数,新手炒股入门,从认识股票知识开始. 1.炒股新手入门基础知识--股票指数MSCI 炒股票新手入门 ...

  6. 数理基础(高等代数)------sympy三角、指数、对数、幂函数、极限、求导、微分、积分等基础知识

    sympy基础知识 1.sympy import sympy print(sympy.pi.evalf())#圆周率π print(sympy.E)#e print(sympy.I)#虚数i prin ...

  7. SQL Server基础知识概念要点详细讲解

    SQL Server基础知识概念要点详细讲解 目录 基础概念 1.网状模型数据库 2.层次模型数据库 3.关系模型数据库 知识点实例总结 基础概念 SQL语言中,between and表示包括两边参数 ...

  8. 2020年信息系统项目管理师真题讲解:基础知识1/3

    2020年信息系统项目管理师真题讲解:基础知识,共75题真题,本实体解析分三篇文章,本篇为第一篇 1.(   )使系统的描述及信息模型的表示与客观实体相对应,符合人们的思维习惯,有利于系统开发过程中用 ...

  9. 最容易理解的计算机网络 基础知识概论(下)

    文章目录 1.计算机网络的分类 1.1按照传输介质分类 1.2按照网络的使用者进行分类 1.3按照网络的规模和作用范围进行分类. 2.计算机网络的性能指标 2.1 带宽 2.2 时延 2.2.1网络时 ...

最新文章

  1. R语言tidyr包gather()函数实战详解:数据收缩、从宽表到窄表
  2. 《DBA修炼之道:数据库管理员的第一本书》——1.4节评估DBA的工作邀请
  3. 了解Android中的meta-data及其应用
  4. 编写微信小程序常用到的界面参数
  5. linux的/etc/hosts的作用
  6. python itertools模块位置_Python高效编程之itertools模块详解
  7. 快速开发基于 HTML5 网络拓扑图应用之 DataBinding 数据绑定篇
  8. 软件工程实践小队Scrum Meeting
  9. 【数据库系统设计】SQL语言实验
  10. 优酷响应式在消费场景的落地之 iOS 篇
  11. 51nod 1273 旅行计划——思维题
  12. 2022年五一建模比赛A题#五一建模
  13. 用R软件绘制中国分省市地图
  14. 计算机联锁控制系统的软件应具备信号操作功能,N6_计算机联锁控制系统原理-软件原理.ppt...
  15. caffe源码学习:Blobs
  16. 键盘可以实现向计算机输入数据判断,计算机应用基础_学习指南.docx
  17. CentOS7 防火墙开放端口配置
  18. Excel竟然可以批量解锁二维码内容的操作
  19. 从零开始VCS+Verdi 安装过程
  20. 你所不知清楚的3D建模师的现状

热门文章

  1. NodeJs 项目开发小结
  2. 计算机视觉领域较好论文汇总
  3. stata 读取文件
  4. Box2DFlash如何给一个刚体的皮肤图片定位?
  5. iOS AVFoundation 自动捕获拍照
  6. 联想计算机入门,入门级首选:联想H420电脑配i3芯评测
  7. 上海澜斌计算机有限公司,CIFX 50E-DP( )
  8. 《用户体验度量》读书笔记
  9. Aconda 修改创建虚拟环境位置
  10. 中国长超细纤维市场趋势报告、技术动态创新及市场预测