Frequency Estimation in Local and Multiparty Differential Privacy

此为Graham Cormode在ICLR2021上的讲座笔记,由于对这块尚未开始研究,内容有待校正,建议观看原视频。
LDP部分参考论文 Frequency estimation under local differential privacy
MDP部分参考论文 Frequency Estimation Under Multiparty Differential Privacy: One-shot and Streaming

本次讲座主要介绍在Frequency Estimation 上的两种差分隐私机制:Local differential privacy 和 multiparty differential privacy

在LDP中重要介绍了

  • 利用Sketch 实现维度下降
  • 使用树型结构实现高效准确的Heavy Hitter
  • LDP的四层结构

在MDP中介绍了

  • one-shot MDP协议,即一个瞬间的MDP协议
  • Streaming MDP协议,即一个时间段的MDP协议。计算包括两个部分
    • intra-epoch
    • inter-epoch

1. Preliminary

1.1 介绍Local Differential Privacy

1.2 介绍 Multiparty Differential Privacy

多方差分隐私 是本地模型和中心化模型的一种概括

  1. 存在k个本地实体p1 ~ pk,一个中心聚合器p0
  2. 与本地差分隐私的区别:一个本地实体不再只有一条数据,而是存在一个数据集Di
  3. N个本地实体相互隔离,每个本地实体有ni条数据,总计N=Σni

Multiparty Differential Privacy 定义

Multipart Differential Privacy 与LDP 和 CDP相互转化

  • 当ni=1时,Multiparty DP等价于LDP
  • 当k=1时,Multiparty DP等价于CDP

1.3 The Frequency Estimation Problem

在multiparty中频率估计的定义

frequency estimation 关注的问题是:如何在有限的绝对误差下提高准确率 & 允许随机化,实现在p较大时,相对较小的误差

Heavy Hitters 介绍

Frequency Estimation 和 Heavy Hitters 时许多复杂问题的基础,比如流算法、分布式算法、sketch算法、压缩感知等等,隐私的算法往往时基于这些已有的算法进行改进和拓展的

Two Linear transforms for LDP and MDP

Hadamard transform

是二进制超立方体的离散傅里叶变换

对稀疏矩阵进行hadamard 变换得到稠密矩阵

Count-Sketch

2 LDP-FO

2.1 FO

针对数值值域d的大小进行分析,当d较大时,将大维度映射到小维度,两种方法:

  • Hash-based
  • Hadamard response

当d特别大时,采用sketch操作,实现维度下降

2.2 Heavy Hitter Searching

频繁项估计:如果通过罗列所有的频率得到将会花销太大

为了限制搜索空间并降低时间开销,提出如下两种方法:

  1. expectation maximization:将string划分为多个substring,然后再恢复频繁项
  2. puzzle piece

其中一种方法是利用树形结构

所有的叶子节点都是individual items,即string;所有的内部节点都是prefix,即前缀

如果一个叶子节点是heavy hitter,那么他的每个祖先prefix 都是heavy hitter

那么在利用树型结构进行遍历的过程中,发现不是heavy hitter的prefix,则无需再向下遍历子孙节点,

2.3 LDP data collection bakeoff

实验结果

3. MDP-FO

3.1 Basic one-shot ε-MDP protocol

提高准确率措施:

假设知道item的总值N

这过程产生了两类误差:sketches误差、noise误差

比单纯地在每个item上添加LDP要来的 less communication & more accuracy

3.2 Streaming MDP Protocol for sliding windows

在流模型中,每个参与方在每个时间戳收到一个新的item

  • 我们希望计算item j在时间段 t1到t1+w的频率估计

使用两个协议实现:

  • intra-epoch:在收到新的item的时间点
  • inter-epoch:所有之前的时间段

intra-epoch

在最新的时间点t,进行两个操作:采样+LDP

  1. 每个参与方i,以p的概率采样是否参加
  2. 如果参加,则以LDP协议报告自己的数据项

采样概率p的选择,总的误差

高效的,但是误差随着时间增大,故要限制epoch size

inter-epoch protocol
  • 每个叶子节点是一个epoch,任何一个时间窗口都可以表示为一个epoch的数据收集
  • 对于每个内部节点使用 one-shot MDP协议

MDP 实验结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-auwgF9l9-1638792724741)(C:\Users\CLOUDNESS\AppData\Roaming\Typora\typora-user-images\image-20211206195927362.png)]

Conclusion

Frequency Estimation in Local and Multiparty Differential Privacy相关推荐

  1. Frequency Estimation Heavy Hitter under Local Differential Privacy的一些重要组件

    Frequency Estimation under Local Differential Privacy 该论文是一个综述类(survey)文章,主要介绍了一个 公共框架--将各种不同的LDP协议放 ...

  2. Locally Differential for Frequency Estimation

    Frequency Estimation LDP 参考文献: Wang T, Blocki J, Li N, et al., 2017. Locally Differentially Private ...

  3. Locally Differential Private Frequency Estimation with Consistency: LDP的主流后处理算法

    Locally Differential Private Frequency Estimation with Consistency 目录 Locally Differential Private F ...

  4. 论文解读2019INFOCOM_Calibrate: Frequency Estimation and Heavy Hitter Identification with LDP

    以下是本人对该论文的解读,如有不当,欢迎批评指正 INTRODUCTION 频数估计(frequency estimation)是高级数据分析的基础,有非常广泛的应用.比如每个网页作为一个item,谷 ...

  5. Repo:Deep Learning with Differential Privacy

    翻译参考:https://blog.csdn.net/qq_42803125/article/details/81232037 >>>Introduction: 当前的神经网络存在的 ...

  6. 差分隐私(Differential Privacy)

    差分隐私(Differential privacy)最早于2008年由Dwork 提出,通过严格的数学证明,使用随机应答(Randomized Response)方法确保数据集在输出信息时受单条记录的 ...

  7. Differential privacy——差分隐私

    Q: 首先我们要明白什么是隐私? 在百度百科上是这样解释的 " 隐私,顾名思义,隐蔽.不公开的私事",即指个人的不愿公开的私事或秘密.那么在互联网信息泛滥的情况下,我们希望我们的数 ...

  8. differential privacy 学习笔记(一)

    differential privacy学习笔记(一) 什么是differential pravicy differential privacy通常被翻译成差分隐私,为了了解什么是差分隐私,我们需要定 ...

  9. 差分隐私相关论文(2) —— Deep Learning with Differential Privacy, Abadi 2016

    本文向大家介绍一下一篇CCS 2016的工作,文章的名字叫Deep Learning with Differential Privacy,在网上应该很容易就能找到,如果有朋友找不到还有兴趣的话可以私信 ...

最新文章

  1. 【怎样写代码】参数化类型 -- 泛型(七):泛型方法
  2. 教你创建高大上的多边形字体
  3. Python基础教程:list中的append()和extend()方法区别
  4. 网易云创大会如何论道科技+教育?
  5. Duilib教程-HelloDuilib及DuiDesigner的简单使用
  6. 哨兵系列卫星_智利Panguipulli湖的卫星遥感水特征时空变化图
  7. 9-[记录操作]--数据的增删改,权限管理
  8. DTC精彩回顾—王义成:国产数据库技术发展的探索与思考
  9. CentOS下NTP安装配置
  10. Dato for Mac(菜单栏时钟工具)支持m1
  11. chapter 9 series
  12. c语言中max的用法。
  13. 用Unity同时开发【微信小游戏】【安卓】【IOS】游戏#6.2 WebSocket通信
  14. html设置成电脑桌面背景,电脑桌面背景怎么更换 电脑桌面背景不能设置怎么办...
  15. mysql字符串分割为数组_mysql下将分隔字符串转换为数组
  16. Pytorch----卷积神经网络(CNN,图像边缘检测 , Sobel滤波器 , Scharr滤波器)--入门级小实例(逐行注释)---学习笔记
  17. ICLR22 自监督graph learning------------AUTOMATED SELF-SUPERVISED LEARNING FORGRAPHS--- 密歇根州立
  18. AirPods 2支持无限充电只要15分钟充满
  19. 小度智能音箱维修点_小度音箱客服电话
  20. format格式化输出

热门文章

  1. 7月更新速递 | 产品实验室N+1,EasyV For Unreal上线!
  2. 宝讯网捷电商:拼多多怎么扫条形码找商品?
  3. 时代周刊》:用形象化的老办法对付大数据
  4. 一个好用的JSON转义工具网站,用于C开发
  5. storm示例之DRPC
  6. Storm之同步服务DRPC
  7. 痛定思痛,30岁的迷茫程序员
  8. Dev c++ 下 使用SFML
  9. 进行requests请求时:InsecureRequestWarning: Unverified HTTPS request is being made to host 127.0.0.1. Ad
  10. MySQL的自身防御机制_心理学考点之自我防御机制—升华、补偿