方法:提出federated shapley value:①保留了规范SV的理想特性②可以在不产生额外通信成本的情况下进行计算③能够捕获参与顺序对数据值的影响
目的: 为了公平的评价数据源,补偿数据所有者对培训过程的贡献。
结论: 证明了有效性

为了公平的评价数据源,补偿数据所有者对培训过程的贡献。——>①Shapley Value要全面评估数据源的每个子集上的模型性能,通信成本高昂。②规范的SV在训练过程中忽视了数据源的顺序,与联邦学习顺序性质相冲突。——>提出federated shapley value:①保留了规范SV的理想特性②可以在不产生额外通信成本的情况下进行计算③能够捕获参与顺序对数据值的影响——>证明了有效性

SV确保:
①模型的所有收益分布在数据源之间
②根据数据所有者对学习过程的实际贡献,分配给数据所有者的值
③当多次使用时,数据的值会累加
FSV用于评估分散的顺序数据:
①可以从每次训练迭代的局部模型更新中确定,不会产生额外的通信成本
②可以捕捉参与顺序对数据值的影响,因为它检查了学习过程中每个玩家子集按照实际参与顺序所带来的性能提升
③保留了规范SV所需要的特性 
提出了一种有效的蒙特卡罗(Monte Carlo)方法计算FSV
进行了噪声标签检测、敌对参与者检测、不同基准数据集上的数据汇总

相关工作:
基于查询的定价,将价格附加到用户发起的查询上
基于数据属性的定价,使用公共价格登记,根据数据年龄和可信度等参数构建价格模型
基于拍卖的定价,即基于拍卖动态设定价格
——>无法适应数据作为一种商品的独特属性(例如:数据源的值取决于下游学习任务和用于解决任务的其他数据源)
标准SV的两个重要假设:
①在每个数据点组合上的训练性能是可测量的
②性能不依赖于训练数据的顺序
——>对于集中学习来说,这两个假设是合理的,因为协调器可以访问整个数据,而且在用于培训之前,数据经常被打乱。但是对联邦设置不再有效。
关于定价数据的两个线程:
①在不同参与者之间的数据质量、通信带宽和计算能力差异的情况下,激励参与的机制设计。
②如何测量数据质量,并根据数据质量共享联邦模型产生的利润

016 A Principled Approach to Data Valuation for Federated Learning(评价 federated shapley value)相关推荐

  1. IBM Machine Learning学习笔记(一)——Exploratory Data Analysis for Machine Learning

    数据的探索性分析 1. 读入数据 (1)csv文件读取 (2)json文件读取 (3)SQL数据库读取 (4)Not-only SQL (NoSQL)读取 (5)从网络中获取 2. 数据清洗 (1)缺 ...

  2. 联邦学习 + 脏数据+Approaches to address the data skew problem in federated learning

    Menu 联邦学习 Fair Resource Allocation in Federated Learning 背景 贡献 FedAvg q-FFL 解决方法 Fed Avg-Style q-Fai ...

  3. 【论文笔记】Personalized Federated Learning with Theoretical Guarantees: A MAML Approach

    Personalized Federated Learning with Theoretical Guarantees: A Model-Agnostic Meta-Learning Approach ...

  4. 联邦学习-论文阅读-Incentive Mechanism for Reliable Federated Learning: A Joint Optimization Approach to Comb

    Incentive Mechanism for Reliable Federated Learning: A Joint Optimization Approach to Combining Repu ...

  5. 基于联邦学习的多源异构数据融合算法 Multi-Source Heterogeneous Data Fusion Based on Federated Learning

    5.基于联邦学习的多源异构数据融合算法 Multi-Source Heterogeneous Data Fusion Based on Federated Learning 摘要:随着科技的迅猛发展, ...

  6. Federated Learning with Non-IID Data

    Federated Learning with Non-IID Data 论文中分析了FedAvg算法在Non-IID数据时,准确率下降的原因.并提出共享5%的数据可提高准确率. 论文笔记参考:htt ...

  7. Tackling Data Heterogeneity in Federated Learning with Class Prototypes, AAAI 2023

    Tackling Data Heterogeneity in Federated Learning with Class Prototypes 作者举了个栗子 分割线----------------- ...

  8. Federated Learning with Non-IID Data 论文笔记

      本文提出联邦学习中的由于Non-IID数据分布而精度降低是因为权重分散(weight divergence),而权重散度可以用搬土距离(EMD)量化,最后提出了一种策略:通过创建一个在所有边缘设备 ...

  9. Blockchain Empowered Asynchronous Federated Learning for Secure Data Sharing in Internet of Vehicles

    <Blockchain Empowered Asynchronous Federated Learning for Secure Data Sharing in Internet of Vehi ...

最新文章

  1. 【Java基础】面向对象特性
  2. iOS 即时聊天键盘处理
  3. QEMU — Guest Agent
  4. X Window、GNOME和KDE之间的关系
  5. web python selenium自动化面试题_干货分享 | Selenium 自动化测试相关的面试题
  6. UNIX网络编程——fcntl函数
  7. Hadoop源代码分析(二)
  8. ExtJs非Iframe框架加载页面实现
  9. Redis在游戏服务器中的应用
  10. 编译libpng出错:pnglibconf.c fatal error: zlib.h 没有那个文件或目录
  11. linux开机进入不了系统安装软件,揭秘linux系统启动流程,面试官问起来再也不怕了...
  12. 华为发布IdeaHub S2系列,与华为云会议结合更强大
  13. [源码和报告分享]基于Java的局域网聊天工具
  14. 规格说明书:吉林市一日游
  15. ROS 使用 gazebo 仿真时遇到的问题
  16. FEDORA9安装后的配置lvlv全记录必看一览表 解决FC9安装后网络需激活
  17. (C++学习笔记七)运算符重载
  18. 神作!Python 入门神图,一图搞定!
  19. 先成家后立业还是先立业后成家?
  20. 高级办公自动化试题及答案(一)

热门文章

  1. Kali--渗透攻击Mysql数据库服务
  2. 大数据量报表展现慢容易卡死,怎么办?
  3. 戎美股份上市首日破发:市盈率达到49倍,郭健夫妇身价48亿元
  4. QQ显好友IP地址插件2018版:支持最新版的QQ
  5. vant 组件van-tabbar实现底部导航
  6. Floyd算法(弗洛伊德算法) 百度百科
  7. 定型“体验+大数据”模式 大悦城走出“弯路”
  8. 百炼智能店店通数据:2020年下半年餐饮行业闭店率超30%
  9. 解读领跑全国的区块链发展“北京方案”:设专项基金,构建开源生态
  10. 必应首页背景图片抓包-截取api