由智谱 AI 和数据竞赛平台 biendata 联合组织的 KDD Cup 2020 目前已经全面展开。本次比赛采用了创新的赛题和赛制,主题为图数据的攻防。本次比赛奖金 2 万美元。 

KDD Cup 由 ACM SIGKDD 主办,是全世界影响力最大的数据竞赛,有“数据世界杯”之称。今年的 KDD Cup 是智谱 AI 第一次参与 KDD Cup,也是 biendata 承办的第四道 KDD Cup 赛题。目前,biendata 已是全球承办 KDD Cup 赛题最多的平台之一。

参赛方法

查看比赛详情,请点击阅读原文或扫描下图二维码。

比赛背景

在自然界和社会科学中,图结构无处不在,包括分子结构、社交网络、论文引用网络和细胞信号通路等。其中,最早于 1965 年被提出的论文引用网络 [1] 是一种典型的图结构:论文是节点,引用关系是边。研究论文引用网络可以在很多领域得到引用,比如科学影响评估,知识发现,以及技术预见等。

深度学习已经在很多领域获得了成功。最近,研究者发现很多深度学习技术可以用于图数据 [2] 。不过,深度学习模型非常容易受到攻击。一个非常类似原数据的对抗样本,可以极大地拉低分类器的性能 [3]。这种情况在图数据上也会出现。2018 年的 KDD 最佳论文就发现极其轻微的扰动就能让节点分类器的准确率大幅下降 [4]。在论文引用网络中,可能存在多种类型的对抗攻击。例如,预打印论文网站(如 arxiv)中的论文因为无需同行评议,所以存在很多低质量的引用 [5]。另一种是虚假引用(coercive citation)。2019 年,《自然》杂志报道了著名出版商爱思唯尔调查发现数百名研究人员通过操纵同行评议流程,增加自己的论文引用数 [6]。

这些对引文网络的攻击不仅会降低公众对科技行业的信任,也会损害对学术数据进行定量分析的努力。所以,我们组织这次比赛,希望可以研究如何攻击和防御学术图数据。

比赛任务

本次比赛分为两个阶段。

阶段I:攻击组织者的模型

在本次比赛中,参赛队伍需要对组织者提供的图数据进行攻击,并拉低组织者的节点分类器的准确率。已有的图包括 593,486 个节点,每个节点都有一个 100 维的特征。其中 543,486 个节点是训练数据,50,000 个节点是测试数据。组织者在后台提供一个节点分类器,为 50,000 个测试节点进行分类。分类器不会被发布。

参赛选手可以添加不超过 500 个新的节点,达到干扰图数据的结果。每个新的节点最多只能有 100 条边。包含了新节点的图将会干扰分类器,降低分类器的性能。如果降低的幅度越大,干扰的效果就越好。

图说:参赛选手需要提交一个很小的矩阵,对原图邻接矩阵略微修改,并试图拉低分类器的性能。

训阶段II:队伍之间的攻防 

在第二阶段,参赛队伍需要根据一个新的图数据集,同时提交攻击和防御器。组织者将在比赛后匹配所有参赛队伍的攻击和防御,计算分数。

比赛讨论群

已添加过“数据竞赛小助手”的选手,请直接私信:机构+姓名+KDD。由数据竞赛小助手邀请加入比赛讨论群。

如果没有添加,请添加 biendata 小助手,可以通过以下二维码添加小助手好友,添加请备注“机构+姓名+KDD”,备注格式不正确将不予通过。

公益合作

AI Time、学术头条

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

图数据的攻与防:智谱AI和biendata联合组织KDD Cup 2020相关推荐

  1. KDD Cup 2020 自动图学习比赛冠军技术方案及在美团广告的实践

    ACM SIGKDD (国际数据挖掘与知识发现大会,简称 KDD)是数据挖掘领域的国际顶级会议. 美团到店广告平台搜索广告算法团队基于自身的业务场景,一直在不断进行前沿技术的深入优化与算法创新.团队的 ...

  2. 智谱AI多项成果惊艳亮相2021北京智源大会

    来源:学术头条 2021 年 6 月 1 日,由北京智源人工智能研究院(以下简称 "智源")主办的 2021 北京智源大会在北京中关村国家自主创新示范区会议中心成功开幕.包括 Yo ...

  3. 哈工大大数据实验_【新闻动态】南京大学PASA大数据实验室在KDD Cup 2020 AutoGraph自动化图数据建模国际挑战赛中荣获第二名...

    近期,在素有"数据世界杯"之称的KDD Cup 2020数据挖掘国际大赛AutoML自动化机器学习赛道(AutoGraph自动化图数据建模)中,南京大学PASA大数据实验室代表队P ...

  4. 自动抓取app数据的攻与防

    当我们发布了一款app后,一般我们并不想让别人获取我们的app数据,更不希望别人调用我们的app后端服务api.一些抢购场景尤其重要,比如:在线预约医院专家号(知名专家的号往往一票难求),在线抢购商品 ...

  5. 47万实例数据集,智源联合旷视发布2020 CrowdHuman人体检测大赛

    2020 年 5 月,北京智源人工智能研究院联合旷视科技共同开启了2020 CrowdHuman人体检测大赛,并同步发布了大规模人体检测数据集.本次比赛的训练集和验证集共有470,000个人类实例,平 ...

  6. 今天19:30 | 复旦大学青年副研究员许嘉蓉—《基于图数据的鲁棒机器学习 》

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 6月7日19:30,本期我们邀请到复旦大学青年副研究员许嘉蓉给大家带来精彩的分享! 哔哩哔哩直播通道 扫码关注AI TIME哔哩哔哩官方 ...

  7. 智能安全的“攻与防之歌”——极智汇,即将登陆首都

    随着新科技的普及,智能产品已经成为生活的一部分,而随之而来的是可能给用户带来的安全风险:隐私安全.财产安全甚至人身安全.在历届GeekPwn极棒黑客大赛上,包括智能车.路由器.无人机.智能手机.电视盒 ...

  8. 独家食用指南系列|Android端SQLCipher的攻与防新编

    大家好,今天给大家的是本周技术拆解官的第二篇文章,主题依然是沿用上一篇文章的主题–Android端SQLite的"食用指南",上篇文章我们讲到了基本的SQLite的定义.使用方法以 ...

  9. 智能家居网络安全攻与防

    背景 物联网将会成为继互联网之后的下一个暴发点,目前以有不少公司已进入该领域. 智能家居作为物联网中最具有潜力的领域,网络安全是必须引起重视的课题.在互联网领域中,用户去安全性的敏感度并不是那个高.但 ...

最新文章

  1. BZOJ1946 : [Ceoi2006]ANTENNA
  2. golang 文件 文件夹 创建 读取 移动 复制 写入 遍历
  3. 玩转SSRS第十篇---自定义代码
  4. Winform中对xml文件进行保存时空白节点自动换行问题的解决
  5. pygame游戏开发入门例子
  6. Linux 命令 find / -ctime +1 真的是查找1天前创建的文件咩?
  7. Elasticsearch的Watcher插件
  8. String s String s=null和String s=a区别
  9. 文件——rstrip() 、lstrip()和 strip()、zip() 函数
  10. asp.net 2.0中实现防盗链
  11. Drools workbench kie-server部署和简单使用(全流程
  12. 得到 jason中 string 的值_简单高性能的Json解析器: Jason
  13. (二十六)Storm常见错误及处理方法
  14. gwas snp 和_【交流】关于SNP与GWAS(Genome Wide Association study)的一些想法
  15. android-player 本地服务器联调
  16. Git 命令行其实真的很好用
  17. 成年人改名字要哪些步骤和手续?
  18. 1104-捷径(DP)
  19. java字母正则表达式,带有国际字母的Java正则表达式
  20. jquery弹出层,带朦胧层。

热门文章

  1. 案例十:输入一批整数,输出其中的最大值和最小值,输入数字0时结束循环。...
  2. hadoop程序实例
  3. D - Connect the Cities (HDU - 3371)
  4. 基本的maven的命令行命令
  5. SQL、LINQ、Lambda 三种用法(转)
  6. OA项目15:权限管理实体设计及映射
  7. poj 1041(欧拉回路+输出字典序最小路径)
  8. XAML概要--事件和后台代码
  9. vue router html后缀,vue-router.html
  10. java socket输入流_java – Socket输入流挂在最后读取.最好的办法呢?