code: https://github.com/xu-ji/IIC
paper: https://arxiv.org/abs/1807.06653

人类是如此擅长“无监督”,以至于我们经常用肤浅的认知作出荒谬的结论。

人类擅长“无监督”,往往是因为“滥用”过往的经验妄下结论; 而AI模型的“无监督”,是对数据“妄下”的结论。自从有了深度网络的“大锤”,曾经传统聚类的钉子(k-means, 谱聚类等)似乎都被敲了一遍。

而强行结合传统聚类的深度学习方法,缺乏语义过滤,谁能保证选取的特征都是对聚类任务有意义的?(回过头还得做PCA和白化)

为了摒弃传统聚类和神经网络的强拼硬凑,IIC(不变信息聚类)被提出 。IIC没有用传统聚类,而是对CNN稍作改动,用互信息最大化目标函数和双输入(two head)CNN的架构:

重要的地方有3点,

一, CNN网络用了双输入(不要误以为用了两个CNN,注意虚线部分是共享权重的)。为了做到无监督,模型每拿到一张图片x,都对这张图片做一次转换操作(平移、旋转或crop)得到另一张图片x’ 。因此,训练时是两次正向传播 + 一次反向传播的模式,把x,x’两张图片的两个输出z,z’一次性得到再做loss计算。

二, loss采用了互信息最大化目标函数 :

为了让模型总能在图像中辨认出(过滤出)相同类别的对象,与交叉熵(cross entropy)不同的是,最大互信息诱导出的z不会是杂乱无章的(cross entropy是对所有位一起做loss惩罚的)。最大互信息会类似one hot key,诱导每一位独立代表一个类别。

三,IIC可以用overclustering做类别更多的聚类(把那些难以聚类的对象放在更多的抽屉)。对IIC来说只要把输出的z,z’ 维数进行扩大 。

综上,IIC极力让模型学到:“当对象类别一致时,网络输出z也应该非常相似”,而最大互信息使得网络输出z有了更强的语义(对应的类别)。

比较违反直觉的是,这种无监督纯粹是把每张图像平移,旋转或crop得到成对图片的,模型最后能在这些成对图片中找到较好的聚类模式:

牛津大学|“不变信息聚类” :Invariant Information Clustering相关推荐

  1. 牛津数学与计算机专业面试三次,录取率只有7%的牛津大学计算机科学专业面试真题来了 没看过就是放弃面试了...

    计算机科学专业可谓是牛津大学的专业之一了,在2021年的QS世界大学排名全英,超过了帝国理工和剑桥大学.在2017年到2019年间,录取率只有7%.牛津大学计算机专业着重于在理论和实践之间建立联系.它 ...

  2. 最新综述:关于自动驾驶的可解释性(牛津大学)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨黄浴@知乎 来源丨https://zhuanlan.zhihu.com/p/426573034 ...

  3. 2021 牛津大学:Recent Advances in Reinforcement Learning in Finance

    Recent Advances in Reinforcement Learning in Finance 1 本文概述 本文是牛津大学2021年对 深度强化学习在金融领域内各种决策的应用 的综述文章. ...

  4. 【论文阅读】2021年牛津大学的 Survey:Recent Advances in Reinforcement Learning in Finance

    1 本文概述 本文是牛津大学2021年对 深度强化学习在金融领域内各种决策的应用 的综述文章.文章分为四个部分,第一部分是整体介绍:第二部分详细介绍了强化学习的基础知识,包括马尔科夫决策过程的定义.基 ...

  5. 快速上手:图聚类入门 Graph Clustering

    硕士研究工作基本告一段落了,静候佳音中- 其实一直想总结一下图节点聚类的一些工作,算是一个逗号吧. 个人总结,若有错误欢迎指正. 本文从问题定义入手,再到近几年的工作,最后进行横向对比,并提供一些个人 ...

  6. 牛津大学计算机系主任:上海是智慧城市的最佳“试验田”|WAIC专访

    上海正在成为AI发展的高地,这不仅表现在企业不断涌现出新的研发成果,同时也体现在上海城市发展治理的不断进步中. 在上海世界人工智能大会期间,一场中科院主办的AI科技沙龙上,有"多智能体系教父 ...

  7. 牛津大学名誉教授Colin Blakemore:大脑是如何计算的?

    智慧起航,共创未来 [导读]9月21日,英国皇家学会会士.中国工程院外籍院士.香港城市大学教授.牛津大学名誉教授Colin Blakemore在第二届中国认知计算与混合智能学术大会(CCHI2019) ...

  8. 牛津大学入学面试就这?组队选个颜色?背后的逻辑水深得很

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 如何顺利入学牛津大学? 别慌,选个颜色先. 最近,一位牛津大学的逻辑学教授发布了一个入学面试问题,在各大平台都引来了大批网友的围观和讨论. ...

  9. 下次迟到的借口有了!牛津大学发现时钟越准确,产生的熵越高

    梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 准确测量时间是有代价的. 钟表作为一种机器,像其他所有机器一样都要遵守热力学定律. 牛津大学的最新研究显示,时钟越准确,产生的熵越高 ,而且 ...

最新文章

  1. Matlab频域高/低通滤波
  2. C++中嵌套类的使用
  3. python 学习笔记 运算符优先级(8)
  4. 十大开源的.NET用户界面框架 让GUI设计不再犯难
  5. mysql分页tmp_count,MySQL MyISAM和InnoDB引擎的写入速度优化比较,分页速度优化
  6. JavaScript判断一个变量是对象还是数组
  7. jenkins 部署文档
  8. 洛谷P1373 小a和uim之大逃离 动态规划
  9. 计算机图形图像电影论文,计算机图形图像绘制技术地现状分析及应用发展.doc...
  10. 点击率预估与冷启动(一)
  11. 写给想做好社区网站人员的一本书
  12. BackgroundWorker的参数传递
  13. 兄弟7360/7460其它设备两个USB Device上、Brother BHL2-Maintenance有个问号,扫描仪无法识别
  14. 漂亮特殊字体可复制 特殊字体生成器
  15. android人脸抠图,人脸框抠图如何实现
  16. 官网Tomcat下载方法
  17. 创业板首批企业或节前招股 新公布6家上会公司
  18. 南阳oj入门题-cigarettes
  19. 基于Bootstrap的Metro风格模板
  20. python学什么内容_老男孩Python都需要学什么内容?老男孩教育

热门文章

  1. SSL==证书相关概念
  2. MySQL主从复制(一主一从)部署
  3. 每日一题---比赛安排---模拟
  4. 上海新骄阀门中秋节放假
  5. 【提高准确率方法总结】
  6. 计算机教师帮带情况,教师帮带总结
  7. clistctrl获取列高 mfc_MFC控件之CListCtrl的应用实例教程
  8. Android内存泄漏查找和解决
  9. angular checkbox 全选和反选功能
  10. iOS 跳转到Wi-Fi设置界面