一、Deep Clustering for Unsupervised Learning of Visual Features

原文链接:https://arxiv.org/pdf/1807.05520.pdf

完全不需要标签的无监督学习方法,好像是为了学习好的特征表达(当然下游任务肯定需要标签)。

网络结构

将所有个输入图像输入卷积神经网络得到表达(或特征)(设输入对应的输出)。然后输入到两个分支:分类分支和聚类分支。

聚类分支先用某种方式聚类(如K-means),得到每张图片的“伪标签”,并计算聚类损失(为待学习的参数矩阵):

其中

分类分支则利用分类头()预测结果,与伪标签比较,计算得到分类损失(log-softmax):

为防止出现平凡解:当一个簇为空时,随机选择一个非空簇,并使用带有小随机扰动的质心作为空簇的新质心。然后,将属于非空簇的点重新分配给两个结果簇();对输入数据进行重新采样使得分布均匀。

若下游任务为图像分类,则丢掉上面的分类和聚类分支,加入新的分类头并微调。

二、ClusterNet: Deep Hierarchical Cluster Network with Rigorously Rotation- Invariant Representation for Point Cloud Analysis

原文链接:ClusterNet: Deep Hierarchical Cluster Network With Rigorously Rotation-Invariant Representation for Point Cloud Analysis | IEEE Conference Publication | IEEE Xplore

严格旋转不变(RRI)映射满足:且映射前后点数不变。其中为点的集合(点云),为任一旋转变换。

采用如下点的表达:

其中的K近邻点之一,序号为分别为-norm、变换前夹角、变换后夹角的最小值;变换为到平面(与正交的平面)的正交投影变换。

本文证明了:(a)上述表达为RRI的;(b)该表达可以重建点云(即除旋转信息以外不损失信息)。

将上述表达重新表示为

则一个点也可以看成4维、个点的点云。然后用PointNet提取该点的局部信息,得到维特征

网络结构

其中EdgeConv(将邻居的特征聚合到每一个点,不进行下采样):

此外还提出一种评估旋转不变性的benchmark:均匀随机产生欧拉轴和旋转角,将测试集的每个点云都进行多种旋转(训练集不变),然后在增强的测试集上评估。

三、Unsupervised Feature Learning for Point Cloud Understanding by Contrasting and Clustering Using Graph Convolutional Neural Networks

原文链接:Unsupervised Feature Learning for Point Cloud Understanding by Contrasting and Clustering Using Graph Convolutional Neural Networks | IEEE Conference Publication | IEEE Xplore

不需要任何标签学习点云语义特征。

ContrastNet:将所有点云分割为两个部分得到部分集,然后在部分集随机抽取两个部分,进行二分类判断,即两个part是否属于同一点云。使用交叉熵损失。

Clustering:使用K-means++方案将所有点云的特征聚类,得到伪标签。

ClusterNet:和本文第一篇文章相同。

聚类损失如下:

ClusterNet预测点云的伪标签,对应的损失如下:

总结(个人理解)

目前的深度聚类算法就是把神经网络和聚类模型结合,总损失等于网络损失和聚类损失之和。而要有聚类损失则要求聚类方法有待优化的目标函数(如K-means、谱聚类、高斯混合模型等,这些方法往往也需要指定聚类数目)。

深度聚类相关(三篇文章)相关推荐

  1. 定义“移动互联网”的三篇文章

    陈勇转载注:本文很短,但总结性很强. 冬吴相对论的一期基本上完整描述了第一篇<半成品时代的生存逻辑>,MP3地址位于:http://www.21cbr.com/html/multimedi ...

  2. C++面试常见问答题看这三篇文章就够了(上)

    目录 1. 标识符的组成结构 2. 动态关联和静态关联的区别 3.  重载(overload)和重写(overried)的区别 4. class和struct的区别 5. 构造方法的特点 6. 面向对 ...

  3. 转三篇文章关于php中session机制

    解决的问题:同一数据库的两个网站,实现一次登录的功能.网上找了很多关于session的文章,最后参考了下面三篇文章有了解决问题的思路 首先我这边发送要已登录A网站用户的session_id给B网站,然 ...

  4. 三篇文章入门CSS(二)

    系列文章目录 三篇文章入门CSS(一) 三篇文章入门CSS(二) 三篇文章入门CSS(三) 内容预警 系列文章目录 一.css的继承 1.样式的继承 实例: 2.选择器的权重 3.RGB颜色与像素 像 ...

  5. 分析RAC下一个SPFILE整合的三篇文章的文件更改

    大约RAC下一个spfile分析_整理在_2014.4.17 说明:文章来源于网络 第一篇:RAC下SPFILE文件改动 在RAC下spfile位置的改动与单节点环境不全然一致,有些地方须要特别注意, ...

  6. 论文笔记| 几分钟看完ResNet的融合特性及冗余性分析的三篇文章

    本文是博主在paper reading时的ppt,主要涉及三篇论文: 1. Residual Networks Behave Like Ensembles of Relatively Shallow ...

  7. 三篇文章了解 TiDB 技术内幕——说存储

    数据库.操作系统和编译器并称为三大系统,可以说是整个计算机软件的基石.其中数据库更靠近应用层,是很多业务的支撑.这一领域经过了几十年的发展,不断的有新的进展. 很多人用过数据库,但是很少有人实现过一个 ...

  8. 小白入门深度学习 | 第三篇:30分钟入门深度学习 - TensorFlow版

    文章目录 一.深度学习是什么 二.实现过程 1. 准备数据 2. 构建神经网络模型 3. 编译模型 4. 训练模型 5. 预测 三.总结 课后练手项目(附代码+讲解)

  9. 三篇文章彻底搞懂Java面向对象之一

    写在前面,Java基础系列文章都是作者基于b站尚硅谷的Java基础视频所做的笔记,没有时间的同学可以认真看看,如果有时间的同学,还是建议看看视频,毕竟笔记说到底还是自己的东西,每个人的习惯也是不一样的 ...

最新文章

  1. 使用Remix编译和部署以太坊智能合约
  2. 转:Tkinter教程之Text(2)篇
  3. 2019上海车展展后报告(整车篇)
  4. python如何训练模型生产_手把手教你用Python构建你的第一个多标签图像分类模型(附案例)...
  5. citrix 路径遍历 rce漏洞(CVE-2019-19781)
  6. 皮一皮:这真是兄弟能做的事???
  7. 有关绑定没有数据显示的问题
  8. css --- 弹性盒子
  9. java 上传 进度,关于 javaweb的文件上传实时显示进度
  10. 几篇关于【核心网】MME、PGW、SGW和PCRF的介绍
  11. 中兴、深度、中国电子打造 UOS 统一操作系统:开源、支持龙芯和海思等国产处理器
  12. 4.11 一维到三维推广
  13. 怎样才能够修改PDF文件中的文字大小
  14. web前端网页制作 小组作业(制作一个简单的小网页)
  15. 一二线城市互联网公司汇总,助你拿高薪!
  16. 天猫精灵智能设备对接(2)
  17. 2021年中国机动车、汽车和新能源汽车保有量及驾驶人和驾驶证业务办理情况分析「图」
  18. 如何用qq远程桌面链接到计算机,如何用qq远程控制电脑_qq怎么远程连接对方的电脑-win7之家...
  19. 虚拟化Citrix Prob “VDI态势感知” 功能介绍
  20. fastjson的漏洞解决—2020年5月28日

热门文章

  1. 如何使用Smartproxy IP代理
  2. ECharts:echarts-wordcloud词云图
  3. offictab,word ,excel多窗口插件
  4. 使用AKLocationManager定位
  5. [免费专栏] Android安全之动态调试APP的一些技巧「Android Studio调试」
  6. Python进行假设检验
  7. 逆向工程核心原理——PE文件格式分析
  8. keil遇到FCARM - Output Name not specified, please check 'Options for Target - Utilities'解决方法
  9. Python彼岸图简易图片爬取保存
  10. 关于Color Space是Gamma还是Linear的一些问题