一、Deep Clustering for Unsupervised Learning of Visual Features

原文链接：https://arxiv.org/pdf/1807.05520.pdf

完全不需要标签的无监督学习方法，好像是为了学习好的特征表达（当然下游任务肯定需要标签）。

网络结构

将所有 $N$ 个输入图像输入卷积神经网络得到表达（或特征）（设输入 $x_n$ 对应的输出 $f_\theta(x_n)$ ）。然后输入到两个分支：分类分支和聚类分支。

聚类分支先用某种方式聚类（如K-means），得到每张图片的“伪标签” $y_n=[0,\cdots,0,1,0,\cdots,0]$ ，并计算聚类损失（ $C$ 为待学习的参数矩阵）：

$\min_{C\in \mathbb{R}^{d\times k}}\frac{1}{N}\sum_{n=1}^N\min_{y_n\in\{0,1\}^k}\left \| f_\theta(x_n)-Cy_n \right \|^2_2$

其中 $y_n^T\mathbf{1}_k=1$ 。

分类分支则利用分类头（ $g_W$ ）预测结果，与伪标签比较，计算得到分类损失（log-softmax）：

$\min_{\theta,W}\frac{1}{N}\sum_{n=1}^Nl(g_W(f_\theta(x_n)),y_n)$

为防止出现平凡解：当一个簇 $B$ 为空时，随机选择一个非空簇 $A$ ，并使用带有小随机扰动的质心作为空簇 $B$ 的新质心。然后，将属于非空簇 $A$ 的点重新分配给两个结果簇（ $A$ 和 $B$ ）；对输入数据进行重新采样使得分布均匀。

若下游任务为图像分类，则丢掉上面的分类和聚类分支，加入新的分类头并微调。

二、ClusterNet: Deep Hierarchical Cluster Network with Rigorously Rotation- Invariant Representation for Point Cloud Analysis

原文链接：ClusterNet: Deep Hierarchical Cluster Network With Rigorously Rotation-Invariant Representation for Point Cloud Analysis | IEEE Conference Publication | IEEE Xplore

严格旋转不变（RRI）映射 $F$ 满足： $F(S)=F(R(S))$ 且映射前后点数不变。其中 $S$ 为点的集合（点云）， $R$ 为任一旋转变换。

采用如下点的表达：

$p_i=(r_i,(r_{i1},\theta_{i1},\phi_{i1}),(r_{i2},\theta_{i2},\phi_{i2}),\cdots,(r_{iK},\theta_{iK},\phi_{iK}))$ 。

其中 $p_{ik}$ 为 $p_i$ 的K近邻点之一，序号为 $k$ ； $(r_{ik},\theta_{ik},\phi_{ik})$ 分别为 $l_2$ -norm、 $T$ 变换前夹角、 $T$ 变换后夹角的最小值；变换 $T$ 为到平面 $L_i$ （与 $p_i$ 正交的平面）的正交投影变换。

本文证明了：（a）上述表达为RRI的；（b）该表达可以重建点云（即除旋转信息以外不损失信息）。

将上述表达重新表示为

$p_i=(\underbrace{(r_i,r_{i1},\theta_{i1},\phi_{i1})}_{T_{i1}},\underbrace{(r_i,r_{i2},\theta_{i2},\phi_{i2})}_{T_{i2}},\cdots,\underbrace{(r_i,r_{iK},\theta_{iK},\phi_{iK})}_{T_{iK}})$

即 $p_i=(T_{i1},T_{i2},\cdots,T_{iK})$ 。

则一个点 $p_i$ 也可以看成4维、 $K$ 个点的点云。然后用PointNet提取该点的局部信息，得到 $D$ 维特征 ${p}'_i$ 。

${p}'_i=\max_{1\leq k\leq K}f_\Theta(T_{ik})$

网络结构

其中EdgeConv（将邻居的特征聚合到每一个点，不进行下采样）：

${x}'_i=\max_{j:(i,k)\in E}f_\Theta(x_i-x_k,x_i)$

此外还提出一种评估旋转不变性的benchmark：均匀随机产生欧拉轴和旋转角，将测试集的每个点云都进行多种旋转（训练集不变），然后在增强的测试集上评估。

三、Unsupervised Feature Learning for Point Cloud Understanding by Contrasting and Clustering Using Graph Convolutional Neural Networks

原文链接：Unsupervised Feature Learning for Point Cloud Understanding by Contrasting and Clustering Using Graph Convolutional Neural Networks | IEEE Conference Publication | IEEE Xplore

不需要任何标签学习点云语义特征。

ContrastNet：将所有点云分割为两个部分得到部分集，然后在部分集随机抽取两个部分，进行二分类判断，即两个part是否属于同一点云。使用交叉熵损失。

Clustering：使用K-means++方案将所有点云的特征聚类，得到伪标签。

ClusterNet：和本文第一篇文章相同。

聚类损失如下：

$\min_{C\in \mathbb{R}^{d\times k}}\frac{1}{N}\sum_{n=1}^N\min_{y_n\in\{0,1\}^k}\left \| f_\theta(x_n)-Cy_n \right \|^2_2,\; y^T_n\mathbf{1}_k=1$

ClusterNet预测点云的伪标签，对应的损失如下：

$\min_{\theta,W}\frac{1}{N}\sum_{n=1}^Nl(g_W(f_\theta(x_n)),y_n)$

总结（个人理解）

目前的深度聚类算法就是把神经网络和聚类模型结合，总损失等于网络损失和聚类损失之和。而要有聚类损失则要求聚类方法有待优化的目标函数（如K-means、谱聚类、高斯混合模型等，这些方法往往也需要指定聚类数目）。

深度聚类相关（三篇文章）相关推荐

定义“移动互联网”的三篇文章
陈勇转载注:本文很短,但总结性很强. 冬吴相对论的一期基本上完整描述了第一篇<半成品时代的生存逻辑>,MP3地址位于:http://www.21cbr.com/html/multimedi ...
C++面试常见问答题看这三篇文章就够了（上）
目录 1. 标识符的组成结构 2. 动态关联和静态关联的区别 3. 重载(overload)和重写(overried)的区别 4. class和struct的区别 5. 构造方法的特点 6. 面向对 ...
转三篇文章关于php中session机制
解决的问题:同一数据库的两个网站,实现一次登录的功能.网上找了很多关于session的文章,最后参考了下面三篇文章有了解决问题的思路首先我这边发送要已登录A网站用户的session_id给B网站,然 ...
三篇文章入门CSS（二）
系列文章目录三篇文章入门CSS(一) 三篇文章入门CSS(二) 三篇文章入门CSS(三) 内容预警系列文章目录一.css的继承 1.样式的继承实例: 2.选择器的权重 3.RGB颜色与像素像 ...
分析RAC下一个SPFILE整合的三篇文章的文件更改
大约RAC下一个spfile分析_整理在_2014.4.17 说明:文章来源于网络第一篇:RAC下SPFILE文件改动在RAC下spfile位置的改动与单节点环境不全然一致,有些地方须要特别注意, ...
论文笔记| 几分钟看完ResNet的融合特性及冗余性分析的三篇文章
本文是博主在paper reading时的ppt,主要涉及三篇论文: 1. Residual Networks Behave Like Ensembles of Relatively Shallow ...
三篇文章了解 TiDB 技术内幕——说存储
数据库.操作系统和编译器并称为三大系统,可以说是整个计算机软件的基石.其中数据库更靠近应用层,是很多业务的支撑.这一领域经过了几十年的发展,不断的有新的进展. 很多人用过数据库,但是很少有人实现过一个 ...
小白入门深度学习 | 第三篇：30分钟入门深度学习 - TensorFlow版
文章目录一.深度学习是什么二.实现过程 1. 准备数据 2. 构建神经网络模型 3. 编译模型 4. 训练模型 5. 预测三.总结课后练手项目(附代码+讲解)
三篇文章彻底搞懂Java面向对象之一
写在前面,Java基础系列文章都是作者基于b站尚硅谷的Java基础视频所做的笔记,没有时间的同学可以认真看看,如果有时间的同学,还是建议看看视频,毕竟笔记说到底还是自己的东西,每个人的习惯也是不一样的 ...

深度聚类相关（三篇文章）

一、Deep Clustering for Unsupervised Learning of Visual Features

二、ClusterNet: Deep Hierarchical Cluster Network with Rigorously Rotation- Invariant Representation for Point Cloud Analysis

三、Unsupervised Feature Learning for Point Cloud Understanding by Contrasting and Clustering Using Graph Convolutional Neural Networks

总结（个人理解）

深度聚类相关（三篇文章）相关推荐

最新文章

热门文章