深度聚类相关(三篇文章)
一、Deep Clustering for Unsupervised Learning of Visual Features
原文链接:https://arxiv.org/pdf/1807.05520.pdf
完全不需要标签的无监督学习方法,好像是为了学习好的特征表达(当然下游任务肯定需要标签)。
网络结构
将所有个输入图像输入卷积神经网络得到表达(或特征)(设输入对应的输出)。然后输入到两个分支:分类分支和聚类分支。
聚类分支先用某种方式聚类(如K-means),得到每张图片的“伪标签”,并计算聚类损失(为待学习的参数矩阵):
其中。
分类分支则利用分类头()预测结果,与伪标签比较,计算得到分类损失(log-softmax):
为防止出现平凡解:当一个簇为空时,随机选择一个非空簇,并使用带有小随机扰动的质心作为空簇的新质心。然后,将属于非空簇的点重新分配给两个结果簇(和);对输入数据进行重新采样使得分布均匀。
若下游任务为图像分类,则丢掉上面的分类和聚类分支,加入新的分类头并微调。
二、ClusterNet: Deep Hierarchical Cluster Network with Rigorously Rotation- Invariant Representation for Point Cloud Analysis
原文链接:ClusterNet: Deep Hierarchical Cluster Network With Rigorously Rotation-Invariant Representation for Point Cloud Analysis | IEEE Conference Publication | IEEE Xplore
严格旋转不变(RRI)映射满足:且映射前后点数不变。其中为点的集合(点云),为任一旋转变换。
采用如下点的表达:
。
其中为的K近邻点之一,序号为;分别为-norm、变换前夹角、变换后夹角的最小值;变换为到平面(与正交的平面)的正交投影变换。
本文证明了:(a)上述表达为RRI的;(b)该表达可以重建点云(即除旋转信息以外不损失信息)。
将上述表达重新表示为
即。
则一个点也可以看成4维、个点的点云。然后用PointNet提取该点的局部信息,得到维特征。
网络结构
其中EdgeConv(将邻居的特征聚合到每一个点,不进行下采样):
此外还提出一种评估旋转不变性的benchmark:均匀随机产生欧拉轴和旋转角,将测试集的每个点云都进行多种旋转(训练集不变),然后在增强的测试集上评估。
三、Unsupervised Feature Learning for Point Cloud Understanding by Contrasting and Clustering Using Graph Convolutional Neural Networks
原文链接:Unsupervised Feature Learning for Point Cloud Understanding by Contrasting and Clustering Using Graph Convolutional Neural Networks | IEEE Conference Publication | IEEE Xplore
不需要任何标签学习点云语义特征。
ContrastNet:将所有点云分割为两个部分得到部分集,然后在部分集随机抽取两个部分,进行二分类判断,即两个part是否属于同一点云。使用交叉熵损失。
Clustering:使用K-means++方案将所有点云的特征聚类,得到伪标签。
ClusterNet:和本文第一篇文章相同。
聚类损失如下:
ClusterNet预测点云的伪标签,对应的损失如下:
总结(个人理解)
目前的深度聚类算法就是把神经网络和聚类模型结合,总损失等于网络损失和聚类损失之和。而要有聚类损失则要求聚类方法有待优化的目标函数(如K-means、谱聚类、高斯混合模型等,这些方法往往也需要指定聚类数目)。
深度聚类相关(三篇文章)相关推荐
- 定义“移动互联网”的三篇文章
陈勇转载注:本文很短,但总结性很强. 冬吴相对论的一期基本上完整描述了第一篇<半成品时代的生存逻辑>,MP3地址位于:http://www.21cbr.com/html/multimedi ...
- C++面试常见问答题看这三篇文章就够了(上)
目录 1. 标识符的组成结构 2. 动态关联和静态关联的区别 3. 重载(overload)和重写(overried)的区别 4. class和struct的区别 5. 构造方法的特点 6. 面向对 ...
- 转三篇文章关于php中session机制
解决的问题:同一数据库的两个网站,实现一次登录的功能.网上找了很多关于session的文章,最后参考了下面三篇文章有了解决问题的思路 首先我这边发送要已登录A网站用户的session_id给B网站,然 ...
- 三篇文章入门CSS(二)
系列文章目录 三篇文章入门CSS(一) 三篇文章入门CSS(二) 三篇文章入门CSS(三) 内容预警 系列文章目录 一.css的继承 1.样式的继承 实例: 2.选择器的权重 3.RGB颜色与像素 像 ...
- 分析RAC下一个SPFILE整合的三篇文章的文件更改
大约RAC下一个spfile分析_整理在_2014.4.17 说明:文章来源于网络 第一篇:RAC下SPFILE文件改动 在RAC下spfile位置的改动与单节点环境不全然一致,有些地方须要特别注意, ...
- 论文笔记| 几分钟看完ResNet的融合特性及冗余性分析的三篇文章
本文是博主在paper reading时的ppt,主要涉及三篇论文: 1. Residual Networks Behave Like Ensembles of Relatively Shallow ...
- 三篇文章了解 TiDB 技术内幕——说存储
数据库.操作系统和编译器并称为三大系统,可以说是整个计算机软件的基石.其中数据库更靠近应用层,是很多业务的支撑.这一领域经过了几十年的发展,不断的有新的进展. 很多人用过数据库,但是很少有人实现过一个 ...
- 小白入门深度学习 | 第三篇:30分钟入门深度学习 - TensorFlow版
文章目录 一.深度学习是什么 二.实现过程 1. 准备数据 2. 构建神经网络模型 3. 编译模型 4. 训练模型 5. 预测 三.总结 课后练手项目(附代码+讲解)
- 三篇文章彻底搞懂Java面向对象之一
写在前面,Java基础系列文章都是作者基于b站尚硅谷的Java基础视频所做的笔记,没有时间的同学可以认真看看,如果有时间的同学,还是建议看看视频,毕竟笔记说到底还是自己的东西,每个人的习惯也是不一样的 ...
最新文章
- 使用Remix编译和部署以太坊智能合约
- 转:Tkinter教程之Text(2)篇
- 2019上海车展展后报告(整车篇)
- python如何训练模型生产_手把手教你用Python构建你的第一个多标签图像分类模型(附案例)...
- citrix 路径遍历 rce漏洞(CVE-2019-19781)
- 皮一皮:这真是兄弟能做的事???
- 有关绑定没有数据显示的问题
- css --- 弹性盒子
- java 上传 进度,关于 javaweb的文件上传实时显示进度
- 几篇关于【核心网】MME、PGW、SGW和PCRF的介绍
- 中兴、深度、中国电子打造 UOS 统一操作系统:开源、支持龙芯和海思等国产处理器
- 4.11 一维到三维推广
- 怎样才能够修改PDF文件中的文字大小
- web前端网页制作 小组作业(制作一个简单的小网页)
- 一二线城市互联网公司汇总,助你拿高薪!
- 天猫精灵智能设备对接(2)
- 2021年中国机动车、汽车和新能源汽车保有量及驾驶人和驾驶证业务办理情况分析「图」
- 如何用qq远程桌面链接到计算机,如何用qq远程控制电脑_qq怎么远程连接对方的电脑-win7之家...
- 虚拟化Citrix Prob “VDI态势感知” 功能介绍
- fastjson的漏洞解决—2020年5月28日
热门文章
- 如何使用Smartproxy IP代理
- ECharts:echarts-wordcloud词云图
- offictab,word ,excel多窗口插件
- 使用AKLocationManager定位
- [免费专栏] Android安全之动态调试APP的一些技巧「Android Studio调试」
- Python进行假设检验
- 逆向工程核心原理——PE文件格式分析
- keil遇到FCARM - Output Name not specified, please check 'Options for Target - Utilities'解决方法
- Python彼岸图简易图片爬取保存
- 关于Color Space是Gamma还是Linear的一些问题