TSNE—聚类结果可视化

文章目录

一、TSNE参数解析
二、案例

TSNE的定位是高维数据可视化。对于聚类来说，输入的特征维数是高维的(大于三维)，一般难以直接以原特征对聚类结果进行展示。而TSNE提供了一种有效的数据降维模式，是一种非线性降维算法，让我们可以在2维或者3维的空间里展示聚类结果。

一、TSNE参数解析

t-SNE是一个可视化高维数据的工具。它将数据点之间的相似性转换为联合概率，并试图最小化低维嵌入数据和高维数据联合概率之间的KL散度。t-SNE具有非凸的代价函数，即不同的初始化可以得到不同的结果。

class sklearn.manifold.TSNE(n_components=2, *, perplexity=30.0, early_exaggeration=12.0,
learning_rate=200.0, n_iter=1000, n_iter_without_progress=300, min_grad_norm=1e-07, metric='euclidean',
init='random', verbose=0, random_state=None, method='barnes_hut', angle=0.5, n_jobs=None,
square_distances='legacy')

sklearn.manifold.TSNE
优化TSNE
How to Use t-SNE Effectively想要具体了解参数含义与控制的可以参考这几个网站，我暂时没时间细细琢磨这些

二、案例

from sklearn.manifold import TSNE
from sklearn.datasets import load_iris,load_digits
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
import osdigits = load_digits()
X_tsne = TSNE(n_components=2,random_state=33).fit_transform(digits.data)
X_pca = PCA(n_components=2).fit_transform(digits.data)ckpt_dir="images"
if not os.path.exists(ckpt_dir):os.makedirs(ckpt_dir)plt.figure(figsize=(10, 5))
plt.subplot(121)
plt.scatter(X_tsne[:, 0], X_tsne[:, 1], c=digits.target,label="t-SNE")
plt.legend()
plt.subplot(122)
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=digits.target,label="PCA")
plt.legend()
plt.savefig('images/digits_tsne-pca.png', dpi=120)
plt.show()

从结果可以看出PCA降到二维后基本混到一起来，很难进行区分。而t-SNE的效果非常的不错。
无监督学习之t-SNE

如果对您有帮助，麻烦点赞关注，这真的对我很重要！！！如果需要互关，请评论留言或私信！

TSNE—聚类结果可视化相关推荐

Nature Methods | TooManyCells:单细胞聚类和可视化方法
2020年3月2日宾夕法尼亚大学的Gregory W. Schwartz等研究人员在nature methods上发表了题为TooManyCells identifies and visualizes ...
python用tsne降维图像_python代码实现TSNE降维数据可视化教程
TSNE降维jne免费资源网降维就是用2维或3维表示多维数据(彼此具有相关性的多个特征数据)的技术,利用降维算法,可以显式地表现数据.(t-SNE)t分布随机邻域嵌入是一种用于探索高维数据的非线性 ...
R语言层次聚类（hierarchical clustering）：数据缩放、PCA聚类结果可视化、fpc包的clusterboot函数通过bootstrap重采样的方法评估hclust层次聚类的稳定性
R语言层次聚类(hierarchical clustering):数据缩放.PCA聚类结果可视化.fpc包的clusterboot函数通过bootstrap重采样的方法评估hclust层次聚类的稳定性 ...
R语言层次聚类（hierarchical clustering）：特征缩放、抽取hclust中的聚类簇（cutree函数从hclust对象中提取每个聚类簇的成员）、基于主成分分析的进行聚类结果可视化
R语言层次聚类(hierarchical clustering):特征缩放.抽取hclust中的聚类簇(cutree函数从hclust对象中提取每个聚类簇的成员).基于主成分分析的进行聚类结果可视化 ...
流行学习、流形学习家族、局部线性嵌入LLE、随机投影（Random Projection）、t-SNE降维及可视化
流行学习.流形学习家族.局部线性嵌入LLE.随机投影(Random Projection).t-SNE降维及可视化目录流行学习.流形学习家族.局部线性嵌入LLE.随机投影(Random Proje ...
层次聚类定义、层次聚类过程可视化、簇间距离度量、BIRCH、两步聚类、BIRCH算法优缺点
层次聚类定义.层次聚类过程可视化.簇间距离度量.BIRCH.两步聚类.BIRCH算法优缺点目录
GMM / MoG 聚类 Matlab 可视化实现
GMM / MoG 聚类 Matlab 可视化实现 GMM介绍 EM进行参数求解 GMM动态可视化 GMM的Matlab动态可视化代码参考书籍:<计算机视觉模型.学习和推理> GMM ...
基于Jupyter 完成聚类输出可视化效果+Excel数据处理输出分布饼图
基于Jupyter 完成聚类输出可视化效果+Excel数据处理输出分布饼图一.根据计科18大类学生的成绩数据(选取两个特征:1.平均成绩GPA: 2.面向对象程序设计成绩),将计科18大类学生分成 ...
高斯混合模型（GaussianMixture Model, GMM）聚类、可视化最优协方差形式、通过TSNE进行结果可视化分析、抽取核心特征因子
高斯混合模型模型: sklearn.mixture.GaussianMixture 混合高斯模型(Gaussian Mixture Model,简称GMM)是用高斯概率密度函数(正态分布曲线)精确地量 ...
K均值聚类（KMeans）、可视化选取最佳K值、通过TSNE进行结果可视化分析、抽取核心特征因子
K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大.该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标. k ...

TSNE—聚类结果可视化

文章目录

一、TSNE参数解析

二、案例

TSNE—聚类结果可视化相关推荐

最新文章

热门文章