TSNE降维jne免费资源网

降维就是用2维或3维表示多维数据(彼此具有相关性的多个特征数据)的技术,利用降维算法,可以显式地表现数据。(t-SNE)t分布随机邻域嵌入 是一种用于探索高维数据的非线性降维算法。它将多维数据映射到适合于人类观察的两个或多个维度。jne免费资源网

python代码jne免费资源网

km.pyjne免费资源网

#k_mean算法

import pandas as pd

import csv

import pandas as pd

import numpy as np

#参数初始化

inputfile = 'x.xlsx' #销量及其他属性数据

outputfile = 'x_1.xlsx' #保存结果的文件名

k = 2 #聚类的类别

iteration = 3 #聚类最大循环次数

data = pd.read_excel(inputfile, index_col = 'Id') #读取数据

data_zs = 1.0*(data - data.mean())/data.std() #数据标准化,std()表示求总体样本方差(除以n-1),numpy中std()是除以n

print('data_zs')

from sklearn.cluster import KMeans

model = KMeans(n_clusters = k, max_iter = iteration) #分为k类

#model = KMeans(n_clusters = k, n_jobs = 4, max_iter = iteration) #分为k类,并发数4

print('data_zs')

model.fit(data_zs) #开始聚类

#简单打印结果

r1 = pd.Series(model.labels_).value_counts() #统计各个类别的数目

r2 = pd.DataFrame(model.cluster_centers_) #找出聚类中心

r = pd.concat([r2, r1], axis = 1) #横向连接(0是纵向),得到聚类中心对应的类别下的数目

print('data_zs')

print(r)

r.columns = list(data.columns) + [u'类别数目'] #重命名表头

print(r)

#详细输出原始数据及其类别

r = pd.concat([data, pd.Series(model.labels_, index = data.index)], axis = 1) #详细输出每个样本对应的类别

r.columns = list(data.columns) + [u'聚类类别'] #重命名表头

r.to_excel(outputfile) #保存结果

TSNE.pyjne免费资源网

# coding=utf-8

from sklearn.manifold import TSNE

from pandas.core.frame import DataFrame

import pandas as pd

import numpy as np

import km as k

#用TSNE进行数据降维并展示聚类结果

tsne = TSNE()

tsne.fit_transform(k.data_zs) #进行数据降维,并返回结果

tsne = pd.DataFrame(tsne.embedding_, index = k.data_zs.index) #转换数据格式

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签

plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

#不同类别用不同颜色和样式绘图

d = tsne[k.r[u'聚类类别']== 0] #找出聚类类别为0的数据对应的降维结果

plt.plot(d[0], d[1], 'r.')

d = tsne[k.r[u'聚类类别'] == 1]

plt.plot(d[0], d[1], 'go')

#d = tsne[k.r[u'聚类类别'] == 2]

#plt.plot(d[0], d[1], 'b*')

plt.savefig("data.png")

plt.show()

数据格式jne免费资源网

数据需要用xlsx文件存储,表头名为Id。jne免费资源网

执行 TSNE.py即可获得可视化图片。jne免费资源网

jne免费资源网

以上这篇python代码实现TSNE降维数据可视化教程就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。jne免费资源网

python用tsne降维图像_python代码实现TSNE降维数据可视化教程相关推荐

  1. python爬大众点评手机号_Python爬虫丨大众点评数据爬虫教程(1)

    方式二: 需要安装fontTools包,没安装的请(pip install fontTools) from fontTools.ttLib import TTFont def get_xml(self ...

  2. python动态交互图表_Python 调用 matplotlib 实现交互式数据可视化图表案例

    交互式的数据可视化图表是 New IT 新技术的一个应用方向,在过去,用户要在网页上查看数据,基本的实现方式就是在页面上显示一个表格出来,的而且确,用表格的方式来展示数据,显示的数据量会比较大,但是, ...

  3. 【Python】数据可视化教程来了!

    来自:Datawhale????数据可视化小组 开源初衷 Matplotlib可以说是python数据可视化最重要且常见的工具之一,几乎每个和数据打交道的人都不可避免,还有大量可视化工具是基于它的二次 ...

  4. python数据查询教程_Python数据可视化教程之基础篇

    经过学习之后,我总结了利用python实现可视化的三个步骤: 确定问题,选择图形 转换数据,应用函数 参数设置,一目了然 1 首先,要知道我们用哪些库来画图? matplotlib python中最基 ...

  5. python图形绘制星空图_Python数据可视化教程:基于Plotly的动态可视化绘图

    1. plotly 介绍 Plotly是一个非常著名且强大的开源数据可视化框架,它通过构建基于浏览器显示的web形式的可交互图表来展示信息,可创建多达数十种精美的图表和地图, 下面我们以jupyter ...

  6. Python新工具:用三行代码提取PDF表格数据

    点击上方"视学算法",星标公众号 重磅干货,第一时间送达 项目作者:vinayak mehta 参与:一鸣 从 PDF 表格中获取数据是一项痛苦的工作.不久前,一位开发者提供了一个 ...

  7. python 柱状图上显示字体_Python爬取百部电影数据,我发现了这个惊人真相!

    2019年就这么匆匆过去了,就在前几天国家电影局发布了2019年中国电影市场数据,数据显示去年总票房为642.66亿元,同比增长5.4%:国产电影总票房411.75亿元,同比增长8.65%,市场占比 ...

  8. python中图例legend标签内容_Python学习第87课-数据可视化之图形标识title、label、legend...

    [每天几分钟,从零入门python编程的世界!] 第86课我们学习了matplotlib,并且用它画了一个简单的图形,但是这个图形上面没有标题,没有标明x轴和y轴,而且用于画这个图形的数据都是我们手动 ...

  9. python批量读取文件内容_Python从数据库读取大量数据批量写入文件的方法

    使用机器学习训练数据时,如果数据量较大可能我们不能够一次性将数据加载进内存,这时我们需要将数据进行预处理,分批次加载进内存. 下面是代码作用是将数据从数据库读取出来分批次写入txt文本文件,方便我们做 ...

最新文章

  1. rabbitmq学习——安装测试
  2. java中的System.out.print()与System.out.println()的区别
  3. C语言——第六周作业
  4. Rocchio算法—文本分类
  5. 重磅发布 阿里云数据中台全新产品DataTrust聚焦企业数据安全保障
  6. Linux 中显示所有正在运行的进程
  7. JavaScript如何给Table行设置颜色?
  8. Android 系统广播
  9. python基础:pip和虚拟环境
  10. 知识竞赛系统的计时器数字或滚动抽签数字不显示的原因解惑
  11. Anagrams by Stack(进栈出栈问题)
  12. 计算机cmd卸载软件,一招让你学会,在win10命令提示符上卸载程序
  13. 京东联盟/好京客API与京东默认PID申请教程
  14. Electron 仿制WeGame(二)
  15. TGA格式图片文件分析
  16. ubuntu服务器安装可视化桌面(Gnome)
  17. CSS | 使一个元素高度由图片撑开
  18. 找PPT模板就上这5个网站~
  19. 我的世界手机版虚拟人生服务器,我的世界大型虚拟人生整合包
  20. UG二次开发教程(基于NX12.0/VS2015版本)

热门文章

  1. testng入门教程5TestNG套件测试
  2. 【读书笔记】iOS-属性列表
  3. poj 1164 The Castle
  4. 嵌入式ARM Linux开发板自启动,跳过输入root用户名和密码
  5. 我想用keil5生成BIN文件,可是安装目录下找不到fromelf.exe
  6. MiniGUI.cfg 文件详解
  7. 最优化算法python实现篇(3)——无约束一维极值(黄金分割法)
  8. 设计模式总结 (1)模式分类
  9. cmake (2)路径指令
  10. MIMIC 以太坊医疗项目开发(4)Axios