sklearn中make_blobs模块使用
需要造数据集的时候,sklearn中的make_blobs模块就很有用。
官方API说明
输入和输出:
翻译如下:
- n_samples是待生成的样本的总数。
- n_features是每个样本的特征数。
- centers表示类别数。
- cluster_std表示每个类别的方差,例如我们希望生成2类数据,其中一类比另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0]。
样例samples:
from sklearn.datasets import make_blobs
from matplotlib import pyplotdata, label = make_blobs(n_samples=100, n_features=2, centers=4)
# 绘制样本显示
pyplot.scatter(data[:, 0], data[:, 1], c=label)
pyplot.show()
如果要设置方差,可以增加cluster_std
参数
from sklearn.datasets import make_blobs
from matplotlib import pyplotdata, label = make_blobs(n_samples=30, n_features=2, centers=3, cluster_std=[0.8, 2.5, 4.5])
# 绘制样本显示
pyplot.scatter(data[:, 0], data[:, 1], c=label)
pyplot.show()
——————————————————————————————————
作者:fred_33c7
链接:https://www.jianshu.com/p/891f46e0125e
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
sklearn中make_blobs模块使用相关推荐
- python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据、matplotlib可视化生成的仿真数据
python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据.matplotlib可视化生成的仿真数据 目录
- sklearn中的make_blobs的用法
sklearn中的make_blobs函数主要是为了生成数据集的,具体如下 data_set, label = make_blobs(n_features=3,n_samples=50, center ...
- python pipline_python中sklearn的pipeline模块实例详解
最近在看<深度学习:基于Keras的Python实践(魏贞原)>这本书,书中8.3创建了一个Scikit-Learn的Pipeline,首先标准化数据集,然后创建和评估基线神经网络模型,代 ...
- 【Python学习】 - sklearn - 用于生成数据的make_blobs模块
函数原型: sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_bo ...
- sklearn中的支持向量机SVM(下)
1 二分类SVC的进阶 1.1 SVC用于二分类的原理复习 sklearn中的支持向量机SVM(上) 1.2 参数C的理解进阶 有一些数据,可能是线性可分的,但在线性可分状况下训练准确率不能达到100 ...
- sklearn中的聚类算法K-Means
1 概述 1.1 无监督学习与聚类算法 决策树.随机森林.逻辑回归虽然有着不同的功能,但却都属于"有监督学习"的一部分,即是说,模型在训练的时候,既需要特征矩阵XXX,也需要真实标 ...
- sklearn中的支持向量机SVM(上)
1 概述 支持向量机(SVM,也称为支持向量网络),是机器学习中获得关注最多的算法.它源于统计学习理论,是除了集成学习算法之外,接触到的第一个强学习器. 从算法的功能来看,SVM囊括了很多其他算法的功 ...
- sklearn中的朴素贝叶斯
1 概述 1.1 真正的概率分类器 在许多分类算法应用中,特征和标签之间的关系并非是决定性的.如想预测一个人究竟是否能在泰坦尼克号海难中生存下来,可以建一棵决策树来学习训练集.在训练中,其中一个人的特 ...
- 导入训练好的决策树文件_决策树在sklearn中的实现
小伙伴们大家好~o( ̄▽ ̄)ブ,今天做一下如何使用sklearn实现决策树,首先声明一下,我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4 ...
- 02_混淆矩阵、准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F值(F-Measure) +Roc曲线和PR曲线+sklearn中分类模型评估API+ 自己补充整理
此博文参考: 关于ROC绘制参考博文: https://blog.csdn.net/u011630575/article/details/80250177 Python+ROC相关的博文: https ...
最新文章
- leetcode--删除链表的倒数第N个节点--python
- motan yar php,motan学习笔记 六 opentracing Brave+zipkin实现-Go语言中文社区
- Python-OpenCV 笔记7 -- 绘图(Draw)
- K8S集群部署-环境准备
- 扩展类加载器 Extension ClassLoader
- python运行代码不成功_python的运行时易犯错误,你中招了没?快来学习了
- Linux 命令 之 【chmod】 修改文件权限~
- 【渝粤教育】电大中专电子商务网站建设与维护 (3)作业 题库
- 涵盖农业、可再生能源、酒店、金融服务、创意服务、科技、林业和建筑业的20家新公司加入《气候宣言》
- 西门子atch指令详解_西门子plc指令含义大全详解
- 提问的力量四:提问的艺术-体验学习中提问的技巧
- 波士顿大学计算机工程硕士,波士顿大学电气与计算机工程理学硕士
- 【Pandas 基础应用 拆分Excel工作簿】
- python bif_小猪的Python学习之旅 —— 1.基础知识储备
- JQ数据库查询时间转换
- 王者荣耀虚拟服务器设置方法,《王者荣耀》操作设置详解
- 前端开发-后台信息管理页面的开发流程
- css 定位连线_前端css实现两点连线
- Java---从键盘输入一位整数,当输入1-7时,输出星期一~星期日
- windows桌面消失,没有任何图标的解决办法