需要造数据集的时候,sklearn中的make_blobs模块就很有用。
官方API说明
输入和输出:

翻译如下:

  • n_samples是待生成的样本的总数。
  • n_features是每个样本的特征数。
  • centers表示类别数。
  • cluster_std表示每个类别的方差,例如我们希望生成2类数据,其中一类比另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0]。

样例samples:

from sklearn.datasets import make_blobs
from matplotlib import pyplotdata, label = make_blobs(n_samples=100, n_features=2, centers=4)
# 绘制样本显示
pyplot.scatter(data[:, 0], data[:, 1], c=label)
pyplot.show()

如果要设置方差,可以增加cluster_std参数

from sklearn.datasets import make_blobs
from matplotlib import pyplotdata, label = make_blobs(n_samples=30, n_features=2, centers=3, cluster_std=[0.8, 2.5, 4.5])
# 绘制样本显示
pyplot.scatter(data[:, 0], data[:, 1], c=label)
pyplot.show()

——————————————————————————————————

作者:fred_33c7
链接:https://www.jianshu.com/p/891f46e0125e
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

sklearn中make_blobs模块使用相关推荐

  1. python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据、matplotlib可视化生成的仿真数据

    python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据.matplotlib可视化生成的仿真数据 目录

  2. sklearn中的make_blobs的用法

    sklearn中的make_blobs函数主要是为了生成数据集的,具体如下 data_set, label = make_blobs(n_features=3,n_samples=50, center ...

  3. python pipline_python中sklearn的pipeline模块实例详解

    最近在看<深度学习:基于Keras的Python实践(魏贞原)>这本书,书中8.3创建了一个Scikit-Learn的Pipeline,首先标准化数据集,然后创建和评估基线神经网络模型,代 ...

  4. 【Python学习】 - sklearn - 用于生成数据的make_blobs模块

    函数原型: sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_bo ...

  5. sklearn中的支持向量机SVM(下)

    1 二分类SVC的进阶 1.1 SVC用于二分类的原理复习 sklearn中的支持向量机SVM(上) 1.2 参数C的理解进阶 有一些数据,可能是线性可分的,但在线性可分状况下训练准确率不能达到100 ...

  6. sklearn中的聚类算法K-Means

    1 概述 1.1 无监督学习与聚类算法 决策树.随机森林.逻辑回归虽然有着不同的功能,但却都属于"有监督学习"的一部分,即是说,模型在训练的时候,既需要特征矩阵XXX,也需要真实标 ...

  7. sklearn中的支持向量机SVM(上)

    1 概述 支持向量机(SVM,也称为支持向量网络),是机器学习中获得关注最多的算法.它源于统计学习理论,是除了集成学习算法之外,接触到的第一个强学习器. 从算法的功能来看,SVM囊括了很多其他算法的功 ...

  8. sklearn中的朴素贝叶斯

    1 概述 1.1 真正的概率分类器 在许多分类算法应用中,特征和标签之间的关系并非是决定性的.如想预测一个人究竟是否能在泰坦尼克号海难中生存下来,可以建一棵决策树来学习训练集.在训练中,其中一个人的特 ...

  9. 导入训练好的决策树文件_决策树在sklearn中的实现

    小伙伴们大家好~o( ̄▽ ̄)ブ,今天做一下如何使用sklearn实现决策树,首先声明一下,我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4 ...

  10. 02_混淆矩阵、准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F值(F-Measure) +Roc曲线和PR曲线+sklearn中分类模型评估API+ 自己补充整理

    此博文参考: 关于ROC绘制参考博文: https://blog.csdn.net/u011630575/article/details/80250177 Python+ROC相关的博文: https ...

最新文章

  1. leetcode--删除链表的倒数第N个节点--python
  2. motan yar php,motan学习笔记 六 opentracing Brave+zipkin实现-Go语言中文社区
  3. Python-OpenCV 笔记7 -- 绘图(Draw)
  4. K8S集群部署-环境准备
  5. 扩展类加载器 Extension ClassLoader
  6. python运行代码不成功_python的运行时易犯错误,你中招了没?快来学习了
  7. Linux 命令 之 【chmod】 修改文件权限~
  8. 【渝粤教育】电大中专电子商务网站建设与维护 (3)作业 题库
  9. 涵盖农业、可再生能源、酒店、金融服务、创意服务、科技、林业和建筑业的20家新公司加入《气候宣言》
  10. 西门子atch指令详解_西门子plc指令含义大全详解
  11. 提问的力量四:提问的艺术-体验学习中提问的技巧
  12. 波士顿大学计算机工程硕士,波士顿大学电气与计算机工程理学硕士
  13. 【Pandas 基础应用 拆分Excel工作簿】
  14. python bif_小猪的Python学习之旅 —— 1.基础知识储备
  15. JQ数据库查询时间转换
  16. 王者荣耀虚拟服务器设置方法,《王者荣耀》操作设置详解
  17. 前端开发-后台信息管理页面的开发流程
  18. css 定位连线_前端css实现两点连线
  19. Java---从键盘输入一位整数,当输入1-7时,输出星期一~星期日
  20. windows桌面消失,没有任何图标的解决办法

热门文章

  1. 【其他】bilibili下载的m4s格式视频如何还原为mp4
  2. 南京oracle认证考试,南京Oracle认证考试-Oracle认证Web组件开发专家(OCWCD)-南京万和...
  3. oracle查询成绩属于什么等级,oracle认证考试成绩查询方法是什么?
  4. 回归分析中15个统计量解释|Eviews回归结果的理解
  5. javaweb网上图书商城案例
  6. vue中下载图片跨域
  7. JSTL 标签大全详解
  8. 用matlab表白,用函数表达对她的爱
  9. FreeRTOS 任务调度 系统节拍
  10. java jsp实现网站访问量的统计