函数功能:

生成各向同性的高斯数据以进行聚类

函数定义:

sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=None, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)

函数参数:

1.n_samples:可以是int,也可以是数组, 可选参数 (default=100)
如果为int,则表示所有簇的样本总数,这个总数在簇之间平均分配。
如果是数组,则数组序列中的每个元素表示每个簇的样本数。
2.n_features:int类型,可选 (default=2)
每个样本的特征数量
3.centers:可以是int, 也可以是大小为n_centers的的数组,数组中的每个元素都为n_features维度, 可选(default=None)
如果是int,表示生成的中心数量。
如果是[n_centers, n_features]数组,表示使用固定的每个中心位置。
如果n_samples是一个int且centers为None,则将生成3个中心。
如果n_samples是数组,则centers必须为None或长度等于n_samples数组长度的数组。
4.cluster_std:可以是float类型,也可以是float序列形式, 可选 (default=1.0)
聚簇的标准差。
如果是float类型,则设置所有聚簇的标准差为这个值;如果是float序列,则按照序列设置每一个聚簇的标准差
5.center_box:一对float值 (min, max), 可选 (default=(-10.0, 10.0))
随机生成中心时每个聚类中心的边界框大小,只能在中心的边界框内生成数据
6.shuffle:boolean类型,可选 (default=True)
打乱返回的样本顺序,返回的第一个样本不一定是第一个簇中的。
7.random_state:可以是int类型, 可以是RandomState实例,也可以是 None (default)
确定用于创建数据集的随机数生成。 int类型表示随机数生成器的种子。

函数返回值

1.Xarray of shape [n_samples, n_features]
生成的样本
2.yarray of shape [n_samples]
每个样本的聚簇类别整数标签

demo

1.固定中心点demo

centers = [[0, 1], [-1, 2], [1, 2], [-2.5, 2.5], [2.5,2.5], [-4,1], [4,1], [-3,-1], [3,-1], [-2,-3], [2,-3], [0,-4]]#设置一些中心点
X, y = make_blobs(n_samples=300, centers=centers, cluster_std=0.3)#产生以这些中心点为中心,一定标准差的n个samples

2.随机中心点demo

X, y = make_blobs(n_samples=300, centers=10, cluster_std=0.3)#生成10个中心点为,标准差为0.3的的300个samples

参考资料

https://scikit-learn.org/dev/modules/generated/sklearn.datasets.make_blobs.html

sklearn中的make_blobs相关推荐

  1. python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据、matplotlib可视化生成的仿真数据

    python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据.matplotlib可视化生成的仿真数据 目录

  2. sklearn中的make_blobs的用法

    sklearn中的make_blobs函数主要是为了生成数据集的,具体如下 data_set, label = make_blobs(n_features=3,n_samples=50, center ...

  3. 【Python】sklearn 中的 make_blobs() 函数详解

    文章目录 一.介绍 二.函数的使用 一.介绍 make_blobs() 是 sklearn.datasets中的一个函数. 主要是产生聚类数据集,产生一个数据集和相应的标签. 函数的源代码如下: de ...

  4. python logistics regression_Python——sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义...

    sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义 ​ 使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛 ...

  5. [机器学习-sklearn]K-means之make_blobs聚类数据生成器

    make_blobs介绍 scikit中的make_blobs方法常被用来生成聚类算法的测试数据,直观地说,make_blobs会根据用户指定的特征数量.中心点数量.范围等来生成几类数据,这些数据可用 ...

  6. sklearn中的支持向量机SVM(下)

    1 二分类SVC的进阶 1.1 SVC用于二分类的原理复习 sklearn中的支持向量机SVM(上) 1.2 参数C的理解进阶 有一些数据,可能是线性可分的,但在线性可分状况下训练准确率不能达到100 ...

  7. sklearn中的聚类算法K-Means

    1 概述 1.1 无监督学习与聚类算法 决策树.随机森林.逻辑回归虽然有着不同的功能,但却都属于"有监督学习"的一部分,即是说,模型在训练的时候,既需要特征矩阵XXX,也需要真实标 ...

  8. sklearn中的支持向量机SVM(上)

    1 概述 支持向量机(SVM,也称为支持向量网络),是机器学习中获得关注最多的算法.它源于统计学习理论,是除了集成学习算法之外,接触到的第一个强学习器. 从算法的功能来看,SVM囊括了很多其他算法的功 ...

  9. sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义

    使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛回归(Logistic Regression),我在实现完之后,可能陷入代码太久,忘记基本的算法原理了,突然想不到coe ...

  10. sklearn中Logistics Regression的coef_和intercept_的具体意义

    使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛回归(Logistic Regression),我在实现完之后,可能陷入代码太久,忘记基本的算法原理了,突然想不到 co ...

最新文章

  1. Java 构造方法与成员方法的区别
  2. Hadoop详解(一):Hadoop简介
  3. 怎样使一排文字中间有间隔_超级间隔条在中空玻璃中的应用
  4. oracle data guard闪回,官方文档上的这段关于 DATAGUARD 闪回的解释,如何理解?
  5. [转]asp.net中常用的一些小技巧
  6. 第三次学JAVA再学不好就吃翔(part26)--static关键字
  7. 从SAP Hybris下单,同步到S/4HANA,触发生产流程
  8. MySQL Cookbook 学习笔记-04
  9. hdu 2545 并查集
  10. 网上的很多Android项目源码有用吗?Android开发注意的地方。
  11. Lesson5 一阶自治微分方程
  12. 【动态规划笔记】区间dp:括号匹配(删除字符和括号匹配)
  13. Atitit 高性能架构之道 attilax著 艾龙 著 1. 应用服务与数据隔离 2 2. 负载均衡你问题 2 2.1. 用户的请求由谁来转发到到具体的应用服务器 2 2.2. 有什么转发的算法
  14. 起点中文网乘“盛大”之势打通产业供应链
  15. 通过mysql修改后台密码_怎么通过修改数据库修改网站后台的管理员密码?
  16. 牛牛的旅游纪念品 动态规划背包问题
  17. 从端到云:飞腾平台全栈解决方案白皮书
  18. 完美解决VS2003.Net fatal error LNK1201: 写入程序数据库“.pdb”时出错 - 细雨淅淅
  19. cad 工程师绘图技巧 (一)
  20. 说我菜?那好,我用Python制作电脑与手机游戏脚本来赢你

热门文章

  1. ShareX 屏幕截图分享好工具
  2. hdu1814 暴力
  3. Spring Security如何防止会话固定攻击(session fixation attack)
  4. java自动发送qq_如何定时批量发送qq消息就是帮助我们自动的发送qq消息
  5. 安卓搜不到airpods_真心丢不起!那就教教你AirPods丢失后如何查找吧
  6. 关于红色警戒2不能在Win1064位系统上运行的问题的解决
  7. cocoscreator1.52 删除anysdk
  8. (初学笔记1)python读多波段遥感影像并存到三维数组中
  9. 【模糊回归预测】基于matlab萤火虫算法优化模糊神经网络回归预测【含Matlab源码 2034期】
  10. MapReduce的C#实现及单元测试(试验)