生成用于线性回归的仿真数据集

from sklearn.datasets import make_regression# 生成特征矩阵、目标向量以及模型的系数
features, target, coefficients = make_regression(n_samples=100, n_features=3, n_informative=3, n_targets=1, noise=0.0, coef=True, random_state=1)# 查看特征矩阵和目标向量
print('Feature Matrix\n', features[:3])
print('Target Vector\n', target[:3])

生成结果

Feature Matrix[[ 1.29322588 -0.61736206 -0.11044703][-2.793085    0.36633201  1.93752881][ 0.80186103 -0.18656977  0.0465673 ]]
Target Vector[-10.37865986  25.5124503   19.67705609]

生成用于分类的仿真数据集

from sklearn.datasets import make_classification# 生成特征矩阵、目标向量以及模型的系数
features, target = make_classification(n_samples=100, n_features=3, n_informative=3, n_redundant=0, n_classes=2, weights=[.25, .75], random_state=1)# 查看特征矩阵和目标向量
print('Feature Matrix\n', features[:3])
print('Target Vector\n', target[:3])

生成结果

Feature Matrix[[ 1.06354768 -1.42632219  1.02163151][ 0.23156977  1.49535261  0.33251578][ 0.15972951  0.83533515 -0.40869554]]
Target Vector[1 0 0]

生成用于聚类的仿真数据集

from sklearn.datasets import make_blobs# 生成特征矩阵、目标向量以及模型的系数
features, target = make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=0.5, shuffle=True, random_state=1)# 查看特征矩阵和目标向量
print('Feature Matrix\n', features[:3])
print('Target Vector\n', target[:3])

生成结果

Feature Matrix[[ -1.22685609   3.25572052][ -9.57463218  -4.38310652][-10.71976941  -4.20558148]]
Target Vector[0 1 1]

总结

  • make_regression返回一个浮点数的特征矩阵和一个浮点数的目标向量
  • make_classification和make_blobs返回的是一个浮点数的特征矩阵和一个代表分类的的整数目标矩阵

【Python】Sklearn创建三种仿真数据集相关推荐

  1. pca算法python代码_三种方法实现PCA算法(Python)

    主成分分析,即Principal Component Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域.它的主要作用是对高维数据进行降维.PCA把原先的n个特征用数目 ...

  2. Python二叉树的三种深度优先遍历

    Python二叉树的三种深度优先遍历 一.广度优先遍历和深度优先遍历 对二叉树进行遍历(traversal)是指依次对树中每个节点进行访问,在遍历的过程中实现需要的业务. 对树的遍历方式有广度优先遍历 ...

  3. 执行 Python 程序的三种方式及Python 的 IDE —— `PyCharm`

    执行 Python 程序的三种方式 3.1. 解释器 python / python3 Python 的解释器 # 使用 python 2.x 解释器 $ python xxx.py# 使用 pyth ...

  4. python和c++哪个好-Scratch和Python与C++三种编程语言选哪个好

    Scratch和Python与C++三种编程语言选哪个好? 目前少儿编程培训机构主要提供的有三种主流课程,分别是Scratch.Python和C++,面对这三种课程家长该如何选择呢,到底哪种课程适合孩 ...

  5. python定时爬虫三种方法

    python定时爬虫三种方法 第一种 import timefrom scrapy import cmdlinedef doSth():# 把爬虫程序放在这个类里 zhilian_spider 是爬虫 ...

  6. python的编程模式-python编程(python开发的三种运行模式)【转】

    版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[-] 单循环模式 多线程模式 reactor模式 [ 声明:版权所有,欢迎转载,请勿用于商业用途. 联系信箱:feixiaoxing ...

  7. python函数调用的三种方式_判断python对象是否可调用的三种方式及其区别

    基本上判断python对象是否为可调用的函数,有三种方法: 1.使用内置的callable函数 callable(func) 用于检查对象是否可调用,返回True也可能调用失败,但是返回False一定 ...

  8. python提供的三种基本数据类型是()_python基础之基本数据类型

    1.概念 1.1 表达式 表达式,是由数字.算符.数字分组符号(括号).自由变量和约束变量等以能求得数值的有意义排列方法所得的组合 表达式特点 表达式一般仅仅用于计算一些结果,不会对程序产生实质性的影 ...

  9. pca算法python实现_三种方法实现PCA算法(Python)

    主成分分析,即Principal Component Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域.它的主要作用是对高维数据进行降维.PCA把原先的n个特征用数目 ...

最新文章

  1. 机器人香囊_青少年智能机器人等级评定~户外营~圆满结束!
  2. spring源码分析之spring注解@Aspect是如何工作的?
  3. php去掉字符串的最后一个字符
  4. 岳阳机器人餐厅在哪_从机器人咖啡看未来餐饮行业大方向,如何才能活下去?...
  5. H3C SecPath防火墙GRE+IPSEC+OSPF典型配置举例
  6. bsp模型适用于图计算_CODE V微信简报:光束合成传播算法(BSP)
  7. opengl加载显示3D模型STL类型文件
  8. ITK:计算网格的平面参数化
  9. reactinput聚焦事件_React focus 事件的坑
  10. 网站总结 和 相关控件 总结
  11. realme Race新旗舰入网:旗下首款骁龙888旗舰
  12. 0e php若类型,0e开头MD5 python生成脚本 PHP哈希弱类型比较缺陷
  13. jupyter 服务器 显示不完全,Jupyter中显示DataFrame的行显示不完全
  14. Git 连接码云 上传本地项目
  15. 浏览器到服务器简单流程图
  16. AcWing 95. 费解的开关(推理)
  17. [小O地图-XOMAP] - 功能简介
  18. 破解rar、zip、7z压缩包加密
  19. 计算机丢失explorer,xp系统如何找回电脑桌面上消失不见的 internet explorer图标
  20. C++中compare函数的使用

热门文章

  1. 处理有外键约束的数据
  2. javaScript命名规范
  3. poj 3131 Cubic Eight-Puzzle 双向广搜 Hash判重
  4. Keil 文本对不上格
  5. 当众讲话第二章当众讲话的基本原则
  6. android surfaceview 清屏
  7. DB2中select top 用法
  8. Hello,Behavior
  9. PhpWord的autoload.php文件及目录的生成方式
  10. 数据库为date型,而前端要显示String型,问题解决