【Python】Sklearn创建三种仿真数据集
生成用于线性回归的仿真数据集
from sklearn.datasets import make_regression# 生成特征矩阵、目标向量以及模型的系数
features, target, coefficients = make_regression(n_samples=100, n_features=3, n_informative=3, n_targets=1, noise=0.0, coef=True, random_state=1)# 查看特征矩阵和目标向量
print('Feature Matrix\n', features[:3])
print('Target Vector\n', target[:3])
生成结果
Feature Matrix[[ 1.29322588 -0.61736206 -0.11044703][-2.793085 0.36633201 1.93752881][ 0.80186103 -0.18656977 0.0465673 ]]
Target Vector[-10.37865986 25.5124503 19.67705609]
生成用于分类的仿真数据集
from sklearn.datasets import make_classification# 生成特征矩阵、目标向量以及模型的系数
features, target = make_classification(n_samples=100, n_features=3, n_informative=3, n_redundant=0, n_classes=2, weights=[.25, .75], random_state=1)# 查看特征矩阵和目标向量
print('Feature Matrix\n', features[:3])
print('Target Vector\n', target[:3])
生成结果
Feature Matrix[[ 1.06354768 -1.42632219 1.02163151][ 0.23156977 1.49535261 0.33251578][ 0.15972951 0.83533515 -0.40869554]]
Target Vector[1 0 0]
生成用于聚类的仿真数据集
from sklearn.datasets import make_blobs# 生成特征矩阵、目标向量以及模型的系数
features, target = make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=0.5, shuffle=True, random_state=1)# 查看特征矩阵和目标向量
print('Feature Matrix\n', features[:3])
print('Target Vector\n', target[:3])
生成结果
Feature Matrix[[ -1.22685609 3.25572052][ -9.57463218 -4.38310652][-10.71976941 -4.20558148]]
Target Vector[0 1 1]
总结
- make_regression返回一个浮点数的特征矩阵和一个浮点数的目标向量
- make_classification和make_blobs返回的是一个浮点数的特征矩阵和一个代表分类的的整数目标矩阵
【Python】Sklearn创建三种仿真数据集相关推荐
- pca算法python代码_三种方法实现PCA算法(Python)
主成分分析,即Principal Component Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域.它的主要作用是对高维数据进行降维.PCA把原先的n个特征用数目 ...
- Python二叉树的三种深度优先遍历
Python二叉树的三种深度优先遍历 一.广度优先遍历和深度优先遍历 对二叉树进行遍历(traversal)是指依次对树中每个节点进行访问,在遍历的过程中实现需要的业务. 对树的遍历方式有广度优先遍历 ...
- 执行 Python 程序的三种方式及Python 的 IDE —— `PyCharm`
执行 Python 程序的三种方式 3.1. 解释器 python / python3 Python 的解释器 # 使用 python 2.x 解释器 $ python xxx.py# 使用 pyth ...
- python和c++哪个好-Scratch和Python与C++三种编程语言选哪个好
Scratch和Python与C++三种编程语言选哪个好? 目前少儿编程培训机构主要提供的有三种主流课程,分别是Scratch.Python和C++,面对这三种课程家长该如何选择呢,到底哪种课程适合孩 ...
- python定时爬虫三种方法
python定时爬虫三种方法 第一种 import timefrom scrapy import cmdlinedef doSth():# 把爬虫程序放在这个类里 zhilian_spider 是爬虫 ...
- python的编程模式-python编程(python开发的三种运行模式)【转】
版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[-] 单循环模式 多线程模式 reactor模式 [ 声明:版权所有,欢迎转载,请勿用于商业用途. 联系信箱:feixiaoxing ...
- python函数调用的三种方式_判断python对象是否可调用的三种方式及其区别
基本上判断python对象是否为可调用的函数,有三种方法: 1.使用内置的callable函数 callable(func) 用于检查对象是否可调用,返回True也可能调用失败,但是返回False一定 ...
- python提供的三种基本数据类型是()_python基础之基本数据类型
1.概念 1.1 表达式 表达式,是由数字.算符.数字分组符号(括号).自由变量和约束变量等以能求得数值的有意义排列方法所得的组合 表达式特点 表达式一般仅仅用于计算一些结果,不会对程序产生实质性的影 ...
- pca算法python实现_三种方法实现PCA算法(Python)
主成分分析,即Principal Component Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域.它的主要作用是对高维数据进行降维.PCA把原先的n个特征用数目 ...
最新文章
- 机器人香囊_青少年智能机器人等级评定~户外营~圆满结束!
- spring源码分析之spring注解@Aspect是如何工作的?
- php去掉字符串的最后一个字符
- 岳阳机器人餐厅在哪_从机器人咖啡看未来餐饮行业大方向,如何才能活下去?...
- H3C SecPath防火墙GRE+IPSEC+OSPF典型配置举例
- bsp模型适用于图计算_CODE V微信简报:光束合成传播算法(BSP)
- opengl加载显示3D模型STL类型文件
- ITK:计算网格的平面参数化
- reactinput聚焦事件_React focus 事件的坑
- 网站总结 和 相关控件 总结
- realme Race新旗舰入网:旗下首款骁龙888旗舰
- 0e php若类型,0e开头MD5 python生成脚本 PHP哈希弱类型比较缺陷
- jupyter 服务器 显示不完全,Jupyter中显示DataFrame的行显示不完全
- Git 连接码云 上传本地项目
- 浏览器到服务器简单流程图
- AcWing 95. 费解的开关(推理)
- [小O地图-XOMAP] - 功能简介
- 破解rar、zip、7z压缩包加密
- 计算机丢失explorer,xp系统如何找回电脑桌面上消失不见的 internet explorer图标
- C++中compare函数的使用