python切分数据集_Python数据集切分实例
在处理数据过程中经常要把数据集切分为训练集和测试集,因此记录一下切分代码。
'''
data:数据集
test_ratio:测试机占比
如果data为numpy.numpy.ndarray直接使用此代码
如果data为pandas.DatFrame类型则
return data[train_indices],data[test_indices]
修改为
return data.iloc[train_indices],data.iloc[test_indices]
'''
def split_train(data,test_ratio):
shuffled_indices=np.random.permutation(len(data))
test_set_size=int(len(data)*test_ratio)
test_indices =shuffled_indices[:test_set_size]
train_indices=shuffled_indices[test_set_size:]
return data[train_indices],data[test_indices]
测试代码如下:
import numpy as np
import pandas as pd
data=np.random.randint(100,size=[25,4])
print(data)
结果如下:
从上图可以看出,原数据集按照5:1被随机分为两部分。但是此种方法存在一个缺点C每次调用次函数切分同一个数据集切分出来的结果都不一样,因此常在np.random.permutation(len(data))先调用np.random.seed(int)函数,来确保每次切分来的结果相同。
因此将上述函数改为:
def split_train(data,test_ratio):
np.random.seed(43)
shuffled_indices=np.random.permutation(len(data))
test_set_size=int(len(data)*test_ratio)
test_indices =shuffled_indices[:test_set_size]
train_indices=shuffled_indices[test_set_size:]
return data[train_indices],data[test_indices]
这个函数np.random.seed(43)当参数为同一整数时产生的随机数相同。
以上这篇Python数据集切分实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持爱蒂网。
python切分数据集_Python数据集切分实例相关推荐
- python划分数据集_Python数据集切分实例
在处理数据过程中经常要把数据集切分为训练集和测试集,因此记录一下切分代码. ''' data:数据集 test_ratio:测试机占比 如果data为numpy.numpy.ndarray直接使用此代 ...
- python案例数据集_Python数据集切分实例
在处理数据过程中经常要把数据集切分为训练集和测试集,因此记录一下切分代码. ''' data:数据集 test_ratio:测试机占比 如果data为numpy.numpy.ndarray直接使用此代 ...
- python计算信息熵_Python计算信息熵实例
计算信息熵的公式:n是类别数,p(xi)是第i类的概率 假设数据集有m行,即m个样本,每一行最后一列为该样本的标签,计算数据集信息熵的代码如下: from math import log def ca ...
- python 对象销毁_python对象销毁实例(垃圾回收)
python对象销毁实例(垃圾回收) 我就废话不多说了,直接上代码吧! '''python对象销毁(垃圾回收)''' class Point: 'info class' def __init__(se ...
- python的计算_python 计算方位角实例(根据两点的坐标计算)
知道两点坐标,怎么计算两点方向的方位角? 答:首先计算坐标增量dx,dy(两个对应坐标分量相减,终点的减始点的). 若dx,dy中有一个为零时,根据另一个的正负决定方位角(0,90,180,270这四 ...
- python 温度 符号_Python通过小实例入门学习---1.0(温度转换)
1.安装Python 3 下载地址: Welcome to Python.orgwww.python.org 2."温度转换"实例:摄氏度--->华氏度 / 华氏度---& ...
- python计算两点间距离_python 计算方位角实例(根据两点的坐标计算)
知道两点坐标,怎么计算两点方向的方位角? 答:首先计算坐标增量dx,dy(两个对应坐标分量相减,终点的减始点的). 若dx,dy中有一个为零时,根据另一个的正负决定方位角(0,90,180,270这四 ...
- python内容限制_Python --类,实例和访问限制
与其他编程语言相比,Python的类机制添加了至少具有新语法和语义的类.它是C ++和Modula-3中发现的类机制的混合体. Python类提供面向对象编程的所有标准功能:类继承机制允许多个基类,派 ...
- python 映射表_python映射列表实例分析
本文实例讲述了python映射列表.分享给大家供大家参考.具体分析如下: 列表映射是个非常有用的方法,通过对列表的每个元素应用一个函数来转换数据,可以使用一种策略或者方法来遍历计算每个元素. 例如: ...
最新文章
- Scrapy_redis框架原理分析并实现断点续爬以及分布式爬虫
- 网络服务搭建、配置与管理大全(Windows版)
- 无线呼叫服务器对码设置,楼层呼叫器对码方式种类
- boost::mpl模块实现count相关的测试程序
- C++ STL栈Stack的使用
- Centos 7 配置 NFS
- 2019.7.16考试总结
- php 5.5.38 ldap安装,centos5.5系统下面,lnmp环境下面php加载ldap扩展
- 数据结构之查找算法:B+树
- android基础入门思考题答案,《Android移动应用基础教程》中国铁道出版社课后习题(附答案)...
- ssm框架整合_框架整合战斗压缩粮篇SpringCloud+SpringBoot+SSM
- 【elasticsearch】总结—elasticsearch启动失败的几种情况及解决
- java 圆弧,JavaFX圆弧
- Unix 网络编程 I/O 模型 第六章
- .Net MVC中设置默认启动为某区域的视图
- 阿里巴巴的安全技术团队是怎么样的?
- VS 可扩展性开发(九):总结篇
- 春款童装产品做短视频营销应该怎么做?短视频营销策略分析
- 读书笔记(8)网络故障排除工具
- 计量语言学软件Altmann-Fitter阿尔特曼拟合器的使用简介(更新中)