在处理数据过程中经常要把数据集切分为训练集和测试集,因此记录一下切分代码。

'''

data:数据集

test_ratio:测试机占比

如果data为numpy.numpy.ndarray直接使用此代码

如果data为pandas.DatFrame类型则

return data[train_indices],data[test_indices]

修改为

return data.iloc[train_indices],data.iloc[test_indices]

'''

def split_train(data,test_ratio):

shuffled_indices=np.random.permutation(len(data))

test_set_size=int(len(data)*test_ratio)

test_indices =shuffled_indices[:test_set_size]

train_indices=shuffled_indices[test_set_size:]

return data[train_indices],data[test_indices]

测试代码如下:

import numpy as np

import pandas as pd

data=np.random.randint(100,size=[25,4])

print(data)

结果如下:

从上图可以看出,原数据集按照5:1被随机分为两部分。但是此种方法存在一个缺点C每次调用次函数切分同一个数据集切分出来的结果都不一样,因此常在np.random.permutation(len(data))先调用np.random.seed(int)函数,来确保每次切分来的结果相同。

因此将上述函数改为:

def split_train(data,test_ratio):

np.random.seed(43)

shuffled_indices=np.random.permutation(len(data))

test_set_size=int(len(data)*test_ratio)

test_indices =shuffled_indices[:test_set_size]

train_indices=shuffled_indices[test_set_size:]

return data[train_indices],data[test_indices]

这个函数np.random.seed(43)当参数为同一整数时产生的随机数相同。

以上这篇Python数据集切分实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持爱蒂网。

python切分数据集_Python数据集切分实例相关推荐

  1. python划分数据集_Python数据集切分实例

    在处理数据过程中经常要把数据集切分为训练集和测试集,因此记录一下切分代码. ''' data:数据集 test_ratio:测试机占比 如果data为numpy.numpy.ndarray直接使用此代 ...

  2. python案例数据集_Python数据集切分实例

    在处理数据过程中经常要把数据集切分为训练集和测试集,因此记录一下切分代码. ''' data:数据集 test_ratio:测试机占比 如果data为numpy.numpy.ndarray直接使用此代 ...

  3. python计算信息熵_Python计算信息熵实例

    计算信息熵的公式:n是类别数,p(xi)是第i类的概率 假设数据集有m行,即m个样本,每一行最后一列为该样本的标签,计算数据集信息熵的代码如下: from math import log def ca ...

  4. python 对象销毁_python对象销毁实例(垃圾回收)

    python对象销毁实例(垃圾回收) 我就废话不多说了,直接上代码吧! '''python对象销毁(垃圾回收)''' class Point: 'info class' def __init__(se ...

  5. python的计算_python 计算方位角实例(根据两点的坐标计算)

    知道两点坐标,怎么计算两点方向的方位角? 答:首先计算坐标增量dx,dy(两个对应坐标分量相减,终点的减始点的). 若dx,dy中有一个为零时,根据另一个的正负决定方位角(0,90,180,270这四 ...

  6. python 温度 符号_Python通过小实例入门学习---1.0(温度转换)

    1.安装Python 3 下载地址: Welcome to Python.org​www.python.org 2."温度转换"实例:摄氏度--->华氏度 / 华氏度---& ...

  7. python计算两点间距离_python 计算方位角实例(根据两点的坐标计算)

    知道两点坐标,怎么计算两点方向的方位角? 答:首先计算坐标增量dx,dy(两个对应坐标分量相减,终点的减始点的). 若dx,dy中有一个为零时,根据另一个的正负决定方位角(0,90,180,270这四 ...

  8. python内容限制_Python --类,实例和访问限制

    与其他编程语言相比,Python的类机制添加了至少具有新语法和语义的类.它是C ++和Modula-3中发现的类机制的混合体. Python类提供面向对象编程的所有标准功能:类继承机制允许多个基类,派 ...

  9. python 映射表_python映射列表实例分析

    本文实例讲述了python映射列表.分享给大家供大家参考.具体分析如下: 列表映射是个非常有用的方法,通过对列表的每个元素应用一个函数来转换数据,可以使用一种策略或者方法来遍历计算每个元素. 例如: ...

最新文章

  1. Scrapy_redis框架原理分析并实现断点续爬以及分布式爬虫
  2. 网络服务搭建、配置与管理大全(Windows版)
  3. 无线呼叫服务器对码设置,楼层呼叫器对码方式种类
  4. boost::mpl模块实现count相关的测试程序
  5. C++ STL栈Stack的使用
  6. Centos 7 配置 NFS
  7. 2019.7.16考试总结
  8. php 5.5.38 ldap安装,centos5.5系统下面,lnmp环境下面php加载ldap扩展
  9. 数据结构之查找算法:B+树
  10. android基础入门思考题答案,《Android移动应用基础教程》中国铁道出版社课后习题(附答案)...
  11. ssm框架整合_框架整合战斗压缩粮篇SpringCloud+SpringBoot+SSM
  12. 【elasticsearch】总结—elasticsearch启动失败的几种情况及解决
  13. java 圆弧,JavaFX圆弧
  14. Unix 网络编程 I/O 模型 第六章
  15. .Net MVC中设置默认启动为某区域的视图
  16. 阿里巴巴的安全技术团队是怎么样的?
  17. VS 可扩展性开发(九):总结篇
  18. 春款童装产品做短视频营销应该怎么做?短视频营销策略分析
  19. 读书笔记(8)网络故障排除工具
  20. 计量语言学软件Altmann-Fitter阿尔特曼拟合器的使用简介(更新中)

热门文章

  1. 电脑副业能做什么?一台电脑能做的副业
  2. 面对ONF挑衅 思科用ACI回绝SDN挑战
  3. Flink Checkpoint超时问题
  4. 一款专为APP设计的后台管理系统平台
  5. cad打开卡死_CAD启动时闪退怎么办?打开CAD就死机怎么办?
  6. MBA都包括哪些课程?有哪些MBA专业书籍值得推荐?
  7. kickstarter众筹
  8. FPGA可以转行数字IC验证吗?
  9. vivo手机怎么安装Android10,首批升级Android 10 Bate教程!vivo手机3步搞定
  10. 文本识别综述 <软件学报_王建新等、中国图象图形学报_刘崇宇等>