机器学习数据集pima-indians-diabetes.data 及R语言读入命令
这个数据集是机器学习常用练习集,包括768个observation,原链接如下
https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/
已经失效,原因是permission restriction。
从网上搜索到了数据集的内容,并将其转换为tab分隔的文本文件。
主要参考了CSDN博主 姜萌芽 的博文
文件已上传至共享资源,链接在此 https://download.csdn.net/download/lf94lf94/11828795。
各列数据说明如下:
文件默认是5积分下载, 问下各位如何设成免费下载?
也可留言免费发送。
或者参考博文,用VIM等自行编辑,乐趣自在其中
R语言可以用如下命令读取并命名header:
diabetes <- read.table(file=“pima-indians-diabetes.data”, sep="\t", header=FALSE) names(diabetes) <- c("npregant", "glucose", "BP", "triceps", "insulin", "bmi", "pedigree", "age", "class") diabetes$class <- factor(diabetes$class, levels=c(0,1), labels=c("normal", "diabetic"))
机器学习数据集pima-indians-diabetes.data 及R语言读入命令相关推荐
- 基于Keras在数据集Pima Indians diabetes上实现多层感知器
机器学习是一种实现人工智能的方法,深度学习则是一种实现机器学习的技术.大量数据为深度学习提供了材料,有了充分的数据做基础,利用深度学习技术就能演绎出更聪明的算法,使深度学习得以迅速发展. 目前有许多深 ...
- Pima Indians Diabetes Database(Pima印第安人糖尿病数据库)
原文: Pima Indians Diabetes Database Predict the onset of diabetes based on diagnostic measures This d ...
- 机器学习中的K-means算法原理与R语言实例
聚类是将相似对象归到同一个簇中的方法,这有点像全自动分类.簇内的对象越相似,聚类的效果越好.支持向量机.神经网络所讨论的分类问题都是有监督的学习方式,现在我们所介绍的聚类则是无监督的.其中,K均值(K ...
- Data transformation R语言与python
https://r4ds.had.co.nz/transform.html 这些R也可以通过python实现,如下 pyrhon: pip install nycflights13 pip insta ...
- UCI 机器学习数据集(分类)
113 Data Sets UCI数据集 Name Data Types Default Task Attribute Types # Instances # Attributes Year Ab ...
- r语言员工离职_使用R机器学习进行员工离职预测系列(一)
最近一直觉得,其实机器学习的门槛并不高,以R语言的角度,甚至稍微学过一点,就可以针对相关数据进行各种算法模型的建立和测试. 而真正有难度的地方一是算法优化部分,二是和对于模型评价的部分,这两个部分往往 ...
- 如何准备机器学习数据集_机器学习演练第一部分:准备数据
如何准备机器学习数据集 Cleaning and preparing data is a critical first step in any machine learning project. In ...
- R语言机器学习之caret包详解(一)
R语言机器学习caret包trainControl函数详解 R语言机器学习之caret包详解(一) 简介 数据预处理 各种数据变换 近零方差变量 创建虚拟变量 重抽样技术 k折交叉验证 留一交叉验证 ...
- R语言使用多个数据类型不同的向量数据创建一个dataframe数据对象、使用[]操作符和列名称访问dataframe指定数据列的数据(dataframe column data)
R语言使用多个数据类型不同的向量数据创建一个dataframe数据对象.使用[]操作符和列名称访问dataframe指定数据列的数据(dataframe column data) 目录 R语言使用多个 ...
最新文章
- 对话框处理与登录测试
- matlab输入数组出曲线,用鼠标画出曲线,并将曲线所经过的点保存到数组中
- 英伟达第二季度营收增长24%
- require js
- arcx函数js_抖音的这个JS,怎么能运行,获取到用户的加载信息
- mysql中in的问题
- rabbitmq的基本安装、配置,以及整合springboot,gradle的hello.demo
- pycharm查询mysql数据库_pycharm访问mysql数据库的方法步骤
- OA审批工作流设计器实现
- 冰点还原忘记密码怎样删除?
- 高德地图完整功能的html,关于高德地图WEB版基础控件的展示
- bugku-逆向-5、Timer
- iOS中的传感器---摇一摇, 计步器,距离感应,陀螺仪
- Emulator: Warning: Quick Boot / Snapshots not supported on this machine. A CPU with EPT + UG featur
- 会议期刊论文发表介绍(计算机科学领域)【转载】
- python后台操作炒股软件下载_GitHub - lipq525/stock-1: stock,股票系统。使用python进行开发。...
- 4.1:如何在Python中打开文件
- 用计算机怎么计算p级数,2020考研计算机数学49个基础知识点
- 掩码和反掩码的使用场景
- 苹果电脑的CCTV直播软件_我是亲民_新浪博客