这个数据集是机器学习常用练习集,包括768个observation,原链接如下

https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/

已经失效,原因是permission restriction。

从网上搜索到了数据集的内容,并将其转换为tab分隔的文本文件。

主要参考了CSDN博主 姜萌芽 的博文

文件已上传至共享资源,链接在此 https://download.csdn.net/download/lf94lf94/11828795。

各列数据说明如下:

文件默认是5积分下载, 问下各位如何设成免费下载

也可留言免费发送。

或者参考博文,用VIM等自行编辑,乐趣自在其中

R语言可以用如下命令读取并命名header:

diabetes <- read.table(file=“pima-indians-diabetes.data”, sep="\t", header=FALSE)
names(diabetes) <- c("npregant", "glucose", "BP", "triceps", "insulin", "bmi", "pedigree", "age", "class")
diabetes$class <- factor(diabetes$class, levels=c(0,1), labels=c("normal", "diabetic")) 

机器学习数据集pima-indians-diabetes.data 及R语言读入命令相关推荐

  1. 基于Keras在数据集Pima Indians diabetes上实现多层感知器

    机器学习是一种实现人工智能的方法,深度学习则是一种实现机器学习的技术.大量数据为深度学习提供了材料,有了充分的数据做基础,利用深度学习技术就能演绎出更聪明的算法,使深度学习得以迅速发展. 目前有许多深 ...

  2. Pima Indians Diabetes Database(Pima印第安人糖尿病数据库)

    原文: Pima Indians Diabetes Database Predict the onset of diabetes based on diagnostic measures This d ...

  3. 机器学习中的K-means算法原理与R语言实例

    聚类是将相似对象归到同一个簇中的方法,这有点像全自动分类.簇内的对象越相似,聚类的效果越好.支持向量机.神经网络所讨论的分类问题都是有监督的学习方式,现在我们所介绍的聚类则是无监督的.其中,K均值(K ...

  4. Data transformation R语言与python

    https://r4ds.had.co.nz/transform.html 这些R也可以通过python实现,如下 pyrhon: pip install nycflights13 pip insta ...

  5. UCI 机器学习数据集(分类)

    113 Data Sets UCI数据集 Name Data Types Default Task Attribute Types # Instances # Attributes Year   Ab ...

  6. r语言员工离职_使用R机器学习进行员工离职预测系列(一)

    最近一直觉得,其实机器学习的门槛并不高,以R语言的角度,甚至稍微学过一点,就可以针对相关数据进行各种算法模型的建立和测试. 而真正有难度的地方一是算法优化部分,二是和对于模型评价的部分,这两个部分往往 ...

  7. 如何准备机器学习数据集_机器学习演练第一部分:准备数据

    如何准备机器学习数据集 Cleaning and preparing data is a critical first step in any machine learning project. In ...

  8. R语言机器学习之caret包详解(一)

    R语言机器学习caret包trainControl函数详解 R语言机器学习之caret包详解(一) 简介 数据预处理 各种数据变换 近零方差变量 创建虚拟变量 重抽样技术 k折交叉验证 留一交叉验证 ...

  9. R语言使用多个数据类型不同的向量数据创建一个dataframe数据对象、使用[]操作符和列名称访问dataframe指定数据列的数据(dataframe column data)

    R语言使用多个数据类型不同的向量数据创建一个dataframe数据对象.使用[]操作符和列名称访问dataframe指定数据列的数据(dataframe column data) 目录 R语言使用多个 ...

最新文章

  1. 对话框处理与登录测试
  2. matlab输入数组出曲线,用鼠标画出曲线,并将曲线所经过的点保存到数组中
  3. 英伟达第二季度营收增长24%
  4. require js
  5. arcx函数js_抖音的这个JS,怎么能运行,获取到用户的加载信息
  6. mysql中in的问题
  7. rabbitmq的基本安装、配置,以及整合springboot,gradle的hello.demo
  8. pycharm查询mysql数据库_pycharm访问mysql数据库的方法步骤
  9. OA审批工作流设计器实现
  10. 冰点还原忘记密码怎样删除?
  11. 高德地图完整功能的html,关于高德地图WEB版基础控件的展示
  12. bugku-逆向-5、Timer
  13. iOS中的传感器---摇一摇, 计步器,距离感应,陀螺仪
  14. Emulator: Warning: Quick Boot / Snapshots not supported on this machine. A CPU with EPT + UG featur
  15. 会议期刊论文发表介绍(计算机科学领域)【转载】
  16. python后台操作炒股软件下载_GitHub - lipq525/stock-1: stock,股票系统。使用python进行开发。...
  17. 4.1:如何在Python中打开文件
  18. 用计算机怎么计算p级数,2020考研计算机数学49个基础知识点
  19. 掩码和反掩码的使用场景
  20. 苹果电脑的CCTV直播软件_我是亲民_新浪博客

热门文章

  1. linux 安装lnmp环境,centos下配置LNMP环境(源码安装)
  2. 教学设计中的一些疑难问题
  3. solidworks电气元件3d库_Solidworks标准件模型库非标设计国标件 SW素材模板
  4. k8s滚动升级_kubernetes滚动更新
  5. 关于科讯cms商城系统的求教
  6. LC792. 匹配子序列的单词数
  7. Sublime Text 2以及Zen Coding
  8. 记录在学习python中易混淆的知识点
  9. MATLAB title,xlabel,ylabel中引入变量
  10. java医院门诊后台管理系统源码