数据集:pima_indians-diabetes.csv
(https://archive.ics.uci.edu/ml/datasets/Pima+Indians+Diabetes)
美国亚利桑那州的⽐马印第安⼈患糖尿病概率极⾼。WHO为此调查了21岁以上
的⼥性患者,并记录了以下信息:
1. 怀孕了⼏次
2. ⾎糖
3. ⾎压
4. ⽪脂厚度
5. 胰岛素
6. 体质指数
7. 糖尿病⾎统
8. 年龄

9. label:是否患病

# 先导⼊入所有要⽤用的class
import numpy
import xgboost
from sklearn import cross_validation
from sklearn.metrics import accuracy_score
# load数据集
dataset = numpy.loadtxt('pima-indians-diabetes.csv', delimiter=",")
# 把 X Y 分开
X = dataset[:,0:8]
Y = dataset[:,8]
# 现在我们分开训练集和测试集
seed = 7
test_size = 0.33
X_train, X_test, y_train, y_test = cross_validation.train_test_split \
(X, Y, test_size=test_size, random_state=seed)
# 训练模型
model = xgboost.XGBClassifier()
# 这⾥里里参数的设置可以⻅见:http://xgboost.readthedocs.io/en/latest/python/
python_api.html#module-xgboost.sklearn
model.fit(X_train, y_train)
# 做预测
y_pred = model.predict(X_test)
predictions = [round(value) for value in y_pred]
# 显示准确率
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: %.2f%%" % (accuracy * 100.0))
# 更更多的模型:
import sklearn.ensemble.RandomForestClassifier
import sklearn.ensemble.RandomForestRegressor
import sklearn.ensemble.AdaBoostClassifier
import sklearn.ensemble.AdaBosstRegressor

XGboost 实战糖尿病预测相关推荐

  1. python预测糖尿病_实战 | 糖尿病预测项目

    项目介绍 这次我们要学习的项目是糖尿病的预测,数据保存在diabetes.csv文件中.数据一共有8个特征和1个标签: Pregnancies:怀孕次数Glucose:葡萄糖测试值BloodPress ...

  2. 【超详细】逻辑回归之kaggle糖尿病预测实战

    学习目标: 逻辑回归--kaggle糖尿病预测实战 [实验所需数据私聊可发] 实验背景: 1.糖尿病是一组以高血糖为特征的代谢性疾病,由于胰岛素分泌缺陷或其生物作用受损则引起高血糖.长期存在的高血糖, ...

  3. 【阿旭机器学习实战】【36】糖尿病预测---决策树建模及其可视化

    [阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. [阿旭机器学习实战][36]糖尿病预测-决策树建模及其可视化 目录 [阿旭机器学习实战][36]糖 ...

  4. 史上最详细的XGBoost实战

    0. 环境介绍 Python 版 本: 3.6.2 操作系统 : Windows 集成开发环境: PyCharm 1. 安装Python环境 安装Python 首先,我们需要安装Python环境.本人 ...

  5. python xgboost实战_史上最详细的XGBoost实战

    0. 环境介绍 Python 版 本: 3.6.2 操作系统 : Windows 集成开发环境: PyCharm 1. 安装Python环境 安装Python 首先,我们需要安装Python环境.本人 ...

  6. 机器学习训练营-基于XGBoost的分类预测学习笔记

    文章目录 前言 一.学习知识点概要 二.学习内容 1 XGBoost的应用及优缺点 1.1 XGBoost的应用 1.2 XGBoost的优缺点 2 基于天气数据集的XGBoost分类实战 2.1 目 ...

  7. 小组作业:糖尿病预测

    提示:该Blog仅用于作业汇报展示,大佬请绕路 文章目录 一.作业介绍 二.数据处理 三.数据分析 四.特征选择 五.模型训练与评价 六.模型优化 七.与原模型进行对比 八.作业总结 一.作业介绍 该 ...

  8. 如何用XGBoost做时间序列预测?

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 来源:Jason Brownlee,整理:数据派THU 本文约3300字 ...

  9. R语言构建xgboost模型、预测推理:输出预测概率、预测标签

    R语言构建xgboost模型.预测推理:输出预测概率.预测标签 目录 R

最新文章

  1. Hessian Web Service C# 示例
  2. CUDA系列学习(五)GPU基础算法: Reduce, Scan, Histogram
  3. 推荐一套开源通用后台管理系统(附源码)
  4. Nacos配置管理-配置热更新
  5. 腾讯极客挑战赛正式开赛!「鹅罗斯方块」开“玩”啦
  6. 对css类名className的一些操作的函数
  7. LINUX使用sed完成文本文件的修改
  8. Oozie的安装及使用
  9. alsa 调试工具 aplay 的 编译与 使用
  10. python用户画像_python用户画像
  11. fms2.0视频服务器系统,[FMS]adobe FMS(flash media server )服务器安装过程
  12. 计算机音乐吧粉刷匠,中班音乐歌曲《粉刷匠》
  13. Php7.5,phpwind7.5灵活的业务支持体系
  14. 利用random解决三色球问题
  15. idea ctrl+alt+鼠标左键和ctrl+鼠标左键的作用和区别
  16. 扫地机器人噪音响_硬件老兵拆机分析:扫地机器人噪音大小到底与何相关?
  17. 群晖服务器主板维修,没那么复杂 群晖DS213j内部拆解
  18. zigbee以太网网关方案
  19. 学习OpenCV:hu矩
  20. 弘辽科技:义乌商家操盘手:怎么把3.8元奥运同款卖成全网第一

热门文章

  1. 【刘汝佳可运行代码】Ordering Tasks UVA - 10305【两种解法】
  2. 【传智播客】Javaweb程序设计任务教程 黑马程序员 课后答案【合集】
  3. 申通快递机器人上岗_申通快速分拣机器人未来有70%人会失业
  4. 里面的自带的字典在哪里_白羊座性格的弱点在哪里 ?
  5. npoi 设定视图为分页预览_按班级分页打印,只要两步就行,不需要再筛选复制打印了...
  6. mysql 5.7.21 主从_Mysql 5.7.21 设置主从库同步
  7. 枚举遍历法,你能循环遍历所有的枚举值吗?
  8. 获取当前周一日期_Excel工作表中最全的日期、时间函数,效率办公必备!
  9. debian 8 mysql_在Debian 8系统安装 nginx + php + mysql(MariaDB) 基本Web环境
  10. sqoop增量导出mysql_sqoop定时增量导入导出