机器学习——糖尿病预测
- 实验目的
表格数据分类,糖尿病预测。
根据生活、饮食、教育、收入等属性,预测得1型、2型和不得糖尿病的概率。
- 实验内容
- 获得数据
- 从数据探索和数据可视化中获得洞见
- 数据探索
- 数据预处理
- 划分数据并训练模型
- 微调模型
- 编码
#获取数据
import pandas as pd
diabetes = pd.read_csv('糖尿病预测.csv')
print('dataset shape {}'.format(diabetes.shape))
diabetes.head()
结果:
#输出前五行数据
from sklearn.model_selection import train_test_split
diabetes.info()
x_train, x_test, y_train, y_test = train_test_split(
diabetes.loc[:, diabetes.columns != 'Diabetes_012'],
diabetes['Diabetes_012'], stratify=diabetes['Diabetes_012'],
random_state=66)
#数据相关性
corr = diabetes.corr()
Corr
#绘图
import seaborn as sns
import matplotlib.pyplot as plt
sns.countplot(diabetes['Diabetes_012'], label="Count")
plt.show("糖尿病数据处理图片")
输出图片:
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=9)
knn.fit(x_train, y_train)
print("Accuracy of K-NN classifier on training set: {:.2f}".format(knn.score(x_train, y_train)))
print("Accuracy of K-NN classifier on test set: {:.2f}".format(knn.score(x_test, y_test)))
输出结果:
# 数据探索
%matplotlib inline
import matplotlib.pyplot as plt
diabetes.hist(bins=50, figsize=(20,15))
plt.show()
from sklearn.metrics import confusion_matrix
from sklearn.metrics import classification_report
y_pred = knn.predict(x_test)
print(classification_report(y_pred, y_test))
confusion = confusion_matrix(y_pred, y_test)
df_cm = pd.DataFrame(confusion)
plt.figure()
sns.heatmap(df_cm, annot=True)
plt.savefig('confusion_matrix')
plt.show()
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(x_train,y_train)
predictions = lr.predict(x_test)
lr.predict_proba([[0,0,0,30,1,0,0,1,1,0,0,1,0,30,0,13,1,0,11,5,3]])
输出结果:
机器学习——糖尿病预测相关推荐
- 【阿旭机器学习实战】【36】糖尿病预测---决策树建模及其可视化
[阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. [阿旭机器学习实战][36]糖尿病预测-决策树建模及其可视化 目录 [阿旭机器学习实战][36]糖 ...
- 利用python机器学习库进行Kaggle皮马印第安人糖尿病预测分析
利用python机器学习库进行Kaggle皮马印第安人糖尿病预测分析 项目摘要 本项目主要使用python对各医学参数与糖尿病之间的关系进行可视化分析.描述性分析.使用scikit-learn机器学习 ...
- 机器学习实验之糖尿病预测
文章目录 机器学习实验之糖尿病预测 **实验内容:** **实验要求:** 加载糖尿病数据集diabetes,观察数据 载入糖尿病情数据库diabetes,查看数据 切分数据,组合成DateFrame ...
- 机器学习 预测模型_使用机器学习模型预测心力衰竭的生存时间-第一部分
机器学习 预测模型 数据科学 , 机器学习 (Data Science, Machine Learning) 前言 (Preface) Cardiovascular diseases are dise ...
- 机器学习糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利
糖尿病概述 糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变.肾脏疾病.高血 ...
- 小组作业:糖尿病预测
提示:该Blog仅用于作业汇报展示,大佬请绕路 文章目录 一.作业介绍 二.数据处理 三.数据分析 四.特征选择 五.模型训练与评价 六.模型优化 七.与原模型进行对比 八.作业总结 一.作业介绍 该 ...
- 计算机书籍-Apress机器学习和预测分析
书名:Microsoft Azure机器学习和预测分析 作者:[美] Roger,Barga,巴尔加,[美] Valentine,Fontama 出版社: 人民邮电出版社 出版时间:2017-08-0 ...
- 50多种适合机器学习和预测应用的API,你的选择是?(2018年版本)
对于做工程项目和搞科研的人来说,有现成的模块或工具使用是一件多么美妙的事情啊,无需访问源码或理解内部工作机制的细节即可完成相应的任务.常用的方法是调用一些API,即一些预先定义的函数,目的是提供应用程 ...
- python财务报表预测股票价格_机器学习股票价格预测从爬虫到预测-数据爬取部分...
声明:本文已授权公众号「AI极客研修站」独家发布 前言 各位朋友大家好,小之今天又来给大家带来一些干货了.上篇文章机器学习股票价格预测初级实战是我在刚接触量化交易那会,因为苦于找不到数据源,所以找的一 ...
最新文章
- 60颗卫星被五手火箭送上天!马斯克疯狂的卫星互联网计划不远了
- Jquery Mobile转场特效之slide | 小小iPhone开发
- android videoview属性,Android VideoView
- 计算一个数的二进制中1的个数
- JavaEE实战班第二天
- windows更改pip源_让你的 pip下载速度 飞起来
- 关于TCP协议的几个问题
- 财富信息不需要传userID后台会根据保存的session提供数据
- 【人脸识别】LFW数据集介绍
- Linux yum 安装
- Git使用方法(二)-远程库与分支
- 软件需求分析--结构化分析(SA)方法[1]
- ubuntu16.04下ROS操作系统学习笔记(三 / 一)ROS基础-工作空间
- httpclient请求服务的各种方法实例
- 左耳朵耗子-陈皓经历(转载)
- 分享一个轻量级免费UML绘图工具JUDE
- 神经语言程序学(Neruo Linguistic Programming)理解层次
- Module not found: Error: Can‘t resolve ‘core-js/fn/promise‘
- sqoop connect oracle,Sqoop从Oracle导出数据出错:The Network Adapter could not establish the connection...
- GDK7+NanoCode调试学习系列1--环境搭建
热门文章
- matlab中乘法器,乘法器(4位乘法器逻辑电路图)
- wincc新建项目无法连接到服务器,wincc flexible 2008 SP2无法连接到SQL服务器
- 处理 -File“D:\Program”失败,因为该文件不具有 ‘.ps1‘ 扩展名。请指定一个有效...
- 服务器拷贝文件内存报错,使用服务器内存拷贝文件
- 绝对定位的子盒子无法撑开父盒子的原因和解决方案
- JavaScript实现京东秒杀效果
- 2020-12-14(237. 删除链表中的节点)
- mysql压缩包启动不了_mysql-8.0.17解压版安装步骤及MySQL服务无法启动问题的解决办法...
- Java+spring 基于ssm的医院设备管理系统#毕业设计
- 【ESP32 S2 烧录AT固件 串口与USB两种方式】