糖尿病概述

糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变、肾脏疾病、高血压、中风等、眼部疾病、下肢截肢上百种,由此增加了过早死亡的风险.因此,糖尿病防治形势十分严峻.

下右图为糖尿病视网膜病变

2019年估算中国糖尿病患病率排名世界第二

中国糖尿病患者数量位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人也加入糖尿病市场,成为药企摇钱树。

下图为中国糖尿病患病率历史数据

糖尿病给经济带来巨大负担
糖尿病也给经济带来了巨大的负担,每年诊断出的糖尿病成本约为 3270 亿美元,而未确诊的糖尿病和前驱糖尿病的总成本接近 4000 亿美元。

糖尿病可预防

虽然糖尿病无法治愈,但减肥、健康饮食、积极运动和接受药物治疗等策略可以减轻这种疾病对许多患者的危害。早期诊断可以改变生活方式和更有效的治疗,使糖尿病风险预测模型成为公共和公共卫生官员的重要工具。

糖尿病致病因子多样化
虽然有不同类型的糖尿病,但 II 型糖尿病是最常见的形式,其患病率因年龄、教育程度、收入、地点、种族和其他健康的社会决定因素而异。这种疾病的大部分负担也落在社会经济地位较低的人身上。
本实验就是通过建立人工智能机器学习模型,预测糖尿病概率和挖掘糖尿病重要致病因子。

糖尿病建模数据集介绍
糖尿病数据集来源Pima印第安人糖尿病数据集。数据集包含769条数据,9个变量。变量如下:妊娠, 血糖,血压,皮肤厚度,胰岛素,BMI,糖尿病系统功能,年龄,是否为糖尿病患者。

本研究的实验数据来自 UniversityofCalifornia,UGI机器学习数据库中的 PimaIndianDiabetes数据集,其研究对象是亚利桑那州凤凰城附近的皮马印第安人.该数据集共有768条数据项,包含8个医学预测变量和1个结果变量,其具体属性包括:怀孕次数(Pregnancies)、血糖浓度(Glucose)、年龄(Age)、血压(BloodPressure)、肱三头肌皮脂厚度(SkinThickness)、胰岛素含量(Insulin)、身体质量指数(BMI)、糖尿病遗传系数(DiabetesPedigreeFunction)和 结 果(Outcome,1代 表 患 糖 尿 病,0代 表 未 患 糖 尿 病).在PimaIndianDiabetes数据集中,Outcome为1的有268例,即为糖尿病患者人数;Outcome为0的有500例,即为未患有糖尿病的人数.

模型价值和意义

通过我们建立的人工智能机器学习预测模型,可实现以下一些研究问题:
1.模型能准确预测个人是否患有糖尿病。
2.模型能挖掘哪些风险因素最能预测糖尿病风险。
3.我们能使用风险因素的一个子集来准确预测一个人是否患有糖尿病。
4.我们可以使用筛选几个重要糖尿病致病特征,然后组合创建为一个简短的问题,以准确预测某人是否可能患有糖尿病或是否有糖尿病的高风险。

传统集成树算法虽然比决策树性能更优,但性能仍有改进空间。

型采用新一代对称树算法,有效降低过度拟合,提高模型预测速度和预测能力。

糖尿病预测模型性能优秀,ROC大于0.84。

通过描述性统计,我们观察匹马印第安糖尿病数据集变量直方图:BMI,血压,血糖三个变量呈现明显正态分布。

所有变量数据缺失率为0,是良好科研建模数据集。

变量相关性热力图显示:血糖,BMI,年龄与糖尿病有高度相关性。

通过数据挖掘,我们得到匹马印第安数据集中变量重要性排序。

模型启示录1
血糖-控制含糖量高的食品摄入,例如白糖,奶茶,糖果,零食。

模型启示录2

BMI-控制体重,适当锻炼

人工智能让生活更美好!

AI机器学习建模Pima印第安人糖尿病数据集-论文

版权声明:文章来自公众号(python生物信息学),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研相关推荐

  1. 《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

    大赛概况 进入21世纪,生命科学特别是基因科技已经广泛而且深刻影响到每个人的健康生活,于此同时,科学家们借助基因科技史无前例的用一种全新的视角解读生命和探究疾病本质.人工智能(AI)能够处理分析海量医 ...

  2. Pima印第安人数据集上的机器学习-分类算法(根据诊断措施预测糖尿病的发病)

    数据集简介 该数据集最初来自国家糖尿病/消化/肾脏疾病研究所.数据集的目标是基于数据集中包含的某些诊断测量来诊断性的预测 患者是否患有糖尿病. 从较大的数据库中选择这些实例有几个约束条件.尤其是,这里 ...

  3. Allstate美国好事达保险公司理赔预测模型案例_企业科研_论文科研_毕业设计

    概述 国好事达保险公司创建于1931年的美国好事达保险公司(Allstate)是美国第二大从事个人险种业务的财险和意外险保险公司, 并跻身于全美最大的15家人寿保险公司的行列.公司的总部设在芝加哥地区 ...

  4. hadloop大数据平台论文_企业大数据平台建设过程中的问题和建议

    2 0 1 7 年 第 1 2 期 信 息 通 信 2017 (总第 180 期) INFORMATION & COMMUNICATIONS ( Sum . N o 180) 企业大数据平台建 ...

  5. 基于python的科技论文_实地科研 | 上海财经大学 | 金融科技、商业分析、人工智能:机器学习、人工智能及其在金融科技中的应用(2021.1.25开课)...

      课题名称   = 机器学习.人工智能及其在金融科技中的应用 =  项目背景   随着云时代的到来,机器学习.人工智能.大数据技术具有越来越重要的战略意义,并逐渐渗透到每一个行业和业务职能领域,成为 ...

  6. 学习笔记——仅仅为了留下Pima印第安人糖尿病发病数据集的网址

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/qq_42370150/article/ ...

  7. 机器学习糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利

    糖尿病概述 糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变.肾脏疾病.高血 ...

  8. 人工智能糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利

    糖尿病概述 糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变.肾脏疾病.高血 ...

  9. 《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-企业科研_论文作业

    大赛概况 进入21世纪,生命科学特别是基因科技已经广泛而且深刻影响到每个人的健康生活,于此同时,科学家们借助基因科技史无前例的用一种全新的视角解读生命和探究疾病本质.人工智能(AI)能够处理分析海量医 ...

最新文章

  1. sendStickyBroadcast和sendStickyOrderedBroadcast
  2. Linux命令整理 - 文件搜索【4】
  3. canvas rotate 累加旋转_【教研动态】音乐活动中,使用材料累加情境的适宜性
  4. Android复习15【动画:创建资源文件夹、创建动画资源文件、组合动画、属性动画、材料设计新特性】
  5. 使用阿里云火车票查询接口案例——CSDN博客
  6. [Leetcode][第491题][JAVA][递增子序列][回溯][RK算法]
  7. oracle10g自带的公共同义词,Oracle10g实战教程第07讲视图、同义词、序列
  8. 从Fedora CoreOS(Fedora35)到CentOS-Stream9的重构
  9. django学习笔记02
  10. 20172331 《Java程序设计》第3周学习总结
  11. html三栏布局有哪几种,CSS三栏布局的5种方法详解
  12. 【算法总结】数学问题-高精度整数
  13. (CNVD-2021-49104) 泛微E-Office v9.0任意文件上传漏洞
  14. python词云图生成简单实用
  15. 日常一记(7)--excel合并两列数据并删除重复项
  16. goole搜索技巧(摘要)
  17. Java语言这些年的发展
  18. ArcMap制作3D地形图
  19. 使用Qt做一个简单计算器
  20. [H265/HEVC] 波前并行处理WPP

热门文章

  1. 互联网快讯:中国联通推出5G视频热线;极米Z6X Pro、极米H3S持续热销;丰速运与云快充达成合作
  2. Windows 11正式发布,新功能太绝了!
  3. 再谈OT算法的协同文档制作的底层基础架构记录
  4. Android 一个简单的音乐播放器
  5. STM32CubeMX实现串口DMA中断通信
  6. 2020年各省二建房建挂靠价格汇总
  7. 加密与解密 入侵检测 扫描与抓包
  8. Cheat Engine安装 汉化
  9. 杨幂穿搭有三宝:露腿,收腰,配饰亮点,赶快马起来
  10. 教程:微信公众号的链接如何提取出来?非常简单!