糖尿病概述

糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变、肾脏疾病、高血压、中风等、眼部疾病、下肢截肢上百种,由此增加了过早死亡的风险.因此,糖尿病防治形势十分严峻.

下右图为糖尿病视网膜病变

2019年估算中国糖尿病患病率排名世界第二

中国糖尿病患者数量位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人也加入糖尿病市场,成为药企摇钱树。

下图为中国糖尿病患病率历史数据

糖尿病给经济带来巨大负担
糖尿病也给经济带来了巨大的负担,每年诊断出的糖尿病成本约为 3270 亿美元,而未确诊的糖尿病和前驱糖尿病的总成本接近 4000 亿美元。

糖尿病可预防

虽然糖尿病无法治愈,但减肥、健康饮食、积极运动和接受药物治疗等策略可以减轻这种疾病对许多患者的危害。早期诊断可以改变生活方式和更有效的治疗,使糖尿病风险预测模型成为公共和公共卫生官员的重要工具。

糖尿病致病因子多样化
虽然有不同类型的糖尿病,但 II 型糖尿病是最常见的形式,其患病率因年龄、教育程度、收入、地点、种族和其他健康的社会决定因素而异。这种疾病的大部分负担也落在社会经济地位较低的人身上。
本实验就是通过建立人工智能机器学习模型,预测糖尿病概率和挖掘糖尿病重要致病因子。

糖尿病建模数据集介绍
糖尿病数据集来源美国疾控中心CDC糖尿病数据集。数据集包含25万条数据,21个变量。变量包括:实验者综合健康状态,性别,年龄,是否吸烟,是否心脏病,是否中风,是否高血压,是否高胆固醇,身体锻炼情况,蔬菜水果摄入情况,BMI指数等等。

美国疾控中心CDC糖尿病数据集一览

模型价值和意义

通过我们建立的人工智能机器学习预测模型,可实现以下一些研究问题:
1.模型能准确预测个人是否患有糖尿病。
2.模型能挖掘哪些风险因素最能预测糖尿病风险。
3.我们能使用风险因素的一个子集来准确预测一个人是否患有糖尿病。
4.我们可以使用筛选几个重要糖尿病致病特征,然后组合创建为一个简短的问题,以准确预测某人是否可能患有糖尿病或是否有糖尿病的高风险。

传统集成树算法虽然比决策树性能更优,但性能仍有改进空间。

型采用新一代对称树算法,有效降低过度拟合,提高模型预测速度和预测能力。

糖尿病预测模型性能优秀,ROC大于0.8,accuracy准确率高于0.866。

美国疾控中心糖尿病数据描述性统计如下

通过模型得出综合健康评级指数,年龄,BMI指数,高血压,高胆固醇是影响糖尿病的5个重要因素。
部分变量数据挖掘结果:GenHlth综合健康分数:数值越大,糖尿病风险越大;数值越小,糖尿病风险越小

年龄:年龄越大,糖尿病风险越大;年龄越小,糖尿病风险越小。

BMI指数:BMI越大,糖尿病风险越大;BMI越小,糖尿病风险越小。左边有少量红色点,每个变量有少数例外,但大趋势不变。

高血压:如果有高血压,糖尿病风险越大;如果没有高血压,糖尿病风险越小。


通过对美国疾控中心CDC糖尿病建模和数据挖掘后,我们得到很多高价值信息。

模型启示录1
血糖-控制含糖量高的食品摄入,例如白糖,奶茶,糖果,零食。

模型启示录2

BMI-控制体重,适当锻炼

模型启示录3-积极防控高血压

模型启示录4-积极防控高胆固醇

糖尿病可防可控,从预防做起,可限制降低糖尿病患病概率,减少政府医疗开支负担。

欢迎商务合作

如果您们对糖尿病模型项目感兴趣,欢迎各大医疗机构,科研机构,生物医药企业联系。

人工智能让生活更美好!

机器学习糖尿病预测模型复现-美国疾控中心CDC25万数据集,论文作业

版权声明:文章来自公众号(python生物信息学),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

机器学习糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利相关推荐

  1. 人工智能糖尿病预测模型-美国疾控中心CDC25万数据集,生物医药企业科研_论文作业_专利

    糖尿病概述 糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变.肾脏疾病.高血 ...

  2. 《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-企业科研_论文作业

    大赛概况 进入21世纪,生命科学特别是基因科技已经广泛而且深刻影响到每个人的健康生活,于此同时,科学家们借助基因科技史无前例的用一种全新的视角解读生命和探究疾病本质.人工智能(AI)能够处理分析海量医 ...

  3. 科研实习 | 加拿大Mila实验室唐建教授招收机器学习/生物医药方向科研实习生...

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! Mila Mila 实验室是由深度学习先驱 Yoshua Bengio 教 ...

  4. 心脏病_冠心病智能预测模型(人工智能,机器学习,用于论文作业_专利_企业建模__项目申报_科研报告,收藏)

    作者Toby,来自心脏病_冠心病智能预测模型 ​ 心脏病(heart disease)是心脏疾病的总称,包括风湿性心脏病.先天性心脏病.高血压性心脏病.冠心病.心肌炎等各种心脏病. 人体"发 ...

  5. 心脏病_冠心病智能预测模型(人工智能,机器学习,用于论文作业_专利_企业建模__项目申报_科研报告)

    ​ 心脏病(heart disease)是心脏疾病的总称,包括风湿性心脏病.先天性心脏病.高血压性心脏病.冠心病.心肌炎等各种心脏病. 人体"发动机" 心脏是一个强壮的.不知疲倦. ...

  6. 糖尿病视网膜病变预测模型-机器学习-人工智能-企业科研

    糖尿病性视网膜病变是糖尿病的一种并发症,由高血糖水平损害眼睛后部(视网膜)引起.如果不加以诊断和治疗,可能会导致失明.任何患有 1 型糖尿病或 2 型糖尿病的人都有可能患上糖尿病性视网膜病变. 然而, ...

  7. 2022年广州市生物医药产业创新补助及申报要求,补贴500-3000万

    2022年广州市生物医药产业创新补助,新药临床研究补助,按临床I.II.III期分别给予100万元.150万元和250万元补助:医疗器械产品注册补助,:进入NMPA创新医疗器械特别审查程序并取得第三类 ...

  8. 糖尿病预测模型-Pima印第安人数据集-论文_企业科研

    糖尿病概述 糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变.肾脏疾病.高血 ...

  9. 机器学习肝炎预测模型machine learning for hepatitis prediction model

    作者Toby,来自机器学习肝炎预测模型 肝炎是由细菌.病毒.寄生虫.酒精.药物.化学物质.自身免疫等多种致病因素引起的肝脏炎症的统称.儿童及成年人均可患病,病毒感染导致的病毒性肝炎较为常见. 由于过度 ...

最新文章

  1. 图灵2010.03书讯
  2. Windows Socket 最大连接数
  3. android 读取 网页,Android读取网页内容
  4. 为什么wait、notify必须在synchronized保护的同步代码中
  5. OpenCV使用VideoWriter和VideoCapture的实例(附完整代码)
  6. ext显示服务器文件,使用linux的fsck.ext2命令检查及修复ext2文件系统
  7. 实现贝叶斯分类器_机器学习实战项目-朴素贝叶斯
  8. 【渝粤题库】陕西师范大学200641高等数学作业(高起专、专升本)
  9. 存储器间接寻址方式_8086微处理器的程序存储器寻址模式
  10. linux文件系统及bash基础特性
  11. 有哪些适合新手练手的C/C++项目?
  12. mysql vector查找_vectort
  13. 情人节海报设计没有灵感?看过来
  14. JNPF开发平台3.3企业版框架 力软敏捷开发框架源码7.0.6旗舰版
  15. 把栏杆拍遍--辛弃疾
  16. 计算机网盘打不开,电脑百度网盘无法打开视频的解决方法|电脑百度网盘无法打开视频如何解决...
  17. 企业微信PC端打不开h5页面
  18. 黑马程序员——多态和抽象类的相关知识
  19. 在线制图:腾讯云架构在线绘制
  20. UML用例图之关联关系、包含关系、扩展关系、泛化关系详解

热门文章

  1. 直播美颜工具对主播们来说有多重要?是否已经成为刚需?
  2. Vue返回上一个页面时如何触发上一个页面的方法
  3. 安全人员去年曾发现高通芯片一重大漏洞 影响骁龙845等30多款芯片
  4. springboot 使用ftl模板导出echarts图表到word
  5. JavaScript 异步函数解析
  6. 两年 Android 经验面经(有赞等公司),安卓事件分发机制面试
  7. Gantt图与PERT图
  8. 爱奇艺万能播放器解决百度网盘限速问题
  9. Rviz显示电脑摄像头
  10. 戴尔塔式服务器显示器掉帧,简单记录我如何解决的笔记本外接显示器游戏掉帧问题...