ML之LoR:基于LoR(逻辑回归)算法对乳腺癌肿瘤(9+1)进行二分类预测(良/恶性)

目录

输出结果

设计思路

数据集

核心代码


输出结果





Testing accuracy (10 training samples): 0.8685714285714285
Testing accuracy (all training samples): 0.9371428571428572

设计思路

数据集

可知该原始数据共有699条样本,每条样本有11列不同的数值:1列用于检索的id,9列与肿瘤相关的医学特征,以及一列表征肿瘤类型的数值。所有9列用于表示肿瘤医学特质的数值均被量化为1~10之间的数字,而肿瘤的类型也借由数字2和数字4分别指代良性与恶性。不过,这份数据也声明其中包含16个缺失值,并且用“?”标出。本代码中,对于存在缺失值的数据,都暂时子以忽略。

Number of Instances:699 (as of 15 July 1992)
Number of Attributes:10 plus the class attribute
Attribute Information:(class attribute has been moved to last column

#Attribute                             Domain                               
1 .Sample code number         id number
2 .Clump Thickness                  1一10
3 .Uniformity of Cell                  1一10
4 .Uniformity of Cell                  1一10
5 .Marginal Adhesion                1一10
6 .Single Epithelial Cell Size     1一10
7 .Bare Nuclei                           1一10
8 .Bland Chromatin                   1一10
9. Normal Nucleoli                    1一10
10 .Mitoses                               1一10
11 .Class:               (2 for benign,  4 for malignant)

核心代码


import numpy as np
intercept = np.random.random([1])
coef = np.random.random([2])lx = np.arange(0, 12)
ly = (-intercept - lx * coef[0]) / coef[1]from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(df_train[['Clump Thickness', 'Cell Size']][:10], df_train['Type'][:10])
print('Testing accuracy (10 training samples):', lr.score(df_test[['Clump Thickness', 'Cell Size']], df_test['Type']))intercept = lr.intercept_
coef = lr.coef_[0, :]
ly = (-intercept - lx * coef[0]) / coef[1]lr = LogisticRegression()
lr.fit(df_train[['Clump Thickness', 'Cell Size']], df_train['Type'])
print('Testing accuracy (all training samples):', lr.score(df_test[['Clump Thickness', 'Cell Size']], df_test['Type']))intercept = lr.intercept_
coef = lr.coef_[0, :]
ly = (-intercept - lx * coef[0]) / coef[1]

ML之LoR:基于LoR(逻辑回归)算法对乳腺癌肿瘤(9+1)进行二分类预测(良/恶性)相关推荐

  1. ML之LoRSGD:基于LoR(逻辑回归)、SGD梯度下降算法对乳腺癌肿瘤(10+1)进行二分类预测(良/恶性)

    ML之LoR&SGD:基于LoR(逻辑回归).SGD梯度下降算法对乳腺癌肿瘤(10+1)进行二分类预测(良/恶性) 目录 输出结果 设计思路 核心代码 输出结果 breast-cancer s ...

  2. ML之Xgboost:利用Xgboost模型对数据集(比马印第安人糖尿病)进行二分类预测(5年内是否患糖尿病)

    ML之Xgboost:利用Xgboost模型对数据集(比马印第安人糖尿病)进行二分类预测(5年内是否患糖尿病) 目录 输出结果 设计思路 核心代码 输出结果 X_train内容: [[ 3. 102. ...

  3. 基于机器学习逻辑回归算法完成癌症病人的肿瘤是否良性的判断

    https://www.toutiao.com/a6630407688360575502/ 2018-12-04 22:46:48 逻辑回归算法 虽然逻辑回归算法的名字中有回归二字,但是它却不是回归算 ...

  4. 基于逻辑回归的癌症分类预测-良/恶性乳腺癌肿瘤预测

    简介:逻辑回归是属于机器学习里面的监督学习,它是以回归的思想来解决分类问题的一种非常经典的二分类分类器. 流程分析: 获取数据 数据处理模块(处理缺失值) 数据集划分 特征工程(标准化) 逻辑回归预估 ...

  5. 算法笔记(11)逻辑回归算法及Python代码实现

    逻辑回归算法是一种被广泛使用的分类算法,通过训练数据中的正负样本,学习样本特征到样本标签之间的假设函数.逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y 服从高斯分布. 因此与线性回归 ...

  6. ML:基于自定义数据集利用Logistic、梯度下降算法GD、LoR逻辑回归、Perceptron感知器、SVM支持向量机、LDA线性判别分析算法进行二分类预测(决策边界可视化)

    ML:基于自定义数据集利用Logistic.梯度下降算法GD.LoR逻辑回归.Perceptron感知器.支持向量机(SVM_Linear.SVM_Rbf).LDA线性判别分析算法进行二分类预测(决策 ...

  7. ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以toad框架全流程讲解

    ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以toad框架全流程讲解 目录 基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以to ...

  8. ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以scorecardpy框架全流程讲解

    ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以scorecardpy框架全流程讲解 目录 基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分 ...

  9. ML之yellowbrick:基于titanic泰坦尼克是否获救二分类预测数据集利用yellowbrick对LoR逻辑回归模型实现可解释性(阈值图)案例

    ML之yellowbrick:基于titanic泰坦尼克是否获救二分类预测数据集利用yellowbrick对LoR逻辑回归模型实现可解释性(阈值图)案例 目录 基于titanic泰坦尼克是否获救二分类 ...

最新文章

  1. web常见几种处理图标方法 【转】
  2. 逆向python生成的可执行文件
  3. oracle+去括号,关于001 TK的几个问题,请大家一起讨论一下
  4. 前端学习(2773):条件编译和跨端兼容
  5. pdf.js 文字丢失问题 .cmaps
  6. gs算法的matlab代码_【图像算法amp;MATLAB】直方图均衡(干货代码)
  7. 2.mysql数据库如何安装_MySQL数据库如何安装
  8. 云服务被归类为IDC业务 提供云服务必须持证上岗
  9. 一个没暂时没有办法实现的问题和一个有意思的小问题!
  10. ai生成图片是什么技术_什么是生成型AI?
  11. vue-element-admin之修改登录页面背景
  12. 里氏代换原则(企鹅是不是鸟!)
  13. BitCoin p2p通信过程
  14. 泛泛而谈的菜鸟学习记录(五)—— Compute Shader
  15. 锐捷无线AC虚拟化配置-VAC
  16. unity实现动态广告牌效果
  17. 初露锋芒的AI战斗机,打开AI军备竞赛的潘多拉盒子
  18. 支付必测--使用fiddler篡改支付金额
  19. JSP--图文并茂(五)
  20. OpenEuler 22.03 安装NextCloud

热门文章

  1. sql 数据库前两列值乘_数据库的基本概念:
  2. Weka学习四(属性选择)
  3. Linux电源管理(10)_autosleep
  4. Dubbo源码分析(三)Dubbo中的SPI和自适应扩展机制
  5. 我国大陆居民身份证Java验证
  6. 网易2017春招笔试真题编程题集合(5)——魔力手环
  7. 《Linux防火墙(第4版)》——1.3 传输层机制
  8. 解决电信网通封锁路由以及上网机器台数的破解方法
  9. python获取城市天气数据案例
  10. 操作系统的极简教程(二)