ML之LoR:基于LoR(逻辑回归)算法对乳腺癌肿瘤(9+1)进行二分类预测(良/恶性)
ML之LoR:基于LoR(逻辑回归)算法对乳腺癌肿瘤(9+1)进行二分类预测(良/恶性)
目录
输出结果
设计思路
数据集
核心代码
输出结果
Testing accuracy (10 training samples): 0.8685714285714285
Testing accuracy (all training samples): 0.9371428571428572
设计思路
数据集
可知该原始数据共有699条样本,每条样本有11列不同的数值:1列用于检索的id,9列与肿瘤相关的医学特征,以及一列表征肿瘤类型的数值。所有9列用于表示肿瘤医学特质的数值均被量化为1~10之间的数字,而肿瘤的类型也借由数字2和数字4分别指代良性与恶性。不过,这份数据也声明其中包含16个缺失值,并且用“?”标出。本代码中,对于存在缺失值的数据,都暂时子以忽略。
Number of Instances:699 (as of 15 July 1992)
Number of Attributes:10 plus the class attribute
Attribute Information:(class attribute has been moved to last column
#Attribute Domain
1 .Sample code number id number
2 .Clump Thickness 1一10
3 .Uniformity of Cell 1一10
4 .Uniformity of Cell 1一10
5 .Marginal Adhesion 1一10
6 .Single Epithelial Cell Size 1一10
7 .Bare Nuclei 1一10
8 .Bland Chromatin 1一10
9. Normal Nucleoli 1一10
10 .Mitoses 1一10
11 .Class: (2 for benign, 4 for malignant)
核心代码
import numpy as np
intercept = np.random.random([1])
coef = np.random.random([2])lx = np.arange(0, 12)
ly = (-intercept - lx * coef[0]) / coef[1]from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(df_train[['Clump Thickness', 'Cell Size']][:10], df_train['Type'][:10])
print('Testing accuracy (10 training samples):', lr.score(df_test[['Clump Thickness', 'Cell Size']], df_test['Type']))intercept = lr.intercept_
coef = lr.coef_[0, :]
ly = (-intercept - lx * coef[0]) / coef[1]lr = LogisticRegression()
lr.fit(df_train[['Clump Thickness', 'Cell Size']], df_train['Type'])
print('Testing accuracy (all training samples):', lr.score(df_test[['Clump Thickness', 'Cell Size']], df_test['Type']))intercept = lr.intercept_
coef = lr.coef_[0, :]
ly = (-intercept - lx * coef[0]) / coef[1]
ML之LoR:基于LoR(逻辑回归)算法对乳腺癌肿瘤(9+1)进行二分类预测(良/恶性)相关推荐
- ML之LoRSGD:基于LoR(逻辑回归)、SGD梯度下降算法对乳腺癌肿瘤(10+1)进行二分类预测(良/恶性)
ML之LoR&SGD:基于LoR(逻辑回归).SGD梯度下降算法对乳腺癌肿瘤(10+1)进行二分类预测(良/恶性) 目录 输出结果 设计思路 核心代码 输出结果 breast-cancer s ...
- ML之Xgboost:利用Xgboost模型对数据集(比马印第安人糖尿病)进行二分类预测(5年内是否患糖尿病)
ML之Xgboost:利用Xgboost模型对数据集(比马印第安人糖尿病)进行二分类预测(5年内是否患糖尿病) 目录 输出结果 设计思路 核心代码 输出结果 X_train内容: [[ 3. 102. ...
- 基于机器学习逻辑回归算法完成癌症病人的肿瘤是否良性的判断
https://www.toutiao.com/a6630407688360575502/ 2018-12-04 22:46:48 逻辑回归算法 虽然逻辑回归算法的名字中有回归二字,但是它却不是回归算 ...
- 基于逻辑回归的癌症分类预测-良/恶性乳腺癌肿瘤预测
简介:逻辑回归是属于机器学习里面的监督学习,它是以回归的思想来解决分类问题的一种非常经典的二分类分类器. 流程分析: 获取数据 数据处理模块(处理缺失值) 数据集划分 特征工程(标准化) 逻辑回归预估 ...
- 算法笔记(11)逻辑回归算法及Python代码实现
逻辑回归算法是一种被广泛使用的分类算法,通过训练数据中的正负样本,学习样本特征到样本标签之间的假设函数.逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y 服从高斯分布. 因此与线性回归 ...
- ML:基于自定义数据集利用Logistic、梯度下降算法GD、LoR逻辑回归、Perceptron感知器、SVM支持向量机、LDA线性判别分析算法进行二分类预测(决策边界可视化)
ML:基于自定义数据集利用Logistic.梯度下降算法GD.LoR逻辑回归.Perceptron感知器.支持向量机(SVM_Linear.SVM_Rbf).LDA线性判别分析算法进行二分类预测(决策 ...
- ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以toad框架全流程讲解
ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以toad框架全流程讲解 目录 基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以to ...
- ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以scorecardpy框架全流程讲解
ML之LoR:基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分卡模型之以scorecardpy框架全流程讲解 目录 基于信用卡数据集利用LoR逻辑回归算法实现如何开发通用信用风险评分 ...
- ML之yellowbrick:基于titanic泰坦尼克是否获救二分类预测数据集利用yellowbrick对LoR逻辑回归模型实现可解释性(阈值图)案例
ML之yellowbrick:基于titanic泰坦尼克是否获救二分类预测数据集利用yellowbrick对LoR逻辑回归模型实现可解释性(阈值图)案例 目录 基于titanic泰坦尼克是否获救二分类 ...
最新文章
- web常见几种处理图标方法 【转】
- 逆向python生成的可执行文件
- oracle+去括号,关于001 TK的几个问题,请大家一起讨论一下
- 前端学习(2773):条件编译和跨端兼容
- pdf.js 文字丢失问题 .cmaps
- gs算法的matlab代码_【图像算法amp;MATLAB】直方图均衡(干货代码)
- 2.mysql数据库如何安装_MySQL数据库如何安装
- 云服务被归类为IDC业务 提供云服务必须持证上岗
- 一个没暂时没有办法实现的问题和一个有意思的小问题!
- ai生成图片是什么技术_什么是生成型AI?
- vue-element-admin之修改登录页面背景
- 里氏代换原则(企鹅是不是鸟!)
- BitCoin p2p通信过程
- 泛泛而谈的菜鸟学习记录(五)—— Compute Shader
- 锐捷无线AC虚拟化配置-VAC
- unity实现动态广告牌效果
- 初露锋芒的AI战斗机,打开AI军备竞赛的潘多拉盒子
- 支付必测--使用fiddler篡改支付金额
- JSP--图文并茂(五)
- OpenEuler 22.03 安装NextCloud