简介:逻辑回归是属于机器学习里面的监督学习,它是以回归的思想来解决分类问题的一种非常经典的二分类分类器。

流程分析:

  1. 获取数据
  2. 数据处理模块(处理缺失值)
  3. 数据集划分
  4. 特征工程(标准化)
  5. 逻辑回归预估器
  6. 模型评估

该案例本篇令恶性肿瘤为正例,使用jupyter进行编写。

代码为:

import pandas as pd
import numpy as np
#1.读取数据
path = "https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data"
column_name = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape','Marginal Adhesion', 'Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin','Normal Nucleoli', 'Mitoses', 'Class']
data = pd.read_csv(path,names=column_name)
data.head()

#2.缺失值处理
#1)替换-》np.nan
data = data.replace(to_replace="?",value=np.nan)
#w)删除缺失样本
data.dropna(inplace=True)
data.isnull().any()  #不存在缺失值

#3.划分数据集
from sklearn.model_selection import train_test_split
#筛选特征值和目标值
x = data.iloc[:,1:-1]
y = data["Class"]
x.head()

y.head()

#4.特征工程
from sklearn.preprocessing import StandardScaler
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)

from sklearn.linear_model import LogisticRegression
#5.预估器流程
estimator = LogisticRegression()
estimator.fit(x_train,y_train)

#逻辑的模型参数:回归系数和偏置
estimator.coef_

estimator.intercept_

#6.模型评估
#方法1 直接比对真实值和预测值
y_predict = estimator.predict(x_test)
print("y_predict:\n",y_predict)
print("直接比对真实值和预测值:\n",y_test==y_predict)#方法2 计算准确率
score = estimator.score(x_test,y_test)
print("准确率为:\n",score)

基于逻辑回归的癌症分类预测-良/恶性乳腺癌肿瘤预测相关推荐

  1. 一个经典机器学习案例——良/恶性乳腺癌肿瘤预测

    良/恶性乳腺癌肿瘤预测 良/恶性乳腺癌肿瘤预测问题是一个十分经典的机器学习问题,简单来说我们需要利用肿块厚度和细胞尺寸这两个特征来判断肿瘤的类型(良性或者是恶性).数据的下载网站如下:http://n ...

  2. sklearn逻辑回归案例分析 《良/恶性乳腺癌肿瘤预测》

    由于对逻辑回归等算法做到深刻理解有点难,目前还在学习中,尽管有现成的模型库,我们还是需要对模型的底层实现有一个了解.这里先记录一下如何利用sklearn的LogisticRegression来做一个简 ...

  3. 【机器学习】:sklearn逻辑回归案例分析 《良/恶性乳腺癌肿瘤预测》

    由于对逻辑回归等算法做到深刻理解有点难,目前还在学习中,尽管有现成的模型库,我们还是需要对模型的底层实现有一个了解.这里先记录一下如何利用sklearn的LogisticRegression来做一个简 ...

  4. 《Python machine learning and practice》—— 良\恶性乳腺癌肿瘤预测

    数据集 良\恶性乳腺癌肿瘤预测数据集 代码分析 第三方库文件 from sklearn.linear_model import LogisticRegression #导入sklearn中的逻辑斯蒂回 ...

  5. 《python机器学习及实战》学习笔记ch1之良/恶性乳腺癌肿瘤预测

    1.文章说明 本系列文章都是自己学习<python机器学习及实战>这本书时所做的一些笔记而已,仅为学习作参考. 2.数据集地址: 数据地址是书中给出的数据下载地址: https://pan ...

  6. 《Python机器学习及实践:从零开始通往Kaggle竞赛之路》第1章 简介篇 学习笔记(三)“良/恶性乳腺癌肿瘤预测”总结

    目录 "良/恶性乳腺癌肿瘤预测" 1.机器学习的三个关键术语 (1)任务 (2)经验 (3)性能 2.机器学习的学习过程 (1)观察测试集数据分布 (2)初始化二类分类器 (3)训 ...

  7. 基于逻辑回归的癌症分类预测-良/恶性乳腺癌肿瘤预测及ROC曲线绘制

    逻辑回归 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归.由于算法的简单和高效,在实际中应用非常广泛.逻辑回归是解决二分类问题 ...

  8. 良/恶性乳腺癌肿瘤预测

    1. Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数: itertools.count():会创建一个无限的迭代器,只能按Ctrl+C退出 itertools.cycl ...

  9. One_良恶性乳腺癌肿瘤预测

    Author:龙箬 Data Science and Big Data Technology Change the world with data! CSDN@weixin_43975035 每朵云都 ...

最新文章

  1. .net运行项目的几种形式
  2. 杂项-权限管理:RBAC
  3. 【Android】Eclipse JNI开发
  4. 5天学习MYSQL数据库第一天剩余全部笔记(超级详细的mysql入门笔记适合新手反复看加深记忆)
  5. EE JSP:使用JSTL标记库生成动态内容
  6. iphone新旧手机数据传输已取消_如何取消iPhone手机App自动扣费?三种方法让你不再被“偷”...
  7. 菜鸟postman接口测试_postman 接口测试(转)
  8. 一朵云重50万公斤,为什么掉不下来?
  9. tensorboard ckpt pb 模型的输出节点_算法工程化系列——模型固化
  10. 【C语言】请输入一个n(n=10)并输出一个n行n列的杨辉三角
  11. Android程序版本更新--通知栏更新下载安装(转)
  12. 10深入Redis Cluster
  13. 如何在你的Android手机上配置 Python 环境?
  14. Python全栈工程师系列学习之学习记录
  15. Java线程状态分析/线程状态转换图
  16. 服务器主动向android手机端推送消息
  17. 伦敦金行情走势k线图
  18. 论证可行性有哪几个方面
  19. 全国流通经济杂志全国流通经济杂志社全国流通经济编辑部2022年第25期目录
  20. 什么是闰年?闰年为什么是366天?为什么不能是100的倍数?

热门文章

  1. Windows本地认证和NTLM认证
  2. 现在做什么副业比较赚钱?多说人都选择这4个副业!
  3. FPGA设计-时序约束(中篇-实例分析)
  4. 【龙芯1B】:DS18B20测温例程
  5. python base64 实现_用Python开发GUI实战教程:图片转换素描画工具
  6. byr-加不加都告诉你
  7. 简述地理信息系统与管理系统,地图制图系统和计算机辅助设计系统,武大_真题98_11(地图学与地理信息系统专业的考研真题)(16页)-原创力文档...
  8. STM32CbueMX之SPI_FLASH + FATFS + USB MSC + 虚拟扩容
  9. 存在哪些生物信息学子领域?
  10. win10关闭自带键盘(亲测有用)