import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model import LogisticRegression

df_train = pd.read_csv(r'E:\BaiduNetdiskDownload\Datasets\Breast-Cancer\breast-cancer-train.csv')#利用pandas读入数据
df_test =pd.read_csv(r'E:\BaiduNetdiskDownload\Datasets\Breast-Cancer\breast-cancer-test.csv')

#选取ClumpThickness与cell size作为特征,构建测试集中的正负分类样本
df_test_negative = df_test.loc[df_test['Type']==0][['Clump Thickness','Cell Size']]
df_test_positive = df_test.loc[df_test['Type']==1][['Clump Thickness','Cell Size']]
plt.scatter(df_test_negative['Clump Thickness'],df_test_negative['Cell Size'],marker='o',s=200,c='red')
plt.scatter(df_test_positive['Clump Thickness'],df_test_positive['Cell Size'],marker='x',s=150,c='black')
plt.xlabel('Clump Thickness')
plt.ylabel('Cell Size')
plt.show()
#利用numpy中的random函数随机采样直线的截距和系数
intercept =np.random.random([1])
coef =np.random.random([2])
lx =np.arange(0,12)
ly = (-intercept-lx*coef[0])/coef[1]
#绘制随机产生的直线
plt.plot(lx,ly,c='yellow')
plt.scatter(df_test_negative['Clump Thickness'],df_test_negative['Cell Size'],marker='o',s=200,c='red')
plt.scatter(df_test_positive['Clump Thickness'],df_test_positive['Cell Size'],marker='x',s=150,c='black')
plt.xlabel('Clump Thickness')
plt.ylabel('Cell Size')
plt.show()

#利用sklearn中的LogisticRegression回归分类器
#使用前十个样本进行训练
lr = LogisticRegression()
lr.fit(df_train[['Clump Thickness','Cell Size']][:10],df_train['Type'][:10])
print('Testing accuracy(10 training samples):',lr.score(df_test[['Clump Thickness','Cell Size']],df_test['Type']))
intercept=lr.intercept_
coef =lr.coef_[0,:]
#原本的分类器是lx*coef[0]+ly*coef[1]+intercept=0,在这里使用ly = (-intyercept-lx*coef[0])/coef[1]
ly = (-intercept-lx*coef[0])/coef[1]
plt.plot(lx,ly,c='green')
plt.scatter(df_test_negative['Clump Thickness'],df_test_negative['Cell Size'],marker='o',s=200,c='red')
plt.scatter(df_test_positive['Clump Thickness'],df_test_positive['Cell Size'],marker='x',s=150,c='black')
plt.xlabel('Clump Thickness')
plt.ylabel('Cell Size')
plt.show()
#使用所有数据训练,学习直线的系数和截距
lr =LogisticRegression()
lr.fit(df_train[['Clump Thickness','Cell Size']],df_train['Type'])
print('Testing accuracy:',lr.score(df_test[['Clump Thickness','Cell Size']],df_test['Type']))
intercept=lr.intercept_
coef =lr.coef_[0,:]
#原本的分类器是lx*coef[0]+ly*coef[1]+intercept=0,在这里使用ly = (-intyercept-lx*coef[0])/coef[1]
ly = (-intercept-lx*coef[0])/coef[1]
plt.plot(lx,ly,c='blue')
plt.scatter(df_test_negative['Clump Thickness'],df_test_negative['Cell Size'],marker='o',s=200,c='red')
plt.scatter(df_test_positive['Clump Thickness'],df_test_positive['Cell Size'],marker='x',s=150,c='black')
plt.xlabel('Clump Thickness')
plt.ylabel('Cell Size')
plt.show()

   
   
   

对良/恶性肿瘤的预测python代码实现相关推荐

  1. bp神经网络预测python代码_机器学习之多层神经网络(附Python代码和数据)

    1 引言 多层神经网络,Multiple-layers Perceptron (MLP),又被称为多层感知机,是机器学习中深度学习的典型算法.关于多层神经网络的算法原理,我们在Stata和R实现的文章 ...

  2. 交通流预测python代码_Python 3 amp; Keras 实现基于神经网络的交通流预测

    交通流量预测在智能交通(ITS)系统中占有重要地位,是实现交通诱导的前提.准确实时的短时交通流预测有助于更好的分析路网交通状况,对路网交通规划和交通优化控制有非常重要的作用.随着交通数据采集技术的不断 ...

  3. 波士顿房价预测python代码_Python之机器学习-波斯顿房价预测

    AI 人工智能 Python之机器学习-波斯顿房价预测 波士顿房价预测 导入模块 import pandas as pd import numpy as np import matplotlib.py ...

  4. 波士顿房价预测python代码_使用Python和Numpy构建神经网络模型——波士顿房价预测案例...

    原标题:使用Python和Numpy构建神经网络模型--波士顿房价预测案例

  5. adf检验代码 python_第22期:向量自回归(VAR)模型预测——Python实现

    一.向量自回归模型简介 经典回归模型都存在一个强加单向关系的局限性,即被解释变量受到解释变量的影响,但反之不成立.然而,在许多情况下所有变量都相互影响.向量自回归(VAR)模型允许这类双向反馈关系,所 ...

  6. 今日代码(200623)--回厂日期预测(python + R)

    代码笔记,仅供参考 回厂日期预测 前言,对不同客户的下一次返厂时间进行预测,大多数客户的返厂次数不足10次,仅有少量客户返厂次数大于30次. 平均值法预测(python) # -*- coding: ...

  7. 2023年美赛C题Wordle预测问题一建模及Python代码详细讲解

    相关链接 (1)2023年美赛C题Wordle预测问题一建模及Python代码详细讲解 (2)2023年美赛C题Wordle预测问题二建模及Python代码详细讲解 (3)2023年美赛C题Wordl ...

  8. 2023年美赛C题Wordle预测问题三、四建模及Python代码详细讲解

    更新时间:2023-2-19 16:30 相关链接 (1)2023年美赛C题Wordle预测问题一建模及Python代码详细讲解 (2)2023年美赛C题Wordle预测问题二建模及Python代码详 ...

  9. 2023年美赛C题Wordle预测问题二建模及Python代码详细讲解

    更新时间:2023-2-19 相关链接 (1)2023年美赛C题Wordle预测问题一建模及Python代码详细讲解 (2)2023年美赛C题Wordle预测问题二建模及Python代码详细讲解 (3 ...

最新文章

  1. flv 自动播放 html autostart=true,《网页制作之FLV视频播放代码的编写.doc
  2. 卖票案例 多线程 java 1615387415
  3. Linux平台上DPDK入门指南
  4. 如何使用Movavi Video Editor编辑婚礼影片?
  5. 一个完整的测试计划模板
  6. 《全球科技通史》吴军老师-读书摘录
  7. 基于SSH 实验室设备管理系统详细功能
  8. Mybatis新增获取Id
  9. 随笔2022.12.6
  10. 获取SD卡序列号和厂商ID
  11. 《炬丰科技-半导体工艺》半导体单晶片旋转清洗器中涡流的周期性结构
  12. 中华英才网爬虫程序解析(2)-多线程threading模块
  13. 并发编程面试汇总(2020)
  14. 测量用计算机软件管理办法,《计算机应用基础》测试题(一)
  15. 饿了么(elementUI)组件库如何在vue项目中使用?
  16. for语句(循环结构)
  17. shell字符串中同时包含单引号和双引号的一种处理方法
  18. 微信小程序中如何实现省市区街道四级地址级联选择
  19. 流式DMA映射实践1:先写一个misc驱动框架
  20. win redis设置开机自启

热门文章

  1. Spring学习第4篇:Spring 的依赖注入
  2. 计算机名词解释 虚拟机,名词解释:什么是虚拟机
  3. 同济版高等数学复习笔记(上册第五、六章)
  4. python3 自然语言处理_Python3NLTK-自然语言处理
  5. 五人合伙最佳股份分配_多人合作如何分配利益-五人合伙开公司,利润如何分配才合理?大家好,我们五个人准备合伙开 爱问知识人...
  6. 基于Python+django的网购平台购物商城-计算机毕业设计
  7. Java 之 数据库
  8. Qt继承QWidget或者QWidget直接弹出窗口(非模态对话框)(对话框)
  9. NBA历史连胜记录和连胜记录及不可超越的记录
  10. CMDB(运维自动化)