使用sklearn训练完模型之后,只有将模型持久化到硬盘上,才能方便下次直接使用。

第一种方式:使用pickle

>>> from sklearn import svm
>>> from sklearn import datasets
>>> clf = svm.SVC()
>>> iris = datasets.load_iris()
>>> X, y = iris.data, iris.target
>>> clf.fit(X, y)
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',max_iter=-1, probability=False, random_state=None, shrinking=True,tol=0.001, verbose=False)>>> import pickle
>>> s = pickle.dumps(clf)
>>> clf2 = pickle.loads(s)
>>> clf2.predict(X[0:1])
array([0])
>>> y[0]
0

第二种方式:使用sklearn.external.joblib

>>> from sklearn.externals import joblib
>>> joblib.dump(clf, 'filename.pkl')
...
加载时
>>> clf = joblib.load('filename.pkl') 

预测模型标记语言:PMML

PMML利用XML描述和存储数据挖掘模型,是一个已经被W3C所接受的标准。
它以纯文本形式存储模型数据,因此跨平台、跨语言性能很好。当模型部署时,往往需要使用此种语言。
PMML是一种标准,许多机器学习库都支持将模型导出为PMML。

决策树导出为图像数据

sklearn.tree包中可以将决策树导出为dot类型的文件,dot类型的文件是一种描述图的纯文本文件,它可以使用文本编辑器打开查看,里面是一堆定义结点和边的命令。

from sklearn import tree, datasetsdata = datasets.load_iris()
x = data['data']
y = data['target']
clf = tree.DecisionTreeClassifier()
clf.fit(x, y)
tree.export_graphviz(clf, out_file="haha.dot")

参考资料

model persistence
PMML
知乎讨论
关于DOT文件格式

转载于:https://www.cnblogs.com/weiyinfu/p/7887850.html

sklearn模型保存相关推荐

  1. Sklearn 模型保存和使用

    sklearn中,训练的模型需要保存,可使用joblib库. 模型 model= PCA(n_componenets = 2) model=.fit(x) 使用joblib库保存 import job ...

  2. Sklearn,TensorFlow,keras模型保存与读取

    一.sklearn模型保存与读取  1.保存 1 from sklearn.externals import joblib 2 from sklearn import svm 3 X = [[0, 0 ...

  3. python手动将机器学习模型保存为json文件

    python手动将机器学习模型保存为json文件 # 导入需要的包和库: # Import Required packages #-------------------------# Import t ...

  4. TensorFlow模型保存和加载方法

    TensorFlow模型保存和加载方法 模型保存 import tensorflow as tfw1 = tf.Variable(tf.constant(2.0, shape=[1]), name=& ...

  5. 【Python】Python语言学习:pip工具使用知识,模型保存pickle,PDF与docx相互转换处理...

    2022年第01周. 这一周的Python语言学习,记录如下. 01 pip工具使用知识 1 pip是什么? pip是一个用Python写的用于安装和管理包的包管理系统.它连接一个叫做Python P ...

  6. 【Python】pip工具使用知识,模型保存pickle,PDF与docx相互转换处理

    2022年第01周. 这一周的Python语言学习,记录如下. 01 pip工具使用知识 1 pip是什么? pip是一个用Python写的用于安装和管理包的包管理系统.它连接一个叫做Python P ...

  7. python打包exe 之打包sklearn模型中的各种坑及其解决方法。

    之前学习了如何打包,如何建立虚拟环境打包,以及如何带资源打包exe. python打包成exe 可执行文件 .教程 使用pipenv建立虚拟环境解决python打包exe文件过大的问题(附打包带图标, ...

  8. python实现sklearn的基本操作流程,sklearn预处理方法,sklearn基础算法的使用,以及sklearn模型的选择方法。

    python实现sklearn的基本操作流程,sklearn预处理方法,sklearn基础算法的使用,以及sklearn模型的选择方法. 一.数据的获取与分析 1.读取数据 2.分析数据 二.数据的预 ...

  9. python机器学习手册——学习代码(导入、处理、时间、图像、降维、sklearn模型、神经网络)

    一.向量.矩阵.数组 # 1.1 创建向量 array #一维数组 import numpy as np vector_row = np.array([1,2,3]) # 创建行向量 vector_c ...

最新文章

  1. idea工具使用总结
  2. 【机器学习】机器学习必知概念
  3. 【UOJ 276】无向图最小环
  4. 信天游机票电子行程单_4月1日起,取得火车票、飞机票等咋抵扣?权威解答来了...
  5. python pipeline框架_爬虫(十六):Scrapy框架(三) Spider Middleware、Item Pipeline|python基础教程|python入门|python教程...
  6. Oracle宣布JDK 6死缓:计划赶不上变化
  7. xamarin android pdf,Xamarin 中的Android资源及使用.pdf
  8. 应用密码学第6章——第七章
  9. 计算机服务添加打印机服务,无法添加打印机报错后台程序服务没有运行的解决方法...
  10. 小白学习Java的路上~rush
  11. Android面试分析一:关于OKhttp详解(附带视频教程,flutter游戏全屏
  12. 300 秒就完成第一超算 1 万年的计算量,量子霸权真时代要来了吗
  13. 非线性编辑系统的选购
  14. spring boot 配置默认数据连接池 HiKariCP
  15. dubbo-admin安装以及dubbo-admin简单使用
  16. python将A文件夹内的所有内容原封不动复制搬运到B文件夹
  17. 【goldengate】官方文档笔记三 Oracle GoldenGate 实时报表
  18. Android 电量显示Widgets插件实现
  19. Bzoj2251 [2010Beijing Wc]外星联络
  20. 7z压缩软件,7z.001 7z.002分卷之后的压缩包怎么解压

热门文章

  1. git remote 命令的用法
  2. pure CSS3 triangle icon
  3. 谷歌 Provisional headers are shown 和360急速模式 网络连接错误
  4. Android中通过ActionBar为标题栏添加搜索以及分享视窗
  5. 服务应用监控健康检测
  6. poj 3384 Feng Shui (Half Plane Intersection)
  7. win32 api for .net
  8. 如何在aspx页面中插入swf动画
  9. SpringBoot 入门知识点详解
  10. Linux 的字符串截取很有用。有八种方法。