场景:需要将模型保存到内存,或磁盘。

代码:

# -*- coding: utf-8 -*-import pandas as pd
import pickle as pkl
from sklearn.externals import joblib
from sklearn import svm
#加载数据
label_ds=pd.read_csv(r"D:\\tmp\\sam_11.csv",sep=',',encoding='utf8',\names=['u_spu_num','u_brand_num','u_cat_num','u_cat_spu','u_brand_spu','u_spu_date','action_type'])
print "训练集,有", label_ds.shape[0], "行", label_ds.shape[1], "列"
#模型训练
label_X  = label_ds[['u_spu_num','u_brand_num','u_cat_num','u_cat_spu','u_brand_spu','u_spu_date']]
label_y = label_ds['action_type']#类别
model = svm.SVC()
model.fit(label_X, label_y)
print model
#模型导出导入磁盘
joblib.dump(model, 'D:\\tmp\\model.pkl')
model2 = joblib.load('D:\\tmp\\model.pkl')
print model2
#模型保存
s = pkl.dumps(model)
model3 = pkl.loads(s)
print model3

数据集:

0,0,6,6,0,0,1
0,0,2,2,0,0,1
0,0,3,3,0,0,1
0,0,2,2,0,0,1
0,0,0,0,0,0,1
0,0,1,1,0,0,0
0,0,9,9,0,0,0
0,0,1,1,0,0,0
0,0,3,3,0,0,0

执行结果:

训练集,有 9 行 7 列
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',max_iter=-1, probability=False, random_state=None, shrinking=True,tol=0.001, verbose=False)
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',max_iter=-1, probability=False, random_state=None, shrinking=True,tol=0.001, verbose=False)
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',max_iter=-1, probability=False, random_state=None, shrinking=True,tol=0.001, verbose=False)

1)采用Python内建的持久性模型 pickle 保存scikit的模型,字符串形式;

2)用joblib(joblib.dump&joblib.load)保存到磁盘,文件形式;

【Python学习系列二十】scikit-learn库模型持久化相关推荐

  1. 【Python学习系列二十六】networkx库图最短路径求解

    场景:基于python库networkx来求解图最短路径,相关算法基础参考 http://blog.csdn.net/fjssharpsword/article/details/52931373 ht ...

  2. python networkx进行最短路径分析_【Python学习系列二十六】networkx库图最短路径求解...

    场景:基于python库networkx来求解图最短路径,相关算法基础参考 http://blog.csdn.net/fjssharpsword/article/details/52931373 ht ...

  3. 【Python学习系列二十九】scikit-learn库实现天池平台智慧交通预测赛

    1.背景:https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.0.0.3f6e7d83RQgWEL& ...

  4. 【Python学习系列二十四】scikit-learn库逻辑回归实现唯品会用户购买行为预测

    1.背景:http://www.datafountain.cn/#/competitions/260/intro DataFountain上的唯品会用户购买行为预测比赛题目,笔者用逻辑回归实现,分数是 ...

  5. 【Python学习系列二十三】Scikit_Learn库降维方法(矩阵分解)-PCAFA

    1主成分分析PCA 1.1 精确PCA和似然估计 PCA基于最大方差的正交变量分解多维数据集.在scikit-learn库中,PCA的实现是先通过fit方法计算n维的特征值和特征向量,然后通过tran ...

  6. 【Python学习系列二十八】绘图库pyecharts

    网址:https://github.com/chenjiandongx/pyecharts 安装:pip install pyecharts 参考代码: # -*- coding: utf-8 -*- ...

  7. 【Python学习系列二十五】数据结构-有向图绘制

    1.场景:从文件中读取节点.有向边,然后绘制. 2.参考代码: # -*- coding: utf-8 -*-import networkx as nx import matplotlib.pyplo ...

  8. 【Python学习系列二十二】pandas数据筛选和排序

    在Pandas中通过.sort和.loc函数也可以实现这两 个功能..sort函数可以实现对数据表的排序操作,.loc函数可以实现对数据表的筛选操作. 1.排序 sort函数主要包含6个参数:colu ...

  9. 【Python学习系列二十一】pandas库基本操作

    pandas很强大,操作参考官网:http://pandas.pydata.org/pandas-docs/stable/ 也有一份10分钟入门的材料:http://pandas.pydata.org ...

最新文章

  1. 数据结构与算法:12 数组与稀疏矩阵
  2. Eclipse中SVN的安装步骤(两种)和使用方法 (转)
  3. Delphi 2010 安装及调试
  4. keras cnn注意力机制_从发展历史视角解析Transformer:从全连接CNN到Transformer
  5. JSP + AJAX 打造簡單聊天室
  6. Linux RPM包校验和数字证书
  7. flask html 路径,【Python】Flask 怎样获取当前页面的相对路径
  8. .NET简谈互操作(三:基础知识之DllImport特性)
  9. Apache Spark Meetup China 第1期 最全资料下载
  10. ld: i386 架构于输入文件foo.o 与 i386:x86-64 输出不兼容
  11. fanuc系统屏蔽服务器,FANUC伺服轴的屏蔽方法
  12. jms和activemq
  13. 万和计算机学院,万和亿的换算(万和亿的换算计算器)
  14. Linux光标移动异常
  15. HDU 2037 今年暑假不AC
  16. Mendeley-一款免费好用的文献管理软件
  17. 动态半透膜背景的热气球漂浮登陆界面 很赞
  18. 记一次m3u8文件转mp4的经历
  19. nginx防火墙设置
  20. android图文并排仿朋友圈,Android之仿微信发朋友圈图片选择功能

热门文章

  1. 5首页加载慢_UIViewController 预加载方案浅谈
  2. IIS FTP部分文件上传报错451的原因及解决方法
  3. golang struct 转map 及 map[string]*Struct 初始化和遍历
  4. Docker 运行的 应用程序无法连接Oracle数据库的解决办法
  5. 5G通信3大场景 来源:elecfans
  6. Mysql内置优化工具show profiles
  7. 解决IE不支持Data.parse()的问题
  8. [BZOJ] 1609: [Usaco2008 Feb]Eating Together麻烦的聚餐
  9. BCP 导入导出数据库数据
  10. 当Android工程中提示你找不到头文件,但你已经设置头文件路径了