【Python学习系列二十】scikit-learn库模型持久化
场景:需要将模型保存到内存,或磁盘。
代码:
# -*- coding: utf-8 -*-import pandas as pd
import pickle as pkl
from sklearn.externals import joblib
from sklearn import svm
#加载数据
label_ds=pd.read_csv(r"D:\\tmp\\sam_11.csv",sep=',',encoding='utf8',\names=['u_spu_num','u_brand_num','u_cat_num','u_cat_spu','u_brand_spu','u_spu_date','action_type'])
print "训练集,有", label_ds.shape[0], "行", label_ds.shape[1], "列"
#模型训练
label_X = label_ds[['u_spu_num','u_brand_num','u_cat_num','u_cat_spu','u_brand_spu','u_spu_date']]
label_y = label_ds['action_type']#类别
model = svm.SVC()
model.fit(label_X, label_y)
print model
#模型导出导入磁盘
joblib.dump(model, 'D:\\tmp\\model.pkl')
model2 = joblib.load('D:\\tmp\\model.pkl')
print model2
#模型保存
s = pkl.dumps(model)
model3 = pkl.loads(s)
print model3
数据集:
0,0,6,6,0,0,1
0,0,2,2,0,0,1
0,0,3,3,0,0,1
0,0,2,2,0,0,1
0,0,0,0,0,0,1
0,0,1,1,0,0,0
0,0,9,9,0,0,0
0,0,1,1,0,0,0
0,0,3,3,0,0,0
执行结果:
训练集,有 9 行 7 列
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',max_iter=-1, probability=False, random_state=None, shrinking=True,tol=0.001, verbose=False)
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',max_iter=-1, probability=False, random_state=None, shrinking=True,tol=0.001, verbose=False)
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',max_iter=-1, probability=False, random_state=None, shrinking=True,tol=0.001, verbose=False)
1)采用Python内建的持久性模型 pickle 保存scikit的模型,字符串形式;
2)用joblib(joblib.dump&joblib.load)保存到磁盘,文件形式;
【Python学习系列二十】scikit-learn库模型持久化相关推荐
- 【Python学习系列二十六】networkx库图最短路径求解
场景:基于python库networkx来求解图最短路径,相关算法基础参考 http://blog.csdn.net/fjssharpsword/article/details/52931373 ht ...
- python networkx进行最短路径分析_【Python学习系列二十六】networkx库图最短路径求解...
场景:基于python库networkx来求解图最短路径,相关算法基础参考 http://blog.csdn.net/fjssharpsword/article/details/52931373 ht ...
- 【Python学习系列二十九】scikit-learn库实现天池平台智慧交通预测赛
1.背景:https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.0.0.3f6e7d83RQgWEL& ...
- 【Python学习系列二十四】scikit-learn库逻辑回归实现唯品会用户购买行为预测
1.背景:http://www.datafountain.cn/#/competitions/260/intro DataFountain上的唯品会用户购买行为预测比赛题目,笔者用逻辑回归实现,分数是 ...
- 【Python学习系列二十三】Scikit_Learn库降维方法(矩阵分解)-PCAFA
1主成分分析PCA 1.1 精确PCA和似然估计 PCA基于最大方差的正交变量分解多维数据集.在scikit-learn库中,PCA的实现是先通过fit方法计算n维的特征值和特征向量,然后通过tran ...
- 【Python学习系列二十八】绘图库pyecharts
网址:https://github.com/chenjiandongx/pyecharts 安装:pip install pyecharts 参考代码: # -*- coding: utf-8 -*- ...
- 【Python学习系列二十五】数据结构-有向图绘制
1.场景:从文件中读取节点.有向边,然后绘制. 2.参考代码: # -*- coding: utf-8 -*-import networkx as nx import matplotlib.pyplo ...
- 【Python学习系列二十二】pandas数据筛选和排序
在Pandas中通过.sort和.loc函数也可以实现这两 个功能..sort函数可以实现对数据表的排序操作,.loc函数可以实现对数据表的筛选操作. 1.排序 sort函数主要包含6个参数:colu ...
- 【Python学习系列二十一】pandas库基本操作
pandas很强大,操作参考官网:http://pandas.pydata.org/pandas-docs/stable/ 也有一份10分钟入门的材料:http://pandas.pydata.org ...
最新文章
- 数据结构与算法:12 数组与稀疏矩阵
- Eclipse中SVN的安装步骤(两种)和使用方法 (转)
- Delphi 2010 安装及调试
- keras cnn注意力机制_从发展历史视角解析Transformer:从全连接CNN到Transformer
- JSP + AJAX 打造簡單聊天室
- Linux RPM包校验和数字证书
- flask html 路径,【Python】Flask 怎样获取当前页面的相对路径
- .NET简谈互操作(三:基础知识之DllImport特性)
- Apache Spark Meetup China 第1期 最全资料下载
- ld: i386 架构于输入文件foo.o 与 i386:x86-64 输出不兼容
- fanuc系统屏蔽服务器,FANUC伺服轴的屏蔽方法
- jms和activemq
- 万和计算机学院,万和亿的换算(万和亿的换算计算器)
- Linux光标移动异常
- HDU 2037 今年暑假不AC
- Mendeley-一款免费好用的文献管理软件
- 动态半透膜背景的热气球漂浮登陆界面 很赞
- 记一次m3u8文件转mp4的经历
- nginx防火墙设置
- android图文并排仿朋友圈,Android之仿微信发朋友圈图片选择功能
热门文章
- 5首页加载慢_UIViewController 预加载方案浅谈
- IIS FTP部分文件上传报错451的原因及解决方法
- golang struct 转map 及 map[string]*Struct 初始化和遍历
- Docker 运行的 应用程序无法连接Oracle数据库的解决办法
- 5G通信3大场景 来源:elecfans
- Mysql内置优化工具show profiles
- 解决IE不支持Data.parse()的问题
- [BZOJ] 1609: [Usaco2008 Feb]Eating Together麻烦的聚餐
- BCP 导入导出数据库数据
- 当Android工程中提示你找不到头文件,但你已经设置头文件路径了