Python之nyoka:nyoka库函数的简介、安装、使用方法之详细攻略
Python之nyoka:nyoka库函数的简介、安装、使用方法之详细攻略
目录
nyoka库函数的简介
1、Nyoka的核心模块
2、模型
(1)、基础模型
(2)、LightGBM:
(3)、XGBoost (version <= 0.90):
(4)、Statsmodels (version <= 0.11.1):
3、预处理
nyoka库函数的安装
nyoka库函数的使用方法
1、Nyoka为每个库包含独立的导出程序,例如scikit-learn、keras、xgboost等。
2、基于StandardScaler的决策树分类器案例
3、LGBMClassifier → PMML
4、基于nyoka库利用LGBMClassifier模型实现对iris数据集训练、保存为pmml模型并重新载入pmml模型进而实现推理
nyoka库函数的简介
Nyoka是一个全面支持最新PMML (PMML 4.4)标准的Python库。使用Nyoka,数据科学家可以出口大量的机器学习和深度学习从流行的Python框架PMML模型通过使用任何众多包括现成的出口商或通过创建自己的专业出口商/个人模型类型通过构造函数的调用序列。
除了大约500 Python类,每个封面PMML标签和所有构造函数参数/属性中定义的标准,Nyoka还提供了越来越多的方便的类和函数,简化数据科学家的生活例如通过阅读或编写任何PMML文件在一行代码中你最喜欢的Python环境。
Nyoka提供了完整的Python源代码,扩展的HTML类/函数文档,以及越来越多的Jupyter笔记本教程,帮助您熟悉Nyoka支持您使用PMML作为您最喜欢的数据科学传输文件格式的方式。
Nyoka文档:https://softwareag.github.io/nyoka/
1、Nyoka的核心模块
- Statsmodels Exporter Module
- Keras Exporter Module
- RetinaNet Exporter Module
- LightGBM Exporter Module
- Pre-Processing Exporter Module
- Scikit-Learn Exporter Module
- XGBoost Exporter Module
- ExponentialSmoothing Exporter Module
- Nyoka's Pre-Processing Module
- Enums Module
2、模型
(1)、基础模型
linear_model.LinearRegression
linear_model.LogisticRegression
linear_model.RidgeClassifier
linear_model.SGDClassifier
discriminant_analysis.LinearDiscriminantAnalysis
tree.DecisionTreeClassifier
tree.DecisionTreeRegressor
svm.SVC
svm.SVR
svm.LinearSVC
svm.LinearSVR
svm.OneClassSVM
naive_bayes.GaussianNB
ensemble.RandomForestRegressor
ensemble.RandomForestClassifier
ensemble.GradientBoostingRegressor
ensemble.GradientBoostingClassifier
ensemble.IsolationForest
neural_network.MLPClassifier
neural_network.MLPRegressor
neighbors.KNeighborsClassifier
neighbors.KNeighborsRegressor
cluster.KMeans
(2)、LightGBM:
LGBMClassifier
LGBMRegressor
(3)、XGBoost (version <= 0.90):
XGBClassifier
XGBRegressor
(4)、Statsmodels (version <= 0.11.1):
tsa.arima_model.ARIMA
tsa.arima.model.ARIMA
(In statespace form)tsa.statespace.SARIMAX
tsa.statespace.VARMAX
tsa.statespace.ExponentialSmoothing
3、预处理
preprocessing.StandardScaler
preprocessing.MinMaxScaler
preprocessing.RobustScaler
preprocessing.MaxAbsScaler
preprocessing.LabelEncoder
preprocessing.Imputer
preprocessing.Binarizer
preprocessing.PolynomialFeatures
preprocessing.LabelBinarizer
preprocessing.OneHotEncoder
feature_extraction.text.TfidfVectorizer
feature_extraction.text.CountVectorizer
decomposition.PCA
sklearn_pandas.CategoricalImputer
( From sklearn_pandas library )
nyoka库函数的安装
pip install nyoka
pip install --user -i https://pypi.tuna.tsinghua.edu.cn/simple nyoka
nyoka库函数的使用方法
1、Nyoka为每个库包含独立的导出程序,例如scikit-learn、keras、xgboost等。
library | exporter |
---|---|
scikit-learn | skl_to_pmml |
xgboost | xgboost_to_pmml |
lightgbm | lgbm_to_pmml |
keras | KerasToPmml |
statsmodels | StatsmodelsToPmml & ExponentialSmoothingToPmml |
retinanet | RetinanetToPmml |
2、基于StandardScaler的决策树分类器案例
from sklearn.pipeline import Pipelinefrom sklearn.tree import DecisionTreeClassifierfrom sklearn.preprocessing import StandardScalerpipeline_obj = Pipeline([("scaler",StandardScaler()),("model",DecisionTreeClassifier())])from sklearn.dataset import load_irisiris_data = load_iris()X = iris_data.datay = iris_data.targetfeatures = iris_data.feature_namespipeline_obj.fit(X,y)from nyoka import skl_to_pmmlskl_to_pmml(pipeline=pipeline_obj,col_names=features,target_name="species",pmml_f_name="decision_tree.pmml")
3、LGBMClassifier → PMML
import pandas as pd
from sklearn import datasets
from sklearn.pipeline import Pipeline
from lightgbm import LGBMRegressor,LGBMClassifier
from nyoka import lgb_to_pmmliris = datasets.load_iris()
irisd = pd.DataFrame(iris.data,columns=iris.feature_names)target = 'Species'
irisd[target] = iris.target
features = irisd.columns.drop(target)#保存模型
pipeline_obj = Pipeline([ ('lgbmc',LGBMClassifier())])
pipeline_obj.fit(irisd[features],irisd[target])
lgb_to_pmml(pipeline_obj,features,target,"lgbmc_pmml.pmml")#读入数据进行测试
auto = pd.read_csv('auto-mpg.csv')
X = auto.drop(['mpg','car name'], axis=1)
y = auto['mpg']feature_names = [name for name in auto.columns if name not in ('mpg','car name')]
target_name='mpg'pipeline_obj = Pipeline([ ('lgbmr',LGBMRegressor()) ])
pipeline_obj.fit(auto[feature_names],auto[target_name])
lgb_to_pmml(pipeline_obj,feature_names,target_name,"lgbmr_pmml.pmml")
4、基于nyoka库利用LGBMClassifier模型实现对iris数据集训练、保存为pmml模型并重新载入pmml模型进而实现推理
ML之nyoka:基于nyoka库利用LGBMClassifier模型实现对iris数据集训练、保存为pmml模型并重新载入pmml模型进而实现推理
Python之nyoka:nyoka库函数的简介、安装、使用方法之详细攻略相关推荐
- Python语言学习:Python常用自带库(imageio、pickle)简介、使用方法之详细攻略
Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 目录 imageio简介及其常见使用方法 pickle简介及其常见使用方法 简介 使用方法 简介及 ...
- Python编程语言学习:包导入和模块搜索路径简介、使用方法之详细攻略
Python编程语言学习:包导入和模块搜索路径简介.使用方法之详细攻略 目录 包导入和模块搜索路径简介 1.Pyhon搜索模块路径的机制 2.自定义配置搜索路径
- Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...
- Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...
- Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...
- Python:numpy库中的一些函数简介、使用方法之详细攻略
Python:numpy库中的一些函数简介.使用方法之详细攻略 目录 numpy库中的一些函数简介.使用方法 1.np.concatenate() 1.1.函数案例 1.2.函数用法 numpy库中的 ...
- Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ、负载均衡、F5、Nginx、容器)的简介、使用方法之详细攻略
Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ.负载均衡.F5.Nginx.容器)的简介.使用方法之详细攻略 目录 DMZ(隔离区)的简介及其使用方法 1.DMZ区 ...
- Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略
Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略 目录 matplotlib.pyplot的plt.legend函数的简 ...
- BigData之Hive beeline:beeline的简介、使用方法之详细攻略
BigData之Hive beeline:beeline的简介.使用方法之详细攻略 目录 beeline的简介 beeline的使用方法 1.命令行参数解释 2.beeline的输出格式 2.1.ta ...
- ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介、使用方法之详细攻略
ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介.使用方法之详细攻略 目录 sklearn.linear_mode中的LogisticRe ...
最新文章
- 百度地图经常崩溃的问题
- 【原创】设置头文件路径, gcc -I 选项写法
- python怎么判断是不是汉字危机_谈 Python 的中文编码处理
- 创业成功需早起?看看IT大佬们的作息时间
- elasticsearch scroll 一页最大数据量_elasticsearch 百亿级数据检索案例与原理
- 阿里云MVP第六期发布——覆盖全球20多个国家和地区,成为数字化转型的中坚力量...
- 用css3的@keyframes里设置transform:rotate(); 当控制动画暂停:animation-play-state:paused暂停,在微信和safari里无效...
- 前方高能!IT 程序员、软件工程师值得考的证书原来有这么多! | 原力计划
- 关于Metropolis-Hasting采样的两个注意事项
- Linux下2号进程的kthreadd--Linux进程的管理与调度(七)
- ubuntu gnome vnc
- MIMO系统获取复用增益
- TeamViewer远程访问打开软件黑屏
- 如何从论文中挖掘和研究思路的办法
- 【Pygame小游戏】确实会玩—教你如何在”吃豆豆“上完美躺赢……(收藏起来偷偷学)
- 闲鱼选品的6个维度,附赠35个爆款品类!
- 安卓文件管理神器--X-plore
- 3. mysql-视图
- 三、Solr管理控制台(二)
- CSDN积分不够了怎么办?快速获得积分看这里