Python之nyoka:nyoka库函数的简介、安装、使用方法之详细攻略

目录

nyoka库函数的简介

1、Nyoka的核心模块

2、模型

(1)、基础模型

(2)、LightGBM:

(3)、XGBoost (version <= 0.90):

(4)、Statsmodels (version <= 0.11.1):

3、预处理

nyoka库函数的安装

nyoka库函数的使用方法

1、Nyoka为每个库包含独立的导出程序,例如scikit-learn、keras、xgboost等。

2、基于StandardScaler的决策树分类器案例

3、LGBMClassifier → PMML

4、基于nyoka库利用LGBMClassifier模型实现对iris数据集训练、保存为pmml模型并重新载入pmml模型进而实现推理


nyoka库函数的简介

Nyoka是一个全面支持最新PMML (PMML 4.4)标准的Python库。使用Nyoka,数据科学家可以出口大量的机器学习和深度学习从流行的Python框架PMML模型通过使用任何众多包括现成的出口商或通过创建自己的专业出口商/个人模型类型通过构造函数的调用序列。
     除了大约500 Python类,每个封面PMML标签和所有构造函数参数/属性中定义的标准,Nyoka还提供了越来越多的方便的类和函数,简化数据科学家的生活例如通过阅读或编写任何PMML文件在一行代码中你最喜欢的Python环境。
     Nyoka提供了完整的Python源代码,扩展的HTML类/函数文档,以及越来越多的Jupyter笔记本教程,帮助您熟悉Nyoka支持您使用PMML作为您最喜欢的数据科学传输文件格式的方式。

Nyoka文档:https://softwareag.github.io/nyoka/

1、Nyoka的核心模块

  • Statsmodels Exporter Module
  • Keras Exporter Module
  • RetinaNet Exporter Module
  • LightGBM Exporter Module
  • Pre-Processing Exporter Module
  • Scikit-Learn Exporter Module
  • XGBoost Exporter Module
  • ExponentialSmoothing Exporter Module
  • Nyoka's Pre-Processing Module
  • Enums Module

2、模型

(1)、基础模型

  • linear_model.LinearRegression
  • linear_model.LogisticRegression
  • linear_model.RidgeClassifier
  • linear_model.SGDClassifier
  • discriminant_analysis.LinearDiscriminantAnalysis
  • tree.DecisionTreeClassifier
  • tree.DecisionTreeRegressor
  • svm.SVC
  • svm.SVR
  • svm.LinearSVC
  • svm.LinearSVR
  • svm.OneClassSVM
  • naive_bayes.GaussianNB
  • ensemble.RandomForestRegressor
  • ensemble.RandomForestClassifier
  • ensemble.GradientBoostingRegressor
  • ensemble.GradientBoostingClassifier
  • ensemble.IsolationForest
  • neural_network.MLPClassifier
  • neural_network.MLPRegressor
  • neighbors.KNeighborsClassifier
  • neighbors.KNeighborsRegressor
  • cluster.KMeans

(2)、LightGBM:

  • LGBMClassifier
  • LGBMRegressor

(3)、XGBoost (version <= 0.90):

  • XGBClassifier
  • XGBRegressor

(4)、Statsmodels (version <= 0.11.1):

  • tsa.arima_model.ARIMA
  • tsa.arima.model.ARIMA (In statespace form)
  • tsa.statespace.SARIMAX
  • tsa.statespace.VARMAX
  • tsa.statespace.ExponentialSmoothing

3、预处理

  • preprocessing.StandardScaler
  • preprocessing.MinMaxScaler
  • preprocessing.RobustScaler
  • preprocessing.MaxAbsScaler
  • preprocessing.LabelEncoder
  • preprocessing.Imputer
  • preprocessing.Binarizer
  • preprocessing.PolynomialFeatures
  • preprocessing.LabelBinarizer
  • preprocessing.OneHotEncoder
  • feature_extraction.text.TfidfVectorizer
  • feature_extraction.text.CountVectorizer
  • decomposition.PCA
  • sklearn_pandas.CategoricalImputer ( From sklearn_pandas library )

nyoka库函数的安装

pip install nyoka
pip install --user -i https://pypi.tuna.tsinghua.edu.cn/simple nyoka

nyoka库函数的使用方法

1、Nyoka为每个库包含独立的导出程序,例如scikit-learn、keras、xgboost等。

library exporter
scikit-learn skl_to_pmml
xgboost xgboost_to_pmml
lightgbm lgbm_to_pmml
keras KerasToPmml
statsmodels StatsmodelsToPmml & ExponentialSmoothingToPmml
retinanet RetinanetToPmml

2、基于StandardScaler的决策树分类器案例

 from sklearn.pipeline import Pipelinefrom sklearn.tree import DecisionTreeClassifierfrom sklearn.preprocessing import StandardScalerpipeline_obj = Pipeline([("scaler",StandardScaler()),("model",DecisionTreeClassifier())])from sklearn.dataset import load_irisiris_data = load_iris()X = iris_data.datay = iris_data.targetfeatures = iris_data.feature_namespipeline_obj.fit(X,y)from nyoka import skl_to_pmmlskl_to_pmml(pipeline=pipeline_obj,col_names=features,target_name="species",pmml_f_name="decision_tree.pmml")

3、LGBMClassifier → PMML

import pandas as pd
from sklearn import datasets
from sklearn.pipeline import Pipeline
from lightgbm import LGBMRegressor,LGBMClassifier
from nyoka import lgb_to_pmmliris = datasets.load_iris()
irisd = pd.DataFrame(iris.data,columns=iris.feature_names)target = 'Species'
irisd[target] = iris.target
features = irisd.columns.drop(target)#保存模型
pipeline_obj = Pipeline([ ('lgbmc',LGBMClassifier())])
pipeline_obj.fit(irisd[features],irisd[target])
lgb_to_pmml(pipeline_obj,features,target,"lgbmc_pmml.pmml")#读入数据进行测试
auto = pd.read_csv('auto-mpg.csv')
X = auto.drop(['mpg','car name'], axis=1)
y = auto['mpg']feature_names = [name for name in auto.columns if name not in ('mpg','car name')]
target_name='mpg'pipeline_obj = Pipeline([ ('lgbmr',LGBMRegressor()) ])
pipeline_obj.fit(auto[feature_names],auto[target_name])
lgb_to_pmml(pipeline_obj,feature_names,target_name,"lgbmr_pmml.pmml")

4、基于nyoka库利用LGBMClassifier模型实现对iris数据集训练、保存为pmml模型并重新载入pmml模型进而实现推理

ML之nyoka:基于nyoka库利用LGBMClassifier模型实现对iris数据集训练、保存为pmml模型并重新载入pmml模型进而实现推理

Python之nyoka:nyoka库函数的简介、安装、使用方法之详细攻略相关推荐

  1. Python语言学习:Python常用自带库(imageio、pickle)简介、使用方法之详细攻略

    Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 目录 imageio简介及其常见使用方法 pickle简介及其常见使用方法 简介 使用方法 简介及 ...

  2. Python编程语言学习:包导入和模块搜索路径简介、使用方法之详细攻略

    Python编程语言学习:包导入和模块搜索路径简介.使用方法之详细攻略 目录 包导入和模块搜索路径简介 1.Pyhon搜索模块路径的机制 2.自定义配置搜索路径

  3. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  4. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

  5. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  6. Python:numpy库中的一些函数简介、使用方法之详细攻略

    Python:numpy库中的一些函数简介.使用方法之详细攻略 目录 numpy库中的一些函数简介.使用方法 1.np.concatenate() 1.1.函数案例 1.2.函数用法 numpy库中的 ...

  7. Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ、负载均衡、F5、Nginx、容器)的简介、使用方法之详细攻略

    Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ.负载均衡.F5.Nginx.容器)的简介.使用方法之详细攻略 目录 DMZ(隔离区)的简介及其使用方法 1.DMZ区 ...

  8. Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略

    Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略 目录 matplotlib.pyplot的plt.legend函数的简 ...

  9. BigData之Hive beeline:beeline的简介、使用方法之详细攻略

    BigData之Hive beeline:beeline的简介.使用方法之详细攻略 目录 beeline的简介 beeline的使用方法 1.命令行参数解释 2.beeline的输出格式 2.1.ta ...

  10. ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介、使用方法之详细攻略

    ML之sklearn:sklearn.linear_mode中的LogisticRegression函数的简介.使用方法之详细攻略 目录 sklearn.linear_mode中的LogisticRe ...

最新文章

  1. 百度地图经常崩溃的问题
  2. 【原创】设置头文件路径, gcc -I 选项写法
  3. python怎么判断是不是汉字危机_谈 Python 的中文编码处理
  4. 创业成功需早起?看看IT大佬们的作息时间
  5. elasticsearch scroll 一页最大数据量_elasticsearch 百亿级数据检索案例与原理
  6. 阿里云MVP第六期发布——覆盖全球20多个国家和地区,成为数字化转型的中坚力量...
  7. 用css3的@keyframes里设置transform:rotate(); 当控制动画暂停:animation-play-state:paused暂停,在微信和safari里无效...
  8. 前方高能!IT 程序员、软件工程师值得考的证书原来有这么多! | 原力计划
  9. 关于Metropolis-Hasting采样的两个注意事项
  10. Linux下2号进程的kthreadd--Linux进程的管理与调度(七)
  11. ubuntu gnome vnc
  12. MIMO系统获取复用增益
  13. TeamViewer远程访问打开软件黑屏
  14. 如何从论文中挖掘和研究思路的办法
  15. 【Pygame小游戏】确实会玩—教你如何在”吃豆豆“上完美躺赢……(收藏起来偷偷学)
  16. 闲鱼选品的6个维度,附赠35个爆款品类!
  17. 安卓文件管理神器--X-plore
  18. 3. mysql-视图
  19. 三、Solr管理控制台(二)
  20. CSDN积分不够了怎么办?快速获得积分看这里

热门文章

  1. 对F-score的理解
  2. stm32 adc过采样_产生ADC误差的外部原因有哪些?
  3. mysql行列转换_Excel、SQL、Python分别实现行列转换
  4. 显示ip地址及包含采集功能的全套函数源代码
  5. js 日期时间的格式化
  6. java 获取nodejs端Gson数据案例(请求MongoDB)
  7. Spring Boot 把 Maven 干掉了,正式拥抱 Gradle!
  8. 软件吃软件,编程工作会越来越多吗?
  9. 数据库里账号的密码,这样存放最安全!
  10. 一文了解文件上传全过程(1.8w字深度解析)「前端进阶必备」