Python:pmml格式文件的简介、安装、使用方法(利用python将机器学习模型转为Java常用的pmml格式文件)之详细攻略

目录

pmml格式文件的简介

1、PMML结构

pmml安装

pmml格式文件的使用方法

1、将训练好的模型转化为PMML文件


pmml格式文件的简介

PMML(Predictive Model Markup Language)主要是作为分析模型训练实例的载体,截至到PMML 4.2版本,支持的模型包括:关联规则、基线模型、决策树、聚类、回归、KNN、神经网络、贝叶斯、记分牌、序列、文本、时间序列、规则集和SVM。  PMML使用统一的规范进行验证,使用XSD进行词法验证,使用XSLT进行语法验证,在构造和解析的时候都要依照统一的PMML规范操作。
       PMML 是一种事实标准语言,用于呈现数据挖掘模型。预测分析模型 和数据挖掘模型 是指代数学模型的术语,这些模型采用统计技术了解大量历史数据中隐藏的模式。预测分析模型采用定型过程中获取的知识来预测新数据中是否有已知模式。PMML 允许您在不同的应用程序之间轻松共享预测分析模型。因此,您可以在一个系统中定型一个模型,在 PMML 中对其进行表达,然后将其移动到另一个系统中,并在该系统中使用上述模型预测机器失效的可能性等。
       简单来说,PMML就是在一个平台训练好模型,然后封装成PMML文件,然后再在另一个平台中可以直接使用训练好的模型。PMML 是数据挖掘群组的产物,该群组是一个由供应商领导的委员会,由各种商业和开放源码分析公司组成。因此,现在的大部分领先数据挖掘工具都可以导出或导入 PMML。作为一个已发展 10 多年的成熟标准,PMML 既可以呈现用于从数据中了解模型的统计技术(如人工神经网络和决策树),也可以呈现原始输入数据的预处理以及模型输出的后处理。

1、PMML结构

  • a) PMML标签  PMML的命名空间定义如下:  xmlns="http://www.dmg.org/PMML-4_2"
  • b) Header标签  Header标签标识着PMML正文的开始,可以包含copyright、描述、名称等信息,可以添加时间戳、注解等元素。
  • c) MiningBuildTask  此元素包含构造模型实例的配置信息,一般是SQL或Java片段。
  • d) DataDictionary  此元素包含挖掘模型的每个属性信息,通过DataDictionary基本可以确定模型的规模。在DataDictionary中的DataField的name必须在DataField和DerivedField的name中唯一。
  • e) TransformationDictionary  TransformationDictionary主要用于从原数据到模型使用数据之间的映射,支持的映射包括正规化、离散化、数值映射、词频、定义函数和聚集。

pmml安装

Python之pypmml:pypmml的简介、安装、使用方法之详细攻略

pmml格式文件的使用方法

1、将训练好的模型转化为PMML文件

利用XGBoost模型对Iris数据训练并转为PMML文件,载入并实现预测

Python:pmml格式文件的简介、安装、使用方法(利用python将机器学习模型转为Java常用的pmml格式文件)之详细攻略相关推荐

  1. Computer:少儿编程—每个人都应该学习编程,它能教你如何思考—编程入门的简介(编程语言的特点种类开发工具对比人类语言)、编程应用、编程意义之详细攻略

    Computer:少儿编程-每个人都应该学习编程,它能教你如何思考-编程入门的简介(编程语言的特点&种类&开发工具&对比人类语言).编程应用.编程意义之详细攻略 导读:乔布斯说 ...

  2. Python之pandas:数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化之详细攻略

    Python之pandas:数据类型变换之object.category.bool.int32.int64.float64以及数据类型标准化之详细攻略 目录 数据类型变换之object.categor ...

  3. AI之NLP:自然语言处理技术简介(是什么/学什么/怎么用)、常用算法、经典案例之详细攻略(建议收藏)

    AI之NLP:自然语言处理技术简介(是什么/学什么/怎么用).常用算法.经典案例之详细攻略(建议收藏) 目录 NLP是什么? 1.NLP前置技术解析 2.python中NLP技术相关库 3.NLP案例 ...

  4. AI之NLP:自然语言处理技术简介(是什么/学什么/怎么用)、常用算法、经典案例之详细攻略(建议收藏)daiding

    AI之NLP:自然语言处理技术简介(是什么/学什么/怎么用).常用算法.经典案例之详细攻略(建议收藏) 目录 NLP是什么? 1.NLP前置技术解析 2.python中NLP技术相关库 3.NLP案例 ...

  5. 设计师:设计师知识储备之硬装部分/软装部分简介、家装材料知识(吊顶材料/门窗材料/五金材料/墙面材料/地面材料/胶粘材料/油漆材料/水电材料/瓦工部分)之详细攻略

    设计师:设计师知识储备之硬装部分/软装部分简介.家装材料知识(吊顶材料/门窗材料/五金材料/墙面材料/地面材料/胶粘材料/油漆材料/水电材料/瓦工部分)之详细攻略 目录 硬装部分/软装部分简介 硬装部 ...

  6. Py之re:re正则表达式库的简介、常用函数、经典案例之详细攻略

    Py之re:re正则表达式库的简介.常用函数.经典案例之详细攻略 目录 re正则表达式库的简介 1.正则表达式元字符表集合--正则表达式的pattern re正则表达式库的常用函数 1.re.comp ...

  7. DL之DNN优化技术:神经网络算法简介之GD/SGD算法(BP的梯度下降算法)的简介、理解、代码实现、SGD缺点及改进(Momentum/NAG/Ada系列/RMSProp)之详细攻略

    DL之DNN优化技术:神经网络算法简介之GD/SGD算法(BP的梯度下降算法)的简介.理解.代码实现.SGD缺点及改进(Momentum/NAG/Ada系列/RMSProp)之详细攻略 目录 GD算法 ...

  8. AutoML:人工智能领域-自动化技术之机器学习自动化技术的简介(预处理→设计算法→训练模型→优化参数)、常用的工具或框架之详细攻略

    AutoML:人工智能领域-自动化技术之机器学习自动化技术的简介(预处理→设计算法→训练模型→优化参数).常用的工具或框架之详细攻略 目录 自动化机器学习技术的简介

  9. DataScienceML:金融科技领域之风控的简介、类别、应用流程(定义目标变量→特征构建思路等)、案例集锦之详细攻略

    DataScience&ML:金融科技领域之风控的简介.类别.应用流程(定义目标变量→特征构建思路等).案例集锦之详细攻略 目录 金融科技领域之风控的简介 1.风控指标相关概念或口径逻辑 金融 ...

最新文章

  1. 语义分割--Full-Resolution Residual Networks for Semantic Segmentation in Street Scenes
  2. java json数据输出,java服务器端输出JSON格式数据
  3. Isometric Game 及译法漫谈
  4. python3在线-Python 3中的新功能
  5. java内存图解_图解JAVA内存模型(JMM:JAVA Memory Model)
  6. ikvm java转换成dll_利用IKVM.NET将Java jar包转换成可供C#调用的dll文件
  7. Flink shell报错 For input string: 0x100
  8. ajax应用_AJAX的应用
  9. 携程将推“3+2”工作模式:每周到岗3天,在家2天,你羡慕吗?
  10. linux登录后自动打开终端,linux登录信息/打开终端信息
  11. 指针用完了怎么办_墙体里水管漏水怎么办?瞧瞧这个,轻松搞定,滴水不漏
  12. kafka组件makemirror处理跨机房业务的应用
  13. SpringBoot2线程池的创建以及执行异步任务
  14. 拓端tecdat|R语言网络分析友谊悖论案例
  15. 防止phpddos攻击
  16. MySQL数据备份恢复太慢解决办法
  17. 10bit灰阶测试图_色彩深度技术探讨,关于8bit,10bit,12bit,16bit,什么是灰阶?...
  18. 腾讯走上王者之位,你以为靠的只是抄袭?
  19. Spring Cloud之Hystrix服务容错
  20. 【DBC】DBC文件格式详解

热门文章

  1. Java二手车交易系统
  2. 使用Picasso加载网页图片到RecyclerView
  3. 在计算机桌面怎么找打印机,win10系统电脑打印机图标找回来的教程
  4. 手机上最小的Linux,Linux没有最小只有更小----361M以下的Linux名单
  5. c sqlserver建表csdn_Oracle拉出在sqlserver建表的语句
  6. 全国铁路查询系统_火车票查询时刻表 全国列车时刻表 火车时刻表查询系统使用说明...
  7. element-ui 2.4.3 如何实现对form部分字段验证的解决方法?
  8. Spring Cloud构建微服务架构:服务消费(基础)
  9. CentOS7搭建Git服务器
  10. redis事务不具有回滚机制,那么它是如何进行事务控制的