本文转自:http://blog.csdn.net/mm_bit/article/details/47405433

weka中的各算法说明

1) 数据输入和输出
WOW():查看Weka函数的参数。
Weka_control():设置Weka函数的参数。
read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。
write.arff:将数据写入Weka Attribute-Relation File Format (ARFF)格式的文件。

2) 数据预处理
Normalize():无监督的标准化连续性数据。
Discretize():用MDL(Minimum Description Length)方法,有监督的离散化连续性数值数据。

3) 分类和回归
IBk():k最近邻分类
LBR():naive Bayes法分类
J48():C4.5决策树算法(决策树在分析各个属性时,是完全独立的)。
LMT():组合树结构和Logistic回归模型,每个叶子节点是一个Logistic回归模型,准确性比单独的决策树和Logistic回归方法要好。
M5P():M5 模型数算法,组合了树结构和线性回归模型,每个叶子节点是一个线性回归模型,因而可用于连续数据的回归。
DecisionStump():单层决策树算法,常被作为boosting的基本学习器。
SMO():支持向量机分类
AdaBoostM1():Adaboost M1方法。-W参数指定弱学习器的算法。
Bagging():通过从原始数据取样(用替换方法),创建多个模型。
LogitBoost():弱学习器采用了对数回归方法,学习到的是实数值
MultiBoostAB():AdaBoost 方法的改进,可看作AdaBoost 和 “wagging”的组合。
Stacking():用于不同的基本分类器集成的算法。
LinearRegression():建立合适的线性回归模型。
Logistic():建立logistic回归模型。
JRip():一种规则学习方法。
M5Rules():用M5方法产生回归问题的决策规则。
OneR():简单的1-R分类法。
PART():产生PART决策规则。

4) 聚类
Cobweb():这是种基于模型方法,它假设每个聚类的模型并发现适合相应模型的数据。不适合对大数据库进行聚类处理。
FarthestFirst():快速的近似的k均值聚类算法
SimpleKMeans():k均值聚类算法
XMeans():改进的k均值法,能自动决定类别数
DBScan():基于密度的聚类方法,它根据对象周围的密度不断增长聚类。它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义为一组“密度连接”的点集。

5)关联规则
Apriori():Apriori是关联规则领域里最具影响力的基础算法,是一种广度优先算法,通过多次扫描数据库来获取支持度大于最小支持度的频繁项集。它的理论基础是频繁项集的两个单调性原则:频繁项集的任一子集一定是频繁的;非频繁项集的任一超集一定是非频繁的。在海量数据的情况下,Apriori 算法的时间和空间成本非常高。
Tertius():Tertius算法。
6)预测和评估:
predict():根据分类或聚类结果预测新数据的类别
table():比较两个因子对象
evaluate_Weka_classifier():评估模型的执行,如:TP Rate,FP Rate,Precision,Recall,F-Measure。

机器学习之 weka学习(二)算法说明相关推荐

  1. 利用计算机语言实现ID3算法,机器学习之决策树学习-id3算法-原理分析及c语言代码实现.pdf...

    机器学习之决策树学习-id3算法-原理分析及c语言代码实现.pdf 还剩 23页未读, 继续阅读 下载文档到电脑,马上远离加班熬夜! 亲,很抱歉,此页已超出免费预览范围啦! 如果喜欢就下载吧,价低环保 ...

  2. 机器学习,深度学习基础算法原理详解(图的搜索、交叉验证、PAC框架、VC-维(持续更新))

    机器学习,深度学习基础算法原理详解(图的搜索.交叉验证.PAC框架.VC-维.支持向量机.核方法(持续更新)) 机器学习,深度学习基础算法原理详解(数据结构部分(持续更新)) 文章目录 1. 图的搜索 ...

  3. Weka学习二(聚类算法)

    http://liouwei20051000285.blog.163.com/blog/static/25236742009101610445275/ 上次我介绍了分类器的使用方法,这次我来介绍一下聚 ...

  4. 机器学习和深度学习_算法测评 | 机器学习VS深度学习

    OLDER BROTHER 大家好,我是你们的机房老哥! "机器学习进阶" 「前言」 " 机器学习和深度学习是很早前就埋下的坑,最近决定整合写一篇,利用机器学习的经典算法 ...

  5. 【机器学习】集成学习及算法详解

    集成学习及算法详解 前言 一.随机森林算法原理 二.随机森林的优势与特征重要性指标 1.随机森林的优势 2.特征重要性指标 三.提升算法概述 四.堆叠模型简述 五.硬投票和软投票 1.概念介绍 2.硬 ...

  6. 机器学习之深度学习 二分类、多分类、多标签分类、多任务分类

    多任务学习可以运用到许多的场景. 首先,多任务学习可以学到多个任务的共享表示,这个共享表示具有较强的抽象能力,能够适应多个不同但相关的目标,通常可以使主任务获取更好的泛化能力. 此外,由于使用了共享表 ...

  7. 机器学习之 weka学习(三)

    本文转自:http://blog.csdn.net/qiao1245/article/category/6115745 Weka教程笔记    http://blog.csdn.net/qiao124 ...

  8. 机器学习之 weka学习(一)weka介绍,安装和配置环境变量

    本部分详情可查看博客http://blog.csdn.net/u011067360/article/details/20844443                                   ...

  9. 深度学习(二)-----算法岗面试题

    ● 深度学习了解多少,有看过底层代码吗?caffe,tf? ● 除了GMM-HMM,你了解深度学习在语音识别中的应用吗? 参考回答: 讲了我用的过DNN-HMM,以及与GMM-HMM的联系与区别:然后 ...

最新文章

  1. fatal error:can't open and lock privilege tables:table 'mysql.host' doesn't exist
  2. flink的datastream进行join操作没有输出结果一例
  3. mysql网页化_页面化操作数据库
  4. mysql数据库下载压缩包_mysql 8.0.22 zip压缩包版(免安装)下载、安装配置步骤详解...
  5. egg 完整实例 增删改查MongoDB,websocket
  6. 串口发送图片VGA显示
  7. 51nod 1050 循环数组最大子段和 单调队列优化DP
  8. python安装换源_Python切换pip安装源的方法详解
  9. 易学入门书籍V8.7版
  10. Java工作流有哪些?如何快速掌握Java技术
  11. MATLAB之物理场可视化
  12. 很不错的英语听力网站
  13. 通过Ping检测网络故障的典型次序和IPconfig命令的使用
  14. ADC模数转换器(STM32系列)
  15. 注册最便宜的xyz域名,低成本搭建一个博客
  16. 微信小程序发布时需要校验违法违规内容、图片,Java后端接口
  17. ES--Kibana相关操作创建索引和Mapping
  18. 微擎添加绑定公众号,空白页或500错误,打不开
  19. 单证与双证高级证书与普通证书的区别与联系
  20. neovim初始化以及插件安装

热门文章

  1. iis php5.4配置_IIS 8+PHP5.4+SQL server2012配置
  2. 高级语言程序设计(c )试卷,《高级语言程序设计C》试卷
  3. 【DS】时间复杂度排序
  4. 电脑屏幕保护怎么取消_STEP考试安排再更新!今年到底要怎么考试?
  5. 『ACM-算法-二分法』在单调递增序列a中查找小于等于x的数中最大的一个(即x或x的前驱)
  6. CF思维联系– CodeForces - 991C Candies(二分)
  7. UIViewController详解
  8. TCP/IP详解笔记----第一章:概述
  9. 晶振测试与使用中的主要问题(z)
  10. The IP you're using to send email is not authorized