经常看到有人问,我想修改Weka里面的算法,我想把Weka的算法加到我自己的程序里面去,但是我该从哪里着手呢?于是,这篇帖子就有必要出现了。但是,这个题目太大了,Weka里面有那么多代码呢,一个个分析起来恐怕一卷书都装不下。因此,这里只能给个大概的意思。
不要想光看这篇帖子就搞懂Weka怎么工作的,你必须自己打开Weka的代码包去体会。更不想想没有用过Weka甚至没接触过Java就来修改它的算法,你会摸不着头脑的(实际上Weka和Java都不是那么难学)。

1 从哪里获得帮助
Data Mining: Practical Machine Learning Tools and Techniques (Second Edition) 这个书的第13-15章应该是必读的。实际上下面的内容也基本上基于这几章。如果你能耐着性子把这几章读懂,肯定不需要往下看这个帖子了。
作为一个Java应用程序,Javadoc是必不可少的。在Weka安装目录doc下面有这份文档。这个是干什么的?——问这个问题的人是没学会Java的人。
如果你还没有学会把Weka的源程序导入到开发工具(IDE)里面,那么本站WEKA开发版有好几个帖子可供参考。Eclipse,Netbeans, Jcreator,你总有中意的吧?

2 核心部分
从IDE可以看到,和大多数Java程序一样,Weka的源代码分成了若干个包(package),根据包的名字就可以看出各自的功能。比如,classifiers是管分类的(还有回归),gui是管图形界面的,等等。这中间各个部分都要调用到的,最最重要的,当然是"weka.core"这个包了。
core包中又有三个类(Class)是重中之重,我们就从这里入手。它们是Instances, Attribute和Instance。
(未完待续)

3 一个自己的分类器

转载于:https://www.cnblogs.com/leona_jay/archive/2008/11/11/1331128.html

棍子节快乐~ 顺便转一篇weka源码分析解析~【转自weka中文网】相关推荐

  1. 【.NET Core项目实战-统一认证平台】第八章 授权篇-IdentityServer4源码分析

    上篇文章我介绍了如何在网关上实现客户端自定义限流功能,基本完成了关于网关的一些自定义扩展需求,后面几篇将介绍基于IdentityServer4(后面简称Ids4)的认证相关知识,在具体介绍ids4实现 ...

  2. 命令构建gradle项目_【Android 修炼手册】Gradle 篇 -- Gradle 源码分析

    预备知识 理解 gradle 的基本开发 了解 gradle task 和 plugin 使用及开发 了解 android gradle plugin 的使用 看完本文可以达到什么程度 了解 grad ...

  3. 【Android 修炼手册】Gradle 篇 -- Gradle 源码分析

    预备知识 理解 gradle 的基本开发 了解 gradle task 和 plugin 使用及开发 了解 android gradle plugin 的使用 看完本文可以达到什么程度 了解 grad ...

  4. android 12 framework开发第53节-Activity的reLaunch及onConfigurationChanged android源码分析

    hi,同学们大家好! 1.Configuration应用开发背景 今天要给大家分享内容就是我们应用开发时候经常会遇到问题,那就是如果系统一些属性变化了,比如语言,横竖屏幕,深色模式等.就会导致系统当前 ...

  5. Java游戏服务器成长之路——弱联网游戏篇(源码分析)

    http://blog.csdn.net/hjcenry/article/details/50530472 前段时间由于公司的一款弱联网游戏急着上线,没能及时分享,现在基本做的差不多,剩下的就是测试阶 ...

  6. 《Ceph源码分析》——第1章,第5节RADOS

    本节书摘来自华章出版社<Ceph源码分析>一书中的第1章,第1.5节RADOS,作者常涛,更多章节内容可以访问云栖社区"华章计算机"公众号查看 1.5 RADOS RA ...

  7. 《Ceph源码分析》——第1章,第一节Ceph的发展历程

    本节书摘来自华章出版社<Ceph源码分析>一书中的第1章,第1.1节Ceph的发展历程,作者常涛,更多章节内容可以访问云栖社区"华章计算机"公众号查看 第1章 Ceph ...

  8. 《Ceph源码分析》——第2章,第2节Buffer

    本节书摘来自华章出版社<Ceph源码分析>一书中的第2章,第2.2节Buffer,作者常涛,更多章节内容可以访问云栖社区"华章计算机"公众号查看 2.2 Buffer ...

  9. FileZilla Server源码分析--大漠落日5节

    之所以有本系列的分析,是因为两点: FileZilla 是目前非常火爆的开源ftp项目,整个项目采用C++代码编写,代码紧凑可读性高,值得学习(缺陷是注释太少). 网络上已有的对该源码的分析基于的版本 ...

最新文章

  1. linux 命令读db文件格式,使用linux的db_load命令生成db数据库
  2. centos/linux 安装node.js
  3. tomcat启动(五)Catalina分析-service.init
  4. 关于灵魂安放,年轻人如何选择适合自己的城市呢?学长有话说
  5. h5 在线语音识别接口
  6. java接口的关键字_java关键字-interface
  7. vray渲染器的工作流程你清楚吗?
  8. 黑苹果MacOS Big Sur 11.0 安装教程及驱动工具
  9. 家校协同小程序实战教程
  10. 用python来开发webgame服务端(4)
  11. 单例设计模式,写出几个例子
  12. 视频播放器软件哪个最好用?盘点6款Windows电脑上超级好用的本地视频播放器
  13. 中小银行数字普惠金融发展的思考和建议
  14. 远程审批、远程会议及远程培训就用天翼云办公
  15. 国家开放大学2021春2623中医药学概论题目
  16. [Kerberos基础]-- kdc集群主从搭建(kerberos相关)
  17. C++培训_001_WIN10的安装与激活_VS编译器的安装
  18. 强大的公式编辑器 —— MathType最新版本安装与使用
  19. python 英语翻译_Python 实现中英文翻译
  20. 物联网测试完整解决方案 | 为你的芯片、模块、终端保驾护航

热门文章

  1. 疯子的算法总结(六) 复杂排序算法 ② 桶排序
  2. 如何更改ubuntu的用户密码
  3. 玩转GIT系列之【git切换到某个tag之后提示“detached HEAD】
  4. nginx cache 配置
  5. 阿里云存储OSS中设置上传文件content type
  6. SQL经典问题1——产品、颜色、数量
  7. 在linux下使用udev获取热插拔(hotplug)事件
  8. md发布test-1 md发布test-1md发布test-1md发布test-1md发布test-1md发布test-1md发布test-1md发布test-1md发布test-1md发布test-
  9. 小额贷款利息违法吗?
  10. 关于恐怖小说“分级”及其他:答《北京娱乐信报》记者张守刚问