发信人: finallyliuyu (领头驴), 信区: NLP
标  题: 求weka JVM outofMemory问题的解决方案
发信站: 水木社区 (Sun Feb 20 10:36:12 2011), 站内

正在用weka做文本分类的实验(主要侧重点在于衡量特征词选择算法的优劣)。
语料库: Reteurs21578
featurewords 100
训练集规模:6950
测试集规模:2676
(采用稀疏数据储存模式)生成的arff文件大小:trainCorpus.arff(538k),testCorpus.arff(208k)分类器采用SMO
结果报错run outof memory。
参照一位同学的方法把runWeka.ini中的maxheap=2048m,依然无效。。
请教版内的各位大神还有别的解决方案吗?
看到网络上有一些改JVM大小的方法,可是我对java不太熟悉哈,不知道如何修改。求详细步骤。
--
NLP业余爱好者一枚

※ 来源:·水木社区 http://newsmth.net/·[FROM: 159.226.20.*]

[本篇全文] [回复文章] [本篇作者:finallyliuyu] [回信给作者] [进入讨论区] [返回顶部][分享到 搜狐微博]

2

发信人: finallyliuyu (领头驴), 信区: NLP
标  题: Re: 求weka JVM outofMemory问题的解决方案
发信站: 水木社区 (Sun Feb 20 10:47:05 2011), 站内

我把我自己的数据上传了,求助电脑上装有weka的童鞋帮忙跑下,不胜感激。另外我疑心我自己的weka安装有问题。 weka官方网上有两种weka,一种是自带jvm的,一种是不带jvm的。由于我电脑上以前装过java SDK,所以我选的是不带jvm的,这样安装后的java在快捷菜单项上无法启动

【 在 finallyliuyu (领头驴) 的大作中提到: 】
: 正在用weka做文本分类的实验(主要侧重点在于衡量特征词选择算法的优劣)。
: 语料库: Reteurs21578
: featurewords 100
: ...................

--
NLP业余爱好者一枚

※ 来源:·水木社区 http://newsmth.net/·[FROM: 159.226.20.*]

附件: trainCorpus.arff (538KB)

附件: testCorpus.arff (207KB)

[本篇全文] [回复文章] [本篇作者:xwild] [回信给作者] [进入讨论区] [返回顶部][分享到 搜狐微博]

3

发信人: xwild (xwild), 信区: NLP
标  题: Re: 求weka JVM outofMemory问题的解决方案
发信站: 水木社区 (Sun Feb 20 10:53:01 2011), 站内

可以试一下weka的命令行,可以设置最大内存
【 在 finallyliuyu (领头驴) 的大作中提到: 】
: 正在用weka做文本分类的实验(主要侧重点在于衡量特征词选择算法的优劣)。
: 语料库: Reteurs21578
: featurewords 100
: ...................

--

※ 来源:·水木社区 http://newsmth.net/·[FROM: 211.87.234.*]

[本篇全文] [回复文章] [本篇作者:finallyliuyu] [回信给作者] [进入讨论区] [返回顶部][分享到 搜狐微博]

4

发信人: finallyliuyu (领头驴), 信区: NLP
标  题: Re: 求weka JVM outofMemory问题的解决方案
发信站: 水木社区 (Sun Feb 20 11:28:23 2011), 站内

我这边按照wekadoc里面调用weka命令行的方法进行调用,没有反应哈,不出分类过程。
【 在 xwild (xwild) 的大作中提到: 】
: 可以试一下weka的命令行,可以设置最大内存

--
NLP业余爱好者一枚

※ 来源:·水木社区 http://newsmth.net/·[FROM: 159.226.20.*]

此主题相关图片如下:wekaSimpleCLI调用.jpg (11KB)

[本篇全文] [回复文章] [本篇作者:xphan] [回信给作者] [进入讨论区] [返回顶部][分享到 搜狐微博]

5

发信人: xphan (DBlue), 信区: NLP
标  题: Re: 求weka JVM outofMemory问题的解决方案
发信站: 水木社区 (Sun Feb 20 16:43:30 2011), 站内

java 在命令行下可以用 -Xms 和-Xmx来设置最小最大内存,比如
java -Xms256m -Xmx5g ...
不过在windows下运行的话,系统对内存也有限制

【 在 finallyliuyu (领头驴) 的大作中提到: 】
: 正在用weka做文本分类的实验(主要侧重点在于衡量特征词选择算法的优劣)。
: 语料库: Reteurs21578
: featurewords 100
: ...................

--

※ 来源:·水木社区 http://newsmth.net/·[FROM: 125.39.171.*]

[本篇全文] [回复文章] [本篇作者:fancyerii] [回信给作者] [进入讨论区] [返回顶部][分享到 搜狐微博]

6

发信人: fancyerii (喵了个咪的), 信区: NLP
标  题: Re: 求weka JVM outofMemory问题的解决方案
发信站: 水木社区 (Sun Feb 20 18:14:10 2011), 站内

这样的问题要么自己调试代码,要么发到他们的maillist比较好。
【 在 finallyliuyu (领头驴) 的大作中提到: 】
: 正在用weka做文本分类的实验(主要侧重点在于衡量特征词选择算法的优劣)。
: 语料库: Reteurs21578
: featurewords 100
: ...................

--

※ 来源:·水木社区 http://newsmth.net/·[FROM: 162.105.200.*]

[本篇全文] [回复文章] [本篇作者:finallyliuyu] [回信给作者] [进入讨论区] [返回顶部][分享到 搜狐微博]

7

发信人: finallyliuyu (领头驴), 信区: NLP
标  题: Re: 求weka JVM outofMemory问题的解决方案
发信站: 水木社区 (Mon Feb 21 21:14:03 2011), 站内

多谢xwild,这个问题目前已经解决。 方案如下:
在weka SimpleCLI窗口依次输入
java -Xmx 1024m
java weka.classifiers.lazy.IBk -K 5 -t data/trainCorpus.arff -T data/testCorpus.arff -i
此处以knn为例来说明如何利用控制台解决weka内存限制的问题。
参考资料 weka自带的WekaManual 第一章 第一节A command line primer
 Morgan.Kaufmann data mining   第十三章第一节 "The command line interface"

【 在 xwild (xwild) 的大作中提到: 】
: 可以试一下weka的命令行,可以设置最大内存

--
NLP业余爱好者一枚

※ 来源:·水木社区 http://newsmth.net/·[FROM: 159.226.20.*]

zz 标 题: 求weka JVM outofMemory问题的解决方案【已解决】相关推荐

  1. 标 题: 慕尼黑:关于跑步的记忆 zz

    发信人: Deschutes (胖胖熊~下一次比赛:6月18日), 信区: RunningLife 标 题: 慕尼黑:关于跑步的记忆 发信站: 水木社区 (Fri May 27 05:02:33 20 ...

  2. 标 题: 腾讯面试题目(PHP程序员)

    发信人: max19830115 (max), 信区: Programming 标  题: 腾讯面试题目(PHP程序员) 发信站: 水木社区 (Mon Apr 18 16:26:07 2011), 站 ...

  3. 第十一届蓝桥杯省赛C++组试题 第3题 求阴影面积

    /* 第十一届蓝桥杯省赛C++组试题 第3题 求阴影面积 */ #include <bits/stdc++.h> using namespace std; int main() {int ...

  4. 第十一届蓝桥杯省赛 C++组试题 第2题 求完数

    /* 第十一届蓝桥杯省赛C++组试题精讲第2题 求完数因子:因子也叫因数,例如3×5=15,那么3和5是15的因子. 同时15×1=15,那么1和15也是15的因子. 1,3,5,15 这四个因子是1 ...

  5. 2020年11月份某kh比赛部分CTF赛题求大佬解题思路

    2020年11月份某kh比赛部分CTF赛题求大佬解题思路 只down下来misc和密码两类题 麻烦大佬们搞一搞这四道题 只down下来misc和密码两类题 百度网盘赛题分享 链接: https://p ...

  6. 编程题——求最小公倍数

    编程题--求最小公倍数 题目描述: 正整数A和正整数B 的最小公倍数是指 能被A和B整除的最小的正整数值,设计一个算法,求输入A和B的最小公倍数. 输入描述: 输入两个正整数A和B. 输出描述: 输出 ...

  7. i10在java中什么意思啊,java题库_JAVA题库的题 求答案啊!!!!!!!!!!!!!!!!_淘题吧...

    ⑴ JAVA题库的题 求答案啊!!!!!!!!!!!!!!!! 1.有点没太明白意思,是要求2个数相加的和吗? 导入Java.util.扫描仪: 公共类应用程序1 /** * @param参数 */ ...

  8. 标 题: 台资企业一般怎么样啊

    标  题: 台资企业一般怎么样啊 发信站: 水木社区 (Fri Apr 24 19:32:07 2009), 站内 谁了解,来说说 我听说是待遇不好,经常加班, 就是项目好,能赚到一些资历 -- 广告 ...

  9. 标 题: 又灌水-反(调试/跟踪/脱壳) 技术集锦

    标 题: 又灌水-反(调试/跟踪/脱壳) 技术集锦 发信人: kongfoo 时 间: 2004-05-27,14:50 详细信息: 反(调试/跟踪/脱壳) 技术集锦 kongfoo/2004.4.1 ...

最新文章

  1. 朴素、Select、Poll和Epoll网络编程模型实现和分析——Select模型
  2. 滚动条——WPF ScrollViewer的应用
  3. 模型评估——ROC、KS
  4. 【poj3709】 K-Anonymous Sequence
  5. SAP Spartacus package.json 里定义的 ts-loader
  6. 信息学奥赛一本通(1319:【例6.1】排队接水)
  7. Opencv--Mat图像基本操作
  8. java进程里面调用方法_在java里面调用CUI程序的方法
  9. Android小知识-单例引起的内存泄漏
  10. 树形控件显示数据库数据项
  11. linux生成密码文本,Linux下用makepasswd和passwordmaker生成密码
  12. python scrapy框架 简书_Python的Scrapy框架
  13. C++实现播放音频文件
  14. python和r语言对比_Python和R语言之分析对比
  15. 微信群控云控客服开发SDK
  16. 关于编写性能高效的javascript事件的技术[转] 来源:酷勤网 发布于 2015-2-12
  17. 使用KMS批量激活操作系统
  18. 基于python网络爬虫的个性化音乐播放器
  19. 计算机科学前沿技术导论论文,计算机科学技术导论论文.doc
  20. buddypress主题_WordPress Gone Social-BuddyPress

热门文章

  1. 【CV秋季划】人脸美颜与风格化视频上新
  2. 全球及中国洗涤剂行业十四五总体规模与盈利状况分析报告2022版
  3. 荣事达空调质量差3天即坏
  4. MyGeneration【ui-原】
  5. python 全栈开发,Day66(web应用,http协议简介,web框架)
  6. 如何实现微服务架构中的服务发现
  7. asp.net内置对象
  8. Untiy3D(4.5) 中应用 MovieTexture,无法关联资源文件可能的原因
  9. 怎么还不见2005的中文版出来的?
  10. 2018危机与机遇丨PMCAFF年度精选合集