一、什么是arff格式文件

  1、arff是Attribute-Relation File Format缩写,从英文字面也能大概看出什么意思。它是weka数据挖掘开源程序使用的一种文件模式。由于weka是个很出色的数据挖掘开源项目,所以使用的比较广,这也无形中推广了它的数据存储格式。

  2、下面是weka自带的一个arff文件例子(weather.arff)

 1 @relation weather2 3 @attribute outlook {sunny, overcast, rainy}4 @attribute temperature real5 @attribute humidity real6 @attribute windy {TRUE, FALSE}7 @attribute play {yes, no}8 9 @data
10 sunny,85,85,FALSE,no
11 sunny,80,90,TRUE,no
12 overcast,83,86,FALSE,yes
13 rainy,70,96,FALSE,yes
14 rainy,68,80,FALSE,yes
15 rainy,65,70,TRUE,no
16 overcast,64,65,TRUE,yes
17 sunny,72,95,FALSE,no
18 sunny,69,70,FALSE,yes
19 rainy,75,80,FALSE,yes
20 sunny,75,70,TRUE,yes
21 overcast,72,90,TRUE,yes
22 overcast,81,75,FALSE,yes
23 rainy,71,91,TRUE,no

  a) 第1行,是关系名称,这个自己随便起,不过写的最好要有意义。

   b) 第3~7行是特征列表,其中第1列是特征说明,不可缺少,第2列是特征名称,第3列是特征类型或特征取值范围。

   c) @data(第9行)是数据域说明,在它下面的全是数据。其中每一行体表一条数据。

   d) 例子中给出的数据域是最基本的表示方法,实际应用中,一般都是用稀疏表示法。

   e) 此处对于arff文件格式不做进一步解释,不懂的地方可以给我留言。

二、总体思路

  1、生成特征文件

  2、文件格式转换

三、具体实现

 参考:weka数据挖掘拾遗(一)---- 生成Arff格式文件

四、weka csv转为arff

  虽然Weka也支持其他一些格式的文件,但是ARFF格式是支持的最好的。因此有必要在数据处理之前把数据集的格式转换成ARFF。

  参考:http://miaochen314.blog.163.com/blog/static/8696422009227101756428/

  

生成arff文件,csv转为arff相关推荐

  1. python读取arff文件_ARFF文件格式

    Attribute -Relation File Format (ARFF) 1.ARFF 头章节包括关系声明和属性声明 关系声明(@ralation Declaration) 关系声明在ARFF文件 ...

  2. 使用 mulan-1.5.0 如何构造.arff文件

    1. 为什么要使用mulan 我用mulan来做多标签数据的分类,但是mulan的输入数据由两个文件控制,一个是data.arff文件,这个文件列出的所有的属性以及这些属性值的类型和他们对应的值.la ...

  3. PHP进行生成并且导出CSV文件

    1.参考 https://www.cnblogs.com/woods1815/p/11875913.html 2.基础 CSV文件是以纯文本形式存储的,一般以逗号为分隔符 3.浏览器导出CSV文件格式 ...

  4. php页面导出csv,使用PHP生成并导出CSV文件

    CSV文件是以纯文本形式存储的,一般以逗号为分隔符. 这里主要简单介绍下如何导出CSV文件. 一.浏览器导出CSV文件格式 /** * 导出CSV文件 */ function exportCsv() ...

  5. 将文本数据转换成arff文件

    目的: 将类似下图的文本数据转换为arff文件.文本数据每一行是一个句子和该句子的类属性值(classValue),得到的arff文件中的一个实例(Instance)即为一个句子的单词向量和类属性值. ...

  6. 用Java创建weka需要的Instance对象和arff文件

    在用Java使用weka时,我们需要weka支持的数据格式,weka官网上给出的大多是从arff文件中导入数据.从数据库中生成对系统环境要求也较高.因此本文介绍了如何通过普通的Java对象生成weka ...

  7. 一个生成Rockwell RSLogix5000 .csv 文件和.L5X文件的Excel插件

    一个生成Rockwell RSLogix5000 .csv 文件和.L5X文件的Excel插件 不知道各位AB PLC工程师花多少时间和精力在重复性的编程工作上.比如模拟量输入输出的处理,模拟量报警, ...

  8. 随机生成数字写入csv文件

    随机生成数字写入csv文件 import csv #导入csv库 import random #导入random库,用来随机生成数字f = open('csv文件/number.csv', 'w+', ...

  9. 随机生成姓名写入csv文件

    随机生成姓名写入csv文件 import csv import random #导入random模块f = open('csv文件/name2.csv', 'w+', encoding='gbk', ...

最新文章

  1. 容器LinkedList原理(学习)
  2. cad打印样式ctb丢失_我的第一次打印:cad模型空间套图框打印图纸
  3. 论文笔记 《Maxout Networks》 《Network In Network》
  4. oracle ORA-00604和BadImageFormatException的解决方法
  5. 向量 矩阵 张量_张量,矩阵和向量有什么区别?
  6. C语言之sprintf使用总结
  7. python分治算法_分治法及其python实现例子
  8. Phinx - 数据库迁移及版本控制介绍(内含中文文档翻译)
  9. 设计一个简单的权限管理系统
  10. python 正则findall右斜杠_Python正则表达式匹配反斜杠问题解析
  11. vue中swiper,vue-awesome-swiper实现轮播;鼠标移入暂停,移除播放;点击暂停按钮暂停,再点击播放。
  12. VS2019打包exe文件
  13. 水倒七分、茶倒八分、酒倒满
  14. 动态规划算法之断句问题
  15. flume多节点集群搭建
  16. 微信小程序开发分析总结
  17. 数据分享|人口空间分布
  18. 计算机应用研究所912,中国科学院计算技术研究所硕士生导师章隆兵
  19. 网络爬虫信息之实战淘宝书包信息爬取14
  20. IE里兼容性视图是做什么用的?该如何设置?

热门文章

  1. Eclipse is running in a JRE, but a JDK is required 解决方法(转)
  2. 运行cmd状态下MySQL导入导出.sql文件
  3. Oracle9i 问题汇总--不断更新中
  4. Java面向对象(1) —— 封装
  5. java深拷贝和浅拷贝介绍
  6. RocketMQ集成SpringBoot
  7. 后端JAVA:说说你对【注解】的理解
  8. 盘点Linux下19 个有趣的命令!
  9. 程序员获取编程灵感的10 种方式
  10. SQL Server 涉及数据库安全常用SQL语句