该软件使用的训练数据和检验数据文件格式如下:

  <label> <index1>:<value1> <index2>:<value2> ...

  其中<label> 是训练数据集的目标值,对于分类,它是标识某类的整数(支持多个类);对于回归,是任意实数。<index> 是以1开始的整数,可以是不连续的;<value>为实数,也就是我们常说的自变量。检验数据文件中的label只用于计算准确度或误差,如果它是未知的,只需用一个数填写这一栏,也可以空着不填。在程序包中,还包括有一个训练数据实例:heart_scale,方便参考数据文件格式以及练习使用软件。

在NET.SVM中,Node和Problem类提供此项功能。如果说我要定义如下数据集:

+1 1:0.708333 2:1 3:1 4:-0.320755
-1 1:0.583333 2:-1 3:0.333333 4:-0.603774 
+1 1:0.166667 2:1 3:-0.333333 4:-0.433962 
-1 1:0.458333 2:1 3:1 4:-0.358491

可以先定义X的矩阵:private Node[][] _X;一组Y的数组private double[] _Y;然后再分别给_X和_Y赋值;

当然,也可以用Problem类提供的方法来Read(Stream)和Read(String)来将数据直接读取到Problem中去。

Class Node

Member

Description

Node()()()

Default Constructor.

Node(Int32, Double)

Constructor.

CompareTo(Node)

Compares this node with another.

Equals(Object)

(Inherited from Object.)

Finalize()()()

(Inherited from Object.)

GetHashCode()()()

(Inherited from Object.)

GetType()()()

(Inherited from Object.)

Index

Index of this Node.

MemberwiseClone()()()

(Inherited from Object.)

ToString()()()

String representation of this Node as {index}:{value}.

(Overrides Object.ToString()()().)

Value

Value at Index.

Class Problem

Member

Description

Problem(Int32, array<Double>[]()[], array<array<Node>[]()[]>[]()[], Int32)

Constructor.

Problem()()()

Empty Constructor. Nothing is initialized.

Count

Number of vectors.

Equals(Object)

(Inherited from Object.)

Finalize()()()

(Inherited from Object.)

GetHashCode()()()

(Inherited from Object.)

GetType()()()

(Inherited from Object.)

MaxIndex

Maximum index for a vector.

MemberwiseClone()()()

(Inherited from Object.)

Read(Stream)

Reads a problem from a stream.

Read(String)

Reads a Problem from a file.

ToString()()()

(Inherited from Object.)

Write(Stream, Problem)

Writes a problem to a stream.

Write(String, Problem)

Writes a problem to a file. This will overwrite any previous data in the file.

X

Vector data.

Y

Class labels.

转载于:https://www.cnblogs.com/petali/archive/2008/11/06/1328454.html

【机器学习】libsvm使用的数据格式相关推荐

  1. 支持向量机SVM详细原理,Libsvm工具箱详解,svm参数说明,svm应用实例,神经网络1000案例之15

    目录 支持向量机SVM的详细原理 SVM的定义 SVM理论 Libsvm工具箱详解 简介 参数说明 易错及常见问题 SVM应用实例,基于SVM的股票价格预测 支持向量机SVM的详细原理 SVM的定义 ...

  2. libsvm Minist Hog 手写体识别

    统计手写数字集的HOG特征 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ 这篇文章是模式识别的小作业,利用sv ...

  3. LibSVM for Python 使用

    经历手写SVM的惨烈教训(还是太年轻)之后,我决定使用工具箱/第三方库 Python libsvm的GitHub仓库 LibSVM是开源的SVM实现,支持C, C++, Java,Python , R ...

  4. 支持向量机libsvm实战入门

    一.libsvm介绍 SVM支持向量机是目前比较流行的一种数据挖掘方法,能够处理较高维度,具体介绍可参考这篇博文: 支持向量机通俗导论(理解SVM的三层境界) LIBSVM是台湾大学林智仁(Lin C ...

  5. libsvm使用心得

    Libsvm使用心得 首先下载Libsvm.Python和Gnuplot: l         libsvm的主页http://www.csie.ntu.edu.tw/~cjlin/libsvm/上下 ...

  6. libsvm python_LibSVM for Python 使用

    经历手写SVM的惨烈教训(还是太年轻)之后,我决定使用工具箱/第三方库 Python LibSVM是开源的SVM实现,支持C, C++, Java,Python , R 和 Matlab 等, 这里选 ...

  7. LIBSVM使用说明、简介及感悟

    使用LIBSVM需要用到的其他工具:Python(相信搞SVM的或多或少都知道Python吧,安装时注意一点就是记得要添加环境变量!).以下内容是指windows平台的. 配套论文:LIBSVM: A ...

  8. libsvm回归预测

    本文,将按照以下的顺序来说明libsvm的用法: 1.Libsvm之初相识 1)libsvm简介(略) 2)Libsvm.python.gnuplot下载 3)环境变量的设置以及如何在DOS下寻找路径 ...

  9. liblinear简介

    1.liblinear是什么 liblinear是国立台湾大学林智仁教授开发的一个工具包. 林教授个人官网 https://www.csie.ntu.edu.tw/~cjlin/ 其中关于liblin ...

最新文章

  1. 什么是 Delta 文件
  2. mysql delete语句_MySQL ------ 触发器(TRIGGER)(二十七)
  3. 《个人信息保护法》,教我如何做产品!
  4. PAT乙级(1035 插入与归并)
  5. mysql sqlsugar_sqlSugar的使用---入门
  6. BI开发之——ETL注意细节
  7. php gd support not found.,安装php71w-gd并获取错误GD库扩展不适用于此PHP安装
  8. TCP方式的网络通信【聊天器示例】
  9. 写在汇编语言开课之前
  10. 服务器主板128G只显示出64G,[硬件维护]请教高手:新买的160G硬盘为什么分区后就只能显示128G?...
  11. [2019HDU多校第一场][HDU 6578][A. Blank]
  12. 抖音 文本转换html,html抖音效果CSS
  13. 华为HCIA Cloud Computing 华为HCIA考证笔记(已获取该证书)
  14. 看我小穷仔和富家MM的经典图聊!!
  15. LeNet:Handwritten Digit Recognition with a Back-Propagation Network
  16. 职业经验 聊一聊职业发展
  17. dataframe将某列的空值填充为12
  18. WPF 将PPT,Word转成图片
  19. java+opencv+selenium实现滑块滑动破解
  20. opencv3.0中contrib模块的添加

热门文章

  1. 扩散模型就是自动编码器!DeepMind研究学者提出新观点并论证
  2. 数字孪生等前沿技术,将如何解码未来交通?
  3. 2020年度国家科学技术奖提名项目公示丨附全名单
  4. 机器学习奠基人Michael Jordan:下代技术是融合经济学,解读2项重要进展
  5. 黑科技揭秘 | 阿里云“天空物联网”连接范围如何达到700平方公里
  6. 谷歌李飞飞:我们依旧站在人工智能研究的起点
  7. 该如何对「半监督学习算法」实际性应用进行评估?Google给出了新答案
  8. 如何打造一支拖业务后腿的技术团队?
  9. 程序员如何避免陷入内卷?
  10. 好玩!PyEcharts 绘制时间轮播图