一、特征选择:类内代表性、类间区别性、特征子集的最优性

1.DF频率法:选择高频词项

2.互信息MI

3.χ2 统计量

二、分类算法

1.线性方法

1.1朴素贝叶斯(假设条件独立)

1.2 Rocchio算法:质心法,效果一般不如NBC

基本思想:中心向量是所有文档向量的算术平均,将每篇测试文档分到离它最近的那个中心向量。

1.3 SVM支撑向量机:软间隔线性分类器

2.非线性方法:KNN最近邻

三、分类评价

1.P值:该类中正确的结果所占该类总结果的比重

P=CT/(CT+CN)

2.R值:该类中正确的结果占所有类正确结果的比重

R=CT(CT+~CT)

3.F值:调和平均值

F=1/(0.5*(1/P+1/R))

4.Accurary值:

Accuracy = (RR+NN)/(RN + RR + NR + NN)

转载于:https://www.cnblogs.com/jizhiyuan/p/3477583.html

Information Retrieval --- Classification相关推荐

  1. 信息检索领域相关资料 (A Guide to Information Retrieval)

    信息检索领域相关资料 (A Guide to Information Retrieval) Organized by Hongfei Yan Last updated on July 27, 2007 ...

  2. Information Retrieval 倒排索引 学习笔记

    一,问题描述 在Shakespeare文集(有很多文档Document)中,寻找哪个文档包含了单词"Brutus"和"Caesar",且不包含"Cal ...

  3. Combining Deep Learning with Information Retrieval to Localize Buggy Files for Bug Reports

    题目:Combining Deep Learning with Information Retrieval to Localize Buggy Files for Bug Reports 作者:An ...

  4. Information Retrieval(信息检索)笔记02:Preprocessing and Tolerant Retrieval

    Information Retrieval(信息检索)笔记02:Preprocessing and Tolerant Retrieval 预处理(Preprocessing) 文档分析及编码转换(Pa ...

  5. 信息检索(Information Retrieval)相关概念

    信息检索(Information Retrieval)相关概念 0 引言 好久没更新了,期末那段时间在突击期末考试,然后寒假又懒惰了一些,疏于学习.这篇算是新年开篇了,在这里笔者先来个迟到的新年祝福, ...

  6. Item Tagging for Information Retrieval: A Tripartite Graph Neural Network based Approach 用于信息检索的项目标签

    文章目录 摘要 简介 Tagging 方法 动机和总览 动机 总览 TagGNN-IT 节点表示 TagGNN-IT Propagation 损失 2.3 TagGNN-QI 2.3.1 边表示 2. ...

  7. Information Retrieval(信息检索)笔记01:Boolean Retrieval(布尔检索)

    Information Retrieval(信息检索)笔记01:Boolean Retrieval(布尔检索) 什么是信息检索(Information Retrieval) 布尔检索(Boolean ...

  8. On the value of temporal information in information retrieval (完)

    参考: On the value of temporal information in information retrieval, Omar Alonso, Michael Gertz and Ri ...

  9. 现代信息检索(Modern Information Retrieval)

    当年好像看到过这门课程,现在还挺后悔没有选修啊,看内容的确应该很不错.赶紧把书买了,回来好好学习学习,希望不晚, 下面是课程相关网页http://ir.ict.ac.cn/ircourse/ 现代信息 ...

最新文章

  1. [转]PDO防注入原理分析以及使用PDO的注意事项
  2. 计算机应用系统的开发活动,计算机应用教学训练系统的开发与应用.doc
  3. 大型网站系统与Java中间件实践 01 认识分布式
  4. oracle date 截取年月,在Oracle中,可用于提取日期时间类型特定部分(如年、月、日、时、分、秒)的函数有那些...
  5. 项目管理九要与八不要
  6. 惠普1020打印机查看已打印页数
  7. 使用ResNet101作为预训练模型训练Faster-RCNN-TensorFlow-Python3-master
  8. mysql数据库客户端--navicat for mysql 12中文破解版64位/32位 v12.0.29
  9. 章草、今草、狂草是草书的三种书写表现方式,你更喜欢哪一种?
  10. 帝国cms模板-免费帝国CMS模板-帝国CMS模板安装详细教程
  11. 我奋斗了18年才和你坐在一起喝咖啡
  12. 一代测序原理 (Sanger法测序)
  13. 10年回顾:世界各地开发高手谈Java
  14. Dongxiexidu
  15. 《高效能人士的七个习惯》读书摘记
  16. 解决微信公众号发布新的版本H5页面有缓存的问题
  17. PLC模拟量输入 模拟量转换FC S_ITR
  18. Noteability的一些使用小技巧
  19. 基于51单片机智能浇花自动浇水灌溉
  20. Ubuntu下vim设置tab键为4个空格

热门文章

  1. 学习笔记_vnpy实战培训day04_作业
  2. 都2020年了,你还认为BI=报表?
  3. 销售行业ERP数据统计分析都有哪些维度?
  4. easyUI的使用.datagrid()生成列表日期时间显示异常,一个方法带入有效修复
  5. idea重写接口没有@override_细说 Java Overload 与 Override 差别
  6. 小程序 php wecahtpay,PHP 微信公众号,小程序获取支付参数。微信支付
  7. esp虚拟服务器,esp32搭建web服务器
  8. PHP 怎样理解go指针,golang指针传递和值传递的区别是什么?
  9. 少年三国志鸿蒙符碎片在哪里,《少年三国志》最新萌新基础介绍4(名将+兵符)...
  10. 人脸关键点:DAN-Deep Alignment Network: A convolutional neural network for robust face alignment