Information Retrieval --- Classification
一、特征选择:类内代表性、类间区别性、特征子集的最优性
1.DF频率法:选择高频词项
2.互信息MI
3.χ2 统计量
二、分类算法
1.线性方法
1.1朴素贝叶斯(假设条件独立)
1.2 Rocchio算法:质心法,效果一般不如NBC
基本思想:中心向量是所有文档向量的算术平均,将每篇测试文档分到离它最近的那个中心向量。
1.3 SVM支撑向量机:软间隔线性分类器
2.非线性方法:KNN最近邻
三、分类评价
1.P值:该类中正确的结果所占该类总结果的比重
P=CT/(CT+CN)
2.R值:该类中正确的结果占所有类正确结果的比重
R=CT(CT+~CT)
3.F值:调和平均值
F=1/(0.5*(1/P+1/R))
4.Accurary值:
Accuracy = (RR+NN)/(RN + RR + NR + NN)
转载于:https://www.cnblogs.com/jizhiyuan/p/3477583.html
Information Retrieval --- Classification相关推荐
- 信息检索领域相关资料 (A Guide to Information Retrieval)
信息检索领域相关资料 (A Guide to Information Retrieval) Organized by Hongfei Yan Last updated on July 27, 2007 ...
- Information Retrieval 倒排索引 学习笔记
一,问题描述 在Shakespeare文集(有很多文档Document)中,寻找哪个文档包含了单词"Brutus"和"Caesar",且不包含"Cal ...
- Combining Deep Learning with Information Retrieval to Localize Buggy Files for Bug Reports
题目:Combining Deep Learning with Information Retrieval to Localize Buggy Files for Bug Reports 作者:An ...
- Information Retrieval(信息检索)笔记02:Preprocessing and Tolerant Retrieval
Information Retrieval(信息检索)笔记02:Preprocessing and Tolerant Retrieval 预处理(Preprocessing) 文档分析及编码转换(Pa ...
- 信息检索(Information Retrieval)相关概念
信息检索(Information Retrieval)相关概念 0 引言 好久没更新了,期末那段时间在突击期末考试,然后寒假又懒惰了一些,疏于学习.这篇算是新年开篇了,在这里笔者先来个迟到的新年祝福, ...
- Item Tagging for Information Retrieval: A Tripartite Graph Neural Network based Approach 用于信息检索的项目标签
文章目录 摘要 简介 Tagging 方法 动机和总览 动机 总览 TagGNN-IT 节点表示 TagGNN-IT Propagation 损失 2.3 TagGNN-QI 2.3.1 边表示 2. ...
- Information Retrieval(信息检索)笔记01:Boolean Retrieval(布尔检索)
Information Retrieval(信息检索)笔记01:Boolean Retrieval(布尔检索) 什么是信息检索(Information Retrieval) 布尔检索(Boolean ...
- On the value of temporal information in information retrieval (完)
参考: On the value of temporal information in information retrieval, Omar Alonso, Michael Gertz and Ri ...
- 现代信息检索(Modern Information Retrieval)
当年好像看到过这门课程,现在还挺后悔没有选修啊,看内容的确应该很不错.赶紧把书买了,回来好好学习学习,希望不晚, 下面是课程相关网页http://ir.ict.ac.cn/ircourse/ 现代信息 ...
最新文章
- [转]PDO防注入原理分析以及使用PDO的注意事项
- 计算机应用系统的开发活动,计算机应用教学训练系统的开发与应用.doc
- 大型网站系统与Java中间件实践 01 认识分布式
- oracle date 截取年月,在Oracle中,可用于提取日期时间类型特定部分(如年、月、日、时、分、秒)的函数有那些...
- 项目管理九要与八不要
- 惠普1020打印机查看已打印页数
- 使用ResNet101作为预训练模型训练Faster-RCNN-TensorFlow-Python3-master
- mysql数据库客户端--navicat for mysql 12中文破解版64位/32位 v12.0.29
- 章草、今草、狂草是草书的三种书写表现方式,你更喜欢哪一种?
- 帝国cms模板-免费帝国CMS模板-帝国CMS模板安装详细教程
- 我奋斗了18年才和你坐在一起喝咖啡
- 一代测序原理 (Sanger法测序)
- 10年回顾:世界各地开发高手谈Java
- Dongxiexidu
- 《高效能人士的七个习惯》读书摘记
- 解决微信公众号发布新的版本H5页面有缓存的问题
- PLC模拟量输入 模拟量转换FC S_ITR
- Noteability的一些使用小技巧
- 基于51单片机智能浇花自动浇水灌溉
- Ubuntu下vim设置tab键为4个空格
热门文章
- 学习笔记_vnpy实战培训day04_作业
- 都2020年了,你还认为BI=报表?
- 销售行业ERP数据统计分析都有哪些维度?
- easyUI的使用.datagrid()生成列表日期时间显示异常,一个方法带入有效修复
- idea重写接口没有@override_细说 Java Overload 与 Override 差别
- 小程序 php wecahtpay,PHP 微信公众号,小程序获取支付参数。微信支付
- esp虚拟服务器,esp32搭建web服务器
- PHP 怎样理解go指针,golang指针传递和值传递的区别是什么?
- 少年三国志鸿蒙符碎片在哪里,《少年三国志》最新萌新基础介绍4(名将+兵符)...
- 人脸关键点:DAN-Deep Alignment Network: A convolutional neural network for robust face alignment