《中文分词算法研究》
看完了才发现作者是经济管理学院的。
这是篇08年的论文。
目前国内外对于中文分词的主要研究成果分为以下几种:正向最大匹配法、反向最大匹配方法、分词与词性标注一体化方法、最佳匹配法、专家系统方法、最少分词词频选择方法、神经网络方法等。
ICTCLAS( Institute of Computing Technology, Chinese Lexical Analysis System)是由中国科学院计算技术研究所研究的基于多层隐马尔可夫模型HMM的汉语词法分析系统。
查全率Precision =分词结果中切分正确的总词数 / 分词结果中的总词数
查准率Recall =分词结果中切分正确的总词数 / 标准文本中的总词数
F1 = 2 ×Precison ×Recall / Precison +Recall
分词速度=分词文件大小 / 分词所用时间
根据这货的实验结果,ICTCLAS的查全率、查准率、F1比正向最大匹配法的好,分词速度慢了点。
《中文分词算法研究》相关推荐
- ComeFuture英伽学院——2020年 全国大学生英语竞赛【C类初赛真题解析】(持续更新)
视频:ComeFuture英伽学院--2019年 全国大学生英语竞赛[C类初赛真题解析]大小作文--详细解析 课件:[课件]2019年大学生英语竞赛C类初赛.pdf 视频:2020年全国大学生英语竞赛 ...
- ComeFuture英伽学院——2019年 全国大学生英语竞赛【C类初赛真题解析】大小作文——详细解析
视频:ComeFuture英伽学院--2019年 全国大学生英语竞赛[C类初赛真题解析]大小作文--详细解析 课件:[课件]2019年大学生英语竞赛C类初赛.pdf 视频:2020年全国大学生英语竞赛 ...
- 信息学奥赛真题解析(玩具谜题)
玩具谜题(2016年信息学奥赛提高组真题) 题目描述 小南有一套可爱的玩具小人, 它们各有不同的职业.有一天, 这些玩具小人把小南的眼镜藏了起来.小南发现玩具小人们围成了一个圈,它们有的面朝圈内,有的 ...
- 信息学奥赛之初赛 第1轮 讲解(01-08课)
信息学奥赛之初赛讲解 01 计算机概述 系统基本结构 信息学奥赛之初赛讲解 01 计算机概述 系统基本结构_哔哩哔哩_bilibili 信息学奥赛之初赛讲解 02 软件系统 计算机语言 进制转换 信息 ...
- 信息学奥赛一本通习题答案(五)
最近在给小学生做C++的入门培训,用的教程是信息学奥赛一本通,刷题网址 http://ybt.ssoier.cn:8088/index.php 现将部分习题的答案放在博客上,希望能给其他有需要的人带来 ...
- 信息学奥赛一本通习题答案(三)
最近在给小学生做C++的入门培训,用的教程是信息学奥赛一本通,刷题网址 http://ybt.ssoier.cn:8088/index.php 现将部分习题的答案放在博客上,希望能给其他有需要的人带来 ...
- 信息学奥赛一本通 提高篇 第六部分 数学基础 相关的真题
第1章 快速幂 1875:[13NOIP提高组]转圈游戏 信息学奥赛一本通(C++版)在线评测系统 第2 章 素数 第 3 章 约数 第 4 章 同余问题 第 5 章 矩阵乘法 第 6 章 ...
- 信息学奥赛一本通题目代码(非题库)
为了完善自己学c++,很多人都去读相关文献,就比如<信息学奥赛一本通>,可又对题目无从下手,从今天开始,我将把书上的题目一 一的解析下来,可以做参考,如果有错,可以告诉我,将在下次解析里重 ...
- 信息学奥赛一本通(C++版) 刷题 记录
总目录详见:https://blog.csdn.net/mrcrack/article/details/86501716 信息学奥赛一本通(C++版) 刷题 记录 http://ybt.ssoier. ...
- 最近公共祖先三种算法详解 + 模板题 建议新手收藏 例题: 信息学奥赛一本通 祖孙询问 距离
首先什么是最近公共祖先?? 如图:红色节点的祖先为红色的1, 2, 3. 绿色节点的祖先为绿色的1, 2, 3, 4. 他们的最近公共祖先即他们最先相交的地方,如在上图中黄色的点就是他们的最近公共祖先 ...
最新文章
- C语言实现图像中值滤波与均值滤波
- linux无人值守安装+PXE
- 重温强化学习之马尔可夫决策过程(MDPs)
- {网络编程}和{多线程}应用:基于UDP协议【实现多发送方发送数据到同一个接收者】--练习
- 设计模式(Design Pattern)
- c语言srand函数怎么用_C语言的main函数到底该怎么写
- JSON字符串转换为Map
- 训练日志 2018.12.20
- java 课后习题 三角形面积计算
- web的demo制造_基于Web的制造追溯系统DEMO
- Java多线程基本概念
- Java ArrayList的Array,Array的ArrayList
- emacs之occur mode笔记
- pycharm更改默认项目地址的方法
- 数据中心效率:40%的改进是通过最佳实践方案
- CentOS 6.0 下 VNC 配置方法
- 2015-2016书籍计划
- 使用servlet实现果树管理系统功能实现,小项目详解,点击链接,可以获得全部源代码
- mouse是计算机软件吗,手机控制电脑软件(EasyMouse)手机端
- SpaceSyntax【空间句法】之DepthMapX学习:第四篇 凸多边形图分析[未完]
热门文章
- ios 8 适配须知
- 协助数据库完成大数据实时查询
- Java中直接输出一个类的对象
- STC学习:八位数码管动态扫描
- OpenCV-图像处理(10、膨胀与腐蚀)
- 聊天室私聊php代码,聊天室技术 - 密谈的实现_php
- 禁用 device/credential guard_iOS 13.3.1 Beta版中引入了禁用U1超宽带芯片的开关
- BNU29140 Taikotaiko(概率)
- K进制 nyoj882
- python交通调查数据处理_python数据分析--关于时间类型数据处理的一种方法