同义替换:哈工大同义词词林扩展版
一、前言
《同义词词林》是梅家驹等人于1983年编纂而成,年代较为久远,对于目前的使用不太适合,哈工大实验室基于该词林进行扩展,完成了词林扩展版。
下载地址:https://www.ltp-cloud.com/download/
二、使用说明
扩展版同义词词林分为5层结构,
随着级别的递增,词义刻画越来越细,到了第五层,每个分类里词语数量已经不大,很多只有一个词语,已经不可再分,可以称为原子词群、原子类或原子节点。不同级别的分类结果可以为自然语言处理提供不同的服务,例如第四层的分类和第五层的分类在信息检索、文本分类、自动问答等研究领域得到应用。有研究证明,对词义进行有效扩展,或者对关键词做同义词替换可以明显改善信息检索、文本分类和自动问答系统的性能。
下载后的词典文件如下所示:
Aa01A01= 人 士 人物 人士 人氏 人选
Aa01A02= 人类 生人 全人类
Aa01A03= 人手 人员 人口 人丁 口 食指
Aa01A04= 劳力 劳动力 工作者
Aa01A05= 匹夫 个人
上述文件编码代表含义见图:
表中的编码位是按照从左到右的顺序排列。第八位的标记有3 种,分别是“=”、“#”、“@”, “=”代表“相等”、“同义”。末尾的“#”代表“不等”、“同类”,属于相关词语。末尾的“@”代表“自我封闭”、“独立”,它在词典中既没有同义词,也没有相关词。
三、其他
1、上文引用均来自哈工大扩展词林说明文档
2、一个获取同义词的python库:https://github.com/huyingxi/Synonyms
同义替换:哈工大同义词词林扩展版相关推荐
- 同义词词林 java_基于同义词词林扩展版的词语相似度计算
词语相似度计算 词义相似度计算在很多领域中都有广泛的应用,例如信息检索.信息抽取.文本分类.词义排歧.基于实例的机器翻译等等.国内目前主要是使用知网和同义词词林来进行词语的相似度计算. 本文主要是根据 ...
- solr之使用IKAnalyzer配置同义词,停止词,扩展词。
环境如下: solr4.7 IKAnalyzer2012FF_u1 配置同义词 第一步 将IKAnalyzer2012FF_u1放到solr-4.7.2/example/solr-webapp/web ...
- 基于信息内容的词林词语相似度计算 - 论文及代码讲解
文章目录 论文 同义词林简介 特点 代码 获取词的编码 求IC值 求相似度 选取相似度最大值 论文:<基于信息内容的词林词语相似度计算 >-2018-彭琦,朱新华等 查看 代码:https ...
- 寻找一种易于理解的一致性算法(扩展版)
最新内容最先更新在主站深入浅出区块链社区 原文链接:寻找一种易于理解的一致性算法(扩展版) 摘要 Raft 是一种为了管理复制日志的一致性算法.它提供了和 Paxos 算法相同的功能和性能,但是它的算 ...
- Joe一款个人博客typecho主题(扩展版)
介绍: 1.原版有的都有,扩版是增加或微调,依然原滋原味的. 2.导航部分,首页向下滚动隐藏.回滚显示导航:文章详情页向下滚动隐藏并显示文章标题.回滚显示导航 3.移动端侧边栏,页面部分超过设置的个数 ...
- C-Lodop的https扩展版,火狐下添加例外
LODOP综合版里的c-lodop是标准版,没有https和广域网打印功能,如果使用了标准版,调试JS的时候会提示,,loaded over HTTPS,,,the content must be s ...
- [项目]用C++实现的壳(扩展版)
前几天我写了篇[用C++实现的壳(基础版)]http://blog.csdn.net/cyxvc 完成了一个非常纯洁的C++壳基础框架.现在这个[扩展版]的壳在之前的基础上增加了两个功能,一个是IAT ...
- css中国社科,2019-2020中国CSSCI 来源期刊及扩展版目录正式公布
原标题:2019-2020中国CSSCI 来源期刊及扩展版目录正式公布 2019年3月25日,南京大学中国人文社会科学综合评价研究院发布最新版(2019-2020版)CSSCI 扩展版来源期刊目录,即 ...
- 驱动精灵2014网卡版 v8.0.522.1102 扩展版
驱动精灵2014网卡版 v8.0.522.1102 扩展版 软件大小:109.3MB 软件语言:简体中文 软件性质:常用软件 软件授权:官方版 更新时间:2014-05-23 应用平台:/Win8/W ...
- 驱动精灵2014网卡版 v8.0.515.1101 扩展版
驱动精灵2014网卡版 v8.0.515.1101 扩展版 软件大小:109.3MB 软件语言:简体中文 软件性质:常用软件 软件授权:官方版 更新时间:2014-05-16 应用平台:/Win8/W ...
最新文章
- 迈出编程第一步!必知必会的10个编程技巧及查错方法
- 搜狗发布全球首个手语AI合成主播,用技术造福听障人群
- 不同组织间的邮件收发
- 通过Visual Studio 2005的项目模板来加速开发过程
- js控制Iframe 和 iframe与主页的交互,传值 (转载)
- SmartSVN:File has inconsistent newlines
- linux安装elasticsearch5.5
- JdbcTemplate(概念和准备)
- LVM( Logical Volume Manager )配置案例(on RHEL4)
- java数据结构--最大堆
- VS2013 异常处理
- 如何关闭系统日志服务器,已解决: 一台R410 服务器不定时宕机,系统日志只有“上一次系统是意外关闭” - Dell Community...
- POI技术—用于java开发解析excel的抽象类
- (三)JAVA使用POI操作excel
- OFFICE2003的自动保存功能。
- ssh 远程连接、上传下载命令
- 服务器 python cant open file_QQ炫舞转服系统-QQ炫舞官方网站-腾讯游戏
- npm shrinkwrap的用途
- 如何改善客户体验和用户体验
- Java Http连接中使用代理(Proxy)及其验证(Authentication)