一、前言

《同义词词林》是梅家驹等人于1983年编纂而成,年代较为久远,对于目前的使用不太适合,哈工大实验室基于该词林进行扩展,完成了词林扩展版。
下载地址:https://www.ltp-cloud.com/download/

二、使用说明

扩展版同义词词林分为5层结构,

随着级别的递增,词义刻画越来越细,到了第五层,每个分类里词语数量已经不大,很多只有一个词语,已经不可再分,可以称为原子词群、原子类或原子节点。不同级别的分类结果可以为自然语言处理提供不同的服务,例如第四层的分类和第五层的分类在信息检索、文本分类、自动问答等研究领域得到应用。有研究证明,对词义进行有效扩展,或者对关键词做同义词替换可以明显改善信息检索、文本分类和自动问答系统的性能。

下载后的词典文件如下所示:

Aa01A01= 人 士 人物 人士 人氏 人选
Aa01A02= 人类 生人 全人类
Aa01A03= 人手 人员 人口 人丁 口 食指
Aa01A04= 劳力 劳动力 工作者
Aa01A05= 匹夫 个人

上述文件编码代表含义见图:

表中的编码位是按照从左到右的顺序排列。第八位的标记有3 种,分别是“=”、“#”、“@”, “=”代表“相等”、“同义”。末尾的“#”代表“不等”、“同类”,属于相关词语。末尾的“@”代表“自我封闭”、“独立”,它在词典中既没有同义词,也没有相关词。

三、其他

1、上文引用均来自哈工大扩展词林说明文档
2、一个获取同义词的python库:https://github.com/huyingxi/Synonyms

同义替换:哈工大同义词词林扩展版相关推荐

  1. 同义词词林 java_基于同义词词林扩展版的词语相似度计算

    词语相似度计算 词义相似度计算在很多领域中都有广泛的应用,例如信息检索.信息抽取.文本分类.词义排歧.基于实例的机器翻译等等.国内目前主要是使用知网和同义词词林来进行词语的相似度计算. 本文主要是根据 ...

  2. solr之使用IKAnalyzer配置同义词,停止词,扩展词。

    环境如下: solr4.7 IKAnalyzer2012FF_u1 配置同义词 第一步 将IKAnalyzer2012FF_u1放到solr-4.7.2/example/solr-webapp/web ...

  3. 基于信息内容的词林词语相似度计算 - 论文及代码讲解

    文章目录 论文 同义词林简介 特点 代码 获取词的编码 求IC值 求相似度 选取相似度最大值 论文:<基于信息内容的词林词语相似度计算 >-2018-彭琦,朱新华等 查看 代码:https ...

  4. 寻找一种易于理解的一致性算法(扩展版)

    最新内容最先更新在主站深入浅出区块链社区 原文链接:寻找一种易于理解的一致性算法(扩展版) 摘要 Raft 是一种为了管理复制日志的一致性算法.它提供了和 Paxos 算法相同的功能和性能,但是它的算 ...

  5. Joe一款个人博客typecho主题(扩展版)

    介绍: 1.原版有的都有,扩版是增加或微调,依然原滋原味的. 2.导航部分,首页向下滚动隐藏.回滚显示导航:文章详情页向下滚动隐藏并显示文章标题.回滚显示导航 3.移动端侧边栏,页面部分超过设置的个数 ...

  6. C-Lodop的https扩展版,火狐下添加例外

    LODOP综合版里的c-lodop是标准版,没有https和广域网打印功能,如果使用了标准版,调试JS的时候会提示,,loaded over HTTPS,,,the content must be s ...

  7. [项目]用C++实现的壳(扩展版)

    前几天我写了篇[用C++实现的壳(基础版)]http://blog.csdn.net/cyxvc 完成了一个非常纯洁的C++壳基础框架.现在这个[扩展版]的壳在之前的基础上增加了两个功能,一个是IAT ...

  8. css中国社科,2019-2020中国CSSCI 来源期刊及扩展版目录正式公布

    原标题:2019-2020中国CSSCI 来源期刊及扩展版目录正式公布 2019年3月25日,南京大学中国人文社会科学综合评价研究院发布最新版(2019-2020版)CSSCI 扩展版来源期刊目录,即 ...

  9. 驱动精灵2014网卡版 v8.0.522.1102 扩展版

    驱动精灵2014网卡版 v8.0.522.1102 扩展版 软件大小:109.3MB 软件语言:简体中文 软件性质:常用软件 软件授权:官方版 更新时间:2014-05-23 应用平台:/Win8/W ...

  10. 驱动精灵2014网卡版 v8.0.515.1101 扩展版

    驱动精灵2014网卡版 v8.0.515.1101 扩展版 软件大小:109.3MB 软件语言:简体中文 软件性质:常用软件 软件授权:官方版 更新时间:2014-05-16 应用平台:/Win8/W ...

最新文章

  1. 迈出编程第一步!必知必会的10个编程技巧及查错方法
  2. 搜狗发布全球首个手语AI合成主播,用技术造福听障人群
  3. 不同组织间的邮件收发
  4. 通过Visual Studio 2005的项目模板来加速开发过程
  5. js控制Iframe 和 iframe与主页的交互,传值 (转载)
  6. SmartSVN:File has inconsistent newlines
  7. linux安装elasticsearch5.5
  8. JdbcTemplate(概念和准备)
  9. LVM( Logical Volume Manager )配置案例(on RHEL4)
  10. java数据结构--最大堆
  11. VS2013 异常处理
  12. 如何关闭系统日志服务器,已解决: 一台R410 服务器不定时宕机,系统日志只有“上一次系统是意外关闭” - Dell Community...
  13. POI技术—用于java开发解析excel的抽象类
  14. (三)JAVA使用POI操作excel
  15. OFFICE2003的自动保存功能。
  16. ssh 远程连接、上传下载命令
  17. 服务器 python cant open file_QQ炫舞转服系统-QQ炫舞官方网站-腾讯游戏
  18. npm shrinkwrap的用途
  19. 如何改善客户体验和用户体验
  20. Java Http连接中使用代理(Proxy)及其验证(Authentication)

热门文章

  1. swagger 修改dto注解_Swagger注解及参数细节的正确书写。
  2. 贝叶斯(Bayes)决策理论
  3. Fiji-imageJ 无法打开
  4. PIC单片机应用开发实践教程(一):MPLAB X IDE 开发环境安装
  5. 步进电机基础(5.9)-步进电机的驱动与控制-三相步进电机的驱动电路
  6. 基于FPGA的CameraLink视频开发案例
  7. 【音频处理】之 Matlab 实现信号的时域和频域的滤波
  8. 推荐个汇编语言编译器 XP系统
  9. SketchUp 更新插件,不用重启让更新生效
  10. 线性规划中的灵敏度分析