本人使用的是maven导入portable版的hanlp

<!-- hanlp --><dependency><groupId>com.hankcs</groupId><artifactId>hanlp</artifactId><version>portable-1.7.5</version></dependency>

里面只含有少量数据,对于一些高级功能(CRF分词、句法分析等),则需要下载额外的数据包,并通过配置文件将数据包的位置告诉Hanlp。

安装过pyhanlp

如果你是安装过pyhanlp 的话,则数据包和配置文件已经安装就绪,可以通过hanlp -v命令查看hanlp.properties文件的位置,hanlp.properties是我们所需的配置文件,我们只需要讲它复制到项目的资源目录 src/main/resources即可(如果没有该目录,手动创建一个即可)

创建resources目录

手动创建resources的步骤:

步骤1:原项目结构图

步骤2:项目右键properties,然后如下一直操作

步骤3:勾选

步骤4:可以看见新建了resources目录

步骤5:最终项目结构图

此时Hanlp就会从/usr/local/lib/python3.6/site-packages/pyhanlp/static记载data,也就是说与pyhanlp公用用一套数据包。

没有安装过pyhanlp

如果使用maven直接配置Hanlp的话,没找到可以使用自定义词典的方法,所以导入hanlp-1.7.2.jar包进行配置。

1.下载jar、data、hanlp.properties。下载地址为https://github.com/hankcs/HanLP,下载后解压缩到一个目录中,比如D:/hanlp

2.在hanlp.properties中修改root地址,为data包的上一级目录。

3.将hanlp.properties放到项目的resources目录中即可。

4.在\data\dictionary\custom文件夹中创建自己的词典,txt格式,utf8编码,形式为词条-空格-词性。(也可以直接在CustomDictionary.txt中添加未登陆词)

5.第一次使用自定义词典前将缓存文件CustomDictionary.txt.bin删除,否则自定义词典不会生效。

6.在hanlp.properties中修改自定义词典路径,将自己的词典加入。
将hanlp.properties的第一行root设为data文件夹的父目录:

root=D:/hanlp

下面第一个词条是手动添加的未登陆词

下面是测试结果

在未加入该登陆词前结果是

[江/ns, 州市/n, 长江大桥/nz, 参加/v, 了/ul, 长江大桥/nz, 的/uj, 通车/v, 仪式/n]

Hanlp添加未登陆词相关推荐

  1. 一种快速的未登陆词识别方法(原理和实现)

    一种快速的未登陆词识别方法(原理和实现) 一种快速的未登陆词识别方法(原理和实现)         最近网络上关于中文分词的算法已经很多了,在实际应用中每个人根据对中文分词的不同理解写了不同的中文分词 ...

  2. 未登陆词/停用词建立和使用

    refer:https://wenku.baidu.com/view/0029a79a376baf1ffd4fad8d.html https://wenku.baidu.com/view/0029a7 ...

  3. postman上传图片时已经添加cookie,但仍显示未登陆

    postman上传图片时,已经添加过cookie,但是返回的结果是用户未登陆,如下图所示: 我的解决办法是:清楚cookie code中的cookie 最终的结果如下:成功 转载于:https://w ...

  4. linux无显卡运行程序,Ubuntu中在应用程序菜单添加未显示的应用程序启动器

    在Ubuntu应用程序菜单添加未显示的应用程序启动器: (1)在这个目录下挑一个喜欢的图标 /usr/share/icons/hicolor/48×48/apps/ 或自己准备一个png图标复制到该目 ...

  5. 盘古分词-关键字搜索没有结果(关键字由未收录词组成)

    由未收录词A.B.C等组成的任意组合在搜索时没有结果的问题. 解决方案很简单在设置中UnknownWordIdentify选项置为False就可以了. 下面是Pangu代码中处理段: if (coun ...

  6. 新安装和已安装nginx如何添加未编译安装模块/补丁

    新安装和已安装nginx如何添加未编译安装模块/补丁 --http://www.apelearn.com/bbs/forum.php?mod=viewthread&tid=10485& ...

  7. mysql添加远程登陆权限及mysql远程连接命令

    mysql添加远程登陆权限及mysql远程连接命令 1.mysql使用本身环境下面mysql数据库中的user表来管理用户及权限 mysql> use mysql;Database change ...

  8. Eclipse用法和技巧十六:自动添加未实现方法2

    前面一篇文章里面介绍了一种常见的自动添加未实现函数的方法.这里在顺便补充几个方法.第一个方法,看上去有点怪怪的: 步骤一:Source > Clean Up: 步骤二:选择custom prof ...

  9. Eclipse用法和技巧十五:自动添加未实现方法1

    java代码中经常要实现一些接口,这个也是java代码独有的地方.实现接口,就意味着要实现这个接口中定义的方法,如果一个个去码出方法就需要记得方法名称等等,就算有内容辅助快捷键帮助,也是很麻烦的.这里 ...

  10. Android 桌面图标添加未读消息角标APP角标最佳实践

    Android 桌面图标添加未读消息角标APP角标最佳实践 本项目的完整演示代码 https://github.com/benchegnzhou/AndroidDevelomentArtDemo 最近 ...

最新文章

  1. usaco The Castle
  2. JQuery Attributes 方法说明
  3. [云炬商业计划书阅读分享] 珠江啤酒公司企业文化调查
  4. IDA Pro动态调试Android so文件
  5. 本科、硕士、博士,究竟有何区别?
  6. acdream 1023 xor按位思考
  7. 问题四十:对ray tracing圆环图形进行debug(2)——C++,用“笛卡尔”方法解一元四次方程
  8. 格式化一个文件的大小(size),或者说是格式化一个app的大小(size)
  9. HDU 5879 Cure -2016 ICPC 青岛赛区网络赛
  10. [转载] 像 IDE 一样使用 vim
  11. Bootloader解锁加锁 Android刷机
  12. erstudio连接mysql_ERStudio下载|数据库建模工具(ER/Studio Data Architect)下载 v17.0.2 官方32/64位版 - 比克尔下载...
  13. 14.Excel vba开发-随机点名
  14. 保姆级透明背景动画导出 —— json格式(Mac系统)
  15. 物联网的未来是什么样的
  16. python查两个微博共同粉丝_Python:获取新浪微博用户的收听列表和粉丝列表
  17. html给页面加背景特效怎么加,给网页加上js特效
  18. 测试人员进阶之路:成为测试专家或测试管理都需要知道什么
  19. ssd1963初始化程序
  20. 物联网学习之旅:微信小程序控制STM32(三)--STM32代码编写

热门文章

  1. 中国分省市地图导航-SVG格式(基于Raphaël)
  2. 开启Spark history server
  3. 20172315 2017-2018-2 《程序设计与数据结构》实验三报告
  4. IDEA的Database表的基本操作
  5. Oracle中的rownum不能使用大于的问题
  6. Cogs 2221. [SDOI2016 Round1] 数字配对(二分图)
  7. 作用域public,private,protected,以及不写时的区别
  8. {面试题4: 替换空格}
  9. SSH整合所需的jar包
  10. 利用模态DIV结合UpdateProgress防止页面重复提交