本文是csu_zipple 分享的关于使用hanlp汉语言处理包提取关键词的过程一个简单的记录分享。想要使用hanlp提取文本关键词的新手朋友们可以参考学习一下!

如何在一段文本之中提取出相应的关键词呢? 之前有想过用机器学习的方法来进行词法分析,但是在项目中测试时正确率不够。于是这时候便有了 HanLP-汉语言处理包 来进行提取关键词的想法。

下载:.jar .properties data等文件

请到大快搜索官网下载 HanLP新版本,1.7.1数据包下载【gitub上也可以下载】

在intellij中配置环境,并运行第一个demo

在项目中配置jar包,添加依赖。

file->Project Structure->Modules->Dependencies->+Jars

将properties文件转移到src根目录下,修改root为自己的数据集路径

运行第一个demo

1 public class TestHanLP {

2    public static void main(String[] args) {

3        System.out.println(HanLP.segment("你好,欢迎使用HanLP!"));

4    }

5 }

可能的错误

字符类型对应表加载失败:D:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes

解决办法:查看错误提示页面下是否有该文件,如果没有则去网上下载一个。像我这里,由于只是使用其一部分功能,为了方便就不再下载了,这里我直接修改了一个文件的文件名—–成功运行!。

成功运行

---------------------

作者:csu_zipple

转载于:https://blog.51cto.com/13636660/2356483

hanlp提取文本关键词的使用方法记录相关推荐

  1. NLP:基于nltk和jieba库对文本实现提取文本摘要(两种方法实现:top_n_summary和mean_scored_summary)

    NLP:基于nltk和jieba库对文本实现提取文本摘要(两种方法实现:top_n_summary和mean_scored_summary) 目录 输出结果 设计思路 核心代码 输出结果 1.测试文本 ...

  2. python中文文本分词_SnowNLP:?中文分词?词性标准?提取文本摘要,?提取文本关键词,?转换成拼音?繁体转简体的 处理中文文本的Python3 类库...

    SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和Te ...

  3. NLP:基于snownlp库对文本实现提取文本关键词和文本摘要

    NLP:基于snownlp库对文本实现提取文本关键词和文本摘要 目录 输出结果 1.测试文本 设计思路 核心代码 输出结果 1.测试文本 今天一大早,两位男子在故宫抽烟对镜头炫耀的视频在网络上传播,引 ...

  4. NLP:基于textrank4zh库对文本实现提取文本关键词、文本关键短语和文本摘要

    NLP:基于textrank4zh库对文本实现提取文本关键词.文本关键短语和文本摘要 目录 输出结果 设计思路 核心代码 输出结果 关键词: 故宫 0.030737773083470445 镜头 0. ...

  5. python自动翻译pdf_python实现从pdf文件中提取文本,并自动翻译的方法

    针对Python 3.5.2 测试 首先安装两个包: $ pip install googletrans $ pip install pdfminer3k googletrans会提供一个命令tran ...

  6. python用来自动修改pdf_python实现从pdf文件中提取文本,并自动翻译的方法

    针对Python 3.5.2 测试 首先安装两个包: $ pip install googletrans $ pip install pdfminer3k googletrans会提供一个命令tran ...

  7. TF-IDF 提取文本关键词

    这篇博客主要是为了总结一下学习TF-IDF提取关键词的方法,同时整合一下代码. 目的:使用jieba分词器提取文本中的主题 import jieba #分词器 import jieba.analyse ...

  8. python文本关键词提取_python提取文本关键词

    python提取关键词textrank算法,将数据库中的数据提取出来,然后进行分析,代码如下 import pymysql import jieba from textrank4zh import T ...

  9. python提取关键词前后原文_python提取文本关键词

    python提取关键词textrank算法,将数据库中的数据提取出来,然后进行分析,代码如下 import pymysql import jieba from textrank4zh import T ...

最新文章

  1. Mathematics for Computer Graphics
  2. 反应器(Reactor):用于事件多路分离和分派的体系结构模式
  3. Kotlin入门(12)类的概貌与构造
  4. [Python] L1-056 猜数字-PAT团体程序设计天梯赛GPLT
  5. html5 过渡时间,CSS3 对过渡(transition)进行调速以及延时
  6. 天大 ACM 1090. City hall
  7. DEM高程数据的获取和应用(全国DEM数据可直接下载)
  8. 基于php的校园垃圾分类网站的设计与实现
  9. 【自动驾驶】KITTI Road Detection Benchmark Devkit_road使用
  10. 工具 | 超实用工具listary和snipaste
  11. Pdfjs-dist 填坑日记
  12. 故障:ID29 的 KDC 警告日志
  13. 安利!王一博与海飞丝的清爽秘籍
  14. 酒浓码浓 - ios进入页面自动弹出键盘
  15. 笔记本无线和有线的MAC地址修改
  16. typescript关键词Parameters和ReturnType
  17. text pad java_Textpad的安装和配置
  18. form表单中onclick事件和onsubmit事件的执行顺序
  19. 嘀嘀和快的上演十月围城 020模式被强化
  20. 王者qq服务器能和微信一起吗,王者荣耀微信和qq能一起玩吗 qq和微信数据互通吗...

热门文章

  1. 基础01类与对象、封装、构造方法
  2. php 修改json数组的值,php – 无法通过str_replace更改JSON数组中的值
  3. excel的mysql语言_Excel的数据库语句
  4. HTML的定义和特点,【HTML】复习笔记(一)初识HTML
  5. 一键 caddy php h5ai_H5ai 在线播放搭建
  6. mysql-8.0.14图文安装_mysql8.0.14安装配置方法图文教程(通用)
  7. python重写和重载的区别_Java 重写(Override)与重载(Overload)
  8. springboot+mybatis+shiro+beetl前端做 服务监控页面
  9. @scheduled注解配置时间_「玩转SpringBoot」用好条件相关注解,开启自动配置之门...
  10. rdd与mysql表 join_Spark 之RDD