本篇讲述FNLP自然语言处理库和jieba中文分词库的安装与使用,FNLP自然语言处理库适合Java开发者学习中文分词处理,jieba中文分词库适合Python开发者学习中文分词处理。通过本篇的学习,可以掌握如下内容。

● FNLP分词库的安装与使用

● jieba分词库的安装与使用

注意:

本篇如无特殊说明,所涉软件均在Windows操作系统下操作。

Java和Python均使用eclipse集成开发工具。

1、FNLP分词库的安装与使用

FNLP是由复旦大学开发的一个基于机器学习的中文自然语言处理开发工具包,也包含为实现这些任务的机器学习算法和数据集,中文分词功能是FNLP库的核心功能之一。

FNLP分词库的安装

(1)FNLP库在github托管源代码,通过github下载整个项目代码压缩包。下载地址:

github.com/FudanNLP/fnlp

(2)从github下载3个模型文件,分别是seg.m(分词模型)、pos.m(词性标注模型)、dep.m(依存句法分析模型),将下载的这3个模型文件复制到fnlp项目models目录下。模型文件下载地址:

github.com/FudanNLP/fnlp/releases

(3)由于从github下载的是FNLP的源代码,需要通过Maven构建项目。下载Maven并安装,Maven下载地址:

maven.apache.org/download.cgi

在下载列表中,选择Binary zip archive类别的ZIP压缩包下载。

① 将下载的zip压缩包解压至任意目录(目录名称不要包含中文)。

② 添加bin目录的路径到Path系统环境变量。

③ 验证是否配置成功,在Windows命令行窗口输入mvn -v命令,显示信息如下图所示。

jieba 同义词_中文分词库FNLP与jieba的安装与使用相关推荐

  1. Python:中文分词库jieba安装使用

    hello,大家好,我是wangzirui32,今天我们来学习jieba中文分词库如何安装使用. 开始学习吧! 1. pip安装 命令: pip install jieba 没有报错即为安装成功. 2 ...

  2. 与自定义词典 分词_使用jieba库进行中文分词、关键词提取、添加自定义的词典进行分词...

    jieba库在中文分词中很常用,做一个简单的介绍和运用~ 需求1:打开本地的十九大报告文本,并采用jieba分词器进行分词,最后将分词结果存入名为segresult的文本文件中. 注释:①jieba库 ...

  3. Python中文分词库——jieba的用法

    1.介绍 jieba是优秀的中文分词第三方库.由于中文文本之间每个汉字都是连续书写的,我们需要通过特定的手段来获得其中的每个单词,这种手段就叫分词.而jieba是Python计算生态中非常优秀的中文分 ...

  4. jieba中文分词库的使用

    文章目录 "结巴"中文分词:Python 中文分词组件 四种分词模式: 算法 主要功能 代码示例 Paddle模式 全模式和精确模式: 通过Viterbi算法新词识别 搜索引擎模式 ...

  5. pythonjieba分词_$好玩的分词——python jieba分词模块的基本用法

    jieba(结巴)是一个强大的分词库,完美支持中文分词,本文对其基本用法做一个简要总结. 安装jieba pip install jieba 简单用法 结巴分词分为三种模式:精确模式(默认).全模式和 ...

  6. jieba,为中文分词而生的Python库

    jieba,为中文分词而生的Python库 中文分词,通俗来说,就是将一句(段)话按一定的规则(算法)拆分成词语.成语.单个文字. 中文分词是很多应用技术的前置技术,如搜索引擎.机器翻译.词性标注.相 ...

  7. python文本分析的开源工具_共有11款Python 中文分词库开源软件

    "哑哈"中文分词,更快或更准确,由你来定义.通过简单定制,让分词模块更适用于你的需求. "Yaha" You can custom your Chinese W ...

  8. NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码

    NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之情感分析:基于python编程(jieba库)实现中文文本情 ...

  9. 【NLP】jieba分词-Python中文分词领域的佼佼者

    1. jieba的江湖地位 NLP(自然语言)领域现在可谓是群雄纷争,各种开源组件层出不穷,其中一支不可忽视的力量便是jieba分词,号称要做最好的 Python 中文分词组件. "最好的& ...

最新文章

  1. SLAM的开源以及在移动端AR的适用分析
  2. Mono for Andriod学习与实践(1)— 初体验
  3. python如何输出多个星号_如何将 Python 的一个类方法变为多个方法?
  4. JSON特殊字符处理
  5. 《大数据》第一届编委会顾问委员会议圆满召开
  6. 最暖数据: 除夕有6.88亿人用微信红包传递狗年祝福
  7. nib、xib与故事板的关系
  8. 在IDEA创建JavaWeb项目
  9. 从零开始入门芯片行业
  10. unity替换鼠标图标
  11. xp计算机字体在哪,Windows XP系统字体库在哪-如何安装新字体
  12. 拆弹专家【爆改车间主任】学习笔记(2)小结
  13. python 冒泡排序 交换次数_(Python)交换排序(气泡排序、快速排序),冒泡排序...
  14. 【FPGA学习笔记】SignalTap II软件的使用
  15. 《计算机操作系统》(第四版)汤子瀛等编著——思维导图详细版本
  16. 动词ing基本用法_(完整版)英语动词ing的用法
  17. Codeforces Round #514 (Div. 2)-D. Nature Reserve
  18. React进阶 - React脚手架
  19. xxljob 配置文件_XXL-JOB的基本用法
  20. python之re模块,内存管理

热门文章

  1. Color Font - 使用颜色和字体
  2. 基于区块链的数据共享访问控制模型
  3. 知识图谱 | (2)知识图谱技术综述(上)
  4. win10python详细配置_Win10系统配置Python3.6+OpenGL环境详细步骤
  5. Wireshark抓包——TCP协议分析
  6. MATLAB——Simulink如何将模块进行封装
  7. RISC-V BOOM核学习
  8. 报错:pymysql.err.IntegrityError: (1062, “Duplicate entry ‘1‘ for key ‘mm.PRIMARY‘“)
  9. Anaconda启动一直停留在loading applications解决方法
  10. mysql 创建唯一约束表