Jcseg分词器官方版是一款简单且超级好用的轻量级Java分词工具,它可以帮助用户轻松提取关键词和关键词,并为Java的使用提供帮助,该软件还提供了一个基于Jetty的Web服务器,可以满足用户的各种Java编程功能要求并支持自定义同义词库,在lexicon文件夹中,您可以随意添加/删除/更改词库和词库的内容,并对词库进行分类,支持词库的多目录加载,在配置lexicon.path中,使用';'分离多个词库目录,将词库分为简化/传统/简化和传统混合词库:它可以特别适用于简化的简化切分,传统的切分以及简化和传统的混合切分,并且可以使用以下同义词Jcseg实现了简体和繁体的相互检索,还提供了两个简单的同义词库管理工具,可以在简体中文和繁体中文之间进行转换并合并同义词库。

软件特色

中英文同义词加法/同义词匹配+汉语拼音加法。同义词库将“现代汉语词典”和cc-cedict词典中的条目集成在一起,并根据cc-cedict词典用汉语拼音标记条目,并根据“汉语同义词词典”用同义词标记条目(没完成) 。更改jcseg.properties配置文件可以在分词过程中将拼音和同义词添加到分词结果中。

中文数字和中文分数识别例如:“这里有一百五十人,四十人。”分为“一百五十”和“一百四十”。 Jcseg会自动将其转换为阿拉伯数字,并将其添加到分词结果中。如:150、1 / 40。

支持识别中英文混合词和中英文混合词(保持词典可以识别任何组合)。例如:B超检查,X射线,卡拉OK,七渡KTV,Do啦A梦。

支持类似英语的中文分段,并使用mmseg算法消除歧义,例如:“ openarkcompiler”将分段为:“ open ark编译器”,此功能也可以关闭。

软件功能

中文分词:mmseg算法 + Jcseg 独创的优化算法,七种切分模式。

关键字提取:基于textRank算法。

关键短语提取:基于textRank算法。

关键句子提取:基于textRank算法。

文章自动摘要:基于BM25+textRank算法。

自动词性标注:基于词库+(统计歧义去除计划),目前效果不是很理想,对词性标注结果要求较高的应用不建议使用。

命名实体标注:基于词库+(统计歧义去除计划),电子邮件,网址,大陆手机号码,地名,人名,货币,datetime时间,长度,面积,距离单位等。

Restful api:嵌入jetty提供了一个绝对高性能的server模块,包含全部功能的http接口,标准化json输出格式,方便各种语言客户端直接调用。

java jcseg 官网_Jcseg轻量级Java中文分词器2.6.5最新版相关推荐

  1. 关公战秦琼手游java,一战成名官网下载-一战成名手游下载v1.1.5 安卓最新版-2265手游网...

    一战成名安卓最新版是一款独具穿越特色的全新国风战争策略手游.三国?大唐?还在穿越这些朝代?那可就过时了,这一次是唐宋元明清的集体打穿越,首款将各个不同时空的国家与武将完美结合的国战手游震撼登场,超过上 ...

  2. Jcseg是基于mmseg算法的一个轻量级Java中文分词器

    Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同 ...

  3. 中文分词器 jcseg 和 IK Analyzer

    为什么要使用lucene中文分词器 在 lucene 的开发过程中,常常会遇到分词时中文识别的问题,lucene提供了 lucene-analyzers-common-5.0.0.jar包来支持分词, ...

  4. minecraft java版皮肤查看_我的世界官网针对Minecraft Java版玩家皮肤的更新

    我的世界官网针对Minecraft Java版玩家皮肤的更新!你可能昨天已经在其他网站了解到了一些和下载Minecraft Java版皮肤有关的新闻,这些新闻指出,一个Minecraft Java版皮 ...

  5. Java开发官网地址大全

    1.Java开发官网 Mybatis Mybatis中文网 https://mybatis.net.cn/ mybatis pagehelper 分页插件 MyBatis 分页插件 PageHelpe ...

  6. 11大Java开源中文分词器的使用方法和分词效果对比,当前几个主要的Lucene中文分词器的比较...

    本文的目标有两个: 1.学会使用11大Java开源中文分词器 2.对比分析11大Java开源中文分词器的分词效果 本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码,至于效果哪个好,那 ...

  7. 11大Java开源中文分词器的使用方法和分词效果对比

    2019独角兽企业重金招聘Python工程师标准>>> 本文的目标有两个: 1.学会使用11大Java开源中文分词器 2.对比分析11大Java开源中文分词器的分词效果 本文给出了1 ...

  8. Java 开源中文分词器Ansj 学习教程

    Java有11大开源中文分词器,分别是word分词器,Ansj分词器,Stanford分词器,FudanNLP分词器,Jieba分词器,Jcseg分词器,MMSeg4j分词器,IKAnalyzer分词 ...

  9. Java开源的11个中文分词器使用方法和分词效果对比

    本文的目标有两个: 1.学会使用11大Java开源中文分词器 2.对比分析11大Java开源中文分词器的分词效果 本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码,至于效果哪个好,那 ...

最新文章

  1. python yield 和 return 对比分析
  2. Java实体类对象修改日志记录
  3. 选择UPS电源的四大要素
  4. 7-2 数组循环左移(20分)(顺序表实现)
  5. Android启动initlogo.rle制作
  6. strstr和strcchr查找字符串和区别
  7. 前端学习(3064):vue+element今日头条管理-状态处理
  8. CSS 单词间距 word-spacing属性
  9. 计算机二级等级考试模拟试题,2016年计算机二级考试office模拟试题
  10. RTOS ---嵌入式操作系统之时钟节拍下的任务切换
  11. Openstack命令
  12. 搜索二维矩阵II(分治法和蛇行)
  13. 互联网时代 手机商务应用为王
  14. 一文了解参数检验和非参数检验
  15. 2019年美赛E题翻译与思路详解
  16. HihoCoder 1838 贪心
  17. 武科大计算机科学与技术教务处,欢迎访问武汉理工大学计算机科学与技术学院...
  18. ETF大小盘轮动策略回测分析
  19. 有备无患——数据中心基础设施备品备件管理
  20. 实现163邮箱发送邮件功能

热门文章

  1. 是学Java好呢?还是学C++更有前途?
  2. 年过35岁的程序员都去哪儿了?
  3. matlab的图例latex,在图例的图例和标签中使用LaTeX?
  4. 算法之Sunday算法
  5. odoo的api接口
  6. Windows和Linux系统下的共享文件夹配置
  7. 读写EEE、FLASH关键点<1>(MC9S12XEP100RMV1)
  8. 【开源了】撸了一个电子文件签字+合同系统,爽!
  9. 萝卜魂军曹机器人_《萝卜魂》作品详介第6弹:《闪亮的塔科特》
  10. 银行柜面系统_无纸化办公!就是这么给力!! 临猗农商银行新一代柜面系统成功上线!!!...