.NET中文分词实现http://http://

使用

Lucene.Net.dll http://www.apache.org/dist/incubator/lucene.net/binaries/2.9.4g-incubating/

PanGu.dll http://pangusegment.codeplex.com/releases/view/50811

PanGu.Lucene.Analyzer.dll

和字典文件 http://pangusegment.codeplex.com/releases/view/31531

示例代码:

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

using Lucene.Net.Analysis;

using Lucene.Net.Analysis.PanGu;

using System.IO;

using System.Collections;

namespace FcCApp {

class Program {

static void Main(string[] args){

String text = "基于java语言开发的轻量级的中文分词工具包";

Analyzer anal = new PanGuAnalyzer();//使用盘古分词

StringReader sb = new StringReader(text);

TokenStream ts= anal.ReusableTokenStream("", sb);

Token t = null;

while ((t=ts.Next())!=null){

Console.Write(t.TermText()+"|");

}

}

}

}

结果:

基于|java|语言|开发|的|轻量级|的|中文|分词|工具包|

示例下载地址:

http://download.csdn.net/detail/lijun7788/4412762

java盘古分词_.NET使用Lucene.Net和盘古分词类库实现中文分词相关推荐

  1. lucene的建立索引,搜索,中文分词

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包. 现在最新的lucene已经更新到6.0版本了.但是这个最新版,需要适配jdk1.80以 ...

  2. 实体对齐 算法_中英命名实体识别及对齐中的中文分词优化 论文笔记

    1.计算命名实体词汇对齐的置信度:对一个中英双语句对,中文在初始分词的基础上进行命名实体识别. 2.分词工具:采用中科院分词工具ICTCLAS.Stanford分词工具对中文句子进行分词,其中Stan ...

  3. 中文分词最佳记录刷新了,两大模型分别解决中文分词及词性标注问题丨已开源...

    伊瓢 发自 中关村 量子位 报道 | 公众号 QbitAI 中文分词的最佳效果又被刷新了. 在今年的ACL 2020上,来自创新工场大湾区人工智能研究院的两篇论文中的模型,刷新了这一领域的成绩. WM ...

  4. Java位语句_卫语句 - 宿小帅的个人空间 - OSCHINA - 中文开源技术交流社区

    1.使用卫语句取代嵌套表达式 函数中的条件逻辑使人难以看清正常的执行途径.使用卫语句表现所有特殊情况. 动机:条件表达式通常有2种表现形式.第一:所有分支都属于正常行为.第二:条件表达式提供的答案中只 ...

  5. java树莓派温度传感器_树莓派传感器篇 - 枫TI的个人空间 - OSCHINA - 中文开源技术交流社区...

    玩树莓派其中方向之一:控制各种传感器.先搞明白各种传感器的参数及使用方式.树莓派GPIO各个引脚的用处及含义,这里要着重说明一点的是:千万不要把3.3V以上的电压链接到树莓派的引脚上,千万不要把3.3 ...

  6. SpringCloud学习笔记024---SpringBoot集成Lucene实现全文检索_分词_索引_更新_删除文档_词条搜索_多条件查询

    JAVA技术交流QQ群:170933152 先看代码实现,下面有lucene介绍: 测试用例 Github 代码 代码我已放到 Github ,导入spring-boot-lucene-demo 项目 ...

  7. Lucene全文检索_分词_复杂搜索_中文分词器

    1 Lucene简介 Lucene是apache下的一个开源的全文检索引擎工具包. 1.1 全文检索(Full-text Search)  1.1.1 定义 全文检索就是先分词创建索引,再执行搜索的过 ...

  8. Java分布式中文分词组件 - word分词

    Java分布式中文分词组件 - word分词 word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义.能准确识别英文.数字,以及日期.时间等 ...

  9. Java分布式中文分词组件 - word分词(转自:https://github.com/ysc/word)

    ###Java分布式中文分词组件 - word分词 ####word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义.能准确识别英文.数字,以 ...

最新文章

  1. linux透明加密系统,基于Linux的透明加密系统的设计与实现
  2. ubuntu远程windows桌面
  3. 【深度学习】90.94%准确率!谷歌刷新ImageNet新纪录!Model soups:提高模型的准确性和稳健性...
  4. 游戏引擎开发和物理引擎_视频游戏开发的最佳游戏引擎
  5. 基于《悉尼协议》框架下Java课程案例教学研究
  6. 在Recyclerview使用GlideAPP加载大量图片导致内存溢出(oom)
  7. 33643分!曼巴精神永不熄,数据回顾科比20年职业生涯辉煌
  8. Ubuntu下Android NDK环境搭建笔记
  9. (C语言)用C语言编写小游戏——三子棋
  10. html中固定浏览器最小化,浏览器自动最小化怎么解决,如何解决浏览器自动最小化...
  11. java网上书店模板_网上书店静态网站模板
  12. webservice规范及webservice框架
  13. 如何下载无水印的抖音视频?
  14. ThinkPad E450 10.11 驱动HD4400的注意即解决方法
  15. HP笔记本电脑如何设置屏幕亮度
  16. mysql锘縖_根据中文字符串查询拼音声母
  17. cmd修改计算机睡眠、休眠时间,批量命令
  18. 2008英语四6级CET6资料大学六级单词
  19. 菜鸟教程css事件,【推荐】DIV+CSS入门菜鸟教程
  20. 干货|如何写好项目进度报告

热门文章

  1. BilSTM 实体识别_NLP入门实体命名识别(NER)+BilstmCRF模型原理Pytorch代码详解——最全攻略...
  2. window.print()实现分页打印
  3. Crack:Aspose.Slides for .NET 22.12.x
  4. 关于IntelliJ IDEA 安装后遇到的各种问题
  5. 分享一下微信域名防封方案
  6. 【计算机网络】频带和频段(图解易懂)
  7. 闭包:让外部函数能访问函数内的变量,让局部变量长期贮存在内存中
  8. design pattern Builder 建造者设计模式
  9. 专接本 微机原理简答题 更新
  10. hdu6608 Fansblog(威尔逊定理)