中文-自然语言处理-开源工具-流行度调查+句法依存树可视化调研

为了找到最流行的中文自然语言处理工具，我进行了一番调研.

开源工具包	百度返回网页数
NLTK	4470000
LTP 哈工大	542,000
OpenNLP	249,000
ICTCLAS	919,000
THULAC	360,000
ANTLR	3,280,000
DDParser	1,840,000
Gensim	2,780,000
spaCy	1,400,000
Stanford CoreNLP	597,000
IKAnalyzer	2,430,000
NLPIR	885,000
东北大学NIUParser	5,890
jieba	5,630,000
FudanNLP	216,000
HanLP	1,430,000

下面我们用python代码对上述开源工具进行排序:

import numpy as np
names=["NLTK","LTP 哈工大","OpenNLP","ICTCLAS","THULAC","ANTLR","DDParser","Gensim","spaCy","Stanford CoreNLP","IKAnalyzer","NLPIR","东北大学NIUParser","jieba","FudanNLP","HanLP"]
popular=np.array([4470000,542000,249000,919000,360000,3280000,1840000,2780000,1400000,597000,2430000,885000,5890,5630000,216000,1430000])y=popular.argsort()print("----------------------------输出下标-------------------------------")
print(y)
result=[]
for item in y:result.append(names[item])# 最终结果
result2=""
for index,item in enumerate(result):if index==len(result)-1:result2=result2+" "+itemelse:result2=result2+" "+item+" <"
print("---------------------------百度中开源中文自然语言处理工具流行度结果-------------------------------")
print(result2)

输出结果如下:

-------------------------------------------------------------输出下标-----------------------------------------------------------------
[12 14 2 4 1 9 11 3 8 15 6 10 7 5 0 13]
---------------------------百度中开源中文自然语言处理工具流行度结果------------------------------------------------
东北大学NIUParser < FudanNLP < OpenNLP < THULAC < LTP 哈工大 < Stanford CoreNLP < NLPIR < ICTCLAS < spaCy < HanLP < DDParser < IKAnalyzer < Gensim < ANTLR < NLTK < jieba

可以看到最著名的是jieba和NLTK

------------------------------------------------------------------支持句法依存树可视化的开源工具------------------------------------------------------

开源工具	参考
stanford coreNLP+nltk	[1]
Hanlp	[2]
LTP哈工大	[3]

南京大学那个句法依存树只支持windows所以不在上面列出.

Reference:

[1]利用nltk可视化stanford coreNLP构建的中文句法树

[2]自然语言处理依存树的可视化

[3]NLP（十二）依存句法分析的可视化及图分析

中文-自然语言处理-开源工具-流行度调查+句法依存树可视化调研相关推荐

python可视化开源工具_这5款Python可视化神器，总有一款适合你！
我们都知道视觉是人们很重要的一种感官,而Python中可视化,在数据相关的研发中也起到"一木支危楼 "的作用.如果从直接查看离线存储在各类数据库中杂乱无章的数据,会让人瞬间感到崩溃 ...
基于python的人工智能Jiagu深度学习自然语言处理开源工具
https://www.toutiao.com/a6695987410259411468/ 一.源码下载地址 https://gitee.com/explore 二.开发文档 1.简介 Jiagu以B ...
【自然语言处理】中文开源工具汇总（7种）
本博客主要是对网络上的一些关于中文自然语言处理开源工具的博客进行整理.汇总,如果有涉及到您的知识产品等,请联系本人已进行修改,也欢迎广大读者进行指正以及补充. 本博客将尽量从工具的使用语言.功能等方面 ...
【自然语言处理】英文开源工具汇总（）
本博客主要是对网络上的一些关于英文自然语言处理开源工具的博客进行整理.汇总,如果有涉及到您的知识产权等,请联系本人已进行修改,也欢迎广大读者进行指正以及补充. 本博客将尽量从工具的使用语言.功能等方 ...
python中文命名实体识别工具包_中文命名实体识别工具（NER）比较
既然中文分词.词性标注已经有了,那下一步很自然想到的是命名实体识别(NER,Named-entity recognition)工具了,不过根据我目前了解到的情况,开源的中文命名实体工具并不多,这里主要 ...
面向中文自然语言处理的60余类系统开源实践项目与工业探索索引
项目介绍面向中文自然语言处理的六十余类实践项目及学习索引,涵盖语言资源构建.社会计算.自然语言处理组件.知识图谱.事理图谱.知识抽取.情感分析.深度学习等几个学习主题.包括作者个人简介.学习心得.语 ...
自然语言处理系列十七》中文分词》分词工具实战》Python的Jieba分词
注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书<分布式机器学习实战>(人工智能科学与技术丛书)[陈敬雷编著][清华大学出版社] 文章目录自然语言处理系列十七分词工 ...
自然语言处理（NLP）常用开源工具总结----不定期更新
学习自然语言这一段时间以来接触和听说了好多开源的自然语言处理工具,在这里做一下汇总方便自己以后学习,其中有自己使用过的也有了解不是很多的,对于不甚了解的工具以后学习熟悉了会做更新的. 1.IKAnal ...
飞桨十大中文NLP开源工具详解
PaddleNLP是基于飞桨(PaddlePaddle)开发的工业级中文NLP开源工具与预训练模型集,将自然语言处理领域的多种模型用一套共享骨架代码实现,可大大减少开发者在开发过程中的重复工作.Pad ...

中文-自然语言处理-开源工具-流行度调查+句法依存树可视化调研

中文-自然语言处理-开源工具-流行度调查+句法依存树可视化调研相关推荐

最新文章

热门文章