中文-自然语言处理-开源工具-流行度调查+句法依存树可视化调研
为了找到最流行的中文自然语言处理工具,我进行了一番调研.
开源工具包 | 百度返回网页数 |
NLTK | 4470000 |
LTP 哈工大 | 542,000 |
OpenNLP | 249,000 |
ICTCLAS | 919,000 |
THULAC | 360,000 |
ANTLR | 3,280,000 |
DDParser | 1,840,000 |
Gensim | 2,780,000 |
spaCy | 1,400,000 |
Stanford CoreNLP | 597,000 |
IKAnalyzer | 2,430,000 |
NLPIR | 885,000 |
东北大学NIUParser | 5,890 |
jieba | 5,630,000 |
FudanNLP | 216,000 |
HanLP |
1,430,000 |
下面我们用python代码对上述开源工具进行排序:
import numpy as np
names=["NLTK","LTP 哈工大","OpenNLP","ICTCLAS","THULAC","ANTLR","DDParser","Gensim","spaCy","Stanford CoreNLP","IKAnalyzer","NLPIR","东北大学NIUParser","jieba","FudanNLP","HanLP"]
popular=np.array([4470000,542000,249000,919000,360000,3280000,1840000,2780000,1400000,597000,2430000,885000,5890,5630000,216000,1430000])y=popular.argsort()print("----------------------------输出下标-------------------------------")
print(y)
result=[]
for item in y:result.append(names[item])# 最终结果
result2=""
for index,item in enumerate(result):if index==len(result)-1:result2=result2+" "+itemelse:result2=result2+" "+item+" <"
print("---------------------------百度中开源中文自然语言处理工具流行度结果-------------------------------")
print(result2)
输出结果如下:
-------------------------------------------------------------输出下标-----------------------------------------------------------------
[12 14 2 4 1 9 11 3 8 15 6 10 7 5 0 13]
---------------------------百度中开源中文自然语言处理工具流行度结果------------------------------------------------
东北大学NIUParser < FudanNLP < OpenNLP < THULAC < LTP 哈工大 < Stanford CoreNLP < NLPIR < ICTCLAS < spaCy < HanLP < DDParser < IKAnalyzer < Gensim < ANTLR < NLTK < jieba
可以看到最著名的是jieba和NLTK
------------------------------------------------------------------支持句法依存树可视化的开源工具------------------------------------------------------
开源工具 | 参考 |
stanford coreNLP+nltk | [1] |
Hanlp | [2] |
LTP哈工大 | [3] |
南京大学那个句法依存树只支持windows所以不在上面列出.
Reference:
[1]利用nltk可视化stanford coreNLP构建的中文句法树
[2]自然语言处理 依存树的可视化
[3]NLP(十二)依存句法分析的可视化及图分析
中文-自然语言处理-开源工具-流行度调查+句法依存树可视化调研相关推荐
- python可视化开源工具_这5款Python可视化神器,总有一款适合你!
我们都知道视觉是人们很重要的一种感官,而Python中可视化,在数据相关的研发中也起到"一木支危楼 "的作用.如果从直接查看离线存储在各类数据库中杂乱无章的数据,会让人瞬间感到崩溃 ...
- 基于python的人工智能Jiagu深度学习自然语言处理开源工具
https://www.toutiao.com/a6695987410259411468/ 一.源码下载地址 https://gitee.com/explore 二.开发文档 1.简介 Jiagu以B ...
- 【自然语言处理】中文开源工具汇总(7种)
本博客主要是对网络上的一些关于中文自然语言处理开源工具的博客进行整理.汇总,如果有涉及到您的知识产品等,请联系本人已进行修改,也欢迎广大读者进行指正以及补充. 本博客将尽量从工具的使用语言.功能等方面 ...
- 【自然语言处理】英文开源工具汇总()
本博客主要是对网络上的一些关于 英文自然语言处理开源工具的博客进行整理.汇总,如果有涉及到您的知识产权等,请联系本人已进行修改,也欢迎广大读者进行指正以及补充. 本博客将尽量从工具的使用语言.功能等方 ...
- python中文命名实体识别工具包_中文命名实体识别工具(NER)比较
既然中文分词.词性标注已经有了,那下一步很自然想到的是命名实体识别(NER,Named-entity recognition)工具了,不过根据我目前了解到的情况,开源的中文命名实体工具并不多,这里主要 ...
- 面向中文自然语言处理的60余类系统开源实践项目与工业探索索引
项目介绍 面向中文自然语言处理的六十余类实践项目及学习索引,涵盖语言资源构建.社会计算.自然语言处理组件.知识图谱.事理图谱.知识抽取.情感分析.深度学习等几个学习主题.包括作者个人简介.学习心得.语 ...
- 自然语言处理系列十七》中文分词》分词工具实战》Python的Jieba分词
注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书<分布式机器学习实战>(人工智能科学与技术丛书)[陈敬雷编著][清华大学出版社] 文章目录 自然语言处理系列十七 分词工 ...
- 自然语言处理(NLP)常用开源工具总结----不定期更新
学习自然语言这一段时间以来接触和听说了好多开源的自然语言处理工具,在这里做一下汇总方便自己以后学习,其中有自己使用过的也有了解不是很多的,对于不甚了解的工具以后学习熟悉了会做更新的. 1.IKAnal ...
- 飞桨十大中文NLP开源工具详解
PaddleNLP是基于飞桨(PaddlePaddle)开发的工业级中文NLP开源工具与预训练模型集,将自然语言处理领域的多种模型用一套共享骨架代码实现,可大大减少开发者在开发过程中的重复工作.Pad ...
最新文章
- beats x连android手机吗,beats x 能连安卓手机吗?
- 对象是否要被回收(引用计数和可达性分析算法)
- python内核_python内核_python内核语言_python版本内核 - 云+社区 - 腾讯云
- 33. 脱壳篇-重建输入表
- 12002.i2ctools工具
- HP 380 G5安装CentOS7时找不到P400 raid卡
- 《Python数据可视化编程实战》—— 1.2 安装matplotlib、Numpy和Scipy库
- 微型计算机原理及应用技术ppt,微型计算机原理及应用技术.ppt
- Nicescroll滚动条插件手机端问题总结
- 06)JDK1.8 新特性学习 重复注解
- 算力测试Linux,附录:计算力的标准Linpack测试详细指南(1)
- 提升网站权重优化方法,网站权重优化步骤
- 树莓派GPIO 基础(一)
- 学习笔记-零基础学习人工智能(0)
- Pod生命周期中的状态解释
- Hive sql常用语句
- true在php中代表,true是什么意思
- 解决WPS下安装了VBA后出现的问题——卸载
- Altium Designer--如何制作过孔(Via)库
- 境内区块链信息服务备案清单(第一批)