知乎上有人提问:GitHub 上有哪些有趣的关于 NLP 的Python项目?

先来说说什么是NLP?

自然语言处理(NLP)的重点是使计算机能够理解和处理人类语言。计算机擅长处理结构化数据,如电子表格;然而,我们写或说的很多信息都是非结构化的。

自然语言处理的目标是使计算机能够理解非结构化文本并从中提取有意义的信息。多亏了spaCy和NLTK等开源库,我们只需几行Python代码就可以实现许多NLP技术。

说到Github上的NLP项目,这里强烈推荐一个36.9K star的仓库:「funNLPPublic」

https://github.com/fighting41love/funNL

这是一个中文NLP项目,作者声称是NLP民工的乐园: 几乎最全的中文NLP资源库

我仔细看了该项目资源的结构,主要是分为各类行业词库、语料库、分词处理工具、语义判别工具、正则应用工具、NLP开源算法、行业技术报告、各种NLP处理框架等等

凡是中文领域NLP沾边的地方,作者通通汇总了相关资源,对初学者来说是不错的一个检索仓库。

虽然看起来比较乱,作者没有去做详细的归类,但良心在于很全,能让你轻松地玩转各种nlp知识,也不失趣味。

下面分别举例一些资源,供大家参考,详细的可以去github仓里自行查找

行业词库、语料库(IT、汽车、医学、动物、财经、法律等)

NLP论文、行业报告

PDF文档处理

语音处理工具

行业应用场景

nlp框架和工具

当然上述案例只是该项目的一小部分,我看了下总共有将近400个NLP资源,非常全。

其他关于NLP的好项目也很多,比如NLP-progress、HanLP、spaCy、jina等等,大家可以自己去探索下。

往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑
AI基础下载机器学习交流qq群955171419,加入微信群请扫码:

【NLP】GitHub 上有哪些有趣的关于 NLP 的Python项目?相关推荐

  1. GitHub 上 57 款最流行的开源深度学习项目【转】

    GitHub 上 57 款最流行的开源深度学习项目[转] 2017-02-19 20:09 334人阅读 评论(0) 收藏 举报 分类: deeplearning(28) from: https:// ...

  2. github上可供新手阅读和玩耍的java项目有哪些??

    扫垃圾 ,Java 爱好者, 前沿技术思考者 刘巍然-学酥 等 217 人赞同 一个聊天程序范例: tinystruct2.0/smalltalk.java at master · m0ver/tin ...

  3. 【AI人工智能学习】GitHub 上适合初学者的 10 个最佳开源 AI 项目

    温馨提示:AI一定是未来程序员的出路,大家可以早点入坑. 目录 人工智能简介 GitHub 上适合初学者的 10 个最佳开源 AI 项目 Part.1 TensorFlow Part.2 PyTorc ...

  4. GitHub上50个最受欢迎的PHP开源项目【2019】

    2019年过去一大半了,PHP中文网为你总结整理下GitHub上在2019年都有哪些流行的PHP相关开源项目,以下是按照GitHub Stars排序的,欢迎参考! GitHub上50个最受欢迎的PHP ...

  5. GitHub上最火的7个spring cloud开源项目,对新手太友好了

    微服务是什么? 微服务架构(Microservice Architecture)是一种架构概念,旨在通过将功能分解到各个离散的服务中以实现对解决方案的解耦.你可以将其看作是在架构层次而非获取服务的类上 ...

  6. 本地运行github上的vue2.0仿饿了么webapp项目

    在vue刚刚开始流行的时候,大多数人学习大概都见到过这样的一个项目吧,可以作为学习此框架的一个模板了 github源码地址:https://github.com/RegToss/Vue-SPA 课程教 ...

  7. GitHub上有哪些比较好的计算机视觉/机器视觉的项目?

    来源:Unsplash,作者: JR Korpa 来源:知乎问题 今天分享一下 Github 上不错的计算机视觉或者机器视觉方面的项目,包括入门的教程.非常经典的算法和实战项目等等. 今日推荐文章 g ...

  8. 我把Github上最牛b的Java教程和实战项目整合成了一个PDF文档

    写在前面 大家都知道 Github 是一个程序员福地,这里有各种厉害的开源框架.软件或者教程.这些东西对于我们学习和进步有着莫大的进步,所以我有了这个将 Github 上非常棒的 Java 开源项目整 ...

  9. Github上发布一天Star数破4K的项目了解一下

    前言 随着时间的推移,我们大家最熟悉的Windows操作系统不断发展.现在Windows已经发展到了Windows10版本.可能大家和我一样,真正使用Windows操作系统也不过是从Windows7开 ...

最新文章

  1. 初创企业股权架构_初创企业如何以每月不到200美元的价格利用生产级基础架构...
  2. search Paths $(SRCROOT)和$(PROJECT_DIR)区别
  3. 搜索文献_【大牛经验分享】如何高效快捷搜索文献?
  4. java 超构造函数_java中的超级构造函数
  5. 大数据学习笔记27:MR案例——多输入源处理成绩
  6. python基础布尔和None(三)
  7. HLSL内置函数一览
  8. 举世闻名的 SQL 注入是什么?这个漫画告诉你!
  9. html背景怎么变成透明的,怎样把图片背景变成透明
  10. 双线性变换(Tustin transform/bilinear transformation)
  11. 监督学习-分类模型1-线性分类器(Linear Classifiers)
  12. 工作感想-软件测试工程师
  13. java 调用felix_使用eclipse开发felix的OSGI插件
  14. 小伙因家人“催催催” 欲轻生 民警苦劝将其救下
  15. Git+Gitlab+Ansible剧本实现一键部署动态网站(二)--技术流ken
  16. OkHttp3封装第二版
  17. oracle数据库测评
  18. redis:地理位置信息geo
  19. 比利时金融监管机构加密货币诈骗黑名单新增28个网站
  20. 李笑来,那个一顿饭点8条鲈鱼的人

热门文章

  1. WEBApp-搭建Android开发环境
  2. 联盟广告新模式—图片广告
  3. php调用matlab
  4. 032-session函数
  5. 微信支付退款结果通知解密 base64_decode / md5 / AES
  6. 密码6-12位数字和字母组成
  7. 前端切图:手机端自适应布局demo
  8. 24-hadoop-hiveserver2jdbc-正则数据导入
  9. 我才知道wordpress还有com和org的区别呢
  10. python绘制分组条形图_python中分组值的条形图