1.分词 Word Segmentation

chqiwang/convseg ,基于CNN做中文分词,提供数据和代码。

2.词预测 Word Prediction

Kyubyong/word_prediction ,基于CNN做词预测,提供数据和代码。

3. 文本蕴涵 Textual Entailment

Steven-Hewitt/Entailment-with-Tensorflow,基于Tensorflow做文本蕴涵,提供数据和代码。

4. 语音识别 Automatic Speech Recognition

buriburisuri/speech-to-text-wavenet,基于DeepMind WaveNet和Tensorflow做句子级语音识别。

5. 自动摘要 Automatic Summarisation

PKULCWM/PKUSUMSUM,北大万小军老师团队的自动摘要方法汇总,包含了他们大量paper的实现,支持单文档摘要、多文档摘要、topic-focused多文档摘要。

6. 文本纠错 Text Correct

atpaino/deep-text-corrector,基于深度学习做文本纠错,提供数据和代码。

7.字音转换 Grapheme to Phoneme

cmusphinx/g2p-seq2seq,基于网红transformer做, 提供数据和代码。

8. 复述检测 Paraphrase Detection 和 问答 Question Answering

Paraphrase-Driven Learning for Open Question Answering, 基于复述驱动学习的开放域问答。

9. 音汉互译 Pinyin-To-Chinese

Kyubyong/neural_chinese_transliterator,基于CNN做音汉互译。

10. 情感分析 Sentiment Analysis

情感分析保护的内容太多了,目前没发现比较全的。推荐两个适合练手的吧:Deeply Moving: Deep Learning for Sentiment Analysis,http://sentic.net/about/。

11. 手语识别 Sign Language Recognition

Home - SignAll, 该项目在手语识别做的非常成熟。

12. 词性标注(POS)、 命名实体识别(NER)、 句法分析(parser)、 语义角色标注(SRL) 等。

HIT-SCIR/ltp, 保护代码、模型、数据,还有详细的文档,而且效果还很好。

13. 词干 Word Stemming

snowballstem/snowball, 实现的词干效果还不错。

14. 语言识别 Language Identification

https://github.com/saffsd/langid.py,语言识别比较好的开源工具。

15. 机器翻译 Machine Translation

OpenNMT/OpenNMT-py, 基于PyTorch的神经机器翻译,很适合练手。

16. 复述生成 Paraphrase Generation

vsuthichai/paraphraser,基于Tensorflow的句子级复述生成,适合练手。

17. 关系抽取 Relationship Extraction

ankitp94/relationship-extraction,基于核方法的关系抽取。

18. 句子边界消歧 Sentence Boundary Disambiguation

https://github.com/Orekhov/SentenceBreaking,很有意思。

19.事件抽取 Event Extraction

liuhuanyong/ComplexEventExtraction, 中文复合事件抽取,包括条件事件、因果事件、顺承事件、反转事件等事件抽取,并形成事理图谱。

20. 词义消歧 Word Sense Disambiguation

alvations/pywsd,代码不多,方法简单,适合练手。

21. 命名实体消歧 Named Entity Disambiguation

dice-group/AGDISTIS,实体消歧是很重要的,尤其对于实体融合(比如知识图谱中多源数据融合)、实体链接。

22. 幽默检测 Humor Detection

pln-fing-udelar/pghumor

23. 讽刺检测 Sarcasm Detection

AniSkywalker/SarcasmDetection,基于神经网络的讽刺检测。

24. 实体链接 Entity Linking

hasibi/EntityLinkingRetrieval-ELR, 实体链接用途非常广,非常适合练手。

25. 指代消歧 Coreference Resolution

huggingface/neuralcoref,基于神经网络的指代消歧。

26. 关键词/短语抽取和社会标签推荐 Keyphrase Extraction and Social Tag Suggestion

thunlp/THUTag, 用多种方法 实现了多种关键词/短语抽取和社会标签推荐。

最常见30种NLP任务练手项目汇总相关推荐

  1. 最常见NLP任务练手项目汇总

    分词 Word Segmentation chqiwang/convseg ,基于CNN做中文分词,提供数据和代码. 词预测 Word Prediction Kyubyong/word_predict ...

  2. 一个完整的python项目源码-Python实例练手项目汇总(附源码)

    #_*_ coding:utf-8 _*_ from tkinter import * importrandomimporttimeimporttkinter.messagebox#俄罗斯方块界面的高 ...

  3. 完整的python项目实例-Python实例练手项目汇总(附源码)

    #_*_ coding:utf-8 _*_ from tkinter import * importrandomimporttimeimporttkinter.messagebox#俄罗斯方块界面的高 ...

  4. [C++练手项目] DocAnalysis

    [C++练手项目] DocAnalysis 文章目录 [C++练手项目] DocAnalysis 任务分析 编码 转换DOC文件到TXT 分词 停止词 两文档相同和不同字符数统计 总体实现思路 一.分 ...

  5. Python 的练手项目:用Python创建一张三维立体画

    本项目生成的三维立体画设计为用"墙眼"方式观看.看到它们的最好方法,就是让眼睛聚焦在图像后面的点(如墙上).有点神奇,一旦在这些图案中感知到某样东西,眼睛就会自动将它作为关注的焦点 ...

  6. Python体系练手项目200例(附源代码),练完可显著提升python水平(鲲鹏编程--Python教育新物种)

    个人公众号 yk 坤帝 后台回复 练手项目 获取全部源代码 1.十转二 2.十转八 3 十转十六 4.字符串转字节 5.转为字符串 6.十转 ASCII 7.ASCII 转十 8.转为字典 9.转为浮 ...

  7. 推荐 Python 十大经典练手项目,让你的 Python 技能点全亮!

    前言:如果有人问:"Python还火吗?""当然,很火.""哪能火多久呢?""不知道." 技术发展到现在衍生出许多种编程 ...

  8. 别让双手闲下来,来做一些练手项目吧

    作者:Weston,原文链接,原文日期:2016-01-27 译者:saitjr:校对:Cee:定稿:千叶知风 自从我昨天发了文,收到的最多的评论就是: 我应该选择哪些 App 来练手呢? 这个问题很 ...

  9. python可以做什么项目-适合Python 新手的5大练手项目,你练了么?

    已经学习了一段时间的Python,如果你看过之前W3Cschool的文章,就知道是时候该进去[项目]阶段了. 但是在练手项目的选择上,还存在疑问?不知道要从哪种项目先下手? W3Cschool首先有两 ...

  10. python适合做什么生意_适合Python的5大练手项目,你练了么?

    在练手项目的选择上,还存在疑问?不知道要从哪种项目先下手? 首先有两点建议: 最好不要写太应用的程序练手,要思考什么更像是知识,老只会写写爬虫是无用的,但是完全不写也不行. 对于练手的程序,要注意简化 ...

最新文章

  1. 基于java+jdbc+servlet+jsp实现图书商城
  2. nvm:Mac下的 node 版本管理工具
  3. Map集合的遍历(java)
  4. 清理计算机英语是什么,如何清理电脑(国外英文资料).doc
  5. 在ASP.NET MVC中使用DropDownList
  6. 查看端口是否被占用,以及端口的应用名称
  7. url中 斜杠如何传输_如何在父子页面中传输数据(layer)
  8. Java 蓝桥杯 矩阵乘法
  9. ModelSerializer序列化(Apiview)
  10. 计算机房选址,数据中心机房如何选址 数据中心机房如何日常维护
  11. KNN算法实现knn完成iris数据集分类
  12. Android机顶盒adb调试及一直显示offline的处理
  13. Tomcat 9安装配置教程
  14. egg mysql 模糊搜索_使用egg-mysql操作mysql数据库
  15. php股票公式,【图】请老师帮忙编写个选股公式_股票公式,选股公式,股票论坛,炒股软件,股票指标_指标编写互助答疑论坛_理想论坛 - 股票论坛...
  16. 知道了蚂蚁森林这个“秘密”,我坐不住了!!
  17. C语言 输入一个数值,分析是正还是负,并打印出此数
  18. 如何使用kindle
  19. 关于升级win10 右键卡顿的解决方法
  20. hadoop错误DataXceiver error processing WRITE_BLOCK operation

热门文章

  1. mysql数据库日志太多_全方位解读 MySQL 日志实现内幕(四)
  2. Java线程拾遗(可重入锁)
  3. android图片选择器实现说明
  4. 网易互娱基于 Flink 的支付环境全关联分析实践
  5. Flink CDC 2.2 正式发布,新增四种数据源,支持动态加表,提供增量快照框架
  6. python标准库——datetime模块
  7. 工频干扰频谱测量_力参数传感器的电阻应变测量系统
  8. C语言1379最小公倍数,求最小公倍数的三种方法
  9. mysql 线上修改参数_9.10、mysql进程、状态在线修改参数重要知识
  10. java 小数如何转换成百分数_看似简单,在JAVA中如何将一个Object转换成Array