与nlp相关的模型概览

  • word2vec
    • CBOW
    • Skip-Gram
  • Doc2Vec
  • RNN、LSTM、GRU
    • 循环神经网络RNN
    • 长短期记忆神经网络(Long Short Term Memory,LSTM)
    • 门控循环单元(Gated Recurrent Unit,GRU)
  • 机器翻译
    • Encoder-Decoder
    • Attention-based Encoder-Decoder
      • Global Attention
      • Local Attention
      • Self Attention
      • Hierarchical Attention
    • Bi-Directional Encode layer
    • Residual Encode layer
    • 总结
  • Image Caption
  • Transformer
  • Bert(Bidirectional Encoder Representations from Transformers)
  • 分词
    • 基于BiLSTM+CRF的分词系统
  • 文本分类
    • 简单模型
    • LSTM
    • 双向RNN+残差网络
    • 堆叠循环神经网络
    • CNN
    • lstm-attention

word2vec

CBOW


Skip-Gram

Doc2Vec

RNN、LSTM、GRU

循环神经网络RNN



长短期记忆神经网络(Long Short Term Memory,LSTM)

计算量大

门控循环单元(Gated Recurrent Unit,GRU)

相比LSTM, 计算量小一些

机器翻译

Encoder-Decoder







Attention-based Encoder-Decoder

Global Attention

encoder的全部信息


Local Attention

encoder的局部信息

Self Attention

传统的attention只有source(encoder)和target(decoder)之间的关联关系,忽略了source和target端分别的关联关系,Self Attention可以捕捉到词与词之间的关系。

Hierarchical Attention

Bi-Directional Encode layer

Residual Encode layer

总结

Image Caption

Transformer

http://nlp.seas.harvard.edu/2018/04/03/attention.html

Bert(Bidirectional Encoder Representations from Transformers)




分词

基于BiLSTM+CRF的分词系统

文本分类

简单模型


LSTM

双向RNN+残差网络

堆叠循环神经网络

堆叠的目的:
底层rnn捕捉的是基本的信息,如:词的含义或者词性
高层rnn捕捉的是更深层次的信息,如:语义

CNN


lstm-attention

与nlp相关的模型概览相关推荐

  1. 关于NLP相关技术全部在这里:预训练模型、图神经网络、模型压缩、知识图谱、信息抽取、序列模型、深度学习、语法分析、文本处理...

    NLP近几年非常火,且发展特别快.像BERT.GPT-3.图神经网络.知识图谱等技术应运而生. 我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准 ...

  2. NLP——文本分类模型(HAN)(三)

    NLP--文本分类模型(HAN)(三) 1.引入 1. NLP--文本分类模型(一) 2. NLP--文本分类模型(二) 在之前的文章中,我们介绍了基于CNN机制是如何应用于文本分类.近些年来Atte ...

  3. NLP诗词生成模型数据准备及实战

    NLP诗词生成模型数据准备及实战 目录 NLP诗词生成模型数据准备及实战 方案流程 示例代码 自然语言处理+数据准备 Machine readable vector format 自然语言处理NLP的 ...

  4. NLP文本生成模型数据准备及实战

    NLP文本生成模型数据准备及实战 自然语言处理+数据准备 Machine readable vector format 自然语言处理NLP的数据预处理有哪些共性,可以参考? 什么样的数据格式是深度学习 ...

  5. NLP语义标注模型数据准备及实战

    NLP语义标注模型数据准备及实战 目录 NLP语义标注模型数据准备及实战 流程示例 代码示例

  6. Github:NLP相关代码、书目、论文、博文、算法、项目资源(附链接)

    来源:AINLP 本文多资源,建议阅读6分钟. 本文为你推荐Github上一个NLP相关的项目:msgi/nlp-journey. 推荐Github上一个NLP相关的项目: msgi/nlp-jour ...

  7. 基于时空相关属性模型的公交到站时间预测算法

    基于时空相关属性模型的公交到站时间预测算法 人工智能技术与咨询 来源:<软件学报> ,作者赖永炫等 摘 要:公交车辆到站时间的预测是公交调度辅助决策系统的重要依据,可帮助调度员及时发现晚点 ...

  8. 自然语言处理(NLP)相关资料汇总

    杂谈 自然语言处理怎么最快入门? - 刘知远的回答 - 知乎 https://www.zhihu.com/question/19895141/answer/24710071 刘老师主要是从ACL等著名 ...

  9. 2022-10-31如何将自己训练的yolo模型转为tensorrt相关的模型(.trt or .engine)

    如何将自己训练的yolo模型转为tensorrt相关的模型 [1].pt模型转.wts模型 [2].wts模型转.trt/.engine模型 本文主要是以自己训练的yolov3-tiny模型作为例子进 ...

最新文章

  1. QGC添加显示多架无人机飞行轨迹
  2. HTML的标签描述12
  3. 程序员面试100题之十五:数组分割
  4. Linux uniq命令
  5. dwmac ethernet driver(stmmac)
  6. 边沿检测—以脉冲形式给出信号
  7. Docker 构建 redis 集群
  8. 【算法】剑指 Offer 05. 替换空格
  9. IntelliJ IDEA 2021 for Mac(最好的java开发工具)正式版支持m1芯片
  10. [置顶] java高级工程师-----struts的内部运行机制详解
  11. 百度测试linux面试题,【百度百度Linux面试题】面试问题:Linux查看… - 看准网
  12. 推荐个国产框架,从此轻松开发 小程序/App/h5
  13. OSChina 周一乱弹 —— 年迈渔夫遭黑帮袭抢
  14. gstBuffer的 data 和 meta
  15. HYPERLEDGER FABRIC网络搭建之network e2ecli_default not found
  16. ONF和ON.Lab合并为一 加速推进SDN落地
  17. MVP结合(RecycleView,Retorfit,GreenDao和EventBus)数据展示
  18. NFM(Neural Factorization Machines):模型原理及pytorch代码实现
  19. 【红帽RHCA考试内容解析】
  20. 工业机器人什么情况下会出现奇点_机器人奇点是什么?他们怎么会像黑洞一样?...

热门文章

  1. Redis 从入门到起飞(下)
  2. 利用Comet4J 及时推送消息
  3. 结构型模式:外观模式(门面模式)
  4. 【Scratch】青少年蓝桥杯_每日一题_1.25_投球
  5. The import java.util cannot be resolved
  6. python构建知识库_手把手教导实战Python Web项目
  7. 微软成功测试氢燃料电池,为数据中心连续供电 48 小时
  8. python同步锁和互斥锁的区别_Python实现的多线程同步与互斥锁功能示例
  9. java des加密解密_JAVA和c# 之间数据通讯时通过DES进行加密解密
  10. des解密 given final_真相解密创新Aurvana Live SE评测怎么样?【使用一个月后感受实情爆料!!!...