下面是我对机器学习解决问题的一个理解:

机器需要做的事:
现象1 —>数据结构1 —> 数据结构2 —> 现象2
1、从现象1—>数据结构1,为了让机器了解是一个什么现象,此过程如果能找到最本质的编码方式将是机器能够成功解决问题的基石,用RGB对图片的编码就是一种非常好的编码。
2、数据结构1—>数据结构2,根据不同的问题可能需要DNN、CNN、RNN等网络结构来找到这种映射关系。这种映射关系是为第3步服务的。
3、数据结构2—>现象2,现象2是针对于你想解决的问题所关注的现象,包含在现象1之中。数据结构2也非常重要,这关乎能否找到合适的Loss function来优化问题,得到映射关系的参数。

对于机器解决问题这3步都至关重要。关于NLP问题的解决,词嵌入矩阵E就相当于此处的数据结构1,但是比我说的最本质的编码要高级一些,这个矩阵会随着拿来训练的语料库变化,语料库会随着时代的变化而变化 。这就是我所说的词嵌入矩阵E对于NLP问题的重要性,有了这个矩阵很多问题只需要很小的训练集也能训练出不错的效果。

对于NLP问题,数据结构1 —>数据结构2这个过程,使用LSTM单元的双向RNN是能解决绝大部分问题,当然对于比较复杂的问题也可以考虑Deep RNNs。
LSTM单元:


Bidirection RNN:

Deep RNN:

机器学习解决问题思路 — 词嵌入矩阵E对于NLP问题的重要性相关推荐

  1. 文本特征提取_02:Word2Vec词嵌入矩阵

    王小草SparkML笔记 笔记整理时间:2017年1月10日 笔记整理者:王小草 今日计事: 除开上周五在家工作,2017年的工作日从3号开始今天第5次上班迟到,无论起多早每天都是会迟几分钟.第一次挤 ...

  2. 词嵌入矩阵(Word Embeddings)的生成

    词嵌入矩阵的学习 词嵌入 格式 词嵌入矩阵的训练 词嵌入 词嵌入矩阵是自然语言处理里非常重要的东西.它可以帮助我们快速的使用小样本建立一个不错的自然语言处理任务.那么他是如何生成的呢. 格式 词嵌入矩 ...

  3. 词嵌入和网络在NLP中贡献

    本文解释如何应用神经网络并整合词嵌入到基于文本的应用中,还有一些主要暗含的好处. 首先词嵌入是词的密集向量表示,其中相似的词在向量空间中尽可能相似.例如在下图中,所有大型猫科动物在向量空间中都很相近. ...

  4. 深度学习实战讲词嵌入 很好的 NLP电子书

    http://yuedu.163.com/source/8ea77c19c3994b7f93b272dfb6017b69_4

  5. 文档词频矩阵_论文理解:从词嵌入到文档距离

    论文作者简介 本论文第一作者Matt J. Kusner是牛津大学的副教授,致力于设计适应现实世界问题需求的新机器学习模型(例如,fair algorithms, discrete generativ ...

  6. [DeeplearningAI笔记]序列模型2.3-2.5余弦相似度/嵌入矩阵/学习词嵌入

    5.2自然语言处理 觉得有用的话,欢迎一起讨论相互学习~Follow Me 2.3词嵌入的特性 properties of word embedding Mikolov T, Yih W T, Zwe ...

  7. word2vec python实现_教程 | 在Python和TensorFlow上构建Word2Vec词嵌入模型

    原标题:教程 | 在Python和TensorFlow上构建Word2Vec词嵌入模型 选自adventuresinmachinelearning 参与:李诗萌.刘晓坤 本文详细介绍了 word2ve ...

  8. 深度学习笔记 第五门课 序列模型 第二周 自然语言处理与词嵌入

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  9. 词嵌入向量WordEmbedding的原理和生成方法

    词嵌入向量WordEmbedding的原理和生成方法 WordEmbedding的使用 WordEmbedding的生成 词嵌入向量(WordEmbedding)是NLP里面一个重要的概念,我们可以利 ...

最新文章

  1. BERT大火却不懂Transformer?读这一篇就够了 重点 命名实体识别
  2. bellman_ford寻找平均权值最小的回路
  3. 忠告初学者学习Linux系统的8点建议
  4. mysql 查询语句 参数,mysql参数化查询语句有关问题
  5. Java程序执行过程
  6. nginx的error.log日志常见的几个错误解决方法
  7. [转]sqlserver2008锁表语句详解
  8. 计算机考研 电路,模拟电路 请高手来帮忙
  9. KKT条件和拉格朗日乘子法
  10. boost::log::sinks::text_ostream_backend用法的测试程序
  11. mysql主从同步单个表实验记录
  12. java 远程查看电脑磁盘,请问你如何在Java中监视计算机的CPU、内存和磁盘使用情况?...
  13. 计算机的网络功能不包括下面项,计算机网络中,防火墙的功能不包括
  14. import 和from... import的作用,导入模块or导入函数
  15. Bootstrap Datatable 简单的基本配置
  16. 【科普篇】推荐系统之矩阵分解模型
  17. ISAServer***检测及配置
  18. Mac下docker安装kali/ubuntu14.04
  19. 《Head first HTML与CSS 第二版》读书笔记 第一章 了解HTML
  20. html5饼图的制作方法,excel2010复合饼图制作方法

热门文章

  1. Codeforces.888G.Xor-MST(Borůvka算法求MST 贪心 Trie)
  2. springcould结合springbboot微服务 开发@^——^@ 模式讲解
  3. 无意中发现Markdown,最终解放了我
  4. java实现中缀表达式转后缀表达式
  5. Caused by: java.lang.NoClassDefFoundError: net/sf/ezmorph/Morpher
  6. 一个特殊的事件绑定程序(通用于各种浏览器)
  7. VMware Centos 网络配置
  8. pytest测试框架(六)---使用skip和skipif跳过测试用例
  9. graphics | 基础绘图系统(四)——柱状图、直方图、扇形图、箱形图和函数图象...
  10. html图像排列代码,HTML图像(示例代码)