1. 基于Hierarchical softmax的CBOW模型

    1. 网络结构:包括3层,分别为输入层,投影层和输出层

      1. 假设Context(w)是由词w的前后各c个词组成
      2. 输入层:包含Context(w)中2c个词的词向量
      3. 投影层:将输入层的2c个向量做求和累加
      4. 输出层对应一个二叉树:以语料中出现过的词当叶子节点,以各词在语料中出现的次数当权值构造出来的huffman树。
    2. 特点:对神经概率语言模型对比
      1. 从输入层到投影层的操作上,神经概率模型通过拼接的方式,而CBOW采用累加的方式
      2. 从有无隐藏层来看,神经概率模型有隐藏层,而CBOW没有隐藏层
      3. 从输出层来看,神经概率模型的输出层是线性结构,而CBOW是树形结构,针对神经概率模型大规模的矩阵运算和softmax归一运算,CBOW对其作出了优化,首先去掉了隐藏层,同时输出层改用Huffman树,从而为利用Hierarchical Softmax技术奠定了基础。
    3. Hierarchical Softmax技术是word2vec中用于提高性能的一项关键技术
    4. 定义条件概率:从根节点到叶子节点的过程中,经历的每个分支都看做一次二分类。且除根节点外,树中每个点都对应了一个取值为0或1的Huffman编码。因此在word2vec中,将编码为0的结点定义为负类,编码为1的点定义为正类。即将一个结点进行分类时,分到左边就是负类,分到右边就是正类。于词典D的任意词w,Huffman 树中必定存在一条从根结点到该词的路径,路径长度为l,则路径上存在l-1个分支,将每一个分支作为二分类,每一次分类产生一个概率,将所有的概率相乘,就得到所需的p(w|Context(w))。
    5. word2vec里面采用的是随机梯度上升法(求最小值用梯度下降法,求最大值用梯度上升法)
  2. 基于负采样的CBOW模型:
    1. 利用随机负采样,大幅提升了计算性能。
    2. 在CBOW模型中,已知词w的上下文Context(w),需要预测w,因此对于给定的Context(w)来说,词w就是一个正样本,其他词就是一个负样本了。
    3. 正样本的标签是1,负样本的标签是0.

word2vec包中cbow模型--学习笔记相关推荐

  1. DMU-单性状重复力模型-学习笔记3

    单性状重复力模型 本次主要是演示如何使用DMU分析单性状重复力模型. 重复力模型和动物模型的区别: 不是所有的性状都可以分析重复力模型, 首先重复力模型是动物模型的拓展, 它适合一个个体多个观测值的情 ...

  2. 文本分类模型学习笔记

    文本分类模型学习笔记 TextCNN 模型结构 HAN 模型结构 实验 数据集 预处理 模型内容 模型训练 模型测试 近年来,深度学习模型在计算机视觉和语音识别中取得了显著成果.在自然语言处理中,深度 ...

  3. anaconda中安装xgboost_ML学习笔记之Anaconda中命令形式安装XGBoost(pip install)

    0x00 概述 在没有安装XGBoost之前,import xgboot会出错,如下: # ModuleNotFoundError: No module named 'xgboost' 0x01 安装 ...

  4. 概率图模型学习笔记:HMM、MEMM、CRF

    作者:Scofield 链接:https://www.zhihu.com/question/35866596/answer/236886066 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权 ...

  5. Heckman两阶段模型学习笔记

    有近两周的时间都在学习Heckman两阶段模型.网上看了一些资料,在CSDN里找到了几篇珍贵的学习笔记,有一篇相当于带我入了门学习笔记 | Heckman两阶段法介绍_Claire_chen_jia的 ...

  6. 机器人学中的状态估计——学习笔记

    机器人学中的状态估计--学习笔记 离散时间的批量估计问题 1.最大后验概率法(Maximum A Posteriori, MAP) 2.贝叶斯推断(Bayesian inference) 离散时间的迭 ...

  7. ARIMA模型学习笔记

    ARIMA模型学习笔记 目录 ARIMA模型学习笔记 ARIMA模型 时间序列平稳性 什么是平稳性 严平稳 弱平稳 平稳性检验 ADF检验(Augmented Dickey-Fuller test) ...

  8. 机器人学中的状态估计学习笔记(二)第三章线性高斯系统的状态估计

    机器人学中的状态估计学习笔记(二)第三章线性高斯系统的状态估计 3.1 离散时间的批量估计问题 3.1.1 问题定义 3.1.2 最大后验估计 3.1.3 贝叶斯推断 3.1.4 存在性.唯一性与能观 ...

  9. Python中索引的学习笔记

    1 前言 今天在学习FaceBoxes- 看到一个比较奇怪的代码,"order = scores.argsort()[::-1][:args.top_k]",不太懂这个" ...

最新文章

  1. [转帖]Sqlcmd使用详解
  2. cacti安装和第三方模块的导入
  3. json格式输出数组隐藏键值方法
  4. html细边框表格代码,html中表格细边框的四种实现及其比较.doc
  5. Windows Phone 7 开发 31 日谈——第25日:外部API
  6. 联合光伏回应“天价收购”质疑:并非每瓦10.24元
  7. 对象转为json形式
  8. 如何使用电脑将拍摄的照片做成gif格式动图?
  9. PostgreSql增删改(与mysql差异)
  10. 你需要知道的WAMP5
  11. 07-图6 旅游规划
  12. session活化与钝化
  13. 摸鱼宝典(一)——贪吃蛇游戏改版:贪吃龙 · 双龙戏珠小游戏(Python)
  14. BufferedInputStream的作用比较
  15. java项目宕机出现原因,java服务宕机原因查询
  16. Ubuntu下PyCharm安装中文汉化包
  17. jdbc之操作BLOB类型字段
  18. Orecal数据库的基本使用
  19. 外星人 17R4笔记本 win10 UEFL 安装Ubuntu16.04 LTS并更换Nvidia显卡驱动 教程+个人心得
  20. 城市景观类毕业论文文献有哪些?

热门文章

  1. pyhton爬诛仙小说
  2. 如何用MCU来控制21489调音?
  3. nginx、php本地配置https
  4. TS流格式小白入门解读
  5. aliexpress 速卖通主图、SKU、属性、详情Python 测试爬取
  6. 微信网址防封防屏蔽,微信域名一直被封怎么办
  7. 4_MySQL_聚合函数和条件查询
  8. 互联网小现象:BAT疯狂投资,网易为何单打独斗?
  9. 输入两个整数,求;两者的和,差,积,商,余数。
  10. t420i升级固态硬盘提升_技术丨如何升级固态硬盘,提高电脑性能