深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删。

✨word2vector系列展示✨

一、CBOW

1、朴素CBOW模型

word2vector之CBoW模型详解_tt丫的博客-CSDN博客

2、基于分层softmax的CBOW模型

基于分层softmax的CBoW模型详解_tt丫的博客-CSDN博客

3、基于高频词抽样+负采样的CBOW模型

基于高频词抽样+负采样的CBOW模型_tt丫的博客-CSDN博客

二、Skip_Gram

本篇

(关于Skip_Gram的分层softmax和负采样,与CBOW类似)

目录

一、前景知识

二、Skip-gram模型思想

三、Skip-gram模型结构分析

1、网络图

2、网络层次级分析

3、注意点

四、代码实现朴素skip-gram


一、前景知识

这些可以根据需要跳着看

NLP之文本预处理详解_tt丫的博客-CSDN博客

NLP之文本特征提取详解_tt丫的博客-CSDN博客

CBoW模型word2vector之CBoW模型详解_tt丫的博客-CSDN博客


二、Skip-gram模型思想

Skip-gram模型跟CBoW模型是反过来的。

CBoW模型通过上下文来预测当前值,而Skip-gram模型是通过当前值预测上下文。


三、Skip-gram模型结构分析

1、网络图

2、网络层次级分析

(1)Input

输入的是1 * V的one-hot向量x(其中V为词典大小)

(2)Hidden

构建一个大小为V * N的嵌入矩阵W(其中N为词向量的维度),所以用这个W和x相乘,得到最终Hidden的输出,大小为1 * N

(3)Output

构建一个大小为N * V的矩阵W’,用W’和Hidden的输出相乘得到最终的输出,大小为1 * V。

3、注意点

skip-gram的训练过程不是一次性用中心词预测窗口数个词,而是中心词和一个周围词组成一个训练样本。

比如当我们指定窗口为2,那么当前词左右的周围词共有4个。有4个周围词的话就有4个样本,即[中心词,周围词1]、[中心词,周围词2]...…

这也决定了上述朴素skip_gram模型的输出是大小为1 * V。(就是这4个1 * V组成了1个当前词预测出上下文4个词)


四、代码实现朴素skip-gram

word2vector之Skip_Gram模型详解相关推荐

  1. word2vector之CBoW模型详解

    深度学习入门小菜鸟,希望像做笔记记录自己学的东西,也希望能帮助到同样入门的人,更希望大佬们帮忙纠错啦~侵权立删. ✨word2vector系列展示✨ 一.CBOW 1.朴素CBOW模型 本篇 2.基于 ...

  2. 使用pickle保存机器学习模型详解及实战(pickle、joblib)

    使用pickle保存机器学习模型详解及实战 pickle模块实现了用于序列化和反序列化Python对象结构的二进制协议. "Pickling"是将Python对象层次结构转换为字节 ...

  3. Transformer 模型详解

    Transformer 是 Google 的团队在 2017 年提出的一种 NLP 经典模型,现在比较火热的 Bert 也是基于 Transformer.Transformer 模型使用了 Self- ...

  4. TensorFlow Wide And Deep 模型详解与应用 TensorFlow Wide-And-Deep 阅读344 作者简介:汪剑,现在在出门问问负责推荐与个性化。曾在微软雅虎工作,

    TensorFlow Wide And Deep 模型详解与应用 TensorFlow Wide-And-Deep 阅读344  作者简介:汪剑,现在在出门问问负责推荐与个性化.曾在微软雅虎工作,从事 ...

  5. TensorFlow Wide And Deep 模型详解与应用

    Wide and deep 模型是 TensorFlow 在 2016 年 6 月左右发布的一类用于分类和回归的模型,并应用到了 Google Play 的应用推荐中 [1].wide and dee ...

  6. 数学建模——智能优化之模拟退火模型详解Python代码

    数学建模--智能优化之模拟退火模型详解Python代码 #本功能实现最小值的求解#from matplotlib import pyplot as plt import numpy as np imp ...

  7. 数学建模——智能优化之粒子群模型详解Python代码

    数学建模--智能优化之粒子群模型详解Python代码 import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplo ...

  8. 数学建模——支持向量机模型详解Python代码

    数学建模--支持向量机模型详解Python代码 from numpy import * import random import matplotlib.pyplot as plt import num ...

  9. 数学建模——一维、二维插值模型详解Python代码

    数学建模--一维.二维插值模型详解Python代码 一.一维插值 # -*-coding:utf-8 -*- import numpy as np from scipy import interpol ...

最新文章

  1. [CF446C]DZY Loves Fibonacci Numbers
  2. 听说下雨天,子序列和孤单的你更配哦~
  3. Jsp之建立JDBC-ODBC桥接器连接数据库
  4. 边缘设备上的实时AI人员检测:以实时模式检测视频中的人员
  5. Fibonacci数列第n项的第7种计算方法:Python列表
  6. Jmeter使用笔记之断言
  7. 如何制作一个横版格斗过关游戏 Cocos2d-x 2.0.4
  8. Linux使用命令记录
  9. TurboFan的故事
  10. CANoe软件安装失败
  11. ac管理器管理员密码忘记了_你应该使用密码管理器吗
  12. 开源网站GitHub把自己给开源了
  13. 计算机二级电子表格使用技巧36种,Excel表格中最经典的36个小技巧,全在这儿了...
  14. evolution ubuntu邮箱_linux下有什么好用的邮件客户端?
  15. 人脸检测--libfacedetection
  16. 使用三丰云服务器建立moon节点搭建zerotier
  17. 帷幄匠心面试题 一面
  18. java之学习记录 5 - 1 - 模拟拉勾项目介绍与后台系统搭建
  19. fooview辅助功能 shell_Fooview:一款功能超多的桌面悬浮球,帮你摆脱多余操作
  20. 如何让自己时刻冷静的方法_情绪激动时如何冷静下来?教你4招很管用

热门文章

  1. 关于调增工程施工扬尘污染防治费等安全文明施工费计取标准的通知〔2019〕180号
  2. 阿里云-云开发平台 应用的创建及使用
  3. 新知识:去掉li前面的项目符号(小圆点)
  4. CSS动画:transition触发动画和animation非触发动画
  5. druid监控无法关闭
  6. android面试——成都卡德智能科技有限公司
  7. 基础练习 十六进制转换成十进制
  8. AngularJS 学习笔记---AngularJS 简介
  9. 视频教程-跟着王进老师学开发Python篇:基础入门案例讲解-Python
  10. Swift与Objective-C:重新认识苹果的编程语言(1)