在我的个人博客上很早就把这篇文章写出来了,现在转到CSDN,作为word2vec的姊妹篇,无论你使用的是word2vec还是glove,两种方式都是通用的。仅作少许改动即可。
前段时间把word2vec词向量的用法整理了一下。处理的是二进制文件,二进制文件处理起来是比较快的,但是过程可能比较繁琐。这次整理了一下glove词向量的处理方式,文件是txt格式的。

Glove.txt文件大概是这样子的。图中红框表示的是单词,红框蓝底的是对应的词向量。

对这个文件的处理方式:

1、先读取一行;

2、分离出单词和词向量

3、注意:使用这种方法的前提是词表顺序和glove.txt文件里的单词顺序一致。

4、代码很简单,如下:

def embLayer(input):with open('n_GloVe.txt', 'r') as file1:emb = []vocab = []for line in file1.readlines():row = line.strip().split(' ')vocab.append(row[0])emb.append(row[1:])emb = np.asarray(emb, dtype="float32")with tf.variable_scope('embedding'):embedding = tf.Variable(emb, name='emb')embeding_input = tf.nn.embedding_lookup(embedding, input)return embeding_input

代码已经上传到github:https://github.com/pkulics/use-pretrained-glove

我的个人网站:lichangsong.win

我的又大又全又便宜的某宝资料铺:

緮置这行话¥PCYX1QCAm9R¥转移至淘宀┡ē【码世界资料铺】;或https://m.tb.cn/h.V6uwZ9I?sm=916410 點击链街,再选择瀏..覽..噐dakai

使用glove词向量相关推荐

  1. 2.8 GloVe词向量-深度学习第五课《序列模型》-Stanford吴恩达教授

    Glove 词向量 (GloVe Word Vectors) 你已经了解了几个计算词嵌入的算法,另一个在NLP社区有着一定势头的算法是GloVe算法,这个算法并不如Word2Vec或是Skip-Gra ...

  2. 一个基于PyTorch实现的Glove词向量的实例

    简介 词向量技术,也称为词嵌入技术(word-embedding),是一种将高维稀疏的向量压缩到低维稠密向量的技术.常见于自然语言处理领域对单词的预处理过程,例如将单词的one-hot向量是高维稀疏的 ...

  3. 详解GloVe词向量模型

      词向量的表示可以分成两个大类1:基于统计方法例如共现矩阵.奇异值分解SVD:2:基于语言模型例如神经网络语言模型(NNLM).word2vector(CBOW.skip-gram).GloVe.E ...

  4. NLP【05】pytorch实现glove词向量(附代码详解)

    上一篇:NLP[04]tensorflow 实现Wordvec(附代码详解) 下一篇:NLP[06]RCNN原理及文本分类实战(附代码详解) 完整代码下载:https://github.com/ttj ...

  5. 机器阅读理解笔记之glove词向量与attentive readerimpatient reader和bi-DAF

    glove词向量模型 词向量的表示可以分成两类: 基于统计方法 共现矩阵.svd 基于语言模型 神经网络语言模型,word2vector,glove,elmo  word2vector中的skip-g ...

  6. 【Pytorch基础教程37】Glove词向量训练及TSNE可视化

    note Glove模型目标:词的向量化表示,使得向量之间尽可能多蕴含语义和语法信息.首先基于语料库构建词的共现矩阵,然后基于共现矩阵和GloVe模型学习词向量. 对词向量计算相似度可以用cos相似度 ...

  7. glove词向量的加载以及预处理

    1. glove词向量的加载 2. glove词向量的预处理 3. 碎碎念 这两天要做论文的实验,关于句向量的. 因为实验代码涉及到对词向量的处理,就记一下吧,其实之前也是看过的,但是中间做了另外一个 ...

  8. 【NLP】基于GloVe词向量的迁移学习

    作者 | Kourosh Alizadeh 编译 | VK 来源 | Towards Data Science 在过去,我在为我的一个项目训练词向量,但我一直在碰壁.我在研究哲学史上的文本,试图找到可 ...

  9. cs224u GloVe词向量方法

    GloVe是Jeffrey Pennington 等作者于2014年提出的一种词向量方法,该方法基于全局词汇,通过统计单词共现的信息训练词向量,将统计信息与局部上下文窗口方法结合起来. 论文:Penn ...

最新文章

  1. python与办公结合_python在办公时能给我们带来什么?
  2. GraphQL 入门第一篇
  3. 表单令牌阻止数据重复提交
  4. UGUI 下拉滚动框
  5. python38怎么用_Python基础练习实例38(数组操作)
  6. 根据 sitemap 的规则[0],当前页面 [pages/index/index] 将被索引 提示
  7. VS2019 配置QT
  8. Scala:集合类型Collection和迭代器
  9. 离线安装docker镜像
  10. iOS底层探索之Runtime(一):运行时方法的本质
  11. 计算机教学提问的观课量表,观课议课|如何使用观察和记录量表
  12. java 内部类总结_java学习笔记9--内部类总结
  13. Google 为什么选择 Jetty,放弃 Tomcat
  14. 我们的地盘,我们做主
  15. Kraljic采购定位模型
  16. List集合去重方法
  17. The Open Group中国首届线上大会 专场三亮点解读
  18. 系统背景描述_舞台灯光网络系统及光源角度资料免费分享
  19. 网站安全之几种常见的网络攻击方式
  20. Sheldon Numbers

热门文章

  1. 虚拟环境(Linux)
  2. php rce,批量thinkphp5的RCE漏洞利用
  3. typedef和define的区别
  4. WordPress多语言版本切换插件Translate WordPress with GTranslate
  5. 【随笔】入坑半年后对嵌入式的一点认识
  6. 嵌入式毕设分享 人体定位智能调速风扇系统
  7. Shortcut Icon地址栏显示图标
  8. 软件工程理论与实践学习——炸鸡的读后感
  9. 六,WiFi天猫精灵零配详解
  10. IC基础知识(二)锁存器与触发器