这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os

logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'

if os.path.exists(fname):

# load the file if it has already been trained, to save repeating the slow training step below

model = gensim.models.Word2Vec.load(fname)

else:

# can take a few minutes, grab a cuppa

model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)

model.save(fname)

words = "woman women man girl boy green blue".split()

for w1 in words:

for w2 in words:

print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))

print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

word2vec实例详解python_Python实现word2Vec model过程解析相关推荐

  1. word2vec实例详解python_在python下实现word2vec词向量训练与加载实例

    项目中要对短文本进行相似度估计,word2vec是一个很火的工具.本文就word2vec的训练以及加载进行了总结. word2vec的原理就不描述了,word2vec词向量工具是由google开发的, ...

  2. java读取本地文件_java 读取本地文件实例详解

    java 读取本地文件实例详解 用javax.xml.w3c解析 实例代码: package cn.com.xinli.monitor.utils; import org.w3c.dom.Docume ...

  3. java 读取本地文件_java 读取本地文件实例详解

    java 读取本地文件实例详解 用javax.xml.w3c解析 实例代码: package cn.com.xinli.monitor.utils; import org.w3c.dom.Docume ...

  4. Word2Vec原理详解

    Word2Vec原理详解 摘要 Word2Vec的Intuition 表示单词间的相似度 Word2Vec的模型 Negative Sampling 参考资料 摘要 一般来说表示词向量最简单的方式就是 ...

  5. 【查询】—Entity Framework实例详解

    Entity Framework 查询使用集成查询,简称LINQ.LINQ是一个查询框架,并不限于Entity Framework使用,同样不限于数据库.LINQ Provider 负责将LINQ查询 ...

  6. angularjs directive 实例 详解

    angularjs directive 实例 详解 张映 发表于 2014-03-13 前面提到了angularjs的factory,service,provider,这个可以理解成php的model ...

  7. php 实例 规范,PHP开发规范实例详解

    本文主要和大家分享PHP开发规范实例详解,希望能帮助到大家. 源文件 代码使用<?php开头 ,忽略闭合标签?> 文件格式必须是无BOM UTF-8格式 一个文件只声明一种类型,如clas ...

  8. 怎么创建python django项目_创建Django项目图文实例详解

    本文实例讲述了创建Django项目的方法.分享给大家供大家参考,具体如下: 创建Django项目 创建一个HelloDjango项目 GitHub地址:https://github.com/liang ...

  9. 一对一关联查询注解@OneToOne的实例详解

    表的关联查询比较复杂,应用的场景很多,本文根据自己的经验解释@OneToOne注解中的属性在项目中的应用.本打算一篇博客把增删改查写在一起,但是在改的时候遇到了一些问题,感觉挺有意思,所以写下第二篇专 ...

最新文章

  1. 数据分析行业需要具备哪些技术 如何快速进入
  2. 一 如何检查oracle的归档日志及空间占用率,清除归档日志、Oracle归档日志使用情况查询、查看oracle数据库一周产生的归档日志
  3. python3精要(21)-函数(2)
  4. Notification的功能和用法 加薪通知
  5. [Java基础]反射获取构造方法并使用
  6. [Python] 制作启动uiautomator2 的web版 uiautomatorviewer2 批处理启动
  7. TTF 自己文件编辑与制作
  8. C语言基础--字符串
  9. confluence添加用户_知识管理平台Confluence教程:如何添加,分配和查看任务
  10. ELK应用之Filebeat
  11. 日报系统、周报系统如何便捷使用?——领导篇
  12. 【Python PE解析器】——制作解析PE文件软件 并进行编译EXE程序 并打包为单个安装程序(全程详细包资料)
  13. 数据结构与算法之迷宫回溯
  14. ubuntu安装google chrome无法启动且打不开网站
  15. 飞塔防火墙添加删除用户配置
  16. 根据公式计算圆周率PI
  17. Linux syslog进程退出日志审计
  18. linux syslog日志转发服务端、客户端配置
  19. C语言实现图书管理系统
  20. 为什么sop很重要?

热门文章

  1. java使用druid maven_SpringMVC+Spring+Mybatis整合,使用druid连接池,声明式事务,maven配置...
  2. html页面刷新回到顶部_HTMl页面中返回顶部的几种实现小结
  3. Segmentation fault到底是何方妖孽
  4. vue写进html,vue中html页面写入$t(‘’)怎么显示
  5. java构造字符缓冲区_java学习笔记 | 学步园
  6. easyui treegrid获取父节点的id_超简单的分布式ID生成方案!美团开源框架介绍
  7. python基础入门:bytes 和 string转换的方法
  8. 打印 Python 的一切 —— pprint beeprint
  9. Python十大常用文件操作
  10. Python 调用pyaudio库录制以及播放wav音频文件