word2vec 本来就是用来解决自然语言处理问题的,它在 NLP 中的应用是显然的。

比如,你可以直接用它来寻找相关词、发现新词、命名实体识别、信息索引、情感分析等;你也可以将词向量作为其他模型的输入,用于诸如文本分类、聚类等各种自然语言处理问题。

事实上,word2vec 的思想和工具,还可以应用于自然语言处理之外的其他领域。一个词,无非就是个符号;句子是词的序列,无非也就是个符号序列。如果我们能够在其他的应用场景中,构造出一些符号,还有这些符号形成的序列,那我们就可以试一把 word2vec。

下面是,根据网络上的资料,整理的 word2vec 在自然语言处理领域之外的一些应用。

【社交网络】

应用场景:在社交网络中,给当前用户推荐 他/她 可能关注的大V

映射关系:每一个大V 就是一个词;将每个用户关注的大V,按照关注的顺序排列,形成文章

【App 商店】

应用场景:App 商店中,向用户推荐感兴趣的 App

映射关系:每个 App 就是一个词;将每个用户下载的 App,按照下载的顺序排列,形成文章

【广告系统】

应用场景:广告主在媒体网站上打广告,媒体网站提供一个后台管理系统,可以让广告主自行决定要将广告推荐给哪些目标人群。

映射关系:每一个页面就是一个词;将每个用户浏览的页面,按照浏览的顺序排列,形成文章。

这样,根据训练后的词向量,就可以计算出页面之间的相关程度。

那目标用户怎么计算呢?浏览与广告主的广告页 相关的页面 的用户 就是广告主潜在的 目标用户。把这些用户推荐给广告主就可以了。

应用场景:广告系统中广告主上线了一支新广告,如何估算用户对新广告的 CTR(Click-Through-Rate),即点击通过率。

映射关系:和上面给广告主推荐目标用户一样的做法,可以计算出每个广告页对应的向量

然后,对这些广告页做一个聚类,把相似的广告页聚在一个簇中。用新广告所在簇的 CTR 来近似新广告的 CTR。

【向量快速检索】

综合以上各种应用,将各种文档转换成向量之后,常见一个基本操作就是输入一个文档(对应的向量),寻找和它最相关的 top k 个文档(对应的向量)。如果要所有文档都比对一遍的话,那时间复杂度就是 O(n)。这在实际的工程应用中就太慢了。因此,需要借助 redis,或者引入 kd-tree, simhash, 聚类等算法来加速检索。

【 原文链接】http://www.ipaomi.com/2017/09/22/word2vec-在-非-自然语言处理-nlp-领域的应用/

参考:

  1. word2vec在工业界的应用场景
  2. 深度学习word2vec笔记之应用篇
  3. word2vec有什么应用
  4. A non-NLP application of Word2Vec
  5. Word2Vec with Non-Textual Data

转载于:https://www.cnblogs.com/ipaomi/p/7682011.html

word2vec 在 非 自然语言处理 (NLP) 领域的应用相关推荐

  1. 自然语言处理nlp全领域综述

    ************************* 精华总结,时间不够只看这个部分就行了 1.书和课 Michael Collins:COMS W4705: Natural Language Proc ...

  2. NLP:自然语言处理技术领域的代表性算法概述(技术迭代路线图/发展时间路线)、四大技术范式变迁概述(统计时代→大模型时代)、四个时代的技术方法论探究(少数公司可承担的训练成本原因)之详细攻略

    NLP:自然语言处理技术领域的代表性算法概述(技术迭代路线图/发展时间路线).四大技术范式变迁概述(统计时代→大模型时代).四个时代的技术方法论探究(少数公司可承担的训练成本原因)之详细攻略 目录 一 ...

  3. Interview之NLP:人工智能领域求职岗位—自然语言处理NLP算法工程师职位的简介、薪资介绍、知识结构之详细攻略

    Interview之NLP:人工智能领域求职岗位-自然语言处理NLP算法工程师职位的简介.薪资介绍.知识结构之详细攻略 目录 自然语言处理NLP算法工程师的职位简介 1.资讯指数 2.各大公司的具体职 ...

  4. 自然语言处理(NLP)之word2vec的实现(PTB语料库)<找语义相近的词>

    在2013年Google开源了一款用于词向量计算的工具:word2vec,它本身不是一种深度学习之类的模型,是一种用于计算词嵌入的体系结构.实际上大家平时说的这个指代的就是前面介绍过的跳字(元)模型与 ...

  5. 视频教程-2020新版 自然语言处理NLP视频课程Word2Vec GloVe关系挖掘-NLP

    2020新版 自然语言处理NLP视频课程Word2Vec GloVe关系挖掘 6年开发经验,具有丰富的移动端.中台.后端.大数据.NLP.语音生成.图像识别开发经验,团队管理经验:擅长数据架构,NLP ...

  6. 2021年自然语言处理(NLP)算法学习路线!

    NLP近几年非常火,且发展特别快.像BERT.GPT-3.图神经网络.知识图谱等技术应运而生.我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准资 ...

  7. 自然语言处理NLP简介

    自然语言处理NLP简介 NLP简介 1 引言 人工智能.机器学习.深度学习 什么是自然语言处理? 人工智能的流派 2 NLP发展历史 人工智能发展历史 推理期 知识期 学习期 文本的预训练可分为两个重 ...

  8. 自然语言处理NLP中文分词,词性标注,关键词提取和文本摘要

    NLP相关工具包的介绍 1.1 jieba "结巴"中文分词,理念是做最好的 Python 中文分词组件. 支持三种分词模式: (1)精确模式,试图将句子最精确地切开,适合文本分析 ...

  9. [深度学习] 自然语言处理 --- NLP入门指南

    NLP的全称是Natuarl Language Processing,中文意思是自然语言处理,是人工智能领域的一个重要方向 自然语言处理(NLP)的一个最伟大的方面是跨越多个领域的计算研究,从人工智能 ...

最新文章

  1. IE6左右边框断线现象
  2. 模板使用自定义类型_「Shopify模板」Shopify模板编辑Shopify模板代码更改教程
  3. 9种高性能高可用高并发的技术架构
  4. php js date 格式化,javascript date格式化示例_javascript技巧
  5. 04.卷积神经网络 W3.目标检测
  6. BZOJ 4810 [Ynoi2017]由乃的玉米田(莫队+bitset)
  7. uboot的readme导读(转)
  8. 数字化转型方法论_老板让我搞数字化转型?成功之后,我整理了这套超全的方法论...
  9. linux 间隔时间中断测试
  10. 【李宏毅2020 ML/DL】P112-114 Q-Learning: Introduction Tips Continuous Actions
  11. 联想IBM服务器装系统教程,联想thinkpad系统安装攻略 每一个步骤都有
  12. TimesTen Classic 18c 卸载 (uninstall)全过程
  13. Flash CS3:FLV视频短片我来做!
  14. 街头篮球服务器未响应,肝的飞起 《街头篮球》魔王试炼FAQ
  15. 微信小程序图片(头像)裁剪工具we-cropper含2d版-完整版
  16. 非常详细的 navigationController 的使用
  17. java的class文件批量反编译成java
  18. Python脚本自动化备份飞塔,华为,思科等设备配置文件。
  19. 免费创建微信公众号全攻略(转载)
  20. java徽章_荣誉勋章_JAVA游戏免费版下载_7723手机游戏[www.7723.cn]

热门文章

  1. numpy 归一化_图卷积网络到底怎么做,这是一份极简的Numpy实现
  2. Python入门--常用的内置模块
  3. 不能随意切换的Tab选项卡页面
  4. IP地址的分类和层次
  5. 试题18 四平方和(枚举法)
  6. 常见危险函数和特殊函数(二)----变量覆盖
  7. AC自动机(HDU 2222: Keywords Search)
  8. string类型的数字字符串直接转换成int型方法
  9. Docker Swarm 使用
  10. python数据存储系列教程——python中mysql数据库操作:连接、增删查改、指令执行