word2vec 在 非 自然语言处理 (NLP) 领域的应用
word2vec 本来就是用来解决自然语言处理问题的,它在 NLP 中的应用是显然的。
比如,你可以直接用它来寻找相关词、发现新词、命名实体识别、信息索引、情感分析等;你也可以将词向量作为其他模型的输入,用于诸如文本分类、聚类等各种自然语言处理问题。
事实上,word2vec 的思想和工具,还可以应用于自然语言处理之外的其他领域。一个词,无非就是个符号;句子是词的序列,无非也就是个符号序列。如果我们能够在其他的应用场景中,构造出一些符号,还有这些符号形成的序列,那我们就可以试一把 word2vec。
下面是,根据网络上的资料,整理的 word2vec 在自然语言处理领域之外的一些应用。
【社交网络】
应用场景:在社交网络中,给当前用户推荐 他/她 可能关注的大V
映射关系:每一个大V 就是一个词;将每个用户关注的大V,按照关注的顺序排列,形成文章
【App 商店】
应用场景:App 商店中,向用户推荐感兴趣的 App
映射关系:每个 App 就是一个词;将每个用户下载的 App,按照下载的顺序排列,形成文章
【广告系统】
应用场景:广告主在媒体网站上打广告,媒体网站提供一个后台管理系统,可以让广告主自行决定要将广告推荐给哪些目标人群。
映射关系:每一个页面就是一个词;将每个用户浏览的页面,按照浏览的顺序排列,形成文章。
这样,根据训练后的词向量,就可以计算出页面之间的相关程度。
那目标用户怎么计算呢?浏览与广告主的广告页 相关的页面 的用户 就是广告主潜在的 目标用户。把这些用户推荐给广告主就可以了。
应用场景:广告系统中广告主上线了一支新广告,如何估算用户对新广告的 CTR(Click-Through-Rate),即点击通过率。
映射关系:和上面给广告主推荐目标用户一样的做法,可以计算出每个广告页对应的向量
然后,对这些广告页做一个聚类,把相似的广告页聚在一个簇中。用新广告所在簇的 CTR 来近似新广告的 CTR。
【向量快速检索】
综合以上各种应用,将各种文档转换成向量之后,常见一个基本操作就是输入一个文档(对应的向量),寻找和它最相关的 top k 个文档(对应的向量)。如果要所有文档都比对一遍的话,那时间复杂度就是 O(n)。这在实际的工程应用中就太慢了。因此,需要借助 redis,或者引入 kd-tree, simhash, 聚类等算法来加速检索。
【 原文链接】http://www.ipaomi.com/2017/09/22/word2vec-在-非-自然语言处理-nlp-领域的应用/
参考:
- word2vec在工业界的应用场景
- 深度学习word2vec笔记之应用篇
- word2vec有什么应用
- A non-NLP application of Word2Vec
- Word2Vec with Non-Textual Data
转载于:https://www.cnblogs.com/ipaomi/p/7682011.html
word2vec 在 非 自然语言处理 (NLP) 领域的应用相关推荐
- 自然语言处理nlp全领域综述
************************* 精华总结,时间不够只看这个部分就行了 1.书和课 Michael Collins:COMS W4705: Natural Language Proc ...
- NLP:自然语言处理技术领域的代表性算法概述(技术迭代路线图/发展时间路线)、四大技术范式变迁概述(统计时代→大模型时代)、四个时代的技术方法论探究(少数公司可承担的训练成本原因)之详细攻略
NLP:自然语言处理技术领域的代表性算法概述(技术迭代路线图/发展时间路线).四大技术范式变迁概述(统计时代→大模型时代).四个时代的技术方法论探究(少数公司可承担的训练成本原因)之详细攻略 目录 一 ...
- Interview之NLP:人工智能领域求职岗位—自然语言处理NLP算法工程师职位的简介、薪资介绍、知识结构之详细攻略
Interview之NLP:人工智能领域求职岗位-自然语言处理NLP算法工程师职位的简介.薪资介绍.知识结构之详细攻略 目录 自然语言处理NLP算法工程师的职位简介 1.资讯指数 2.各大公司的具体职 ...
- 自然语言处理(NLP)之word2vec的实现(PTB语料库)<找语义相近的词>
在2013年Google开源了一款用于词向量计算的工具:word2vec,它本身不是一种深度学习之类的模型,是一种用于计算词嵌入的体系结构.实际上大家平时说的这个指代的就是前面介绍过的跳字(元)模型与 ...
- 视频教程-2020新版 自然语言处理NLP视频课程Word2Vec GloVe关系挖掘-NLP
2020新版 自然语言处理NLP视频课程Word2Vec GloVe关系挖掘 6年开发经验,具有丰富的移动端.中台.后端.大数据.NLP.语音生成.图像识别开发经验,团队管理经验:擅长数据架构,NLP ...
- 2021年自然语言处理(NLP)算法学习路线!
NLP近几年非常火,且发展特别快.像BERT.GPT-3.图神经网络.知识图谱等技术应运而生.我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准资 ...
- 自然语言处理NLP简介
自然语言处理NLP简介 NLP简介 1 引言 人工智能.机器学习.深度学习 什么是自然语言处理? 人工智能的流派 2 NLP发展历史 人工智能发展历史 推理期 知识期 学习期 文本的预训练可分为两个重 ...
- 自然语言处理NLP中文分词,词性标注,关键词提取和文本摘要
NLP相关工具包的介绍 1.1 jieba "结巴"中文分词,理念是做最好的 Python 中文分词组件. 支持三种分词模式: (1)精确模式,试图将句子最精确地切开,适合文本分析 ...
- [深度学习] 自然语言处理 --- NLP入门指南
NLP的全称是Natuarl Language Processing,中文意思是自然语言处理,是人工智能领域的一个重要方向 自然语言处理(NLP)的一个最伟大的方面是跨越多个领域的计算研究,从人工智能 ...
最新文章
- IE6左右边框断线现象
- 模板使用自定义类型_「Shopify模板」Shopify模板编辑Shopify模板代码更改教程
- 9种高性能高可用高并发的技术架构
- php js date 格式化,javascript date格式化示例_javascript技巧
- 04.卷积神经网络 W3.目标检测
- BZOJ 4810 [Ynoi2017]由乃的玉米田(莫队+bitset)
- uboot的readme导读(转)
- 数字化转型方法论_老板让我搞数字化转型?成功之后,我整理了这套超全的方法论...
- linux 间隔时间中断测试
- 【李宏毅2020 ML/DL】P112-114 Q-Learning: Introduction Tips Continuous Actions
- 联想IBM服务器装系统教程,联想thinkpad系统安装攻略 每一个步骤都有
- TimesTen Classic 18c 卸载 (uninstall)全过程
- Flash CS3:FLV视频短片我来做!
- 街头篮球服务器未响应,肝的飞起 《街头篮球》魔王试炼FAQ
- 微信小程序图片(头像)裁剪工具we-cropper含2d版-完整版
- 非常详细的 navigationController 的使用
- java的class文件批量反编译成java
- Python脚本自动化备份飞塔,华为,思科等设备配置文件。
- 免费创建微信公众号全攻略(转载)
- java徽章_荣誉勋章_JAVA游戏免费版下载_7723手机游戏[www.7723.cn]