Incorporating Lexical Priors into Topic Models(即交互式主题模型的应用)论文阅读
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。
未经本人允许禁止转载。
文章目录
- 论文来源
- 应用场景及模型
- 第一个模型
- 第二个模型
- 第三个模型
- 模型应用
论文来源
论文来自于自然语言处理会议ACL
Jagarlamudi J, Daumé III H, Udupa R. Incorporating lexical priors into topic models[C]//Proceedings of the 13th Conference of the European Chapter of the Association for Computational Linguistics. Association for Computational Linguistics, 2012: 204-213.
这篇论文中,提供了三个模型,都是交互式主题模型,该篇论文的模型在一些管理学顶级期刊上的论文中,皆有看到。例如:
Puranam D, Narayan V, Kadiyali V. The effect of calorie posting regulation on consumer opinion: a flexible Latent Dirichlet Allocation model with informative priors[J]. Marketing Science, 2017, 36(5): 726-746.
Toubia O, Iyengar G, Bunnell R, et al. Extracting Features of Entertainment Products: A Guided Latent Dirichlet Allocation Approach Informed by the Psychology of Media Consumption[J]. Journal of Marketing Research, 2018: 0022243718820559.
应用场景及模型
交互式主题模型,个人认为只适应于科研领域,对于工业领域肯定不行。原因是其需要用户提供一些内容,例如种子词汇。但对于科研来说,其优势很大,主要是其可以使获得的主题更具意义,更有说明性(这对论文的创新点很有帮助)。
第一个模型
在作者的论文中,一共提供了三个模型。
这是第一个模型,其可以对每个主题的词汇初始化,即设置一些词汇(主要针对的是主题词分布)。模型的生成过程较为简单,如下图所示:
在这里需要注意的是,主题模型产生的主题数目并不是2T2T2T,而还是TTT个主题。即下图标红的地方最后还是要合并的。
合并公式如下:
第二个模型
第二个模型,针对的是文档的主题分布。模型如下:
其生成过程如下:
这里一个非常重要的点,是引入了group的概念。
第三个模型
作者的第三个模型是前两个模型的结合体。
模型应用
该模型,在18年被应用到管理学顶刊上,如下:
Toubia O, Iyengar G, Bunnell R, et al. Extracting Features of Entertainment Products: A Guided Latent Dirichlet Allocation Approach Informed by the Psychology of Media Consumption[J]. Journal of Marketing Research, 2018: 0022243718820559.
其主要动机如下:
即利用第一个模型,生成娱乐产品的主题词分布。在应用模型的过程中,作者使用了心理学的内容,即主题和种子词汇来源与正向心理学划分。使用该模型,可以得到每个电影的主题分布,之后作者利用这个主题分布,来作为content-based/hybrid方法的输入。
Incorporating Lexical Priors into Topic Models(即交互式主题模型的应用)论文阅读相关推荐
- 【论文笔记8】Tree-Structured Neural Topic Model (分层神经主题模型 / TSNTM)
Tree-Structured Neural Topic Model 树结构的神经主题模型 论文概述 题目:Tree-Structured Neural Topic Model 作者:Masaru I ...
- 论文:lda2vev:Mixing Dirichlet Topic Models and Word Embeddings to Make lda2vec
lda2vev:Mixing Dirichlet Topic Models and Word Embeddings to Make lda2vec 论文概述 ABSTRACT Introduction ...
- 论文阅读《Bidirectional LSTM-CRF Models for Sequence Tagging》
论文地址:<Bidirectional LSTM-CRF Models for Sequence Tagging> 文章目录 论文阅读 研究背景 BI-LSTM-CRF 网络 训练流程 实 ...
- 主题模型简介(Topic Models)
主题模型简介(Topic Models) 要想更好地管理当今爆炸式的电子文档档案,需要使用新的技术或工具来处理自动组织.搜索.索引和浏览大型电子文档集合.在当今机器学习和统计学研究的基础上,利用层次概 ...
- 主题模型(topic models)总结
主题模型(topic models)总结 相关主题模型(CTM)是一种用于自然语言处理和机器学习的统计模型.相关主题模型(CTM)用于发现一组文档中显示的主题. CTM的关键是logistic正态分布 ...
- 主题模型(topic models)解释及评估
主题模型(topic models)解释及评估 目录 主题模型(topic models)解释及评估 主题解释及评估 展示主题 标记主题<
- 词袋模型(bag of words)构建并使用主题模型(topic models)特征进行文本聚类分析(clustering analysis)实战
词袋模型(bag of words)构建并使用主题模型(topic models)特征进行文本聚类分析(clustering analysis)实战 目录
- Dynamic Topic Models的Python实现
Dynamic Topic Models的Python实现 Dynamic Topic Models(DTM)简介 Dynamic Topic Models的实现 数据与预处理 Python实现 Dy ...
- 主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流. 未经本人允许禁止转载. 论文来源 Nguyen D Q, Billingsley ...
最新文章
- Microbiome:利用Nanopore高通量测序技术解析污水处理体系可移动抗性基因组(一作解读)
- 浅析枚举类型(Enumerated types)
- 记录一个SpringBoot集成邮件及工具类博客
- Hadoop学习笔记(一):零Linux基础安装hadoop过程笔记
- 4.8_adapter_结构型模式:适配器模式
- java url dns_JAVA反序列化-ysoserial-URLDNS
- c++常用代码(持续更新)
- 帧大小超过交换机mtu_三层交换机与路由器区别在哪里?
- 学***必去的网站“***基地”
- WPF教程(三十四)Hello, bound world!
- Java实现数组反转
- 由于系统限制了文件目录的读/写权限,程序将会退出,你可以重新安装百度网盘到有权限的目录或以管理员身份运行百度网盘。
- 富贵电玩 富贵旺旺 富贵精华版 富贵3 后门 格机问题研究
- word通配符,查找与替换
- 中国博士生数量增长太快将会导致博士就业难
- html excel 在线查看,web在线查看服务器的Excel文件
- 【微信小程序调用百度API实现图像识别功能】----项目实战
- 在java中jkd中文意思_Java JDK是什么意思?有什么作用?
- php 随机获取字母,PHP获取随机数字和字母的步骤大全
- 企业微信版本更新(4.0.0.6003)