本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。
未经本人允许禁止转载

论文来源

Das R, Zaheer M, Dyer C. Gaussian lda for topic models with word embeddings[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers). 2015, 1: 795-804.

这篇论文发在15年的计算机顶会ACL上,作者来自于卡内基梅隆。

简介

连续的词嵌套模型学习海量的非结构化文本效果非常好,适应于很多自然语言处理任务。在作者的这篇文章中,作者将LDA中词的生成部分换成了多元高斯分布,并采用了一种快速的collapsed Gibbs sampling算法来求解模型。

普通的LDA简介我就不过多介绍了,想了解的请看我之前的相关博客介绍。其生成方式如下:

论文理解











说明

这里涉及到许多贝叶斯公式推理方面的知识,建议大家参考以下内容:
1、《LDA数学八卦》
2、Griffiths T. Gibbs sampling in the generative model of latent dirichlet allocation[J]. 2002.
3、Murphy K P. Conjugate Bayesian analysis of the Gaussian distribution[J]. def, 2007【这个相当好,提供了大量的与高斯分布先验后验的推理细节
4、Bayesian_Data_Analysis,Third_Edition_(Andrew_Gelman)【一本非常学习贝叶斯数据分析非常不错的书籍】

代码详解

Gaussian LDA(高斯LDA)简介相关推荐

  1. LDA主题模型简介及Python实现

    一.LDA主题模型简介 LDA主题模型主要用于推测文档的主题分布,可以将文档集中每篇文档的主题以概率分布的形式给出根据主题进行主题聚类或文本分类. LDA主题模型不关心文档中单词的顺序,通常使用词袋特 ...

  2. Laplacian of Gaussian (LOG) 高斯拉普拉斯算子

    Laplacian(拉普拉斯)是对于一张图像的二阶空间导数上各向同性的测量.一张图像的Laplacian会显示出intensity(亮度) 剧烈变化的区域,所以经常用作边缘检测. 一幅图像的拉普拉斯变 ...

  3. 图像算法:Difference of Gaussian(DOG) 高斯函数差分

    概念 Difference of Gaussian(DOG)是高斯函数的差分. 它是可以通过将图像与高斯函数进行卷积得到一幅图像的低通滤波结果,即去噪过程, 这里的Gaussian和高斯低通滤波器的高 ...

  4. 【论文笔记 1】On-Line LDA 在线LDA模型

    On-Line LDA: Adaptive Topic Models for Mining Text Streams with Applications to Topic Detection and ...

  5. LDA︱基于LDA的Topic Model变形+一些NLP开源项目

    一.LDA的变形 转载于:转:基于LDA的Topic Model变形 Topic Model最适合的变种是加入先验信息: 我相信题主使用的是完全无监督的Topic Model,然而这实在是过于不wor ...

  6. 【LDA】LDA主题模型笔记—主要是狄利克雷

    d表示文章,z表示主题,w表示单词 这里意思是,狄利克雷先验分布 产生 一组 多项式分布集合 也就是说 狄利克雷分布 产生 主题分布 (也就是doc-topic分布)(超参数 α \alpha α情况 ...

  7. lda php,LDA主题分析代码实现

    主题文本分析: 首先读取txt文本,并删除stop_list中存放的停止词汇 f = open('..\\LDA_test.txt') texts = [[word for word in line. ...

  8. LDA模型简介及应用

    这里写自定义目录标题 一.LDA模型简介 简述LDA生成过程 LDA整体流程 LDA的核心公式 二.LDA模型应用 一.LDA模型简介 LDA模型指隐含狄利克雷分布(Latent Dirichlet ...

  9. python朴素贝叶斯调参_邹博机器学习升级版II附讲义、参考书与源码下载(数学 xgboost lda hmm svm)...

    课程介绍 本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现(Python).如何做算法的参数调试.以实际应用案例分析各种算法的选择等. 1.每个算法模块按照"原理 ...

最新文章

  1. Java高级特性:clone()方法
  2. python中的os操作文件,文件路径
  3. 转:Dubbo与Zookeeper、SpringMVC整合和使用(负载均衡、容错)
  4. Linux的用户管理
  5. Mongodb 3.0 创建用户
  6. nginx基于htpasswd安全验证
  7. 手机号正则和邮箱正则,常用正则解释
  8. Matlab linspace函数C++实现
  9. 【那些年踩过的坑】服务器配环境:Ubuntu 16.04 + Titan Xp + CUDA 9.0 + cuDNN 7.1 + Tensorflow + Pytorch + MXNet
  10. 国内怎么使用chatGpt
  11. Android事件分发机制浅析
  12. Kotlin全套视频教程分享
  13. jsp铁路交通查询系统
  14. 嵌入式系统开发笔记78:电话、电报发明给予我们的启示
  15. SpringCloud Stream多源的使用
  16. c语言递归求和函数,c语言递归算法怎么实现
  17. 创意红色祥云中国风PPT模板
  18. android应用编译失败 ResXMLTree_node size 类错误,以及 android studio 项目内搜索
  19. java aws s3 文件上传_java-用于在S3中上传文件并在DB中写入记录的AWS API
  20. 阿里云如何解析域名,阿里云域名解析最新教程

热门文章

  1. Oracle数据恢复、数据库恢复、灾难恢复专题
  2. Hibernate初学者教程
  3. 消息队列面试 - 如何进行消息队列架构设计?
  4. debian 9.4 安装教程 linux系统debian9.4图文详细安装步骤
  5. java 课后习题 编写判断从键盘输入的字符串是否为回文
  6. 刷新echart控件
  7. 为什么我们需要Q#?
  8. C#LeetCode刷题之#443-压缩字符串​​​​​​​(String Compression)
  9. struts2中Action名称的搜索顺序
  10. EasyUI中文帮助文档