http://www.52ml.net/1917.html

主题模型LDA(latent dirichlet allocation)的应用还是很广泛的,之前我自己在检索、图像分类、文本分类、用户评论的主题词抽取等都用过,做feature、降维等。例如可以用主题维度来表示原来的字典维度,大大的降低了文本表示的维度。这其实也很deep learning中的对特征的抽象有点相似,通过一些聚类等的思想,将一些细粒度的特征组合到一个新的空间上去,例如主题空间。

而且GibbsSampling的LDA实现也相对容易,可以参考一些代码。

最近看微博上 志飞Google 发起的帖子,大多业界用lda或者plsa的都表态了。腾讯的rickjin等。摘录一些,大家以后遇到类似的问题可以尝试下topic model。

===

rickjin :PLSA 和 LDA 在广告系统中做文本语义相似度的计算还是可以的,至少能保证弱语义相关性。另外,我们把 LDA inference 出来的 topic 用在了文本分类器中做feature, 可以显著的提升分类器的 precission/recall

机器学习那些事儿 :在计算搜索query相似度时直接采用LSA了,因为SVD的效率在工业界已经很成熟。//@rickjin :回复 @志飞Google :哦, 没有说清楚, 我指的是弱语义关联,比如 LDA 可以有效的用于计算 "柯南" 和 "火影忍者" 这两个 query 的相似度

机器学习那些事儿 :打个比方,有1000万个样本,只用learning的100个topic做feature,结果可想而知// @余凯_西二旗民工 :只用topic分类,效果不好,尤其是在训练样本多的时候。// @老师木 : 只用topic作文本分类,效果怎样。

李沐mu :有公司用lda做cookie做user group,然后当feature用,效果挺好/ @洪亮劼 : 目前正在做LDA在大规模user profiling + personalization的工作。

张栋_机器学习 :PLSA (dirichlet prior = zero 的 LDA)还是很实用的,我们用它解过几个工业界的问题

袁全V :我们在广告中在用lda做cookie-url grouping, 最近在尝试用来发现长尾语义

苏劲松XMUNLP :baidu好像把plsa用得挺好的,lda就不知道了。

转载于:https://www.cnblogs.com/DjangoBlog/p/6210663.html

LDA(latent dirichlet allocation)的应用相关推荐

  1. gensim实现LDA(Latent Dirichlet Allocation)算法提取主题词(topic)

     Latent Dirichlet Allocation(LDA) 隐含分布作为目前最受欢迎的主题模型算法被广泛使用.LDA能够将文本集合转化为不同概率的主题集合.需要注意的是LDA是利用统计手段对主 ...

  2. R语言文本主题模型之潜在语义分析(LDA:Latent Dirichlet Allocation)

    文本分析:主题建模 library(tidyverse) theme_set( theme_bw()) 目标 定义主题建模 解释Latent Dirichlet以及此过程的工作原理 演示如何使用LDA ...

  3. LDA: 从头到尾彻底理解LDA (Latent Dirichlet Allocation)

    小记: 很长一段时间没有更新博客了,因为工作比较忙,也没有回答一些朋友的问题, 非常抱歉. 这篇LDA的总结已经写好了有三个多月, 一直没有时间发到CSDN上, 今天周末, 本来打算在很火爆的国内MO ...

  4. 自然语言处理NLP之主题模型、LDA(Latent Dirichlet Allocation)、语义分析、词义消歧、词语相似度

    主题模型 主题模型旨在文章中找到一种结构,学习到这种结构后,一个主题模型可以回答以下这样的问题.X文章讨论的是什么?X文章和Y文章直接有多相似?如果我对Z文章感兴趣我应该先读那些文章?什么是主题?主题 ...

  5. 简单易学的机器学习算法——Latent Dirichlet Allocation(理论篇)

    引言 LDA(Latent Dirichlet Allocation)称为潜在狄利克雷分布,是文本语义分析中比较重要的一个模型,同时,LDA模型中使用到了贝叶斯思维的一些知识,这些知识是统计机器学习的 ...

  6. 潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(三)

    潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(三) 目录 潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(三) 主题演 ...

  7. 潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(二)

    潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(二) 目录 潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(二) LDA ...

  8. 潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(一)

    潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(一) 目录 潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型(一) LDA ...

  9. 潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)

    文章目录 1. 狄利克雷分布 2. 潜在狄利克雷分配模型 3. 学习推理 4. sklearn.decomposition.LatentDirichletAllocation 潜在狄利克雷分配(lat ...

  10. LDA(Latent Dirichlet allocation)

    目录 1. 贝叶斯网络 2. 主题模型 2.1 主题模型的直观理解 2.2 共轭先验分布 2.3 二项分布及其共轭先验--Beta分布 2.3.1 Bete分布 2.3.2 二项分布与其先验分布 2. ...

最新文章

  1. c语言的特点能够编制出复杂的功能程序,以下不是C语言的特点的是()
  2. finalshell Linux 传输文件 xftp
  3. 【洛谷P1816 忠诚】线段树
  4. openssl java使用手册_openssl使用手册
  5. Java内存原型分析:基本知识
  6. 9.proc目录下的文件和目录详解
  7. benchmark问题_使用U盘来掩盖CEPH IO性能低下的问题
  8. 鸿蒙官网什么样,鸿蒙系统推广,结果会怎么样?
  9. 基于机器视觉的玻璃Mark点字符识别
  10. js window.onload 加载多个函数的两种方法
  11. 第7章 XSL高级应用
  12. 河北等保测评机构项目测评收费价格标准参考
  13. 【其他】笔记本的辐射有多大?
  14. matlab解方java_在matlab中求解欠定方程组
  15. HDU5855 Less Time, More profit(最大权闭合图)
  16. 年中Flag挑战日榜:最终挑战王会花落谁家?
  17. NOIP 2015 简记
  18. 什么是favicon.ico,以及如何使用它
  19. MySQL加锁处理分析--何登成
  20. 加拿大存储厂商将在二战掩体中建设云数据中心

热门文章

  1. java 富文本 xss_Jsoup 防止富文本 XSS 攻击
  2. Redis的安装(windows)
  3. 求解偏微分方程开源有限元软件deal.II学习--Step 37
  4. 求解偏微分方程开源有限元软件deal.II学习--Step 11
  5. [BZOJ5329] [SDOI2018] 战略游戏
  6. CentOS 7.4 上如何安装 tomcat 9
  7. python全栈学习--day13(迭代器,生成器)
  8. 【探路者】10月16日立会报告(团队第1周-第3次)
  9. 【转】Using hash_map on GCC
  10. 【转】那些令人喷饭的注释