时间总是不够用,这里就不自己写了,摘自一篇转发的博客,感觉挺有用!

一个大牛写的介绍,貌似需FQ

http://tedunderwood.wordpress.com/2012/04/07/topic-modeling-made-just-simple-enough/

David M.Blei主页:http://www.cs.princeton.edu/~blei/publications.html,上面有布雷最新的文章:Introduction to probabilistic topic models

以下内容来自网络,但是作者已经不可考啦,抱歉没法找到原始引用

关于LDA并行化:
那么若利用MapReduce实现,怎样的近似方法好呢?
斯坦福的ScalaNLP项目值得一看:
http://nlp.stanford.edu/javanlp/scala/scaladoc/scalanlp/cluster/DistributedGibbsLDA$object.html
另外还有NIPS2007的论文:
Distributed Inference for Latent DirichletAllocation http://books.nips.cc/papers/files/nips20/NIPS2007_0672
ICML2008的论文:
Fully Distributed EM for Very Large Datasetshttp://www.cs.berkeley.edu/~jawolfe/pubs/08-icml-em

LDA和HLDA:
(1)D. M. Blei, et al., "Latent Dirichlet allocation," Journal of Machine Learning Research, vol. 3, pp. 993-1022, 2003.
(2)T. L. Griffiths and M. Steyvers, "Finding scientific topics," Proceedings of the National Academy of Sciences, vol. 101, pp. 5228-5235, 2004.
(3)D. M. Blei, et al., "Hierarchical Topic Models and the Nested Chinese Restaurant Process," NIPS, 2003.
(4)Blei的LDA视频教程:http://videolectures.net/mlss09uk_blei_tm/
(5)Teh的关于Dirichlet Processes的视频教程:http://videolectures.net/mlss07_teh_dp/
(6)Blei的毕业论文:http://www.cs.princeton.edu/~blei/papers/Blei2004.pdf
(7)Jordan的报告:http://www.icms.org.uk/downloads/mixtures/jordan_talk.pdf
(8)G. Heinrich, "Parameter Estimation for Text Analysis," http://www.arbylon.net/publications/text-est.pdf
基础知识:
(1)P. Johnson and M. Beverlin, “Beta Distribution,” http://pj.freefaculty.org/ps707/Distributions/Beta.pdf
(2)M. Beverlin and P. Johnson, “The Dirichlet Family,” http://pj.freefaculty.org/stat/Distributions/Dirichlet.pdf
(3)P. Johnson, “Conjugate Prior and Mixture Distributions”, http://pj.freefaculty.org/stat/TimeSeries/ConjugateDistributions.pdf
(4)P.J. Green, “Colouring and Breaking Sticks:Random Distributions and Heterogeneous Clustering”, http://www.maths.bris.ac.uk/~mapjg/papers/GreenCDP.pdf
(5)Y. W. Teh, "Dirichlet Process", http://www.gatsby.ucl.ac.uk/~ywteh/research/npbayes/dp.pdf
(6)Y. W. Teh and M. I. Jordan, "Hierarchical Bayesian Nonparametric Models with Applications,”
http://www.stat.berkeley.edu/tech-reports/770.pdf
(7)T. P. Minka, "Estimating a Dirichlet Distribution", http://research.microsoft.com/en-us/um/people/minka/papers/dirichlet/minka-dirichlet.pdf
(8)北邮论坛的LDA导读:[导读]文本处理、图像标注中的一篇重要论文Latent Dirichlet Allocation,http://bbs.byr.edu.cn/article/PR_AI/2530?p=1
(9)Zhou Li的LDA Note:http://lsa-lda.googlecode.com/files/Latent Dirichlet Allocation note.pdf
(10)C. M. Bishop, “Pattern Recognition And Machine Learning,” Springer, 2006.
代码:
(1)Blei的LDA代码(C):http://www.cs.princeton.edu/~blei/lda-c/index.html
(2)BLei的HLDA代码(C):http://www.cs.princeton.edu/~blei/downloads/hlda-c.tgz
(3)Gibbs LDA(C++):http://gibbslda.sourceforge.net/
(4)Delta LDA(Python):http://pages.cs.wisc.edu/~andrzeje/research/deltaLDA.tgz
(5)Griffiths和Steyvers的Topic Modeling工具箱:http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm
(6)LDA(Java):http://www.arbylon.net/projects/
(7)Mochihashi的LDA(C,Matlab):http://chasen.org/~daiti-m/dist/lda/
(8)Chua的LDA(C#):http://www.mysmu.edu/phdis2009/freddy.chua.2009/programs/lda.zip
(9)Chua的HLDA(C#):http://www.mysmu.edu/phdis2009/freddy.chua.2009/programs/hlda.zip
其他:
(1)S. Geman and D. Geman, "Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images," Pattern Analysis and Machine Intelligence, IEEE Transactions on, vol. PAMI-6, pp. 721-741, 1984.
(2)B. C. Russell, et al., "Using Multiple Segmentations to Discover Objects and their Extent in Image Collections," in Computer Vision and Pattern Recognition, 2006 IEEE Computer Society Conference on, 2006, pp. 1605-1614.
(3)J. Sivic, et al., "Discovering objects and their location in images," in Computer Vision, 2005. ICCV 2005. Tenth IEEE International Conference on, 2005, pp. 370-377 Vol. 1.
(4)F. C. T. Chua, "Summarizing Amazon Reviews using Hierarchical Clustering," http://www.mysmu.edu/phdis2009/freddy.chua.2009/papers/amazon.pdf
(5)F. C. T. Chua, "Dimensionality Reduction and Clustering of Text Documents,” http://www.mysmu.edu/phdis2009/freddy.chua.2009/papers/probabilisticIR.pdf
(6)D Bacciu, "Probabilistic Generative Models for Machine Vision," http://www.math.unipd.it/~sperduti/AI09/bacciu_unipd_handouts.pdf

【转】 LDA必读的资料相关推荐

  1. 我爱机器学习--机器学习方向资料汇总

    转载:http://blog.csdn.net/shuimanting520/article/details/45748505 机器学习爱好者资料 机器学习领域的几种主要学习方式 From Stump ...

  2. 产品经理入门到大神的资料全推荐

    菁菁小提示:谢谢晓生的推荐书单,有了它再也不用去问产品经理应该看那些书籍和浏览那些网站了,需要的伙伴们记得打包拎回家... 大约两年前整理的资料库,有一段时间关闭了这个页面.发现很多新人对这类资料有很 ...

  3. 我爱机器学习网机器学习类别文章汇总

    机器学习领域的几种主要学习方式 From Stumps to Trees to Forests KDD-2014 – The Biggest, Best, and Booming Data Scien ...

  4. 强烈推荐给从事IT业的同行们 (转载)

    作者:李学凌   文章来源:bbs.ustc.edu.cn 中国有很多小朋友,他们18,9岁或21,2岁,通过自学也写了不少代码,他们有的代码写的很漂亮,一些技术细节相当出众,也很有钻研精神,但是他们 ...

  5. 玩转 Rockchip 的开发板,这些信息你要知道

    RK 的处理器 Rockchip 在江湖中简称 RK,是一家总部坐落于福建福州的 SOC 设计公司. RK  基于 Arm cortex-A 内核设计的一系列 SOC ,宛如苍穹中一颗颗明星,在国内外 ...

  6. 一个合格的程序员所具备的素质和修养

    程序员基本素质: 作一个真正合格的程序员,或者说就是可以真正合格完成一些代码工作的程序员,应该 具有的素质. 1:团队精神和协作能力 把它作为基本素质,并不是不重要,恰恰相反,这是程序员应该具备的最基 ...

  7. 巴菲特致股东的一封信:2002年

    原文请参考:http://www.伯克希尔hathaway.com/letters/2014ltr.pdf 学习心得: 全文如下 致伯克希尔公司全体股东: 本公司2002年的净值增加了61亿美元,每股 ...

  8. VC知识库的一篇文章

    给浮躁的软件业同仁 转载自:VC知识库的文章 版权所有:不知道 以下文章都是经典,看不看随你的便,我只希望知识掌握在更多中国人的手里! 中国有很多小朋友,他们18,9岁或 21,2 岁,通过自学也写了 ...

  9. 如何学Python?--捕蛇者说

    如何学Python? Posted on 2017年12月28日 by laixintao 21 Comments 很多人问过我"怎么开始学Python?","Pytho ...

最新文章

  1. debian10 Unable to correct problems, you have held broken packages.
  2. git diff Git查看版本改动
  3. 多视图几何总结——从本质矩阵恢复摄像机矩阵
  4. 重装Nodejs后,webstorm代码报错问题
  5. Linux下网卡绑定模式
  6. 如何通过mac地址找到设备_如何通过 Apple Watch 解锁 Mac
  7. 世界杯29场点球大战的269个点球数据都在这里!霍金的公式帮了英格兰吗?
  8. 【Deep Learning 二】课程一(Neural Networks and Deep Learning),第二周(Basics of Neural Network programming)答案
  9. Windows10安装sql2016配置iis问题
  10. 高通QCC3020应用开发的软件平台的搭建
  11. WordCloud库的使用
  12. php 0xc0000135,php 错误代码 0xc0000135是什么情况
  13. Python走心的42个代码例子
  14. vnc远程软件,四款值得使用的vnc远程软件推荐
  15. velocity模板大小写转换
  16. 移植mysql到安卓手机_记录dbnet文本检测转ncnn并移植到安卓上
  17. Java程序:停车场计费
  18. arm+银河麒麟v10安装nginx1.18
  19. 趣学算法NYOJ加勒比海盗船
  20. 3w服务器把信息组织成为,网站前面的www是什么意思?

热门文章

  1. 让Squid 显示本地时间
  2. Sarg安装配置使用
  3. 一些实用的 Javascript 代码
  4. WMI技术介绍和应用——Instance/Method Provider
  5. 吴恩达老师深度学习视频课笔记:人脸识别
  6. Windows和Linux下通用的线程接口
  7. linux那个11命令是什么意思,11个有用的Linux命令
  8. linux的自定义input,Linux Input子系统之第一篇(input_dev/input_handle/input_handler)
  9. 随机森林 java_机器学习weka,java api调用随机森林及保存模型
  10. 机器人瓦力船长机器人_警察“瓦力”来啦!机器人巡逻南京路 这样的它你喜欢吗?...