郑昀 201012

很少转载其他人的博文,但此位来自于QQ阅读团队的“啃饼随笔”博客,一直在撰写AI、文本挖掘、文本分类以及一些方法论方面的心得体会,尤其是本月初在玩聚网被连续关闭(第一财经周刊用封面故事《保证书的世界》报道了此事)(我也荣幸地成为了“北京开关厂厂长”)之后,啃饼博客针对玩聚网写了案例分析,把玩聚网创建以来的技术和产品路线做了一个回顾,也算是为玩聚网支持者和我们做了一个精彩点评。下面为他的全文(原文链接):

+++++++++++++++++++++++++++++++++

啃饼 2010年12月02日

下面是玩聚网自成立以来推出的各种产品,以及和它类似的产品。先大概看看,然后我再说。

产品名(起始年份):描述(涉及的技术点)

热点自动发现:文本相似性计算、层次聚类、特征向量空间等

  • 热点聚合(2007.1):国内主流博客服务提供商(热点自动发现)
  • 热点聚合(2007.4):草根评论自动聚合(热点自动发现)
  • 热点聚合(2007.7):草根图片自动聚合(热点自动发现)
  • 热点聚合(2007.8):国内主流论坛(热点自动发现)
  • 热点聚合(2007.9):国内主流科技新闻媒体(热点自动发现)
  • 宝聚-股市风向标(2007.11):股票(智能语义聚合应用框架垂直应用)
  • 热点聚合(2007.12):关联视频自动聚合(热点自动发现)

相关(相似)产品:

  • digg(2004.11):社会化书签(集体智慧)
  • techmeme(2005.9):追踪科技类热门文章(a_list、反向链接分析)
  • google新闻(2006.1):个性化新闻聚合(协同过滤)
  • 百度新闻(2007.1):新闻分类聚合(文本相似性、文本分类)
  • 豆瓣九点 (2007.1):社会化阅读社区(优质博客源)
  • 抓虾“好看”(2007.4):热文(自动分类)

产品名(起始年份):描述(涉及的技术点)

  • 玩聚SD(2008.5):社会化对话(a_list、智能语义聚合应用框架垂直应用)
  • 玩聚SR(2008.12):基于twiter GReader delicious等的社会化文章推荐(a_list、mashup、memeTracker、Rank、语义关联技术)
  • 玩聚SRBacks(2009.1):聚合评论和分享(blog插件)
  • 玩聚Liked(2009.2):基于FriendFeed API的热门喜欢榜单(memeTracker、Rank)
  • 玩聚RT(2009.2):基于Twitter API的热门锐推榜单(memeTracker、Rank)
  • 玩聚PP(2009.9):基于Twitpic Flickr的热门图片榜单(memeTracker、Rank)
  • 玩聚HOT(2009.12):基于新浪微博的大事件监测(搜索关键词、memeTracker、Rank)
  • 微博锐推榜(2010.9):基于新浪微博的热门锐推榜单(memeTracker、Rank)

相关(相似)产品:

  • stumbleupon(2001):社交化网页推荐引擎(浏览器插件)
  • FriendFeed(2007.11):feed流聚合(lifestream)
  • Tweetmeme():基于twitter追踪tweet热门内容(memeTracker)
  • RssMeme():基于GReader shared items追踪rss热门内容(memeTracker)

玩聚网是利用语义挖掘技术追踪互联网热点的阅读类网站,最早是做新闻、博客和论坛的热点追踪,产品逻辑上类似于国外的techmeme,但是技术上使用了语义挖掘,不同于techmeme的反向链接分析。之所以借重于语义挖掘这种高难度技巧,郑昀解释说是因为国内的博客写作与国外不同,国内的博客在数量和质量上表现不稳定,并且不习惯在博客间使用链接引用方式。

这个时期做出来的产品有些像是技术驱动的结果,重点是在检测一种新方法的可行性。推出的产品并没有太大的反响,但是却积累了很丰富的经验,引发了大量的思考:关于国内外现状的比较、关于新媒体的思考、关于阅读最细致最底层的思考,甚至关于人性的思考。

基于那些充分的思考,玩聚SD,这个社会化对话系统上线了,运用了成熟的智能语义聚合应用框架。郑昀是这样描述玩聚SD的:Social Dialogue就是利用国内优秀的IT、互联网、电信的博客或媒体作为过滤器,他们在博客上的互相引用和讨论,被玩聚SD捕获到。因为这些博客关注的基本上保持一贯的水准,他们之间的社会性对话,也就是就某一个热门话题展开的讨论,往往最及时地反映业界热点,时间差往往不超过一小时。玩聚SD就是负责实时追踪并展示这些对话,通过反向链接计算,通过文本相似计算。

玩聚SD并没有获得更大的关注,分析原因,可能有以下几点:

  • 1、收集的数据还不够多,过于小众,热点的更新比较慢;
  • 2、入口问题,不能用rss订阅,就无法满足多数人的使用习惯,包括那些博客们;
  • 3、SD的UI也不算好,读起来有点乱,可能内容是精彩的,但是没耐心看下去;

SD刚出来的时候还是有不少bloger关注的,但可能也只限于一个很小的圈子,这个圈子之外的人不能完全理解这种东西。

玩聚SR的成功是个意外,郑昀如是说:我们最初并没有想到SR会受到大家的肯定。这实际上是一款技术需求最低的产品,只花了几天就做好了。玩聚SR是一个追踪各种社会化媒体,实时发现IT人都在分享和推荐什么的工具。玩聚SR使用了一些简单的规则和算法,似乎并没有很重的语义挖掘技术蕴藏其中。玩聚SR的成功,除了依赖玩聚本身的技术积累,很大的一个原因是使用了google reader分享和twitter的数据,这两个数据源相比SD的博客有更大的受众,而且它部分解决了用户的真实需求:信息爆炸。玩聚SR很好的抓住了一个趋势,可谓是在一个恰当的时机做了正确的事情。

玩聚SR的成功原因可以总结以下几点:

  • 1、采用google reader分享和twitter这两个优质数据源,有更多的受众;
  • 2、采用热文列表的简单表现,容易被大众用户接受;
  • 3、入口更丰富,支持rss订阅和微博订阅;
  • 4、及时跟进用户反馈,推出SRBacks、SRCBacks等插件应用。

玩聚SR的成功估计让郑昀意识到了mashup的价值,玩聚之后的很多尝试都借重于mashup各种数据源:玩聚Liked使用了FriendFeed的数据;玩聚RT使用了twitter的数据;玩聚PP使用了twitpic和flickr的数据;玩聚HOT和微博锐推榜使用了新浪微博的数据。这些应用都是比较简单的,语义挖掘在这里只是一个辅助的角色。

玩聚后期的成功是恰当的使用了开放数据的缘故,但这也正是它最大的软肋,缺少自有数据的支撑,处在一个非常复杂的互联网环境,这就决定了当前的玩聚是走不了太远的。但是,这又怎么样,作为语义应用框架的提出者和实践者,郑昀走过的路可以帮助无数的后来者清除羁绊。动嘴不如动手,在当前浮躁气氛浓烈的互联网大环境下,能够做到这点太不容易了。

玩聚的案例还有一些实际的指导作用。总结了以下几点:

  • 1、不要轻易改变用户的使用习惯,那会死的很惨,除非你创造了一个革命性的产品;
  • 2、无论使用多么复杂的技术,面向用户的功能一定要力求简单易理解,好的技术应该致力于让这种简单更加稳定;
  • 3、语义技术在一些领域大有作为,有复杂的玩法,同时也有简单的玩法,决定于你想要的。

最后,很杯具的,玩聚已经由于众所周知的原因,只能FQ到twitter关注@rtmeme 去膜拜一下了。那可是个很聪明的机器人哦:)

此日志来自QQ邮箱!

++++++++++++++++++++++++

全文完。

欢迎订阅啃饼随笔,由于他的QZone空间不好订阅,所以我一般都是订阅他的新浪博客:http://blog.sina.com.cn/kenbinzhang RSS:http://blog.sina.com.cn/rss/1736173915.xml 。

赠送图片:

我的推特流:

1、

传说中,某些公司都是几十辆几十辆奥迪的买,不知道替谁采购的。这也是一条路:北京市公务机关的公务车五年内是不能再增加指标了,但我公司可以买好上好牌照“借给”公务员们开啊。

2、

那些北京4S店的销售们这个春节会过得很滋润,估计会有大量销售拿到年终奖后辞职,反正开春之后,面对大大萎缩的销售状况,还是早点逃离得好。

3、

这制片助理当的:http://is.gd/jhOfc 背景介绍:《让子弹飞》制片助理赵铭友情客串。

4、

记者讲述商业史时很习惯把领导者的行为随机化或者幼稚化。举例:『凡客副总裁杨芳在小区偶遇正在打扫的李阿姨,随口问了一句:“今年夏天会花多少钱买件T恤?”李阿姨说,“30以下我会买”。陈年得知答案后,就给凡客的印花T定价29元。』再譬如:“引爆点就是凡客的帆布鞋产品。帆布鞋的思路来源于陈年的小侄女,她是帆布鞋粉丝,五年前,她就永远是一双帆布鞋,而且很精心的清洗它。陈年大为触动,试试帆布鞋。”

5、

寻找LBS+各种Map API+SNS技术高手(Location:北京),请帮忙推荐。

6、

丁磊终于赚钱了:2010年上半年,出栏一头200斤左右的生猪,亏损大约在200元左右。而风起云涌的通胀,让近两个月,每头猪赢利达到300元左右——据经济观察报报道。

附送三个小萝莉:

转载于:https://www.cnblogs.com/zhengyun_ustc/archive/2010/12/24/ju690_kenbing.html

推荐阅读啃饼随笔的《玩聚网的案例分析》相关推荐

  1. (推荐阅读)H264, H265硬件编解码基础及码流分析

    需求 在移动端做音视频开发不同于基本的UI业务逻辑工作,音视频开发需要你懂得音视频中一些基本概念,针对编解码而言,我们必须提前懂得编解码器的一些特性,码流的结构,码流中一些重要信息如sps,pps,v ...

  2. 用matlab仿真函数在空间分布,1.3 信道函数免费阅读_MATLAB R2016a通信系统建模与仿真28个案例分析免费全文_百度阅读...

    4.1 雷达回波信号随机热噪声分析 在实际的雷达回波信号中,不仅有目标的反射信号,同时还有接收机的热噪声.地物杂波.气象杂波等各种噪声和杂波的叠加.由于噪声和杂波都不是确知信号,所以只能通过统计特性来 ...

  3. 玩聚SD:感谢ECVIP、盗盗、网贝、和菜头的博客推荐

    首先非常感谢电子商务博客和showeb2.0盗盗两位朋友对玩聚SD的推荐,能够在这两位非常优秀的博客上看到SD的名字,真的很感动.[20080616 18:47 updated: 名站网贝也进行了推荐 ...

  4. 主打个性化推荐阅读的摘客,玩的是什么?

    你的朋友圈是不是关注几十上百个微信公众号,每天打开来看的次数却少之又少?你是不是 每天去不同的牛逼哄哄的网站逛,看所谓的大流干货呢?你是不是想找感兴趣领域的专业技能,面对如此众多的平台,花费大量的时间 ...

  5. 【玩聚】OneJoo中国的第一个memeTracker?

    郑昀 20070723<?xml:namespace prefix = o /> China Web2.0 Review<?xml:namespace prefix = st1 /& ...

  6. 玩聚的Blog墙 VIII

    郑昀@玩聚SR  20090423 Blogs: 当我把这个消息发到Twitter上时,得到了多达18条Retweets,并迅速登上了玩聚RT热榜,可见此事受到的关注度有多大,而锐推及玩聚RT热榜带来 ...

  7. 转:iFire:玩聚 SRBacks 自定义脚本及样式表

    感谢iFire的第一时间修改并试用,而且调试出如此清新的样式. 下面转贴一下他的自定义脚本和样式表: 玩聚 SRBacks 自定义脚本及样式表 admin @ 2009-01-11 02:34 59 ...

  8. Java程序员到架构师的推荐阅读书籍

    作为Java程序员来说,最痛苦的事情莫过于可以选择的范围太广,可以读的书太多,往往容易无所适从.我想就我自己读过的技术书籍中挑选出来一些,按照学习的先后顺序,推荐给大家,特别是那些想不断提高自己技术水 ...

  9. 玩聚SR和FriendFeed的区别

    20090104 郑昀@玩聚SR 玩聚SR和FriendFeed  它们解决的东西不一样,关注点完全不一样.下面它们对自己的定义很清楚地表明了这一点: 玩聚SR 是一个追踪各种社会化媒体,实时发现IT ...

  10. Java程序员的推荐阅读书籍

    作为Java程序员来说,最痛苦的事情莫过于可以选择的范围太广,可以读的书太多,往往容易无所适从.我想就我自己读过的技术书籍中挑选出来一些,按照学习的先后顺序,推荐给大家,特别是那些想不断提高自己技术水 ...

最新文章

  1. BigPipe学习研究
  2. PHP中的const
  3. springboot实现多线程service实现
  4. 在11g中alter system set recyclebin = off 报错 recyclebin 参数在11g和10g中的区别
  5. 谁今天收到鸿蒙系统推送,鸿蒙系统正式推送,只有部分高端机才能收到
  6. python自动测试a_python自动化单元测试
  7. FPGA阻塞赋值与非阻塞赋值用法
  8. Linux 目录配置标准:FHS
  9. 在苹果Mac中如何不用鼠标刪除文件?
  10. 使用HTML5 Web存储的localStorage和sessionStorage方式
  11. 单元测试框架TestableMock快速入门(四):Mock的生效范围
  12. igm焊接机器人基本操作_焊接机器人技术讲解.ppt
  13. 使用ID3算法实现决策树
  14. iPhone5s 换电池、修右上角翘起的悲催过程
  15. python鼠标移动的方法_python自动化之鼠标移动
  16. wamp3.1.0 X64下载链接(最新)
  17. NLP标注工具Brat
  18. 《jsp程序设计》智多星手机销售网后台设计
  19. 免费视频教程!零基础学Python系列(7) - 数据类型之bytes(上)
  20. 今夕何年(模拟日期)

热门文章

  1. 如何在Mac上创建和引导Linux USB驱动器
  2. new Date()浏览器兼容性问题
  3. puppet进阶指南——cron资源详解
  4. java工程中的相关路径
  5. 分智- 招聘,公司评论,晒工资,薪水
  6. 5016.网络安全__防火墙应用案例和双机HA部署案例
  7. Volume Shadow Copy Service(VSS)如何工作
  8. 扒一扒微信后台架构.....
  9. 如何优雅的统计代码耗时?
  10. 从滴滴亏109亿说起