数据是什么?你的所作所为的一切记录都可以是数据。QQ聊天内容、微博、淘宝搜索商品、购买、在大众点评上对商户的评价……都是数据。

在过去十几年发展中,BAT都积累了海量的数据。百度积累了用户搜索行为,这种数据涵盖了医疗、旅行等生活的方方面面;阿里巴巴则积累了跟用户购买行为相关的数据,从决策到购买,以及购买的商品,腾讯则积累了用户沟通的信息。

有了基础数据,再采用科学的分析和处理,才能产生用户端的价值。如果没有合用的数据,那就是“巧妇难为无米之炊”,也就不能称为名副其实的数据网站,就像你空有一本武功秘籍,自己却不会半招一式,同样不能称为武林高手。

大众点评在本地O2O行业经过十余年耕耘,已经积累了超过4200万条评价信息,超过1000万个商户信息,此外还用户1.8亿的移动数据,已经完善会员体系。这是大众点评成为数据网站的基础,也是一个重要的里程碑。此外,大众点评还积累了海量交易、用户浏览等数据。

大众点评网站上的内容(即数据)都是通过UGC产生的,从第一个用户上传第一家商户开始,数据就开始产生,目前每个月产生的内容高达百万级。首先是商家的基础信息展示,然后越来越多的用户进行点评,在这个过程中,平台积累了商家和用户两方面的数据。

一个是关于商家地址、菜品、环境、服务等方面的数据,一个是用户的消费习惯等,并且在用户点评过程中,也有一个对商家数据不断调整、完善的机制。

当大众点评开始涉及交易业务时,数据更加丰富。目前,在大众点评的大数据结构中,用户的行为日志数据量占总数据量的大部分,剩下的就是交易数据。

海量的用户点评信息背后包括着用户对饮食的喜好、活动地理位置甚至背后的交易信息,而且数据在源源不断产生中,这满足了社会化分工产生数据的基本需求。

大众点评目前目前推出的应用分为两类:一类是商户通、推广通,这些是收费产品;另一类,比如大众点评指数,为消费者提供决策;还有餐饮行业风向标,提供行业发展参考;同时在业务方面可以为用户提供个性化推荐;点评管家则可以帮助商家分析经营行为、用户特点等。同时,大众点评也在做开放平台,即将数据向第三方开放,他们在此基础上进行二次开发,走向开放是大数据应用的趋势。

此前不久,大众点评技术部门进行了一次有趣的尝试,从海量用户点评信息中提炼出跟星座消费特征相关的信息,在网上发布信息之后得到了诸多粉丝的响应。这种娱乐化的数据尝试只是个开始,之后还可以做更多更深入的数据探索。

此前一次专访中,张涛曾经提到,根据对一个地区用户点评信息的分析,结合用户点击流量,可以得到很多信息。比如在某个城市,哪个菜系比较受欢迎,哪些项目比较受到关注。而大众点评可以通过大数据分析出一个区域,甚至具化到一个商圈的发展水平和阶段。

月度百万UGC内容产生只是大众点评数据的一个里程碑,随着之后用户数据的丰富,结合用户搜索、交易等数据,大众点评可以为用户提供越来越智能的产品。

具体到产品上就是,一个热爱吃牛排的人,当他在搜索附近美食的时候,提供牛排的商户会排到优先的位置。这个只是简单应用,随着数据的丰富,大众点评可以直接给你建议,附件哪个商户的六分熟的菲力牛排最符合你的口味。这些信息对用户来说才更为智能和贴心。

当然,整个大数据应用的神秘面纱才被掀开一点,更多在概念和想法阶段,之后还有很长的路需要走。

转载于:https://my.oschina.net/u/1160813/blog/344831

为什么说大众点评是大数据网站相关推荐

  1. 大众点评的大数据实践转

    摘要:大众点评网从2011年中开始使用Hadoop,并专门建立团队.Hadoop主分析集群共有60多个节点.700TB的容量,月运行30多万个Hadoop Job,还有2个HBase线上集群.作者将讲 ...

  2. 行进中换轮胎——万字长文解析美团和大众点评两大数据平台是怎么融合的

    点击上方"公众号"可以订阅哦 本文根据作者在2017年ArchSummit的分享记录整理而成. 背景 互联网格局复杂多变,大规模的企业合并重组不时发生.原来完全独立甚至相互竞争的两 ...

  3. 大众点评的大数据实践

    2011 年小规模试水 这一阶段的主要工作是建立了一个小的集群,并导入了少量用户进行测试.为了满足用户的需求,我们还调研了任务调度系统和数据交换系统. 我们使用的版本是当时最新的稳定版,Hadoop ...

  4. python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...

    python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07

  5. python爬取大众点评_浅谈python爬取58同城,大众点评这两个网站

    1.爬取58同城租房网遇到的坑:我爬了一页数据被封了ip,此时的我是非常的不爽,才十几条数据就封我,于是我就想着一定得找ip代理来解决这个问题,后面就写了个ip代理去弄,另外把之前头部信息ua改成了u ...

  6. python爬取大众点评数据_Python 爬取大众点评 50 页数据,最好吃的成都火锅竟是它!...

    作者 | 胡萝卜酱 责编 | 伍杏玲 成都到处都是火锅店,有名的店,稍微去晚一点,排队都要排好久,没听说的店,又怕味道不好. 那么如何选择火锅店呢?最简单的肯定是在美团.大众点评上找一找啊.所以,本文 ...

  7. python爬取大众点评_Python 爬取大众点评 50 页数据,最好吃的成都火锅竟是它!...

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 胡萝卜酱 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...

  8. Python利用scrapy框架,爬取大众点评部分商铺数据~

    分享一下,自己从0开始,用python爬取数据的历程.希望可以可以帮到一起从0开始的小伙伴~~加油. 首先,我的开发环境是: 电脑:macOS Sierra 10.12.6 编译器:PyCharm + ...

  9. 开发一个大数据网站做的铺垫

    知名大数据分析网站推荐8个 用到的大数据5个关键技术 人工智能6大关键技术

最新文章

  1. 在Ubuntu 14.04上设置生产环境可用的Node.js
  2. 绘图的尺寸_AutoCAD新功能:参数化绘图,绘制看似简单,实际复杂,案例详解...
  3. WPF 放大镜(Magnifying Glass)
  4. poj 3261 Milk Patterns 后缀数组 最长重复子串
  5. 洛谷P3405 [USACO16DEC]Cities and States省市
  6. 2019传智python就业班视频_2019黑马JAVAEE57期基础班就业班(全套)
  7. 手机浏览器被强制跳转_Azure front door 强制http redirect to https
  8. MFC输出EXCEL文档的过程总结
  9. hashtable的C++实现
  10. hdu 4300 Clairewd’s message kmp匹配! 多校联合赛第一题
  11. day11_界面闪烁处理
  12. 开启xmp1还是2_原神风魔龙技能打法详细教程攻略 奇货匣开启次数是否保留会刷新吗...
  13. “2016年度优秀软件工程造价师”“工信部行业标准《软件研发成本度量规范》2016年度应用示范单位” 评选活动正式启动...
  14. java编译网络爬虫_自己动手做网络爬虫系列——1 | 学步园
  15. 如何修改朋友圈定位到其他异地城市
  16. 计算机操作系统(慕课版)各章思维导图
  17. 《大数据时代》读书笔记-思维导图
  18. 22.1.11京东大数据实习面试
  19. mac m1 esc键失灵
  20. python编程价格_Python基础练习实例46(查询价格)

热门文章

  1. 【计算机网络】CRC校验码||循环冗余码详解及计算习题
  2. 不同引导词引导的宾语从句
  3. 知识蒸馏论文翻译(3)—— Ensembled CTR Prediction via Knowledge Distillation
  4. 记录重装Win7的心路历程
  5. hive partion 键 关联(join)其他表
  6. Linux重定向和管道
  7. Nginx源码分析1--------编写Nginx扩展模块
  8. c++: rvalue, prvalue, lvalue, glvalue
  9. 关于ASP.NET导出Excel表格的个人总结归纳
  10. java security / SSL / TLS / md5 / sha / base64 / rsa / des / aes / 3des