新数仓系列:开源组件运营(3)
大数据前几年各种概念争论很多,NoSQL/NewSQL,CAP/BASE概念一堆堆的,现在这股热潮被AI接过去了。大数据真正落地到车联网,分控,各种数据分析等等具体场景。
概念很高大上,搞得久了就会发现,大部分都还是数据仓库的衍伸,所以我们称呼这个为“新数仓”,我准备写一系列相关的文章,有没有同学愿意一起来的?请联系我。前面有一些相关文章,大家可以看看:
新数仓系列:Hbase周边生态梳理(1)
新数仓系列:Hbase国内开发者生存现状(2)
HBase 和 Cassandra的浅谈
数据库存储模型简述
HBASE+Solr实现详单查询
产品决定的是长期竞争力,运营决定的是短期用户体验。本文简单梳理下开源组件的运营方法。不正确的,欢迎大家给我留言多讨论。
运营主要分为内容运营、用户运营、活动运营和产品运营。
1. 内容运营
内容运营这样一个分支,其实核心要解决的问题是:围绕着内容的生产和消费搭建起来一个良性循环,持续提升各类跟内容相关的数据,如:内容数量、内容浏览量、内容互动数、内容传播数……等等。
因而,内容运营这个模块下要关注和解决的问题可能包括了以下问题中的一个或多个——
我的内容基础属性是什么?(文字?图片?音频?)需要具备何种调性?(逗比搞笑?段子八卦?深度评论?一手资讯?文艺暖心?)内容从哪里来?(UGC?PGC?)
我的内容如何组织和展现?(专题?列表?分类导航?字体?字号?行距?段距?)
如何在已有基础上做出用户更喜欢看的内容?(内容策划?内容选题?内容如何借势热点事件和人物?)
我现有的内容如何能够更容易、更高频地被用户所消费?(内容标题怎么写?好内容如何推送给用户?推送频次如何?推送手段有哪些?EDM?站内信?Push?)
我的内容生产如何可以具备持续性?(做活动?稿费?用户激励机制?其他利益交换?)
如何更好地引导用户来与我的内容发生互动甚至传播内容?(制造话题?讨论氛围引导?传播机制设计?)
2. 用户运营
跟内容运营相似,所谓用户运营这样一个分支,其实核心要解决的问题,也是围绕着用户的新增-留存-活跃-传播以及用户之间的价值供给关系建立起来一个良性的循环,持续提升各类跟用户有关的数据,如:用户数、活跃用户数、精英用户数、用户停留时间……等。
所以,用户运营要关注的问题可能包括了以下问题中的一个或多个——
我们的用户该从哪里来?(微博?豆瓣?广告?BD合作?线下地推?人肉?现有用户传播?)如何落实?(BD?付费?渠道建设?产品机制设定?)
用户来了之后,我们如何建立和维护我们跟用户间的关系?(多互动?多要反馈?多送礼品?多帮用户解决实际问题?)
如何让愿意留在这里玩的用户更多?(分析数据?关注留存?提升留存?关注活跃?拉升活跃?用户积分体系设计?用户激励体系设计?)
当用户量慢慢多起来比如达到几百万的时候,如何增强我对整个用户生态的影响力和掌控力?(如何对用户进行分类?针对每类用户我们应该如何服务和管理?怎样让不同类型的用户之间产生价值关系?如何构建起一个良性可掌控的站内用户模型?)
用户如果出现流失怎么办?(分析流失原因?建立流失预警机制?召回?放弃?)该如何召回?(召回策略?EDM?短信?Push?)
3. 活动运营
至于活动运营,核心就是围绕着一个或一系列活动的策划、资源确认、宣传推广、效果评估等一系列流程做好全流程的项目推进、进度管理和执行落地。一个活动运营,必须事先明确活动的目标,并持续跟踪活动过程中的相关数据,做好活动效果的评估。
其实,活动是一种再常见不过的运营手段,也是一个合格的运营必须要掌握和熟练运用的一种手段。往往在我们做内容运营和用户运营的过程中,也必不可少的会涉及到很多活动。所以其实,单独把“活动运营”设为一个独立岗位的互联网公司,其实并不是特别多。
基本上,一个公司可能会专门设置出来一个“活动运营”岗的典型场景,可能仅有两种——
该公司对“活动”的定位较高,会定期通过一些中大型的活动来拉升某些核心数据或是宣传公司品牌,而活动的策划设计、执行确认等也通常比较复杂,需要专门有人来主Hold和跟进(类似支付宝集五福这样的活动,就很复杂);
该公司用户已有一定用户体量,为了做好用户的维系,需要定期策划和落地一些活动。又或该项业务本身就需要持续不断的活动来助推(好比电商网站,淘宝天猫等各种定期购物节)。
4. 产品运营
所谓产品运营,其实要做的事情,就是通过一系列各式各样的运营手段(比如活动策划、内外部资源拓展和对接、优化产品方案、内容组织等等),去拉升某个产品的特定数据,如:装机量、注册量、用户访问深度、用户访问频次、用户关系对数量、发帖量……等等。
所以,一个真正意义上的“产品运营”,其实是一个综合能力比较均衡,既熟悉各类运营手段,又熟悉产品,甚至能够自己完成一些产品方案的人。
对于一家互联网公司,会设置一个“产品运营”岗位的场景,以下两种情况是比较典型的——
一个比较成熟的产品新上了一个分支功能,在一段时间内需要一个人对接协调各种资源,干好各种活,对该功能相关产品数据负责(如新浪微博上线了一个“微群组”功能);
一个中早期的互联网公司,不需要对运营划分得那么复杂,就是需要有一个人啥都至少会点儿,啥都能干,还能把产品养活起来,所以ta就成了“产品运营”……
开源组件的运营,实际和产品运营比较贴切;
前面系列文章比较了Cassandra和Hbase。Cassandra在国外用的相对广泛,整体活跃度要高于hbase;和hbase在国内反而要火一些。
Cassandra最近两年在大数据公司Datastax的大力培育下获得长足发展,功能和性能均大幅提升,Datastax的估值也达数亿美元。从apache cassandra首页来看,大概有超过1500个公司在使用cassandra。其中除了facebook和twitter外还一些有代表性的公司列举如下:
Instagram:inbox、newsfeed、 audit、fraud detection,12 EC2 node,1.2T,2w+ wps,1.5w+ rps;
eBay:200+TB,400+M写,100+M读,应用场景:商品详情页上的Social Signals,如Like,Want,Own,Favorites等;用户和商品的hunch taste graph;时间序列如移动通知,反作弊,soa,监控,日志服务等;
Netflix:包含288+96+60个实例的大规模集群,每秒110万的写操作,3个AWS EC2 美国东部region的zone自动复制副本,总计330万写操作/秒;
Apple:75000+ nodes, 10s of PBs,Millions ops/s, largest cluster 1000+ nodes。
从技术实现上来讲,cassandra同时具备AWS Dynamo和Google Bigtable的设计理念,同时引入了P2P技术,具备大规模可分区行存储能力,强调AP,实现了最终一致性,具备多数据中心复制支持,具备市场上最具有竞争力的可扩展性,无中心节点,一致性和时延可调,无单点故障,每个节点只有一个进程等等大数据存储管理的先进特点,并支持spark、storm、hadoop的集成。但同时,Cassandra实现复杂性高,没有相应的中文社区,文档太少,国内应用和实践太少,Datastax也未进入中国市场,因此在中国的推广会比较困难。
众多大数据开源组件里面,相对来说,搞的相对比较好的是spark,mongoDB。搞的好,通常需要一个商业组织在负责和管理,纯粹靠开源运作和个人兴趣,是比较难的。可以先看一眼mongoDB的中文社区http://mongoing.com/webinar_cn,相比我前面讲的hbase没有一个共同的社区要好不少。
开源运营通常的手段有:
1、 有一个好的社区(用于用户互动,不限于论坛,微信群,QQ群)。
2、 好的资料;用户手册(中文手册)、出版书籍、周报、日报等,帮助解决入门门槛问题。
3、 线上线下交流活动(meetup,专家讲座,summit等)。
4、 成功的用户案例。
5、 ISV(云应用市场,线下团队)
6、 最最重要的还是产品要好,要有一个广泛的适应场景,解决客户足够多的问题,持续的演进和竞争力(低成本、高性能、稳定性、易用性),出了问题及时响应解决。
现在很多云服务都是基于开源组件实现,做云服务核心核心之一就是做生态,所以相比传统的产品销售,只靠产品特性打动用户是远远不够的。
产品决定的是长期竞争力,运营决定的是短期用户体验。云服务领域,产品和运营,两手抓、两手都要硬!
猜你喜欢
NoSQL 还是 SQL ?这一篇讲清楚
阿里的OceanBase解密
#大数据和云计算技术#: "四有"社区介绍
大数据和云计算技术周报(第5期)
新数仓系列:Hbase周边生态梳理(1)
《大数据架构详解》第2次修订说明
简单梳理跨数据中心数据库
云观察系列:漫谈运营商公有云发展史
云观察系列:百度云的一波三折
云观察系列:阿里云战略观察
超融合方案分析系列(7)思科超融合方案分析
加入技术讨论群
为了方便大家相互交流学习,社区创建微信/QQ群,社区群人数已经2500+,欢迎大家加下面助手微信,拉大家进群,自由交流。
喜欢QQ群的,可以扫描下面二维码:
欢迎大家通过二维码打赏支持技术社区(二维码累计打赏36+,打赏英雄请留名,社区感谢您):
新数仓系列:开源组件运营(3)相关推荐
- Uncode系列开源组件简介
概述 Uncode 是基于Java 语言的一系列企业级开源组件,作者冶卫军 (开源作者花费大量时间维护开源项目,期望正确使用).主要包括:移动后端开发框架Uncode-BaaS ,通用数据库访问组件U ...
- 数仓系列第11篇:实时数仓
目录 导读: 1.数据仓库简介 2.数据仓库的发展 3.数据仓库建设方法论 4.数据仓库架构的演变 5.实时数仓案例 6. 实时数仓与离线数仓的对比 导读: 本文将从数据仓库的简介.经历了怎样的发展. ...
- 数仓系列 | 深入解读 Flink 资源管理机制
精选30+云产品,助力企业轻松上云!>>> 整理:王文杰(Flink 社区志愿者) 摘要: 本文根据 Apache Flink 系列直播整理而成,由阿里巴巴高级开发工程师宋辛童分享. ...
- 元数据管理系统解决方案及产品调研-数仓系列(一)
元数据管理系统产品选型分析 1 概述 需要给目前数据仓库适用一套元数据管理系统,目的 减少人为的维护工作量.web页面协同工作(多人统一入口使用).元数据权限管理等 1.1 应用背景 目前数据 ...
- 系列 | 漫谈数仓第四篇NO.4 『数据应用』(BIOLAP)
点击上方蓝色字体,置顶/星标哦 目前10000+人已关注加入我们 本文目录CONTENTS ☞ 01.可视化BI工具 [ 开源BI,商业BI,传统BI ] ☞ 02.OLAP科普 [ ROLAP M ...
- 咖啡汪日志——遇见数仓,理想与现实的碰撞,前景与难点的对接
嗷呜! 作为不是在戏精,就是在戏精的路上的二哈 本汪最近又搞到了新玩意儿 做数仓,主要用于支撑大数据分析和架构层决策 前言 通过这篇文章,我们能学到什么: 1.了解数仓的前景. 2.了解到数仓前期ET ...
- 数仓体系效率全面提升!同程数科基于 Apache Doris 的数据仓库建设
应用实践 | 数仓体系效率全面提升!同程数科基于 Apache Doris 的数据仓库建设 导读:同程数科成立于 2015 年,是同程集团旗下的旅游产业金融服务平台.2020 年,同程数科基于 Apa ...
- 2021阿里巴巴大数据技术公开课第一季:外部工具连接SaaS模式云数仓MaxCompute实战
简介:MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供快速.全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运 ...
- 新氧云原生全栈数仓最佳实践
简介: 新氧数据中台数据研发部总监 高宏超:自建大数据平台面临困难与挑战,我们从成本.安全.资产管理及组件可扩展性等综合考量后决定整体迁移到阿里云,上云后,总体资源成本降低30%,性能上提升2-3倍, ...
最新文章
- mysql大表迁移_MySQL 大表迁移
- java何时支持await,内存-为什么Java等待这么长时间才能运行垃圾回收器?
- 统计某一时刻的在线人数
- UA PHYS515A 电磁理论III 静磁学问题2 标量势方法与向量势方法简介
- 工作改进三步曲:简化、优化、固化
- python 两个内置函数——locals 和globals(名字空间)批量以自定义变量名创建对象
- 字符串中最后一个单词长度
- 查看地区的ip段_「教程」CloudFlare 自选 IP优化网站速度
- 云计算的发展及应用--演讲用PPT
- xxljob默认登录_xxl-job安装部署整理
- 计算机等级考试中的c语言程序
- html之table删除和添加数据(获取行号和列号)
- aws rds监控慢sql_探索AWS RDS SQL Server上SQL Server集成服务(SSIS)
- matlab Tricks(二十七)—— 可变输入参数输出参数的适配
- 解决在嵌入式平台上无法进行字符编码的问题
- iOS xcode 9 注释快捷键
- 电容中那些独有的特性和功能,你有了解吗?
- 如何算计算机主机地址,ip地址怎么算子网掩码_根据ip地址算子网掩码
- Halcon错误 #2021: System clock has been set back.
- Windows下如何打开CSV文件
热门文章
- java中between and什么意思,关于 oracle between and的用法!
- matlab中P代码即P文件加密与逆向工程探讨
- 微信公众号新手注册,创建菜单栏,发布文章详细操作教程
- 小米5S刷机认真看一眼就能会的简单详细教图文
- android wifi取消自动连接网络,Android 11新增无线网络连接安全策略 可以不自动连接某些特定WiFi...
- 高刷显示器变成24Hz的原因及解决方法
- 微信小程序云开发(2)— 云数据库
- 微信添加地址时选择地区功能是怎么实现的
- 3d数字孪生项目开发分享
- 使用Visual Studio怎样制作登录界面