数据洞察

  1、数据介绍

  数据区间是2018年2月1日—5月10日,历时两个月,累计260968条。

  采集过程中,对作者做了去重处理,也就是说每个作者只取了TA的一条视频数据。

  这也代表着我们拥有26W个作者的数据。

  数据包含视频描述、发布时间、播放数、点赞数、评论数、转发数、尺寸、清晰度、时长、是否包含商品广告、是否包含水印,以及视频作者的昵称、性别、生日、账号创建时间、是否认证、认证类型等数据。

  另外,数据均为前端可见数据,未使用任何违规操作。

  2、首次推荐分水岭是5000,请把赞“刷”到100+

  做过今日头条自媒体账号的人应该了解,头条的推荐算法是先把文章做小范围推荐,查看文章在该部分人中的阅读数据。

  如果阅读数据良好,则会扩大文章的推荐范围。数据越好,推荐范围则越大。

  既然抖音是头条系产品,那肯定采用了同样的推荐逻辑。

  从用户的方便程度来看,点赞>评论>转发,那么点赞作为推荐算法的指标权重应该会大于其他两个。

  从头条的推荐算法推测,视频应该会先被推荐给一部分用户,如果点赞数达到某个水平,则会将视频推荐给更多的人;如果没有,那么视频大概率会凉了。

  经过不断分段统计视频各播放量与点赞之间的关系,得到了下面这张表格:

  由于采集机制的原因,我们很难采集到没有被推荐的视频,但就现有的1907条播放量在5000以下的视频我们可以清晰地看到,这些视频的点赞量100以下的占到了94%。

  那么反过来可以推断,想要你的视频被更多的人看到(也就是进入系统推荐的二阶段),那么你视频的点赞量至少应该增加到100以上。

  我做了几个视频进行了测试,发布后分享出去让好友帮忙点赞(下文会给出方法),那些在1小时内点赞量突破一百的,播放量在几小时内很快破万;

  而那些点赞量低的,则不再被人问津。

  即便这个结果在测试中得到了验证,但是我却不能给出实锤结论。

  首先,目前采集到的低于5000播放量的数据,大都在5月以后发布,传播时间不够长,或许这恰好是点赞量低的原因;

  其次,与整体的样本量相比,这部分数据只占不到1%,没有达到统计分析的样本数要求。

  无论如何,视频的点赞量肯定会作为推荐权重的依据,点赞越高自然是越好的。

  3、看似红红火火,但瓶颈似乎已经到来

  作者数据包含了账号的注册时间,我把作者的注册时间按照月份统计,发现抖音用户的增长似乎在放缓:

  从上面的用户注册时间分布来看,抖音用户在2018年1月份达到顶峰,随后开始逐月递减,4月份已经只有3月份的一半!

  实际上,这个数据仍然存在一些漏洞。

  毕竟存在一种可能,就是新注册的用户不喜欢发布视频,而是在注册一段时间后才开始发布。

  或者,新注册用户的视频因为还未得到系统的推荐,被我们采集到的概率也随之降低。

  如果账号的创建时间不能说明问题,我们来看另一组数据。

  把视频的发布时间与其相对应的播放量和点赞量结合,我得到了各月发布视频的平均点赞量。

  为了去除数据传播时长的影响,我去掉了5月以后发布的视频,得到各月平均点赞量分布图:

  数据显示,各月视频的平均点赞数在逐月降低,4月份视频平均点赞量甚至不足3月份的一半。

  或许是因为视频越来越堵,用户已经麻木,但无论如何,早期的红利在逐渐降低,想上车的要赶紧了。

  4、拍满15s不是最好的,10s更受用户欢迎

  目前抖音未公布获得视频超过15s时长权限的机制,但至少我们知道“优质”是选拔的重要条件,所以在分析视频时长时,我去掉了时长超过15s的视频。

  对15s以内视频的平均点赞情况作了分析,得到以下分布图:

  数据并不支持我们把视频拍满15s,10s是最好的,13s也不错,甚至11s都优于15s。

  由于超过15s的视频数量仅6866条,在样本中占比太少,我就不再给出分析。在相同数量级下(均少于100条),39s、42s、50s和58s看上去效果不错。

  5、男女比例严重失调,小哥哥的视频更受欢迎

  统计26W个作者的性别,我发现抖音用户中女性用户数量接近男性的3倍!

  显然是严重失调。

  (注:“无”代表用户没有填写性别信息)

  从用户组成来看,就很容易理解为什么抖音的带货能力这么强了。

  从购物能力来看,女性购买力更强,毕竟大部分钱都掌握在女性的手里。

  把作者性别和其发布视频的平均点赞量结合,我神奇的发现,小哥哥们的视频竟然更受欢迎!

  难不成是因为女性用户多于男性,异性相吸?

  注:没有性别信息的用户有多个视频点赞量超过百万(比如用户@安德罗妮、的一个视频点赞量达到600W),造成了该类别用户的平均点赞量过高,不排除这部分用户均为女性的可能性。

  6、生活化的内容是抖音的主流,年轻人愿意表达爱与喜欢

  使用新浪微舆情的文本分析功能,把视频的描述文字做了词性和情感方面的分析,发现生活化的内容是抖音的主体。

  对视频描述文本的词性分析,动词方面除了“喜欢”和“爱”以外,生活化的“想”、“拍”、“吃”是出现频率最高的词;

  形容词方面“快乐”、“开心”、“好看”和“可爱”是抖音用户最喜欢表达的感情;

  名词上“小哥哥”和“小姐姐”显然已经成为发抖音的固定搭配。

  整体词频方面,除了“小哥哥”、“小姐姐”以及“抖音小助手”以外,具备强烈生活色彩的“爸爸”、“我妈”、“弟弟”、“老公”、“我家”这些词同样被高频率使用。

  2

  福利:一些抖音小技巧

  1.精细化运营,一些小细节很重要

  我们来看下面两个视频截图,你发现什么差别了么?

  如果两个视频都需要视频描述来完善视频的内容,那么后一个视频的效果会更好,因为相比于白色视频背景,纯黑色可以非常清晰的把底部的视频描述凸显出来。

  除此以外,视频内容和质量相似的情况下,竖向的视频比横向的视频更容易被点赞,不信你横过手机点赞一下试试……

  2.能不能绕过机器筛选直接被推荐到更大的流量池?

  随着监管制度的完善,纯机器算法筛选和推荐已经不能满足用户对高质量内容的需求,于是今日头条引入了大量人工审核团队。

  这些人工除了审核内容是否违规外,还承担发现优质内容、使其提前进入推荐队列的职责(我猜的)。

  如果我猜对了,那么,如果视频能跨过机器的迭代推荐,直达人工,岂不是会更快速的火起来?

  这个方法就是在视频描述里加入一些机器识别不准确的敏感词,你们如果胆大可以试一试。

  你现在在抖音中还会点赞吗?

  欢迎评论区留言,与大家分享哦。

更多阅读:

  • 26万条抖音数据背后的推荐逻辑以及严重失调的男女比例
  • 美图秀秀官方数据:2013年1月下旬美图秀秀移动端日活跃用户数560万
  • 数据显示70%Facebook美国用户有一位在Facebook上出柜同性恋、双性恋好友
  • Experts Exchange:调查显示 Siri 语音助手满意度高达81%完胜谷歌、微软
  • engadget:2013年Q2三星预期收入利润达83.3亿美元
  • 腾讯:530亿并购大鳄如何炼成
  • Flurry :2013年6月中国手机市场苹果占有率第一 小米第三
  • 数据挖掘与虚拟医药科研
  • 2013年8月 TIOBE 编程语言排行榜单
  • 1987-1997:星巴克咖啡帝国的崛起之路
  • Groupon财报:2013年Q2Groupon营收6.08亿美元 同比增长7%
  • Gartner : 2014年25 大供应链厂商排名 Apple 连续 7 年排名第一
  • 从客户、服务和地理三图看微软业务
  • Kantar:2014年Q3中国快速消费品市场同比增长回升到6.9%
  • 华硕财报:2013年Q3华硕净利润1.67亿美元 下降26%

');

26万条抖音数据背后的推荐逻辑以及严重失调的男女比例相关推荐

  1. 抖音数据统计_26万条抖音数据背后的推荐逻辑以及严重失调的男女比例

    本文作者:喜哥(张佳)易灵微课<数据分析-认知与实践>讲师 新榜数据分析师 人人都是产品经理.华尔街见闻专栏作家 简书科技类优秀作者本文首发自公众号喜新(noyanjiu),如需转载请注明 ...

  2. Python看春运,万条拼车数据背后的春节迁徙地图

    Python看春运,万条拼车数据背后的春节迁徙地图 今天是正月初九,春运返程也已过半.这篇文章,作者对北京.上海.广州.深圳.杭州等地 1万多条出行数据进行分析,得出了一些有意思的结论,并且绘制了这几 ...

  3. 分析了2.2W条抖音数据,发现“95后”其实很养生……

    导读:通过一些特殊渠道,我拿到了2月26日-3月27日的2.2W条视频数据,清洗梳理后得到一些好玩的结论,你们或许会喜欢: 抖音的核心用户群体"95后"们也很养生,0点以后基本都睡 ...

  4. 抖音用户规模达5.18亿,数据解读抖音支付背后逻辑?

    每当巨头一步棋,用户就开始瞻仰.1月19日,抖音支付在抖音APP内正式上线,在支付宝和微信支付外,抖音APP内又多了一个"抖音支付"的入口.追究其背后的脉络与逻辑,或许可以在最近扑 ...

  5. 推荐系统视频行业揭秘,“抖音快手”现象级产品背后的推荐逻辑

    随着5G渗透率的快速提升,小视频应用还将迎来新的爆点,小视频行业从不缺对手,想从一片红海中脱颖而出,面临的困境可想而知.如何冲破重重困境,需要找到视频与用户之间的最佳连接,在综合成本.收益.落地难度等 ...

  6. 抖音数据统计_2019年抖音数据报告的分析探究

    不看抖音的我看完2019抖音数据报告后,我不得不赞叹抖音的覆盖面以及其发展潜力,从抖音的数据我们也能了解到当下的热点和新的趋势,本文我将从十个方面来分析这份数据. 01 抖音日活跃用户增长 在这份报道 ...

  7. 微信小程序转头条/抖音小程序的方法

    很多公司都在做小程序,现在主流小程序有不少:微信小程序/头条小程序/百度小程序/支付宝小程序/QQ小程序...,很多公司为了方便开发都会采用taro或uni等开发方式,直接多端使用,但是对于小公司这些 ...

  8. 极客日报:HarmonyOS 2.0用户数升至5000万;腾讯起诉抖音侵权《王者荣耀》,获赔60万?抖音:没侵权,已上诉!

    一分钟速览新闻点! HarmonyOS 2.0用户数升至5000万 京东方宣布推出柔性OLED FDC屏下摄像头技术 腾讯起诉抖音侵权<王者荣耀>,获赔60万?抖音:没侵权,已上诉! 网易 ...

  9. 爬取抖音数据实践方案《进阶版》

    这篇文章是续上一篇(爬取抖音数据实践方案<基础版>).根据实际情况,落地的方案是:mitmdump+模拟器+python脚本+mysql数据库. 最终达到的效果截图: 接下来我把上面方案拆 ...

最新文章

  1. springboot-mysql-pagehelper分页插件集成
  2. 思考:开发者如何挑选最合适的机器学习框架?
  3. 【软考-软件设计师】计算机系统知识概览
  4. android数字累加,Android自己设置View之数字自动增长
  5. Mr.J--简单页面制作
  6. 大数据_Hbase-分布式介绍_分布式发展历程_去中心化_客户端负载均衡_服务器端负载均衡---Hbase工作笔记0001
  7. 控股天弘基金 阿里无银行之名行银行之实
  8. codeforces776D
  9. 管理感悟:测试的目的是什么
  10. MybatisPlus官方文档
  11. 收藏!一文掌握数据分析知识体系
  12. CAD如何绘制六连环图案?CAD使用圆,椭圆,直线综合练习
  13. 不动产租赁运营平台,为不动产租赁提供强劲的运营支持
  14. 嵌入式开发培训靠谱吗,嵌入式开发培训怎么样?
  15. C语言课设飞机票订购系统
  16. 301、404、200、304等HTTP状态
  17. JavaScript 数组塌陷
  18. python中的序列是什么_Python中的序列
  19. css多个属性怎么写,.css多个属性读取写法?
  20. 计算方法之非线性方程组求解

热门文章

  1. 测网速-在线网速测试原理及代码
  2. 魔兽世界最新服务器推荐,魔兽世界服务器人数最新数据!萌新入坑,老玩家转服慎重选择!...
  3. iOS Run Loop
  4. 华为开发者认证与DevEco Studio编译器下载
  5. 数据库——数据库的创建
  6. bff Backends For Frontends 聚合层
  7. 网页控制430单片机
  8. 【编程开发】MD5算法原理
  9. datetime格式提取年月日
  10. nginx 代理 redis