作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据

个人公众号:数据森麟(ID:shujusenlin),知乎同名专栏作者。


前言:

随着《延禧攻略》的播出,魏璎珞、富察皇后等各位后宫小主的命运时刻牵动着各位观众的心。同时爱奇艺也因为该剧的大火,收获了单日超过6亿的播放量。我们此次将对比各大视频网站2018年截止到8月18号的电视剧和综艺节目的播放情况,大家可以据此选择购买会员的视频网站(壕er可以无视,直接购买所有会员)。

01

数据来源

猫眼APP提供了每日各大视频网站的播放量,截图如下:

我们通过Fiddler分析得到数据接口地址, 以优酷网8月11号电视剧播放量为例:

http://maoyan.com/proseries/api/seriesTopRank.json?platformType=1&seriesType=0&dateRange=0&date=2018-08-11

其中platformType=1表示平台为优酷,SeriesType=0表示类型为电视剧,dateRange=0表示为数据日榜,最后的date则为具体日期,代码如下:

play_data = pd.DataFrame(columns=['date','name','play_num','type','platform','monopoly'])
for i in range(0, 3):
    for j in range(0,7):
        for date in pd.date_range('2018-01-01','2018-08-18',freq='D'):
            try:
                time.sleep(0.5) 
                url= 'http://box.maoyan.com/proseries/api/seriesTopRank.json?platformType='+str(j)+'&seriesType='+str(i)+'&dateRange=0&date='+str(date)[0:10]
                html = requests.get(url=url, cookies=cookie, headers=header).content
                data = json.loads(html.decode('utf-8'))['data']['seriesDailyRankList']
                for item in data:
                    play_data = play_data.append({'date':str(date)[0:10],
                                                  'name':item['name'],
                                                  'play_num':float(item['playCountDesc']),
                                                  'type':i,
                                                  'platform':j,
                                                  'monopoly':item['platformInfoDescV2']},
                                                 ignore_index=True)
                print(str(i)+' '+str(j)+' '+str(date)[0:10])                 
            except:

02   整体播放量

通过猫眼接口我们可以获得各大视频网站每天TOP30电视剧、TOP30网剧(我们统一为电视剧)和TOP30综艺节目的日播放量,以此对比视频网站2018整体的播放量,我们用R语言的ggplot完成数据可视化的部分:

可以看到在猫眼提供的七个视频网站中,搜狐、乐视、PP视频占比非常小。我们在后面的内容中将重点对比腾讯、优酷、爱奇艺和芒果四大视频网站。首先看一下整体播放量:


下面看一下剧集和综艺分别的播放量:

可以看到无论是剧集还是综艺,2018年迄今为止腾讯视频都处于领先地位。芒果视频在剧集的播放量相较于其他网站,播放量偏低,但在综艺方面已经超过了优酷,与爱奇艺基本持平。

03

月度播放量

在前言中我们提到了《延禧攻略》最近大火,我们通过月度数据看一下其近期是否带动了爱奇艺整体的电视剧播放量份额:

可以看到在1-7月电视剧播放量一直落后于腾讯,大部分时间落后优酷的爱奇艺在8月通过《延禧攻略》的播出实现了反超,由于同类型的《如懿传》已经定档在腾讯播出,爱奇艺能否继续保持优势也值得期待。

我们同时看一下综艺的月度数据:

腾讯从4月份开始,随着《创造101》等节目的播出,在综艺节目的播放量上遥遥领先于其他的视频网站,下半年能够延续该势头与其能否继续找到有爆点的节目息息相关。

04

独播数据

独播视频一直以来都是视频网站最为重要的资源,我们首先看一下整体独播占比随月度变化情况:

综艺节目的独播占比要高于电视剧,这与视频网站大力投入到自制节目有关,也使得喜爱综艺节目的用户对于网站会员的需求变大。同时可以看到6月以来的独播占比开始持续增加,都已经超过50%,这或许也将成为未来视频网站的一大趋势。

下面看一下各大网站分别的独播占比情况:

各大网站6月以来的独播占比都在显著提高,优酷的综艺节目独播占比基本上超过了9成。芒果随着新版《流星花园》的播出,独播占比也在快速提升,未来可能也会在电视剧播放量占到更高份额。

05

剧集对比

首先我们看一下平均日播放量(我们选取每个电视剧最高的五天进行评价)TOP25的对比及网站分布

《延禧攻略》在爱奇艺单个平台的单日平均播放量已经超过了除《恋爱先生》和《谈判官》外所有多平台播放的电视剧,并且与上述两部多平台总体剧集也十分接近。我们也更加深刻地理解了选取剧集对于视频网站的整体影响。

我们同时选出所有的独播剧集,对比独播剧集TOP25:

从数量上对比,优酷和腾讯处于明显的领先地位,并且都有爆款电视剧。而爱奇艺的《延禧攻略》和芒果的《流星花园》排名靠前,也相应提高了其在电视剧播放量上的份额,或许这也会促使这两个网站加大独播剧集的占比。

最后看一下综艺的情况:

显然腾讯在综艺节目方面处于明显的领先地位,无论是整体播放量还是独播资源播放量和数量都领先于其他的竞争对手。整体的发展趋势未来或许会促使更多的《创造101》诞生。

由于可视化代码比较多,而且重复性比较强,我们选取其中的独播剧集绘制部分语句来进行展示:

##绘制TOP25独播剧集数据

drama_agg_mon <- ddply(drama_stat_mon,.(name,monopoly,type),summarise,
                   total_play=sum(play_num))
drama_agg_mon <- drama_agg_mon[order(drama_agg_mon$total_play,decreasing = T),][1:25,]
drama_agg_mon$rank <- 1:25
drama_top_mon <- merge(drama_stat_mon,drama_agg_mon,all.x = FALSE,all.y = TRUE,by=c('name'))
ggplot(drama_top_mon,aes(x=reorder(name,-rank),y=play_num,fill=platform))+
  geom_bar(stat='identity',position = 'stack')+ggtitle('TOP25独播电视剧平均日播放量(亿)')+
  theme_wsj()+coord_flip()+
  scale_fill_wsj()+
  theme(legend.position = 'top',
        legend.title = element_blank(),
        legend.text = element_text(size = 25),
        panel.grid = element_blank(),
        axis.text.x = element_text(size=15),
        axis.text.y = element_text(size=20),
        strip.text.x = element_text(size=20),
        strip.text.y = element_text(size=20,angle = 0),
        plot.title = element_text(size=25,hjust=0.5))

往期回顾:

卫视实时收视率对比 | R爬虫&可视化第1季

当古代文人参加“中国好诗人”节目 | R爬虫&可视化第2季

同花顺股票分数可视化 | R爬虫&可视化第3季

近三十年6000部国产电视剧告诉了我们些什么 | R爬虫&可视化第四季

R爬虫&可视化第五季-图解欧洲足球五大联赛

爬虫告诉你, 互联网大数据行业有多赚钱!

公众号后台回复关键字即可学习

回复 爬虫            爬虫三大案例实战  
回复 Python       1小时破冰入门

回复 数据挖掘     R语言入门及数据挖掘
回复 人工智能     三个月入门人工智能
回复 数据分析师  数据分析师成长之路 
回复 机器学习      机器学习的商业应用
回复 数据科学      数据科学实战
回复 常用算法      常用数据挖掘算法

透过日播放量超过6亿的《延禧攻略》,看2018视频网站格局相关推荐

  1. 透过日播放量超过6亿的《延禧攻略》,看2018视频网站格局(附代码)

    来源:数据森麟 本文约2000字,建议阅读6分钟. 本文将对比各大视频网站2018年截止到8月18号的电视剧和综艺节目的播放情况,并对数据进行分析. [ 导读 ]随着<延禧攻略>的播出,魏 ...

  2. 从延禧攻略看,把自己打造成一个成功的产品你需要思考这些

    这个夏天,无数人沉迷于<延禧攻略>不可自拔,魏姐一路升级打怪,最后笑傲后宫,还有白月光富察皇后,大猪蹄子乾小四,全民公敌尔晴,太多经典的人物了,这些人物都是成功的,而从做产品的角度来看,人 ...

  3. AI还原乾隆后妃样貌,延禧攻略众生相。

    对效果进行了调整,又出一期视频,上了B站首页热门榜,播放量近50W. 上期视频很多留言说想看,乾隆后妃的,这次也安排上了,CSDN也上传了视频. AI还原乾隆后妃样貌,延禧攻略众生相. 视频链接:ht ...

  4. 分析日播放量超 6 亿的《延禧攻略》,看爱奇艺腾讯视频谁胜谁败

    作者 | 徐麟 责编 | 郭芮 随着<延禧攻略>的播出,魏璎珞.富察皇后等各位后宫小主的命运时刻牵动着各位观众的心.同时爱奇艺也因为该剧的大火,收获了单日超过6亿的播放量. 我们此次将对比 ...

  5. 每天6亿人在看《延禧攻略》?大数据告诉你哪家视频网站VIP值得买(附代码)

    导读:随着<延禧攻略>的播出,魏璎珞.富察皇后等各位后宫小主的命运时刻牵动着各位观众的心.同时爱奇艺也因为该剧的大火,收获了单日超过6亿的播放量.我们此次将对比各大视频网站2018年截止到 ...

  6. 《延禧攻略》网播50亿+,脑洞广告背后有家智能营销扫地僧

    每年都有现象级网络大剧,今年当属<延禧攻略>,上映三周多网播就已破50亿,爱奇艺神剧平台的地位愈发牢固. 富察皇后(秦岚饰)下线,娴妃(佘诗曼饰)问鼎中宫之位,璎珞(吴谨言饰)为查清富察皇 ...

  7. 延禧攻略单日播放量超5亿爱奇艺为何因此关闭了前台播放量显示

    如今的电视剧动辄百亿几百亿的播放量都是家常便饭,一部剧破亿的播放量没什么,破一百亿.两百亿甚至更多,才是牛气!而且现在的电视剧宣传的时候,播放量是其中一个宣传的一个重点,比如说前段时间很网络上的热门电 ...

  8. 数据库界的《延禧攻略》来了,不看你就输了

    胜者为王,败者为寇这种思想好像从古代就一直延续到今日.非要分出个胜负,分出个谁好,谁坏才罢休. 在数据库领域也会有此类问题,我混迹开源数据库圈多年.MySQL 数据库占领着开源数据库的头把交椅,Mon ...

  9. 硅谷版《延禧攻略》,到底哪位科技大佬才是真正的魏璎珞?

    硅谷Live / 实地探访 / 热点探秘/ 深度探讨 最近小探碰到一个在谷歌工作的美国小哥哥问小探最近都看啥剧.<延禧攻略>啊!小探好后悔自己为啥不是女儿身投入大清帝王的怀抱--没想到 一 ...

最新文章

  1. linux splash qt,ubuntu14.04 splash安装
  2. 车辆动力学基础(1)
  3. ES6-let和const命令
  4. com.alibaba.fastjson.JSONObject之对象与JSON转换方法
  5. .NET Core 下使用 Kafka
  6. java 抽象类构造函数_抽象类可以有构造函数吗?
  7. scp上传服务器加特殊端口
  8. 怎么保证读取最新数据_摄影师的数据存储有多难,怎么存储大量数据并保证安全高速防水防摔防尘?SanDisk...
  9. AJAX JSONP源码实现(原理解析)
  10. 基于深度学习的大豆叶片病害识别(自然环境下1470张图像)
  11. python字典输出键值对_Python:遍历字典 键值对
  12. SiT9005:1 -141MHz单端扩频振荡器SSXO
  13. python入门笔记——类和对象③(案例:自动随机文字游戏——决战紫禁之巅)
  14. Firefox火狐浏览器如何本地备份导入、导出密码
  15. yield 函数的理解
  16. 直角三角形(rigtri)
  17. 使用Python以UCI心脏病数据集为例,进行数据简单分析
  18. 深度盘点:初学者必备这 15 个 Scikit-Learn 重要技能
  19. 知识从来就不是一个人的
  20. 由RGB到HSV的转换详解

热门文章

  1. EG网关网口连接西门子PLC应用案例
  2. 微信支付v2开发(9) 标记客户投诉处理状态
  3. 【C语言】案例十三:冰雹猜想
  4. 《信息安全保障》一2.3 信息安全保障工作方法
  5. 干货 | 关于射频芯片最详细解读
  6. 机器学习进阶之概率论(1)
  7. matlab常见符号运算( 因式分解、展开、合并、简化及通分等,计算导数,积分,符号求和、代数方程和微分方程求解)
  8. STM32读取RTC时钟
  9. MVTec 针对 Intel 发行版工具套件推出新插件
  10. 计算机专业英语教程第五版课文,计算机专业英语教程阅读