无论有小孩还是没小孩的朋友,如今都不会错过每周的《爸爸去哪儿》节目。作为当下最火的综艺节目,各种分析和报道可谓满天飞,但目前能够被引用的数据往往局限于电视收视率和网络播放量,这种“过时”了的普通数据对于节目制作方和观众来说,除了能够体现节目的基本受欢迎程度外,并不能带来太多的价值。

  随着大数据在在线视频领域的广泛应用,视频网站的内容如今已经被“接”上了大数据的翅膀,像《爸爸去哪儿》这样的火爆节目,通过对网友的数据分析,甚至可以得到网友对每期节目每一秒钟内容偏好,大数据的威力在在线视频领域正逐渐显现。

  大数据揭开内容“盲点”

  “虽然节目很火爆,但是作为制作方,其实还是很想知道观众对于每期节目各部分内容的反馈。可是现在的数据只能看收视率的高低和播放量的多少,这只是对节目整体进行一个评价,关于节目细节所存在的‘盲点’,制作方并不能具体了解到。”据业内人士表示,如今在影视内容制作领域,如何能够更好地揣摩到观众对内容的喜好已经成为了业内最迫切需要解决的问题。

  “与传统的电视传播途径相比,在线视频内容由于嫁接在互联网渠道上,把很多不可能变成了可能。”近日,细心的网友会发现在爱奇艺上出现了用30分钟可以看完时长90分钟的《爸爸去哪儿》《快乐大本营》《康熙来了》等热门综艺、并且不会落下任何一段亮点内容。据介绍,和以往视频网站采用的编辑人工剪辑不同,爱奇艺此次使用的神奇“剪刀手”是大数据。

  据爱奇艺相关负责人介绍,这个神奇“剪刀手”是爱奇艺推出“绿镜”视频编辑功能。该功能能够通过综合分析用户海量视频观看数据,自动判断用户喜好,并将精彩内容抽离出来,生成受关注程度最高的“精华版”视频,用户进入爱奇艺内容播放页即可选择观看完整视频或绿镜精华版内容。

  大数据的威力也让大受欢迎的《爸爸去哪儿》显露出了节目的“盲点”。在《爸爸去哪儿》海岛篇(下)中,“萌娃真心话”、“点球大战”等视频片段,成为《爸爸去哪儿》最受网民喜爱的内容。用户观看这两段视频时,产生的快进次数趋近于0,并且有近40%用户在爱奇艺上观看这两段视频后进行了快退操作,反复观看了两遍以上相关内容。在大数据的剖析之下,视频内容本身的优劣可谓是暴露无遗。

  在线视频成大数据“宝库”

  据去年7月iResearch艾瑞咨询发布的数据显示,在线视频用户规模已经超越搜索服务跃居第一,继时长份额居首后又成为覆盖最多网民的网络服务,在线视频成为互联网第一大应用。与此同时,在所有网络服务当中,网民用于观看视频的时长超越其他网络服务,稳居所有服务首位,表明网民对在线视频的依赖程度不断加深。

  此外,与以往在线视频内容集中在影视剧方面相比,如今各大在线视频网站通过对UGC(用户分享视频)方面的发力,也极大地增强了内容的丰富性。刚刚进行了品牌重新升级定位的PPS就将UGC内容作为发力的重点之一,据PPS爱频道负责人陶嘉翰介绍,PPS目前平均每日上传视频量已经突破50000个,这个量级已经开始接近以UGC模式起家的土豆网。在56网方面,也已经将2014年的战略聚焦在“56出品”上,并通过加大自制投入、丰富节目类型、抢占多屏加大“56出品”的内容输出等级方面来丰富内容。在线视频内容日渐丰富还体现在央视的内容也频频与在线视频网站进行合作,其中由优酷与央视《东方时空》打造的《网罗视界·拍客》在优酷的总播放量就已超过2000万,而最近连中央电视台新闻联播节目播出的部分新闻内容,也直接选用了优酷拍客的作品。

  “与传统互联网服务相比,在线视频在覆盖人数和使用时长两方面都遥遥领先,而随着内容方面的不断丰富,可以说已经为利用在线视频内容提炼大数据提供了充分的‘生产资料’。”战国策分析师杨群在接受南方日报记者采访时认为,与传统的搜索和新闻资讯类内容相比,在线视频内容可以体现出用户更多的个人喜好,同时也容易获得用户的行为偏好。“以往网友在网上看新闻资讯,可能只是单方面的浏览,最大程度的互动就是去留言和评论,但是留言评论的数据一方面较难统计,另一方面也无法得到对新闻资讯内容细节的评价。至于搜索服务,虽然可以较为精准地得到用户偏好和需求,但是对于用户后续的行为则缺乏有效的跟踪,对内容的质量也无法做出评价。”杨群表示,在线视频内容的丰富性和用户可操作性,让用户的喜好更容易收集到。“用户选择哪类型节目来观看,本来就是一个喜好的重要甄别,而在观看视频的过程中,用户可以通过对某段内容的喜好进行选择性的快进和倒退、充分播放甚至分享,这种对于内容的‘选择’很大程度上可以客观地反映出内容在观众中的受欢迎程度。”

  大数据带来更大的商业价值

  如果说类似爱奇艺绿镜功能给用户带来足够多的便利,对于影视制作机构而言,此类数据分析功能无疑将带来更大的商业价值。大数据分析能够全面系统地展示视频节目在用户中的受欢迎程度,以及每一个节目、每一个视频中最受用户喜爱的片段和用户最不喜欢的部分,所以影视制作方可以通过大数据观察用户对每个内容片段的不同反应,实现对节目环节和电视剧情节设置的优化调整。

  “56网将通过用户调研和大数据分析,持续探索品牌内容营销模式。”56网市场营销副总裁李浩认为,大数据不仅能够为用户和内容制作方带来价值,同时能够让在线视频网站在营销层面获益。据介绍,56网利用大数据的分析,使得优质自制节目和微电影更易于为广告主量身定制,让广告主的品牌营销准确率更高,同时向电视台、IPTV、航空、地铁公交传媒等全方面输出56出品自制内容,实现最大化的全媒体人群覆盖,为平台获取更多的大数据样本。

  大数据为平台提供对外的营销优势外,对自身的发展调整也起到了重要的指导作用。迅雷看看近日就根据大数据的挖掘而发布了迅雷看看电影院(付费频道)用户画像数据报告,其中数据显示90%以上影视VIP用户(付费会员用户)为男性,对于迅雷看看而言,从大数据分析中可以了解到只要抓住了男性用户,就抓住了“网络票房”。此外,数据还显示影视VIP用户主要需求是高清(高清/正版),占比最高超过80%。可见,高清画质已成为迅雷看看高端视频用户的一大重点需求。

  “大数据不仅能够让广告主更加精准的投放,为在线视频网站带来更多的收入,就连广大原创作者,也可以利用大数据获得收益。”杨群举例说到,通过对用户数据的分析,原创作者可以了解到制作什么样的内容更加容易得到用户的青睐,获得更高的点击率。“更多的点击率,原创作者就可以获得更多的广告分成,而在线视频网站就可以承担平台的作用。”据介绍,优酷就发起了一场盛大的“晒音乐”分享活动,通过优酷分享计划和一系列演唱会和大赛活动,帮助音乐作者强化自身品牌增加粉丝数的同时获得丰厚的广告分成收益,让热衷音乐的牛人们在原创路上摆脱苦逼,获得更好的发展。

汉语分词系统NLPIR(前身ICTCLAS)从2000年诞生以来,历时14年,全球用户突破30万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名,已经成为中文信息处理领域标杆性的工作。ICTCLAS创始人张华平博士倾力打造,即将推出的NLPIR2014版,是迄今为止最大的一次更新,在汉语分词体系架构下增加了对英文词法分析的支持,可以自动识别英文词汇的原型、词性标注、命名实体与关键词;并在当前汉语词法分析的基础上,实现了文档的完整语义分析,自动提取文档的人名、地名、机构名、文章作者、发布的媒体、关键词与摘要,是当前中文信息处理的必备神器,值得期待!

我们即将召开NLPIR2014发布暨ICTCLAS用户大会,由北京理工大学大数据搜索挖掘实验室主办,计算机世界与大数据论坛联合承办。张华平博士诚邀历年来所有支持我们前行的ICTCLAS用户,中文分词及中文信息处理的技术爱好者莅临参加,分享中文语言智能理解的美妙。届时,张华平博士将亲自讲解NLPIR2014背后的技术原理与最新进展,并由资深工程师在不同操作系统不同开发语言下NLPIR的实训技巧,同时还有不同背景的资深用户分享他们的使用开发经验。

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名)

基本信息

会议形式

(a) PPT算法讲解;

(b) NLPIR2014系统演示与实际开发操作;

(c) 针对学员具体需求的互动交流会

(d) 提供专属U盘:保护NLPIR2014的演示系统、各类试用的API以及新版开发手册;

会议时间

12月21日上午9:00-12:00,下午13:30-17:00 ( 17:00-18:00 开放式讨论答疑 )

门票费用

(a)1400 (包含门票,NLPIR2014演示系统、开发包与文档, U盘,工作餐,赠送由张华平博士亲笔签名的《大数据搜索与挖掘》专著);

(b) 12月10日前缴费优惠价1300元;老学员或同单位三人以上报名九折优惠;全日制学生凭学生证会费优惠价格980元,不含发票。

(c)名额有限,参会者需在参会前提前购买门票。

(d)差旅及食宿费用自理。

与会嘉宾

主讲人:张华平:NLPIR(ICTCLAS)创始人与开发者,北京理工大学大数据搜索挖掘实验室主任,博士,副教授

主持人:赵燕平:北理工经管学院教授,北京理工大学大数据搜索挖掘实验室副主任

特邀ICTCLAS典型用户嘉宾待定(将包括跨国企业、金融、政府机关、科研院所、投资与互联网等代表性用户)

会议地址

北京理工大学理工国际交流中心

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名)

ICTCLAS创始人张华平博士简介

2005年博士毕业于中科院计算所,研究方向为:微博计算、自然语言处理、信息检索与信息安全、大数据搜索与挖掘。曾先后获得2010年度钱伟长中文信息处理科学技术奖一等奖,中科院院长优秀奖、中科院计算所所长特别奖,中科院计算所“百星计划”首批入选者。张华平作为课题组长主持开发了国家自然科学基金、863、973、242等科研课题十余项,发表《大数据搜索与挖掘》《信息检索:算法与启发式规则》《自然语言理解》等专译著3部,所研制的ICTCLAS分词系统已经向国内外的企业和学术机构颁发了三十万多份授权,在学术界和产业界得到了广泛的应用。并作为特邀技术专家,先后在中央电视台、全国网络侠客行大会、全球大数据技术峰会、中国网络科学大会上做大数据相关的主题演讲,广受好评。

会议日程

时间

讲师

环节

主要内容

8:00-9:00

各位参会人员

会议报到

签到,领取各项资料。

9:00-9:20

赵燕平教授

大会开幕式

开幕式致辞,嘉宾与学员介绍

9:20-09:50

张华平博士

NLPIR2014发布

1)     NLPIR2014功能展示:分词、词性标注、命名实体识别、新词识别、英文分析、关键词提取;

2)    NLPIR2014开发包介绍

09:50-10:10

合影留念及茶歇

10:10-12:00

张华平博士

NLPIR2014汉语分词关键技术及最新进展

1.  ICTCLAS的层叠隐马分词模型(汉语分词、未登录词识别、词性标注)

2.   ICTCLAS的词典管理专利算法:完美双数组TRIE树;

3.  新词识别与关键词提取算法原理;

4.  NLPIR2014英语词法分析技术;

12:00-13:30

工作午餐

13:30-15:00

张华平博士

康肖钰硕士生

张冰波硕士生

NLPIR2014汉语分词开发包使用实训

1.    NLPIR2014 C/C++语言调用实训

2.    NLPIR2014 Java语言调用实训

3.    NLPIR2014 Linux调用实训

4.    NLPIR2014 高级编程实训(多线程安全、用户自适应分词、python调用、关键词提取等)

15:00-15:30

朱勇高级工程师

NLPIR示范应用:黄金眼Web大数据搜索与挖掘平台

主要介绍利用NLPIR系统开发的黄金眼Web大数据搜索与挖掘平台,展示主要功能与背后的实战应用经验,目前已经应用于工信部、总参、财经杂志等单位。

15:30-16:00

姜伟(北京外事办信息中心主任)

NLPIR示范应用:政务公文主题词提取系统

主要介绍利用NLPIR系统开发的政务公文主题词系统,历经十余年,目前已经应用于大部分政府机关。

16:00-16:30

罗文川(缔元信CTO)

NLPIR示范应用:缔元信网站统计数据挖掘与应用

主要介绍缔元信利用NLPIR系统开发的互联网网站统计数据挖掘与应用,是目前网站统计方面权威的机构。

16:30-17:00

待定

17:00-18:00

张华平博士

交流沙龙

可与ICTCLAS创始人张华平博士直接交流讨论

名额有限,先到先得,参会报名热线:

张老师 :13681251543    Email: zhangjie@bigdatabbs.com

官网支持:http://ictclas.nlpir.org

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名)

转载于:https://my.oschina.net/u/1160813/blog/181788

在线视频插上“大数据翅膀”相关推荐

  1. 视频监控为校园安全插上“隐形的翅膀”

    随着公众社会安全防范意识的提高,安防系统慢慢在各种公共场合普及.而我国教育事业的发展,高校的规模越来越大,学生人数不断增多,校区开放程度和后勤服务社会化程度亦越来越高,学校的管理工作和安全保安工作面临 ...

  2. 时序数据库(TSDB)-为万物互联插上一双翅膀

    本文由  网易云 发布. 时序数据库(TSDB)是一种特定类型的数据库,主要用来存储时序数据.随着5G技术的不断成熟,物联网技术将会使得万物互联.物联网时代之前只有手机.电脑可以联网,以后所有设备都会 ...

  3. 拥抱 Elasticsearch:给 TiDB 插上全文检索的翅膀

    拥抱 Elasticsearch:给 TiDB 插上全文检索的翅膀 作者介绍:孙晓光,知乎技术平台负责人,与薛宁(@Inke).黄梦龙(@PingCAP).冯博(@知乎)组队参加了 TiDB Hack ...

  4. 华为云DevCloud为虚拟仿真插上互联网的翅膀

    华为云DevCloud为虚拟仿真插上互联网的翅膀 两三年前,虚拟仿真或者说VR,火得一塌糊涂,火得不真实.又在无人察觉中,平静地落下帷幕,这个行业开始回归本质.原本专业性极强的领域,以游戏为突破口.以 ...

  5. 为有梦青年插上助力的翅膀 魅族开发者大赛取得圆满成功

    2016年11月19日,在北京京都信苑饭店,"魅族技术开放日第六期暨魅族开放平台开发者大赛颁奖礼"在SDCC2016中国软件开发者大会分会场盛大召开,本次活动不仅邀请了业界技术大咖 ...

  6. 仿真技术为“工业 4.0”插上想象的翅膀

    "智能+"时代来临 新兴技术正在叩响行业转型之门 首当其冲的当属承载工业之魂的制造业 面向工业4.0 制造业应该如何打破低端锁定困局 加快融合智能制造步伐呢? 对于现代制造企业来说 ...

  7. 让传统的振弦传感器插上信息化的翅膀---VM系列读数模块

    让传统的振弦传感器插上信息化的翅膀---VM系列读数模块 产品主要应用于振弦传感器信号转换.自动化监测.岩土工程监测.地质灾害等领域. 关键词:安全监测,自动化,振弦传感器,测量模块 作为国内领先的从 ...

  8. 【Workshshop No.3 | Kyligence X 青云QingCloud Workshop】零基础搭建云上大数据平台

    7月13日Kyligence 与青云QingCloud 联合举办的"零基础搭建云上大数据平台" Workshop诚邀您参加. Kyligence Cloud 是 Kyligence ...

  9. 未来的计算机绘画图片,电脑绘画——为想象力插上科技的翅膀 二十中附校科技社团电脑绘画作品展...

    原标题:电脑绘画--为想象力插上科技的翅膀 二十中附校科技社团电脑绘画作品展 二十中附校电脑绘画卓越能力课程开展至今有近2年时间了.课程帮助学生认识绘画工具和软件.培养良好的绘画习惯.提高绘画和艺术创 ...

最新文章

  1. Android架构篇-5 CI/CD(持续集成、持续交付、持续部署)
  2. php简单文件上传类
  3. 为@RequestMapping标注的方法扩展其传入参数
  4. 让Windows7 x64 IIS7支持32位应用程序
  5. java异常个人理解
  6. 第二章 物理层 1 物理层的基本概念 [计算机网络笔记]
  7. 使用Nacos项目jar包启动抛出的yml异常
  8. WPF 利用键盘钩子来捕获键盘,做一些不为人知的事情...完整实例
  9. 最好的 6 款 React 后台管理系统模板和框架
  10. ubuntu系统firefox浏览器无法播放音视频
  11. 不知道怎么把英文文档翻译成中文?手把手教你怎么操作
  12. idea 行号栏太宽以及显示一些图标问题解决
  13. 《数据最重要的成员--算法》
  14. stm32 火灾自动报警及联动控制源码_火灾自动报警系统怎么进行消防联动控制设计...
  15. 存储容量扩展的设计仿真实验
  16. stata domin
  17. GDB 用法之查看内存
  18. 做一只展翅翱翔的雄鹰
  19. c++实现高速缓存Cache
  20. 从DS1302电路设计总结的晶振电路设计规范

热门文章

  1. matlab 变量上小尖尖,发动机最中间的那个小尖尖,你猜是什么?
  2. 用户太多:互联网巨头之惑
  3. 深大uooc学术道德与学术规范教育第二章
  4. Vue3.0 中的数据侦测
  5. 苹果手机计算机隐藏照片app,‎App Store 上的“秘密计算器 - 隐藏私人照片和视频”...
  6. 什么是高中物理?一篇长长长长文告诉你!
  7. Promise学习-手写一个promise
  8. 使用Kaiju无组装计算宏基因组数据物种注释相对丰度
  9. 南宁第四中学2021年高考成绩查询,2021高考结束,我们一同见证这些难忘的瞬间...
  10. 关于如何将网页做的完整且美观的解决办法