从业务的角度看,企业级大数据平台功能可细分为查询检索、数据挖掘、统计分析、深度分析,其中深度分析分为机器学习和神经网络。

从技术的角度看,企业级大数据平台功能细分为Batch、SQL、流式处理、machine learning、Deep learning。

企业的数据一部分来自于本身的业务数据,比如:MySQL、oracle等,还有一部分是大量的事件。数据源不同,处理的方式也不一样。传统的技术手段很难全面覆盖。采用大数据实时分析平台,那么,基于日志数据源,就用事件写入kafka;如果是针对MySQL、oracle等传统rdbms,就用Sqoop,写入HDFS里,并建立Hive的集群。还可以存一份数据在云端。有一部分业务就是对数据合并后放入HDFS做大量的业务查询和业务统计。这时希望用SQL的方式进行查询,会有很多选项,它选择的是大数据平台的Impala等。还有一些流式处理或机器学习可以用到大数据平台的Spark。

社会文献出版社就是一个很好的例子。出版社要想在市场竞争中取得一席之地,除了要有一支过硬的内容生产队伍,还需要人人能用数据说话。所以构建基于出版社的大数据运营体系,势在必行。社会科学文献出版社选用了Smartbi,并期望通过Smartbi建立企业的BI平台来解决如上问题。截至到去年,全社30%的员工成为Smartbi的重度依赖者,可以一天不刷微博,但不能一天不用Smartbi!

对于策划人员而言,之前在进行选题策划时,要听取发行人员的意见,或者随机发放调查问卷,这种方式会因为发行人员样本数量太小、主观性太强、问卷的可靠性低等原因导致调查结果与实际市场需求存在一定偏差。如今利用Smartbi对上游出版社和下游书店以及读者之间的数据进行分析,在需求最大的区域找出最合适的市场,以及不同个体的实时需求,挑选出社会公众关注度高的题材,与社交媒体上具有重大影响的公众人员进行联合宣传调查,从而实现精准的题材策划。

于运营人员而言,曾经天天加班做报表,即使是格式相同的周报、月报,还是需要每一次都进行手工填充。但有了Smartbi,只要用数据处理工具制作一次数据流,并基于该数据流制作一次分析看板,以后的工作量就是点击一次鼠标,选择自动更新源数据即可。同时,Smartbi是基于Excel设计的,兼容了绝大部分Excel的能力,他们不再需要懂代码,只要会Excel就能迅速上手。

除此之外,出版社还可以对收集的用户性别、年龄、所处位置、消费水平、职业、浏览记录、收藏书单、籍评价等个人信息进行分析,了解读者的行为习惯,以便迅速地在海量数据之中寻找到不同客户的需求,从而实现精准营销。同时,依据目标读者消费者的喜好,将营销信息很好地呈现在书籍设计和包装中,通过各种形式传达给读者,做每一位读者的专属在线书店。这种量身定制的数字化精准营销,对书籍的点击率、浏览时长以及购买率有明显的提升作用。

社会科学文献出版社对BI的应用逐渐从简单的工具应用深度融入到业务、管理、财税等各项活动中。

社会科学文献出版社做出的这个决定,太正确了。让数字化运营思路推动数据价值是涌出来的,只有管理层意识到数字化运营管理分析的重要性,让BI成为工作的一部分才能充分体现数据的价值。经营分析指标体系数据分析从各种维度分析具体指标,需要构建一套完整的指标体系、统一的规则,才能让各条线共享、认可数据分析的结果。

企业级大数据平台应用场景介绍相关推荐

  1. (1)大数据和应用场景介绍

    专栏目录 (1)大数据和应用场景介绍 (2)大数据技术综述总结 (3)HDFS原理与高可用技术原理介绍 (4)Yarn架构.资源管理原理和运维技术介绍 (5)Kafka原理和高可用介绍 1.大数据基本 ...

  2. 大数据平台CDH的介绍和5.16/6.3版本的搭建

    以下记录和介绍为自己在测试环境中的实际操作,因为很详细,所以篇幅较长,作为自己的记录文档,同时也帮助初学大数据平台搭建的朋友. 目录 1. CDH介绍 Hadoop主流三大发行版本: 1.1 CDH体 ...

  3. 【硬刚大数据】企业级大数据平台建设参考 | 淘宝滴滴美团360快手京东

    欢迎关注博客主页:https://blog.csdn.net/u013411339 欢迎点赞.收藏.留言 ,欢迎留言交流! 本文由[王知无]原创,首发于 CSDN博客! 本文首发CSDN论坛,未经过官 ...

  4. 企业级大数据平台智能运维好帮手——星环科技多模数据平台监控软件Aquila Insight

    Aquila Insight介绍 Aquila Insight是星环科技推出的一款多模数据平台监控软件,为企业运维团队提供了一套统一.完整.便捷的智能化运维解决方案.通过丰富的仪表盘管理.告警与通知管 ...

  5. 《企业级大数据平台构建:架构与实现》阅读总结

    目录 基本结构 1. 网络虚拟化 1.1 大二层交换网络 1.2 SDN(Software Defined Network) 1.3 NFV(Network Function Virtualizati ...

  6. 秒级处理海量数据,浙江移动大数据平台是怎么做到的?

    近年来,随着云计算.移动互联网.物联网等技术的发展,以及智能手机.平板电脑等终端设备的不断涌现,各种类型的电商.社交媒体等应用快速发展,产生了海量的数据,并且数据量增长的速度越来越快,庞大的数据资源引 ...

  7. 个人理解数据中台与大数据平台区别

    个人理解数据中台与大数据平台区别 概念介绍 本文主要介绍如下几个数据概念: 数据库 数据库是"按照数据结构来组织.存储和管理数据的仓库".是一个长期存储在计算机内的.有组织的.有共 ...

  8. 秒级处理海量数据,浙江移动大数据平台是怎么做到的

    项目背景 近年来,随着云计算.移动互联网.物联网等技术的发展,以及智能手机.平板电脑等终端设备的不断涌现,各种类型的电商.社交媒体等应用快速发展,产生了海量的数据,并且数据量增长的速度越来越快,庞大的 ...

  9. 大数据平台应用 17 个知识点汇总

    一.大数据中的数据仓库和Mpp数据库如何选型? 在Hadoop平台中,一般大家都把hive当做数据仓库的一种选择,而Mpp数据库的典型代表就是impala,presto.Mpp架构的数据库主要用于即席 ...

最新文章

  1. NSOperation下载网络图片(四)
  2. PowerShell: 详解Windows10常用的PowerShell高级任务
  3. 上千个电脑文件怎么搬?用Python一键复制移动
  4. unreal world 皮革_UnRealWorld 进阶游戏教程
  5. cp linux 显示进度条_Unix/Linux/Mac os下 文件互传
  6. 转载---SQL Server XML基础学习2之--FOR XML AUTO/RAW
  7. python 递归函数与循环的区别_提升Python效率之使用循环机制代替递归函数
  8. (转)正则表达式在ORACLE中的使用
  9. python wrapper_Python functools之partial, update_wrapper, wraps
  10. python小说阅读器_用python实现自己的小说阅读器
  11. c语言遍历字节,C语言遍历结构体
  12. HBase 管理,性能调优
  13. 深入理解 C 语言的函数调用过程
  14. 大华相机RTSP获取视频方式
  15. SQLSERVER、ORACLE中根据汉字获取拼音函数
  16. 宋体 ttf_Linux安装7种思源宋体的5个步骤
  17. IDEA中Python使用url时报错:Traceback (most recent call last)
  18. win10系统更新服务器太慢了,win10更新慢如何解决
  19. php es使用,PHP的ES入门(一)—— Index的创建和删除
  20. 软件定制开发解决方案

热门文章

  1. 为什么在室内4G信号会变弱
  2. [论文总结] 农业工程领域中App和Web相关应用论文笔记
  3. 我们不做看客,只做时代的赋能者—FMI2018人工智能与大数据高峰论坛圆满落幕...
  4. 【造物笔记】基于51单片机的心形流水灯
  5. 厉害了!几行代码搞定机器学习模型
  6. 【C语言】帮你解决c语言中数组的问题
  7. 同步脑电图-功能磁共振融合推断宏观脑动力学
  8. mybatis中type-aliases-package的用法
  9. HTML5+CSS大作业——明星个人主页(15页) 创作主页
  10. Shell脚本中读取文件每一行的方法总结