想象一下,今天中国互联网每60秒可以发生哪些事情?60秒内,百度搜索达到450万次,微博发送80万条,淘宝发生8000笔交易,QQ空间照片上传15万张,数据就像滚雪球一样,越滚越大,不管你是不是喜欢,整个庞大的数据生态圈就这么悄悄的席卷而来了。根据IDC提供的研究报告,2020年预计全球新建和复制的信息量已超40ZB,是2012年的10倍,而中国数据量将超8ZB,比2012年增长22倍,快速膨胀的数据量促进了商业智能市场的发展。

比尔盖茨曾经说过:“如何搜集、管理和利用信息将决定您的胜负。”商业智能正式在这种需求下诞生的,那么究竟什么是商业智能呢?它与我们的生活是否息息相关 呢?从小型的超市系统,到银行、航空、水利、电力、铁路运输等大型系统,商业智能的应用无处不在。商业智能技术早已不再是大企业的专利,其应用领域已经拓 展至中小规模的企业,而在这新一轮的变革中,永洪在商业智能领域扎根三年了。对你而言,商业智能是近在咫尺,还是远在天边呢?本期名人堂皮皮邀请到了搬运 大数据的亨利,永洪科技CEO 何春涛坐镇,大数据时代下,商业智能应用暗藏哪些玄机?

皮皮Q1

何总,您好!很高兴有机会采访到您,我了解到您曾经在商业智能领域的跨国企业里担当研发副总裁,而2013年是您人生中的一个转折点,在这一年里,您选择了创业,能不能分享下您当时创办永洪科技的初衷?

何春涛A1:

创业之前的2012年,国内BI市场份额大致是这样的:Cognos 24%、BO 24%、BIEE 16%,如果再算上MSTR、Microsoft等等,可以说被国际厂商长期垄断,而国际市场更不可能有本土厂商的立足之地。作为BI行业的研发人员,这 样的局面看上去让人心痛。自己年纪也不小,考虑了一段时间,就决定出来折腾一把,希望能改变一下格局。

艾 瑞咨询是我们持续合作的大客户之一,为我们Pre-A轮融资提供了坚强的后盾。后来,我们又同美国经纬连续做了数千万的A轮和A+轮融资。到今年年初,我 们基本确定B轮融资,目前正在操作过程中。创业的路很难,好在认可永洪的客户越来越多,有一帮优秀的战友始终在一起努力,还有一些投资界不错的朋友对我们 的给力支持。

皮皮Q2

谈到大数据,除了来自数据库、结构化文件、消息队列和应用系统产生的结构化数据外,还有社交媒体、用户点击评论等产生的非结构化数据,当然还包括电信行业比如呼叫记录、摄像头、ATM机等传感器产生的数据,而商业智能平台是如何做到读懂各种类型的数据源的?

何春涛A2:

商业智能平台,几乎都是通用软件。也就是说,可以在各个行业各种场景中使用。针对您说的这个问题,一般用两种办法来解决:如果一个数据源遵循开放标准,例如 ODBC、JDBC,我们可以通过开放标准接入;如果它不遵循开放标准,在软件的数据建模层我们有自己的标准,一般通过提供适配器将这些非结构化数据接 入。

事实上,很多不遵循开放标准的大数据,一般也有成熟的Open API,比如微信公众号的企业数据。通过Open API,我们可以连接社交、电商、搜索等领域的大数据,将数据以结构化或者非结构化形式进行存储,再进行交互式分析和深度分析。

皮皮Q3

如果把企业经营和管理的数据比喻成“矿石”,那么商业智能的作用就是将这些“矿石”转化成“精矿”。商业智能到底给我们的生活带来了哪些便利呢?能不能结合一些实际的案例,和我们分享下商业智能采矿的处理过程。

何春涛A3:

永洪科技有一句口号:大数据小数据,一天实现可视化分析。事实上,这是数据分析行业的主流发展趋势:将数据做轻度清洗,再进行轻度建模,之后将细节数据直接 入库。这里的数据仓库一般具备高性能计算能力,用户提交的各种数据分析请求,都可以直接基于细节数据进行实时计算,在几秒之内返回结果。

这样的数据分析流程不再需要IT部门深度参与,主要由商业用户自己完成,而IT用户主要做好轻度ETL、轻度建模、平台监控等工作。大家可以阅读以下我的另一篇文章《谁是BI平台的深度用户? 》,链接是:

http://mp.weixin.qq.com/s?__biz=MzAwNzAwNjMyMw==&mid=203465261&idx=1&sn=3a55f0f826431966d8d2f9eb9231ac1d&scene=1&from=groupmessage&isappinstalled=0#rd

拿我们BI的一个客户举个例子吧。国内最大母婴社区宝宝树将永洪BI应用于社区数据分析,主要用户不是IT人员,而是业务人员。业务人员通过行为数据和搜集到的孩子年龄、孕产期等关键数据,给用户做出精准画像。积累关键数据后,业务团队会做深度分析。

比 如上周有多少新用户?推的新品收入增长怎样?上个月的新用户这个月的购买情况如何?用户的平均回购周期相对环比是缩短了还是延长了?各渠道引流占比有何变 化?通过在BI平台上进行交互式分析,这些问题的答案很容易浮出水面,继而他们就知道下一步如何来调整产品、推广和销售计划了。

大家知道,BAT等互联网巨头都认为自己是大数据企业,数据已经成为了企业的核心资产。如果我们不收集存储好“矿石”,或者不开展有效的“精炼”工作,在商 业竞争中将处于下风。BAT这样的互联网巨头一般都有多达几十甚至上百人的IT研发团队,他们的实力比较强,主要基于开源技术按需定制数据分析平台,完成 数据的存储、建模、分析、预测工作。当然,对绝大多数企业来说,通过与永洪科技这样的优秀BI厂商合作,将是性价比和成功率都很高的选择。

皮皮Q4

商 业银行的网点非常多,每天的现金流都不一样,那么银行面临的问题就来了,怎么解决或者平衡各网点的现金流问题?银行能否利用商业智能为我们提供各种智能化 和个性化的服务呢?对于航空公司来讲,订票系统有没有可能根据个人的历史订票记录去预测未来哪些潜在客户在什么时段内预订机票呢?发电企业如何根据历史发 电量、历史增长率和其他因素去预测未来几年的用电需求呢?这些貌似与我们息息相关的困局能否通过商业智能来解决或者完善呢?

何春涛A4:

对于怎么解决或者平衡各网点的现金流问题,商业智能可以采取的手段比较多。一方面我们可以根据历史数据进行机器学习,为网点建立合适的现金配备模型;另一方 面为了应对临时需求,在现金配备大大高于或者低于现金需求的中位值时系统及时触发报警,这样银行网点就能及时验证报警并采取修复手段。

说到金融行业,不少股份银行是基于永洪BI建立了自己的营销系统,目的之一就是为了给金融客户提供更好的个性化服务。基于原始数据,系统会首先进行“用户画 像”,比如基于AUM值将用户分层,基于理财偏好将用户分群,再提供个性化的智能服务。比如用户打开手机银行终端,他看到的前几个理财产品已经是个性化 的。

国家电网以及一些东部大省的电力公司都是我们的客户,他们在BI领域的建树也是令人称道的。随着智能电表的普及推广,他们的监控能力在某些场景中已经精确到每个用电用户,通过BI平台,一旦用电量只剩50度电时,就会发消息温馨提示一下用电客户。

皮皮Q5

实 时计算一般都是针对海量数据进行的,一般要求为秒级。对于大型网站的流式数据,比如网站的访问PV/UV、用户访问了什么内容、搜索了什么内容等,实时的 数据计算和分析可以动态实时地刷新用户访问数据,展示网站实时流量的变化情况,分析每天各小时的流量和用户分布情况等。这些数据源是实时的不间断的,要求 用户的响应时间也是实时的,那如何实现大数据实时计算与流计算呢?

何春涛A5:

我们在电信运营商有一个场景,是对各种上网数据进行病毒和安全监控,防止手机等终端感染病毒或受到攻击。记得当时支撑这个场景的刀片服务器接近200台,即 将超过400台。整个集群横向分为三层:分别是实时计算层、流计算层、离线计算层。我们对集群进行了纵向分割,把这个大集群变成了小集群,以去除服务器和 网络之间的干扰。这样一来,整个集群可以实现快速水平扩展,而处理能力随着集群规模的增长,也实现了线性增长。

实时计算和流计算可以采用一些开源框架,譬如Storm、Spark等,在设计架构时,我们重点测试了一下Storm,在未经深度调优的前提下,从收集的实 验数据来看,处理能力达不到系统的设计要求;我们也试着寻找国内外有无在类似规模上使用Storm的场景,结果也不太好。

这 些年大数据分析成为了我重点发力研究的一个方向,在分布式领域我拥有一些专利技术。这些技术在类似的项目中发挥了关键作用。不管是采用开源还是闭源技术, 我们需要灵活运用分布式计算、内存计算、分布式通信、可靠性等领域的知识和经验,才可能更好地实现大数据实时计算与流计算。

皮皮Q6

作为商业智能的核心,数据仓库需要将历史细节性数据归档到离线的存储设备上,主要用来支持企业管理人员的决策分析,那么它究竟与数据库有什么区别呢?怎么做到数据的备份与恢复、数据归档、系统监控?

何春涛A6:

一般地,数据仓库是一个逻辑概念,而数据库是一个物理概念。数据库系统可以很好的解决事务处理,实现对数据“增删改查”等功能,但是却不能提供很好的决策分 析支持,事务处理优先考虑的是响应的及时性,决策分析需要考虑的是数据的集成性和完整性,将大部分数据从OLTP系统中剥离出来,就形成了今天的数据仓库 系统。

打造企业级数据仓库,可以用合适的数据库承担数据存储和计算功能。数据备份和归档,在以前往往用磁带做数据的定期备份,而现在的大数据中心,很多采用 Hadoop承担数据存储和离线计算功能。Hadoop的分布式文件系统HDFS自动完成数据的备份与恢复工作,而系统监控也有类似Ambari等开源项 目可以使用。

皮皮Q7

拿 监控行业举例吧,监控行业的大数据,以一个部署了1万个摄像头的中等城市为例,假定每个摄像头每秒压缩视频数据量为1Mb(比特),则一天共产生 108TB的视频录像,而城市犯罪信息等重要数据也有几十年的沉淀。面对海量的监控和警务数据,大数据平台能否实现智能化的信息分析和预测?

何春涛A7:

基于监控数据的分析和预测,技术已经比较成熟,不管是分析还是预测,很多人做得不错,成功案例也不少,举个例子来讲,在美国洛杉矶,警方通过对数据分析,能 预测出来12小时内哪个地区最有可能发生犯罪案件。非常有趣的事实是, 关于犯罪预测,其中有一个重大起因源于地震预测。 洛杉矶警察局采用了一套用于预测地震后余震的数学模型:大地震之后, 在附近地区随后发生余震的概率很大。借助这个数学模型,洛杉矶警察局把过去80年内的数百万个犯罪纪录输入了模型。数据显示,当某地发生犯罪案件后, 不久之后附近发生犯罪案件的概率也很大,这与大地震之后余震发生的模式十分吻合。刚开始大家半信半疑,到后来经过验证,这一系统已经成为了警方分配警力、 安排巡察的重要依据。

在英国,英国政府通过高效使用公共大数据技术每年可节省约330亿英镑,相当于英国每人每年节省约500英镑。

皮皮Q8

正 所谓百闻不如一见,一图胜千言,足以见得人类离不开可视化。而数据的可视化可以堪称是技术与艺术的完美结合,是整个商业智能和分析平台的最上层展现环节。 主流的数据可视化工具有哪些?有的免费,有的付费,在数据可视化工具的选择中,有哪些需要考虑的因素?它们适合什么样的应用场景?

何春涛A8:

对于主流的数据数据可视化,国际厂商有QlikView、Tableau,国内永洪科技的Z-Dashboard不错。开源项目也很多,单Web端国际上就 有D3、InfoVis、Processing等知名项目,国内百度的ECharts也做得不错,可视化和统计分析工具上,像Excel、GiigekChartAPI、R语言用的人也非常多。

初了考虑是否开源以外,大家在可视化工具的选择上,也会关心这款可视化工具是否操作简单、可视化效果是否丰富、数据集成是否支持多种方式、数据源的兼容性等因素。

如果你有5个甚至更多的Developer,能够承担项目失败的风险,需求不经常变动,可以考虑基于开源项目。如果你希望有一款工具能很让你卓有成效地进行交互式可视化分析,建议选择与优秀的数据分析厂商合作。

活动介绍

作为国内数据库与大数据领域最大规模的技术盛宴,2015第六届中国数据库技术大会(DTCC)即将于2015年4月16日-18日在北京新云南皇冠假日酒 店震撼登场。大会以“大数据技术交流和价值发现”为主题,云集了国内外顶尖专家,大会特别开设了《大数据下商业智能与数据库》专场11,届时来自永洪科技 的CEO将在大会现场发表演讲,欢迎大家报名:http://dtcc.it168.com/

【2015DTCC】专访永洪科技CEO:商业智能搬运大数据之谜相关推荐

  1. 连续3年!永洪科技入选“2022年度大数据解决方案top50”

    3月22日,永洪科技成功入选由德本咨询.eNet研究院.互联网周刊联合调研发布的"2022年大数据解决方案top50"排行榜.今年是永洪科技连续3次入选该榜单. 据了解," ...

  2. 永洪科技斩获2019年度大数据分析创新产品和优秀方案2项殊荣

    近日,由中国信息协会主办,信息化观察网.国润互联信息技术研究院.中国信息化网承办的2019第三届中国信息化和软件服务业年度风云榜正式揭榜.永洪科技于2019年推出的国内首款桌面智能数据分析工具Yong ...

  3. 永洪科技千人用户大会上 AI与Reporting产品正式发布

    2017年11月18日,永洪科技用户大会在北京千禧大酒店召开.大会现场正式发布了Yonghong AI与Yonghong Reporting两款新产品,并为此前评选出的永洪数据科学研究院MVP获奖者进 ...

  4. 永洪科技携手华为构建金融智慧运营与商业智能方案,解决金融敏捷分析难题

    2021年4月13日,永洪科技携手华为在华为苏州研究所正式发布金融大数据分析平台联合解决方案,以业务为导向,数据为驱动,实现数据价值与业务的深度融合.永洪科技副总裁兼战略生态部总经理石虎.销售总监朱斌 ...

  5. 【每日新闻】永洪科技何春涛:将BI产品做得越来越厚 | Gartner报告:2017年全球云计算市场不断集中...

    点击关注中国软件网 最新鲜的企业级干货聚集地 趋势洞察 坚持是种信念,努力是种精神! 2018中国软件生态大会 趋势洞察 永洪科技何春涛:将BI产品做得越来越厚 近日,北京软件与信息服务业促进中心发布 ...

  6. 中国银行业100强发布,头部名企为何选择永洪科技?

    近日,2020年中国银行业100强榜单发布,上榜单位和永洪科技银行客户高度重合,是永洪科技在金融行业BI与数据分析领域一直保持市场占有率第一的很好佐证. "数据应用成熟度越高的行业,永洪科技 ...

  7. 永洪科技王桐:人生要么是一段大胆的冒险,要么什么都不是

    获得腾讯在数据分析领域第一笔投资.创业4年实现4轮融资.2016年营收过亿--这些光环下的永洪科技,一直在以超预期的速度迅猛发展;而31岁就成为执掌永洪整个营销体系的高级副总裁--王桐,则无疑成为2B ...

  8. 永洪科技与润乾软件达成战略合作,共同开拓大数据驱动

    2017年11月8日,永洪科技与润乾软件举行签约仪式,双方宣布达成战略合作,未来将共同推动大数据分析行业发展,树立数据化智慧运营标杆企业,全面推进"以卓越的数据技术为客户创造价值,实现客户成 ...

  9. 成就好生意·成为好企业丨828 B2B企业节,永洪科技来了

    8月28日,由华为云与生态伙伴联合发起的"828 B2B企业节"盛达开幕,该节日将持续一个月,为企业数字化转型搭建创新发展平台,成就好生意,成为好企业. 永洪科技作为华为重要生态合 ...

  10. 助力企业数字化转型!涛思数据与永洪科技完成战略合作签约

    近日,由永洪科技主办.涛思数据协办的 "2023 永洪科技城市峰会"在经开区信创园举行.涛思数据与蓝凌软件.飞腾信息.司库立方等众多经开区内外企业和厂商共同参加了本次峰会,立足经开 ...

最新文章

  1. 女神推荐, 卡片,广告图 ,点击查看更多
  2. SIG Cloud Provider Alibaba 网研会第 2 期顺利召开 | 云原生生态周报 Vol. 46
  3. ES6学习笔记(十六)async函数
  4. xilinx soc学习笔记之在Ubuntu上安装Qt 5
  5. kaggle颅内出血比赛分析
  6. c语言在函数中传递指针,[求助]关于文件指针在函数中传递的问题
  7. JavaEE实战班第十二天
  8. pytorch torch.rand
  9. 卸载注册表_3Dmax软件无法安装?3Dmax软件正确卸载方法,重装无忧
  10. 移动先行之谁主沉浮? 带着你的Net飞奔吧!
  11. [AD]-学习笔记-元件库介绍及电阻容模型和IC类器件的创建
  12. 德标螺纹规格对照表_德标等螺纹对照表
  13. tomcat配置war包解压地址
  14. 4宫格 android,四宫格拼图软件
  15. vue 移动端剪裁
  16. (bilibili)b站看不见视频评论区或不显示高级弹幕
  17. MATLAB | solve函数求解析解时不支持分段函数的解决方案
  18. Vue实现简单的发表评论,吐槽评论
  19. VR能巅覆传统音乐产业吗?
  20. 关于 Ant Design 的一些笔记

热门文章

  1. Pandas(数据分析处理库)---讲解
  2. 岌岌可危?大数据营销与数据泄露相伴而行
  3. 《50个问题吃定所有对手》 博客思听 2011年1月
  4. 网页回到顶部 GoTop 按钮自动隐藏
  5. QT自定义按钮类(自定义图片,形状,点击特效)
  6. MATLAB泰勒展开lnx,lnx泰勒展开公式形式,lnx泰勒展开式怎么展开,sinx泰勒展开
  7. [培养锻炼能力][耳机]耳机线断裂维修经验
  8. 执行fadein追加css,基于CSS3完成淡入(fadeIn)淡出(fadeOut)结果
  9. 如何批量实现通过MP3标题重命名文件名
  10. 成长与发展---怎么给博士军团当好“博导”?(PL)