随着对大数据技术的不断发展和研究,其各个环节的技术发展呈现出新的发展趋势和挑战。2015年12月,中国计算机学会(CCF)大数据专家委员会发布了中国大数据技术与产业发展报告,并对中国大数据发展趋势进行了展望,主要包含以下6个方面。

1大数据可视化

近几年大数据概念迅速深入人心,大众直接看到的大数据更多是以可视化的方式体现。可视化是通过把复杂的数据转化为可以交互的图形,帮助用户更好地理解分析数据对象,发现、洞察其内在规律。可视化实际上已经极大拉近了大数据和普通民众的距离,即使对IT技术不了解的普通民众和非技术专业的常规决策者也能够更好地理解大数据及其分析的效果和价值,从而可以从国计、民生两方面都充分发挥大数据的价值。建议在大数据相关的研究、开发和应用中,保持相应的比例用于可视化和可视分析。

2大数据与多学科融合

大数据技术是多学科多技术领域的融合,数学和统计学、计算机类技术、管理类等都有涉及,大数据应用更是与多领域产生交叉。这种多学科之间的交叉融合,呼唤并催生了专门的基础性学科——数据学科。基础性学科的夯实,将让学科的交叉融合更趋完美。在大数据领域,许多相关学科从表面上看,研究的方向大不相同,但是从数据的视角看,其实是相通的。随着社会的数字化程度逐步加深,越来越多的学科在数据层面趋于一致,可以采用相似的思想进行统一研究。从事大数据研究的人不仅包括计算机领域的科学家,也包括数学等方面的科学家。希望业界对于大数据的边界采取一个更宽泛、更包容的姿态,包容所谓的“小数据”,甚至将领域的边界泛化到“数据科学”所对应的整个数据领域和数据产业。建议共同支持“数据科学”的基础研究,并努力将基础研究的成果导入技术研究和应用的范畴中。

3大数据安全

大数据带来的安全与隐私问题主要包括以下3个方面:第一,大数据所受到的威胁也就是常说的安全问题,当大数据技术、系统和应用聚集了大量价值时,必然成为被攻击的目标;第二,大数据的过度滥用所带来的问题和副作用,比较典型的就是个人隐私泄露,还包括大数据分析能力带来的商业秘密泄露和国家机密泄露;第三,心智和意识上的安全问题。对大数据的威胁、大数据的副作用、对大数据的极端心智都会阻碍和破坏大数据的发展。建议在大数据相关的研究和开发中,保持一个基础的比例用于相对应的安全研究,而让安全方面产生实质性进步的驱动力可能是对于大数据的攻击和滥用的负面研究。

4大数据多样化处理模式

大数据的处理模式更加多样化,Hadoop不再成为构建大数据平台的必然选择。在应用模式上,大数据处理模式持续丰富,批量处理、流式计算、交互式计算等技术面向不同的需求场景,将持续丰富和发展;在实现技术上,内存计算将继续成为提高大数据处理性能的主要手段,相对传统的硬盘处理方式,在性能上有了显著提升。特别是开源项目Spark,目前已经被大规模应用于实际业务环境中,并发展成为大数据领域最大的开源社区。Spark拥有流计算、交互查询、机器学习、图计算等多种计算框架,支持Java、Scala、Python、R等语言接口,使得数据使用效率大大提高,吸引了众多开发者和应用厂商的关注。值得说明的是,Spark系统可以基于Hadoop 平台构建,也可以不依赖Hadoop平台独立运行。

很多新的技术热点持续地融入大数据的多样化模式中,形成一个更加多样、平衡的发展路径,也满足大数据的多样化需求。建议将大数据研究和开发有意识地链接和融入大数据技术生态中,或者利用技术生态的成果,或者回馈技术生态。

5大数据智能应用结合深度分析推动

在学术技术方面,深度分析会继续成为一个代表,推动整个大数据智能的应用。这里谈到的智能,尤其强调是涉及人的相关能力延伸,比如决策预测、精准推荐等。这些涉及人的思维、影响、理解的延展,都将成为大数据深度分析的关键应用方向。

相比于传统机器学习算法,深度学习提出了一种让计算机自动学习产生特征的方法,并将特征学习融入建立模型的过程中,从而减少了人为设计特征引发的不完备。深度学习借助深层次神经网络模型,能够更加智能地提取数据不同层次的特征,对数据进行更加准确、有效的表达。而且训练样本数量越大,深度学习算法相对传统机器学习算法就越有优势。

目前,深度学习已经在容易积累训练样本数据的领域,如图像分类、语音识别、问答系统等应用中获得了重大突破,并取得了成功的商业应用。预测随着越来越多的行业和领域逐步完善数据的采集和存储,深度学习的应用会更加广泛。由于大数据应用的复杂性,多种方法的融合将是一个持续的常态。建议保持对于智能技术发展的持续关注。在各自的分析领域(如在策划阶段、技术层面、实践环节等)尝试深度学习。

6大数据技术生态的良性发展

大数据是应用驱动,技术发力,技术与应用一样至关重要。决定技术的是人才及其技术生产方式。开源系统将成为大数据领域的主流技术和系统选择。以Hadoop为代表的开源技术拉开了大数据技术的序幕,大数据应用的发展又促进了开源技术的进一步发展。开源技术的发展降低了数据处理的成本,引领了大数据生态系统的蓬勃发展,同时也给传统数据库厂商带来了挑战。新的替代性技术,都是新技术生态对于旧技术生态的侵蚀、拓展和进化。

对数据处理的能力、性能等进行测试、评估、标杆比对的第三方形态出现,并逐步成为热点。相对公正的技术评价有利于优秀技术占领市场,驱动优秀技术的研发生态。各类创业创新大赛纷纷举办,为人才的培养和选拔提供了新模式。大数据技术生态是一个复杂环境。2016年,“开源”会一如既往占据主流,而测评和大赛将形成突破性发展。建议不要闭门搞大数据技术和系统,要开门融入世界性的技术生态中。

行业大数据技术发展趋势相关推荐

  1. 五大未来大数据技术发展趋势

    过去几年当中,大数据技术已经迎来长足发展:从一个乐观积极的流行词汇变成人见人恨的疑难杂症,关注重点也由纯粹的数据规模转向对类型及速度的追求.所谓"大数据"及其相关技术在经历了高度重 ...

  2. 2015中国大数据技术大会在北京隆重开幕

    2015中国大数据技术大会在北京隆重开幕 2015年12月10日,作为大数据领域规模最大.最具影响力的IT盛会,2015中国大数据技术大会(BDTC 2015)在北京新云南皇冠假日酒店盛大开幕.CCF ...

  3. 第十六届中国大数据技术大会五大分论坛顺利举办!

    1月8日下午,由苏州市人民政府指导.中国计算机学会主办.苏州市吴江区人民政府支持,CCF大数据专家委员会.苏州市吴江区工信局.吴江区东太湖度假区管委会.苏州市吴江区科技局.苏州大学未来科学与工程学院及 ...

  4. 大数据技术概述与入门

    一.大数据概述 大数据概念最初来自于2009年的<自然>杂志, Ginsberg采用大数据搜索引擎查询数据并对流行性流感活动进行检测,之后在2011年2月<科学>杂志通过社会调 ...

  5. Google大数据技术架构探秘

    Google是大数据时代的奠基者,其大数据技术架构一直是互联网公司争相学习和 研究的重点,也是行业大数据技术架构的标杆和示范. 1.谷歌的数据中心 谷歌已经建立了世界上最快.最强大.最高质量的数据中心 ...

  6. 最全的教育行业大数据解决方案,个个针对痛点

    2014年起,"大数据"概念首次被正式写入<政府工作报告>:2017年,中共中央政治局就实施国家大数据战略进行第二次集体学习.大数据的悄然兴起也带动了教育行业的革新,移 ...

  7. 2015 中国大数据技术大会 PPT 尝鲜

    2015 中国大数据技术大会已经圆满落幕,本届大会历时三天,以更加国际化的视野,从政策法规.技术实践和产业应用等角度深入探讨大数据落地后的挑战,作为大数据产业界.科技界与政府部门密切合作的重要平台,吸 ...

  8. 大数据技术主要应用在哪些行业

    大数据席卷全球的大趋势下,我们可以明显地感觉到,数据在受到越来越多的重视,从国家到企业,各个层面都认可数据的价值,而在各个行业领域当中,大数据技术的应用,将带来新的发展路径. 今天我们就来聊聊,大数据 ...

  9. 百分点大数据技术团队:基于HugeGraph的知识图谱技术在白酒行业的落地实践

    编者按:信息化是企业在外部环境变化时保持核心竞争力的有力手段.在白酒企业信息化过程中,通过应用大数据.云计算等的新智慧营销方式,精准定位消费群体,将对中国白酒未来营销起到革命性作用. 在营销过程中,白 ...

  10. 英特尔展示体育行业与大数据技术应用

    ZDNet至顶网服务器频道 06月19日 新闻消息: 为解析体育领域大数据的创新应用模式.进一步挖掘和验证大数据推动社会和经济发展的价值,主题为"赛场内外大数据 商业变革芯洞察"的 ...

最新文章

  1. Revisiting Salient Object Detection: Simultaneous Detection, Ranking, and Subitizing of Multiple Sal
  2. s1考试 图书管理系统 结构体版
  3. javascript mysql读写_微信小程序云开发实现云数据库读写权限
  4. MSIL 教程(三):类和异常处理(转)
  5. 单向链表操作之删除倒数第n个结点
  6. android获取imei兼容_Android获取IMEI号码
  7. 福禄克FI-3000光纤监测显微仪使用MPO检查摄像头?
  8. mysql用户和权限管理总结_【转】mysql 用户及权限管理 小结
  9. AD9173/AD9689 FMC采集板卡调试记录
  10. Enjoying virus ⌒●ǒ●⌒
  11. 本地分支与线上代码发生冲突,导致不能应用最新储藏问题
  12. mysql 1698_MySql Error 1698(28000)问题的解决方法
  13. 2020年下半年会议时间表
  14. 简单搜索引擎使用技巧
  15. 2021年数维杯数学建模分析和思路——B题
  16. 由《樱桃小丸子》想到的……(未完成)
  17. Reactive 简介
  18. 162号段,165号段,167号段
  19. 【纪中受难记】——Day5: 改题好烦
  20. App 抓包问题与解决

热门文章

  1. 博客群建软件-关键词要如何优化才能有好的排名
  2. CrazyTalk Animator 3 for Mac破解版永久激活方法附破解补丁
  3. 英雄联盟服务器状态在线怎么解决,解决英雄联盟无法连接到服务器的方法 看完就明白了...
  4. python调用百度AI语音识别
  5. PLC通过PIO模式控制绝对位置型IAI电缸
  6. 区块链专利正从量向质转变 智慧金融、医疗健康和能源三领域质量最高
  7. 内存颗粒位宽和容量_内存颗粒编码原则,方便大家识别颗粒是否可用与扩容
  8. 【专题5: 硬件设计】 之 【70.开关电源 之 电感计算例子】
  9. 2017 年,最热开源静态网站生成器 TOP 20 揭晓!
  10. docker装LibreELEC_Linux和macOS系统安装LibreELEC的方法