在方法论方面,大数据带来了三大挑战。第一,是分析基础;第二,计算的模式与计算方法需要推倒重来;第三,根本性判定需要条件。

大数据的挑战和问题

  谈论大数据是时代话题,拥有大数据是时代特征,解读大数据是时代任务,应用大数据是时代机遇。这四句话概括出大数据时代。从本质上说,数据,就是指资料的信息化、数字化,大数据的复杂性体现在四个方面,第一,海量性;第二,实践性;第三,异构性;第四,分布性。这是大数据区别于传统数据的四个特点。什么是大数据技术?严格地讲,是没有定义的。

  目前,有关大数据搜集、整理、成熟、解读或应用的技术,我们统称为大数据。在日常生活中,大数据的价值到底在哪里?需要强调四个方面。

  第一,提供社会科学的方法论,实现基于数据的决策,助推管理革命。这也正是目前大数据最热的领域是在社会科学方面的原因所在。大数据改变了人们对文科、理科的认识。社会科学最大的问题在于没有一个可普遍遵循的、可重复和被所有人接受的公共方法论,而利用大数据,弥补了这个缺憾。

  第二,形成科学研究的新范式,支持基于数据的科学发现,减少对精确模型与假设的依赖,使过去不能解决的问题变得可能解决。也就是说,我们有一种方法能够较小地依赖于模型和依赖于假设,形成了第四种科研范式。

  第三,形成高新科技的新领域,推动互联网、物联网、云计算等行业深入发展,形成大数据产业。互联网能实现如何把信息技术中的人、环境、机器,沟通在一起来处理问题,这是未来的发展。而大数据,则是实现信息化的组成,换句话说,即实现机器和机器的交换、人和机器的交换,是以数据的形式来沟通、来交换的。

  第四,大数据成为社会进步的新引擎,深刻改变人类的思维、生产和生活方式,推动社会变革和进步。

理性认识大数据

  信息技术革命与经济社会活动的交融催生了大数据。大数据是经济社会、现实世界、管理决策的片断记录,蕴含着碎片化信息。随着分析技术与计算技术的突破,解读这些碎片化信息成为可能,这是大数据成为一项新的高新技术、一类新的科研范式、一种新的决策方式乃至一种文化的原由。大数据是指数量特别巨大、种类繁多、增长极快、价值稀疏的复杂数据,简而言之,是“大而复杂”的数据集。作为信息资产,大数据的价值需要运用全新的处理思维和解译技术来实现。

  大数据具有大价值

  大数据的价值主要通过大数据技术来实现。大数据技术是基础性信息技术,它刻画了新一代信息技术中机器与机器、机器与人之间信息交换的内容特征,构成了现代信息技术的基本信息处理模式。因此,大数据从信息载体这一底层捕捉到了信息化的共性基础、未来发展与普适技术。这说明,大数据热潮的来临是一种必然,大数据技术不会是过眼云烟。

  科学理解大数据的“大”

  数据的积累是一个从量变到质变的过程。当数据积累不够多时,没有人能读懂这些“碎片”背后的故事。但随着数据的积累,特别是超过某个临界值后,这些“碎片”整体所呈现的规律就会在一定程度上被显现出来。可以认为,这一从量变到质变的临界值是区分数据“大”与“不大”的标准。所以,大数据的“大”是相对的,是与所关注的问题相关的。只有这样理解,才能避免产生大数据能解决所有问题的误读。

  科学理解大数据的“复杂”

  由于具有海量性、快变性、异构性和分布性等复杂特性,大数据技术是一项不断发展的技术,并非已经成熟。这当然并不妨碍运用现有大数据技术从现实的各种大数据中获得价值,但我们必须清楚:大数据的价值实现是无止境的,大数据理论、技术和产业将相伴而行。这是大数据发展的基本形态。

大数据带来三大挑战

  数据的获取是基本的,因此,数据的程序和处理是基本的。大数据的资源管理与规模,大数据高效和处理信息技术,大数据分析和处理统计学的计算技术,这三者中,大数据扮演的是不同的角色。

  比如,大数据分析和大数据处理,两者是有区别的。处理,如统计,查询,排序,比例,融合,对齐等等,统称为数据处理。数据处理的逻辑,是计算机严格的逻辑运算。但是,处理与分析的深层次是不一样的,那么,大数据分析会涉及到哪些问题?比如,数据中间呈现了什么样的发展趋势,数据中间有什么共性结构,数据链如何关联?数据有什么特定的模式,相互之间如何对应?如何分析?以及优化与控制等等。这是大数据分析。因此,分析相对于处理来说,并不是逻辑运算,而是用人工智能的方式来处理。在数据分析技术上,我国目前的发展相当缓慢。有数据表明,目前全世界有4% 的大数据,但是真正用来做分析的不到0.4%。

  在方法论方面,大数据带来了三大挑战。第一,是分析基础;第二,计算的模式与计算方法需要推倒重来;第三,根本性判定需要条件。依赖于样本是独立组成的假设,分析出来的结果可能是谬误的。“基础不牢,地动山摇”,就是这个道理。换句话说,如果大数据的分析技术不建立起来的话,很多的假设都是不成立的,大数据的危险性可想而知。

  科学技术是关键,分析技术是处理办法,根本性判定,这是当前最值得关注的三个问题。为此,需要建立的三大基础:第一,统计学基础;第二,计算理论的基础;第三,模拟技术。

  大数据的机遇是什么?最大的机遇是学科发展问题。什么叫学科发展机遇?以融合信息、数学、计算、数据为一体的数据科学正式形成。这对于大学人才的培养,对于学科的设置等各方面将起到根本性作用。

本文转自d1net(转载)

中国工程院院士徐宗本:大数据的挑战和问题相关推荐

  1. 中国科学院院士徐宗本:大数据与智能制造融合应用

    5月5日,"2017中国工业大数据大会·钱塘峰会"在杭州国际博览中心举办.本届峰会以"数据驱动创新 融合引领变革"为主题,围绕工业大数据展开分享与交流.中国科学 ...

  2. APUS 朱辉:移动应用出海的大数据建设挑战

    本文根据 APUS 大数据负责人朱辉在神策 2018 数据驱动大会现场,发表题为<移动应用出海的大数据建设挑战>的演讲整理所得. APUS 是智能手机上的用户系统.第一款产品 APUS L ...

  3. 数据建模大数据就业挑战月薪30K

    点击关注 异步图书,置顶公众号 每天与你分享 IT好书 技术干货 职场知识 本文大概 10624 字 读完共需 30 分钟 Tips 参与文末话题讨论,即有机会获得异步图书一本. 数据建模是对现实世界 ...

  4. 大数据全攻略:10年老兵带你看尽MaxCompute大数据运算挑战与实践

    大数据计算服务(MaxCompute,原名ODPS)是一种快速.完全托管的TB/PB级数据仓库解决方案.MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决 ...

  5. 2023年-梅宏院士等:大数据技术的四大挑战与十大趋势

    日前,中科院院士梅宏联合中国人民大学.华中科技大学.中科院计算技术研究所.中国科学院大学.北京理工大学多位专家,发布最新论文<大数据技术前瞻>.该文在计算体系重构的背景下,指出了大数据技术 ...

  6. 梅宏院士等:大数据技术的四大挑战与十大趋势

    来源:数字化转型工作室 大数据技术前瞻 本文约3500字,建议阅读10分钟 本文在计算体系重构的背景下,指出了大数据技术发展的四大技术挑战和十大发展趋势. 日前,中科院院士梅宏联合中国人民大学.华中科 ...

  7. 中国科学院院士徐宗本:人工智能的基石是数学

    来源:科学网 "人工智能的基石是数学,没有数学基础科学的支持,人工智能很难行稳致远." 近日,由联合国教科文组织和中国工程院联合主办的联合国教科文组织国际工程科技知识中心2019国 ...

  8. 三位院士压轴,大数据产业生态建设与发展高峰会成功举办

    数领万物,共创未来.12月25日下午,由中国国际大数据产业博览会组委会主办的"永不落幕的数博会"2020系列活动--"大数据产业生态创新发展高峰会"在北京举行, ...

  9. 院士论坛︱李德仁院士:展望大数据时代的地球空间信息学(论文版)

    展望大数据时代的地球空间信息学 李德仁1,2 1.武汉大学测绘遥感信息工程国家重点实验室,湖北 武汉 430079:2.地球空间信息技术协同创新中心,湖北 武汉 430079 Towards Geo- ...

最新文章

  1. iOS 导航栏遮挡视图
  2. 利用Java存储过程简化数据库操作
  3. linux下syscall函数,SYS_gettid,SYS_tgkill
  4. [PHP]Maximum execution time of 30 seconds exceeded
  5. awaitUntil() 方法的使用
  6. Qt基于文本协议的网络应用开发
  7. mysql 1280_技术分享 | MySQL 一次奇怪的故障分析
  8. 【BZOJ2004】公交线路(动态规划,状态压缩,矩阵快速幂)
  9. ip打包后如何加入 xilinx_科普!插上USB设备后电脑是怎么识别的呢?
  10. Android风格与主题
  11. 栈的典型应用 —— 延迟缓冲
  12. 2018年python工作好找吗-2018年 Python面试必看的10个问题及答案
  13. 【ACL2019】最佳长论文阅读笔记,降低机器翻译中的exposure bias
  14. 巧用GPSID驱动 快速实现WinCE GPS开发
  15. 联想本win10 virtualbox 安装centos
  16. 【通讯录自动导入】txt格式转vcf格式
  17. 区块链中的epoch
  18. UG NX二次开发(C#)-曲线-NXOpen.Curve初探
  19. vue 应用中Throttling navigation to prevent the browser from hanging.问题
  20. 变送器和传感器有什么区别和联系?

热门文章

  1. 三勾商城是开发友好的微信小程序商城,框架支持SAAS,支持发布 iOS + Android + 公众号 + H5 + 各种小程序
  2. CREAMy简洁大气模板Typecho主题
  3. HTML5博客个人日志记录网页模板
  4. 百度SEO站群PHP进销存源码ERP多仓库管理源码
  5. H5源码口红机在线游戏无需公众号
  6. Spring Boot集成Redis缓存之注解方式
  7. 做一个项目,平时都用到哪些工具提高效率(中)
  8. 谈谈Dictionarylt;T1,T2gt;和Listlt;Tgt;的问题 [转]
  9. jQuery: 操作select option方法集合
  10. Linux Shell脚本入门教程系列之(九)Shell判断 if else 用法