来源:科技导报

本文约1600字,建议阅读5分钟

大数据作为产业发展的创新要素,在数据科学与技术、商业模式、产业格局、生态价值与教育层面,均带来了新理念和新思维。

2019年,大数据、数据科学、机器学习、人工智能领域的研究与应用持续发展。物联网与传感设备的普及带来数据的爆炸性增长。大数据作为产业发展的创新要素,在数据科学与技术、商业模式、产业格局、生态价值与教育层面,均带来了新理念和新思维。

大数据与人工智能的快速普及应用除了受数据量激增因素影响外,还有另外两方面因素影响:一是深度神经网络算法处理大规模非结构化数据集的能力越来越强;二是算力的飞跃。随着光刻技术进一步发展,终端设备和边缘设备的数据处理能力持续提高,云、端与边缘计算结合,实现低成本海量可用计算资源。

2019 年大数据与人工智能生态圈中,最活跃的领域包括:大数据基础设施服务、大数据分析服务、数据资源服务、数据源管理及API服务、跨平台数据存储及分析服务,开源大数据软件工具,以及在各个垂直领域的产业大数据应用和企业大数据应用。

大数据与人工智能生态圈顶层分类

大数据、人工智能与产业深度融合,在交通运输、电子商务、金融服务、医疗健康、科学研究等领域展现出广阔的应用前景。“数字化转型”是大数据技术应用的驱动力,是要让企业真正成为“数据驱动”的企业,使得企业生产更加绿色、智能。大数据已经逐渐成为企业升级转型发展的有力引擎,在提升产业竞争力和推动商业模式创新方面发挥越来越重要的作用。

同时,大数据也开辟了国家治理的新路径,国家社会管理现代化面临着由碎片型向整体型、由应急型向预防型、由管控型向参与型、由粗放型向精细型、由静态型向动态型转变的“五位一体”的全面变革。物联网推动互联网应用从消费领域向生产领域扩展,并逐步深入城市管理各个环节。通过对海量、动态、高增长、多元化、多样化数据的高速处理,人们快速获得有价值信息,提高公共决策能力,从而逐步改变国家治理架构和模式。

目前最重要的大数据技术领域主要包括以下4个方面。

01.生态系统的建设

提及大数据,就无法避免提及Apache Hadoop。多年来,Hadoop已经发展到包含整个相关软件生态系统,许多商业大数据解决方案都基于Hadoop,基于Hadoop的产品和服务市场持续增长;

其次,大数据处理引擎的研发,Apache Spark是Hadoop生态的重要组成部分,已经在生产环境中广泛部署,也吸引了大量的项目开发者;

此外,处理和统计数据的编程语言和软件环境,例如开源项目R语言得到数据科学家的广泛应用,许多流行的集成开发环境(IDE),包括Eclipse和Visual Studio,都支持R语言,R已经成为世界上最流行的用于大数据项目的高级语言之一。

02.海量数据存储方案

例如数据湖(data lake)。许多企业正在建立数据湖(存储来自许多不同的数据源的数据并按原态存储),当企业想要存储数据但尚不确定如何使用数据时,数据湖尤其具有吸引力。物联网(IoT)数据的爆发正在影响数据湖应用的增长。

03.NoSQL 数据库的发展

为适应非结构化数据的存储与高性能需求,以及相对不那么严苛的数据一致性的要求,Mon⁃goDB、Redis、Cassandra、Couchbase 等 NoSQL 数据库流行。随着大数据趋势的增长,NoSQL数据库变得越来越流行。

04.数据的预测分析

预测分析是大数据分析的子集,是根据历史数据预测未来事件或行为。通过数据挖掘、建模和机器学习技术,获取对未来趋势的洞察。

在大数据时代,机遇与挑战并存。大数据技术研究者在迎接数据与智能技术带来无限可能的同时,也不得不面对其所蕴藏的风险。随着公民个人和企业组织所有的行为均被数字化,海量数据的实时处理与分析技术更加成熟,大数据在带来奇迹的同时也引入滥用和误用的风险。大数据安全保护技术与数据权责管理成为大数据领域最重要的主题,任何组织都无法回避谁拥有影响未来的数据权的问题。

互联网的早期阶段,数据隐私更多是要保护用户在线行为的隐私,这只占人民日常生活的一小部分,因此得到的关注是非常有限的。随着个人生活和工作的全部活动都通过网络和互联设备来完成,海量数据融合的能力、人脸识别的能力、结果预测的能力、异常分析的能力整合在一起将带来严重的数据隐私风险。

作者简介

孙家广院士

孙家广,中国工程院院士,清华大学教授,现任大数据系统软件国家工程实验室主任、中国图学学会理事长。主要研究方向为计算机图形学、计算机辅助设计、软件系统及工程。

编辑:于腾凯

​孙家广院士:大数据软件的机遇与挑战相关推荐

  1. 快讯 | 孙家广院士任昆仑数据首席战略顾问

    [ 摘要 ]做人要与人为善,做企业要帮助客户成长,为客户谋求长期价值,我们的企业才有生存立足的根本. 2018年4月16日,昆仑数据迎来了重量级大咖的加盟--孙家广院士正式成为昆仑数据首席战略顾问.而 ...

  2. 重磅!中国工程院院士孙家广加盟昆仑数据,担任首席战略顾问

    [数据猿导读] 4月16日,昆仑数据聘任中国工程院院士孙家广担任公司首席战略顾问,孙家广院士致力于推进工业化和信息化的融合,也非常关心我国制造业信息化智能化的建设,此番他的加盟,昆仑数据可谓是如虎添翼 ...

  3. 孙家广院士加盟昆仑数据,锁定首席战略顾问一职

    近日,昆仑数据迎来了一位业内重量级大咖的加盟,即孙家广院士. 孙家广院士,作为软件工程与系统及其应用领域的专家,清华大学教授,国家863计划自动化领域专家委主任.首席科学家,1999年就当选为中国工程 ...

  4. 联合国“全球脉动”计划 《大数据开发:机遇与挑战》

    联合国"全球脉动"计划发布 <大数据开发:机遇与挑战> 2012 年 5 月 29 日,联合国"全球脉动"( Global Pulse)计划发布&l ...

  5. 1.1大数据时代的机遇与挑战

    面对挑战,传统数据遭遇天花板 海量数据的高存储成本 数据批处理性能不足 流式数据处理能力缺失 有限的扩展能力 单一的数据源 数据资产对外繁殖 挑战一:业务部门无清晰的大户数据需求 挑战二:企业内部数据 ...

  6. 健康医疗大数据发展的机遇与挑战

    国家卫计委牵头起草的<关于促进和规范健康医疗大数据应用发展的指导意见>提出,到2017年底,基本形成跨部门健康医疗数据资源共享共用格局.医疗行业是数据密集型行业.IDC预测,截至2020年 ...

  7. 大数据带来的机遇与挑战

    摘 要:数据来源的渠道也逐渐增多,这不光包括了本地的文档.音视频,还包括了网络内容和社交媒体.大数据的时代已然来临,并给各行各业带来了根本性变革. 随着物联网.移动互联网.社会化网络的快速发展, 企业 ...

  8. 中国高校首个Apache开源项目 清华数为物联网时序数据库IoTDB 及可自由组装的大数据软件栈系列组件发布...

    四月的清华园,百花冠冕,春意盎然. 4月25日,清华软件学院师生校友相约云端,共贺清华大学109周年校庆,软件学院建院19周年. 由于疫情防控需要,软件学院通过腾讯会议和学堂在线在线直播方式,举办&q ...

  9. 给青年人的来信|孙家广:锻炼真本事、解决真问题

    编者按: 今年是中国共青团成立100周年.在今年的五四青年节之际,我们给清华园的很多"大先生"写去了一封信,求问学术科研与人生选择之道.老师们真切朴实的回信令我们深受感动.倍感鼓舞 ...

最新文章

  1. CSDN付费专栏写作感悟及成长之路、兼论学习会员模式的创作者协同效应
  2. 【codeforces 508B】Anton and currency you all know
  3. Cisco学习笔记 CCNP-EIGRP
  4. C/C++存储区划分
  5. ds18b20温度转换指令_DS18B20温度传感器(附代码并浅谈与或运算)
  6. 重磅!13所985高校,成立大学联盟!
  7. python 调用另一个py_Python打包:setuptools与setup.py/.cfg入门简介
  8. PNP8550(3.3V DC蜂鸣器) - 原理图系列
  9. sqlyog通过跳板机ssh连接mysql数据库
  10. 央行降息开始 房价下跌不行也要行
  11. 既然谭浩强的C语言教材不好,那应该选什么书作C语言教材?
  12. 码农小汪-Hibernate学习6-hibernate中Annocation修饰属性
  13. 如何修改手机IP地址
  14. html弹出对话框 自动点击,c#如何自动点击网页弹出的对话框的确认键
  15. 你的格局决定你的结局
  16. 2021湖北技能高考文化综合成绩查询,2021年湖北省技能高考文化综合考试大纲.pdf...
  17. ​路由器是如何工作的?
  18. 警告!从ISO映像创建的U盘可能无法完全启动!Unknown引导扇区不支持NTFS文件系统
  19. 小步快跑是这样玩的(上)
  20. 国信证券学习系列(7)

热门文章

  1. 傅里叶变换性质证明卷积_傅里叶变换(三) 采样与离散序列
  2. Oracle中INSTR和SUBSTR的用法
  3. gradle build connection reset or protocol_version build failure
  4. Java AQS论文翻译
  5. SSH错误:packet_write_wait: Connection to 10.57.19.250 port 22: Broken pipe
  6. 英语写作学习笔录 task1 body
  7. sqlite3常用命令以及django如何操作sqlite3数据库
  8. MYSQL注入天书之服务器(两层)架构
  9. 添物 不花钱学计算机及编程(预备篇)— 编译原理
  10. 彻底卸载 RAD Studio 2009/2010/XE+ 的步骤