点击上方蓝字关注我们

《大数据》

第7卷第2期 2021年3月

大数据2021年第2期

(点击原文链接在官网阅读完整文章)

目次

01 题导读:大数据可视分析应用

袁晓如

02 大数据可视分析在海洋领域的应用

解翠, 李明悝, 陈萍, 李孝天, 宋键, 董军宇, 赵佳萌

03 足球比赛数据可视分析

曹安琪, 陈泓宇, 谢潇, 巫英才

04 基于移动通信数据的城市可视分析研究

王桂娟, 周锐, 蔡梦杰, 汤勇, 李茸茸, 陈华容, 吴亚东

05 食品安全大数据可视化关联分析

陈谊, 孙梦, 武彩霞, 孙小然

06 中国白酒文化可视化研究

陈超, 吴亚东, 付朝帅, 童兴, 李攀, 褚琦凯, 王雪楠

07 专题导读:高性能计算虚拟数据空间

张广艳

08 面向国家高性能计算环境的虚拟数据空间系统

秦广军, 肖利民, 张广艳, 牛北方, 陈志广

09 GVDS:面向广域高性能计算环境的虚拟数据空间

肖利民, 宋尧, 秦广军, 周汉杰, 王超波, 韦冰, 魏巍, 霍志胜

10 分布式存储系统中的数据高效缓存方法

杨青霖, 吴桂勇, 张广艳

11 国家高性能计算环境的虚拟数据空间运行支撑技术研究

何小雨, 邓笋根, 栾海晶, 牛北方

12 面向非易失内存的MPI-IO接口优化

邓镇龙, 陈志广

13 广东省数字政府网络安全评估体系与实践

高尚省, 郭勇, 高智伟, 钟世敏, 刘丕群, 刘婷

摘要

专题:大数据可视分析应用

专题导读:大数据可视分析应用

作者:袁晓如

摘要:可视化是数据科学的重要组成部分。可视化把数据转化为可以交互的图形图像,能够帮助用户更好地理解、分析复杂的数据对象,而可视分析则通过紧密耦合可视化交互界面与自动计算,大大提高人类发现和洞察数据内在规律的能力,通过降低对复杂数据的认知壁垒,综合提高对数据进行交互探索的能力。过去几年中,可视化与可视分析多次入选中国计算机学会大数据专家委员会发布的《中国大数据技术与产业发展报告》,也位列美国商务部2018年发布的出口管制清单的数据分析技术首项。近年来,可视化迅速被越来越广泛地应用在数据科学以及日常应用的方方面面。本专题汇集了多方面的可视化应用方向,邀请研究相关领域应用的可视化专家团队撰文,展示可视化与可视分析的广阔应用场景。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00001.shtml

大数据可视分析在海洋领域的应用

作者:解翠, 李明悝, 陈萍, 李孝天, 宋键, 董军宇, 赵佳萌

摘要:随着海洋观测技术和数值仿真技术的发展,人们能获取到规模更大、分辨率更高的海洋数据,这为复杂多元海洋环境要素及结构现象的分析带来了机遇,同时也给传统的分析方法带来了挑战。因此,将大数据可视分析方法引入了海洋数据分析,并探索了其在多元海洋时空数据分析、海洋重要结构的时空特征和演化分析等方面的应用价值,开发了多个可视分析系统,并通过全球和我国周边一些海域数据分析的案例研究,提出了海洋数据可视分析的基本框架,展示了可视分析是大数据时代海洋复杂数据分析方面一种很有前途的技术。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00003.shtml

足球比赛数据可视分析

作者:曹安琪, 陈泓宇, 谢潇, 巫英才

摘要:足球比赛数据可视分析能够帮助足球数据分析师清晰直观地发现比赛中隐藏的规律,吸引了众多研究人员的关注。首先对现有的足球比赛数据可视分析工作进行阐述,按照数据类别将其分为基于统计数据的分析、基于事件数据的分析、基于轨迹数据的分析;然后进一步讨论了足球比赛数据可视分析当前面临的挑战;最后对未来发展方向进行了展望。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00015.shtml

基于移动通信数据的城市可视分析研究

作者:王桂娟, 周锐, 蔡梦杰, 汤勇, 李茸茸, 陈华容, 吴亚东

摘要:随着移动电话的深入普及,大规模通信数据给人们提供了前所未有的观测城市微观结构和动态的机会,而如此大规模的高维异构时空关系数据又给高效数据解读带来了挑战。作为重要的大数据分析手段,可视化被越来越多地应用到这一领域。回顾近年来基于通信数据的城市可视分析研究工作,首先归纳了移动通信数据的主要来源、特征和常用的数据处理方法,然后从通信数据的内在对象“人”“通信设备”和“城市空间”3个方面阐述相应的可视化方法,并对基于通信数据的城市可视分析面向的任务、方法和特点进行了梳理,最后对基于通信数据的城市可视分析进行了展望。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00032.shtml

食品安全大数据可视化关联分析

作者:陈谊, 孙梦, 武彩霞, 孙小然

摘要:随着检测技术的提高和互联网技术的广泛应用,食品安全数据的规模不断增大、类型不断增多,对数据分析技术提出了极大挑战。近年来出现的可视分析技术,通过提供图形交互界面,帮助领域人员深入理解数据并洞悉数据中的隐含规律,提高对食品安全风险的分析、发现、预警和溯源能力,为食品安全监测和管控提供了新手段。首先分析了食品安全数据的主要来源、特征和分析任务;然后提出了一种关联可视分析技术分类方法,从属性关联、实体关联、对比分析和时空分析4个方面阐述了近10年来的食品安全大数据可视化关联分析方法;最后提出了该领域存在的问题和挑战。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00061.shtml

中国白酒文化可视化研究

作者:陈超, 吴亚东, 付朝帅, 童兴, 李攀, 褚琦凯, 王雪楠

摘要:作为一种特殊的文化形式,中国白酒文化在传统的中国文化中有独特的地位。将可视化技术应用到中国白酒文化领域,对于传播和弘扬中国白酒文化的丰富内涵、增强文化自信、促进国际文化交流具有重要作用。总结了中国白酒文化可视化的应用场景,阐述了中国白酒文化可视分析的基本流程,然后从文学作品、文物考古以及历史演变3个维度分析了中国白酒文化可视化研究现状,并归纳了文本数据可视化、网络数据可视化、时空数据可视化和多维数据可视化等可视化方法在中国白酒文化可视化领域的呈现类型,最后探讨了中国白酒文化可视化的未来研究热点。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00078.shtml

专题:高性能计算虚拟数据空间

专题导读:高性能计算虚拟数据空间

作者:张广艳

摘要:高性能计算环境是支撑国家科技创新、经济发展的核心基础设施。目前国家高性能计算环境的总计算能力已突破200 PFlops,总存储容量超过160 PB。但是各节点广域分散,计算与存储资源难以统筹使用。本专题从虚拟数据空间系统构建、分布式系统高效缓存、国家高性能计算环境对虚拟数据空间的运行支撑以及面向非易失内存的MPI-IO接口优化等多个角度出发,探索了构建高性能计算虚拟数据空间的过程中面临的机遇和挑战以及相应的解决方案,希望能够引起广大读者的兴趣,并起到抛砖引玉的作用。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00099.shtml

面向国家高性能计算环境的虚拟数据空间系统

作者:秦广军, 肖利民, 张广艳, 牛北方, 陈志广

摘要:高性能计算环境是支撑国家科技创新、经济发展、国防建设的核心信息基础设施,世界高性能计算强国纷纷建设基于多超算中心资源的广域高性能计算环境。然而,高性能计算环境中资源种类繁多且地域分布广,无法有效发挥资源的聚合效应,难以满足大型应用对广域分布数据的统一管理和高效访问需求。为此,提出了一套可用于构建广域全局虚拟数据空间的完整技术体系,包括虚拟数据空间模型、跨域虚拟数据空间构建、广域环境中数据高效迁移、广域环境中存算协同调度、跨域高并发数据聚合处理等技术,并研发了一个可运行于国家高性能计算环境的虚拟数据空间系统,可有效支撑广域分散异构存储资源的统一高效访问,实现广域环境中分布数据的跨域共享和协同处理。目前,该软件系统已在国家高性能计算环境实验性部署,并验证了分子对接、全基因组关联分析、天气预报模式3类典型大型应用。验证结果表明,所研虚拟数据空间构建方法和系统可有效聚合广域分散的存储资源,满足大型应用的数据空间需求。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00101.shtml

GVDS:面向广域高性能计算环境的虚拟数据空间

作者:肖利民, 宋尧, 秦广军, 周汉杰, 王超波, 韦冰, 魏巍, 霍志胜

摘要:广域高性能计算环境是支撑科技创新和社会经济发展的核心信息基础设施。然而,在广域高性能计算环境中,异构存储资源在地理位置上的分散分布导致无法发挥广域存储资源的聚合效应,难以满足对广域分布数据的统一管理和高效访问需求。为此,提出了虚拟数据空间构建方法及数据访问性能优化方法,并实现了一个面向广域高性能计算环境的全局虚拟数据空间(GVDS)。GVDS可聚合广域分布的异构存储资源,形成统一的虚拟数据空间,有效支撑用户以统一访问模式高效访问广域分散的异构存储资源,实现广域环境中分布数据的跨域共享和协同处理。测试结果表明,与国际领先的面向广域高性能计算环境的OneData、GFFS等存储系统相比,GVDS实现了相当的功能,且数据访问性能明显提升。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00123.shtml

分布式存储系统中的数据高效缓存方法

作者:杨青霖, 吴桂勇, 张广艳

摘要:针对典型分布式存储系统存在的写放大、I/O路径过长、响应时延较高等问题,提出了一种基于SSD的分布式存储系统中数据高效缓存方法,采用读写旁路和懒惰缓存的缓存管理策略,以及兼顾最近访问时间和历史访问频率的缓存替换策略,并根据前台工作负载的变化情况,自适应地调整主动回刷脏数据的速率,显著提升了存储系统的读写性能。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00147.shtml

国家高性能计算环境的虚拟数据空间运行支撑技术研究

作者:何小雨, 邓笋根, 栾海晶, 牛北方

摘要:国家高性能计算环境的特点是广域分散、系统异构、存储资源隔离自治,这对存储设备管理、数据跨域共享等提出了极大的挑战。首先阐述了虚拟数据空间系统的概念,然后分析了其作为国家高性能计算环境的一部分,如何通过视图访问、数据共享、计算环境对接有效降低跨域的访问开销;接着通过模块化方式将虚拟数据空间系统与国家高性能计算环境进行深度的融合,将其功能补充到国家高性能计算环境中;最后通过统一的虚实空间用户管理框架实现了跨域统一、透明安全的存储服务和对大型计算应用的支撑,这对于国家高性能计算环境的发展具有十分重要的意义。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00158.shtml

面向非易失内存的MPI-IO接口优化

作者:邓镇龙, 陈志广

摘要:在高性能计算环境中,MPI应用多个计算节点同时访问底层存储系统文件时,其I/O开销受到访问模式和外存设备性能的影响。针对MPI应用访问文件的特征,利用非易失内存高带宽、低时延、可字节寻址、数据可持久化等优势,提出面向非易失内存的MPI-IO接口优化方案;对文件数据建立分布式的缓存并维护持久性的元数据、对进程间数据传输策略进行优化,使应用可以有效管理、利用非易失内存设备,保持缓存数据一致有效。实验结果证明,所提系统为应用带来数十倍的读写性能提升。未来将进一步优化本方案的并行性。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00172.shtml

动态

广东省数字政府网络安全评估体系与实践

作者:高尚省, 郭勇, 高智伟, 钟世敏, 刘丕群, 刘婷

摘要:《2020联合国电子政务调查报告》显示,全球电子政务整体发展水平不断提升,数字政府转型快速推进,在线政务服务水平普遍提高,数据治理框架不断完善。随着数字政府建设的不断推进和深化应用,网络安全面临的风险和挑战不断增加。世界各国纷纷在国家战略的要求和指导下制定了与互联网相关的法律或命令,互联网发展越早、越成熟的国家,对网络安全的治理越关注,例如美国、日本已经发布了国家级网络安全战略等。

政府数字化转型的本质是推进政务数据的整合、开放和共享,然而政务业务和数据的融合加大了网络安全防护的难度,网络安全治理成为我国数字政府建设的重点。为了防范和化解广东省数字政府网络安全风险,提高风险预见、预判能力,有必要对数字政府网络安全防护现状进行评估,促进全省各地市迭代建设网络安全防护体系,提升整体安全防护能力。

原文链接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-2-00182.shtml

联系我们:

Tel:010-81055448

010-81055490

010-81055534

E-mail:bdr@bjxintong.com.cn

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中文科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,并被评为2018年国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

关注《大数据》期刊微信公众号,获取更多内容

《大数据》2021年第2期目次摘要相关推荐

  1. 《大数据》2021年第6期目次摘要

    点击上方蓝字关注我们 <大数据> 第7卷第6期 2021年11月 大数据2021年第6期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读:大数据支撑的智能应用 周斌, 秦永彬 0 ...

  2. 《大数据》2021年第5期目次摘要

    点击上方蓝字关注我们 <大数据> 第7卷第5期 2021年9月 大数据2021年第5期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读:国产环境下的大数据处理系统 陈刚 02 面 ...

  3. 《大数据》2021年第4期目次摘要

    点击上方蓝字关注我们 <大数据> 第7卷第4期 2021年7月 大数据2021年第4期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读 马礼 02 数据权属界定面临的问题困境与破 ...

  4. 《大数据》2021年第3期目次摘要

    点击上方蓝字关注我们 <大数据> 第7卷第3期 2021年5月 大数据2021年第3期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读:基于大数据的知识图谱及其应用 靳小龙, 阮 ...

  5. 《大数据》2022年第1期目次摘要

    点击上方蓝字关注我们 <大数据> 第8卷第1期 2022年1月 大数据2022年第1期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读:科学数据治理 陈刚 02 高能同步辐射光源 ...

  6. 《大数据》2020年第6期目次摘要

    点击上方蓝字关注我们 <大数据> 第6卷第6期 2020年11月 大数据2020年第6期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读:教育大数据 刘三女牙 02 面向数据共享 ...

  7. 《大数据》2020年第4期目次摘要

    点击上方蓝字关注我们 <大数据> 第6卷第4期 2020年7月 大数据2020年第4期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读:大数据异构并行系统 陈海波 02 GPU事 ...

  8. 《大数据》2020年第3期目次摘要

    点击上方蓝字关注我们 <大数据> 第6卷第3期 2020年5月 大数据2020年第3期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读:数据资产化探索 朱扬勇,陈贵海 02 数据 ...

  9. 《大数据》2020年第5期目次摘要

    点击上方蓝字关注我们 <大数据> 第6卷第5期 2020年9月 大数据2020年第5期 (点击原文链接在官网阅读完整文章) 目次 01 专题导读:医学大数据 邹北骥 02 一种基于深度神经 ...

最新文章

  1. IJ中 运行tomcat 配置
  2. delete表1条件是另一个表中的数据,多表连接删除(转)
  3. android getevent参数,android getevent、sendevent、input keyevent 使用说明
  4. C# 将List中的数据导入csv文件中
  5. 函数求值需要运行所有线程_精读《深度学习 - 函数式之美》
  6. 使用Tika进行文本抽取
  7. php array函数 array_slice截取数组
  8. 关于分行数字化转型工作的几点思考
  9. 【人工智能算法】算法基础之K均值聚类算法
  10. html打印成pdf页面大小,pdf页面大小调整 pdf打印页边距怎么设置
  11. GET、POST、PUT、DELETE等用法
  12. 泰坦尼克号生存预测python_用Python预测泰坦尼克号生存情况
  13. Oracle 大表数据删除/清理方法小结
  14. Python numpy函数:shape用法(简单样本及样本对应变量场景)
  15. 51单片机PCF8591-AD-DA转换
  16. 3DMAX入门教程 | 命令面板 标准基本体的创建和参数
  17. 解读redis的配置文件--redis.conf
  18. 你遇到过启动电脑以后系统桌面无法显示吗
  19. python33.dll_python33.dll,下载,简介,描述,修复,等相关问题一站搞定_DLL之家
  20. 使用pandas时间窗口函数rolling完成量化交易之移动平均线

热门文章

  1. 【JMeter】Thread Group下的组件Sampler取样器
  2. 【批处理】windows环境将文件放置在虚拟盘
  3. JMeter如何切换成中文详细步骤
  4. SELinux 引起的 Docker 启动失败
  5. 高级技巧之Lambda表达式
  6. 开始我的blog之旅
  7. 【ACM】nyoj_103_A+BII_201307291022
  8. 不连续曲线 highcharts_什么是正则曲线和正则曲面
  9. python画精美图案_Python语言的魅力------完美图案
  10. mysql数据库服务器名_mysql数据库服务器名