引言

之前我们有一篇文章《一文读懂多维分析技术(OLAP)的进化过程》为大家介绍了多维分析技术(即联机分析处理(On-Line Analytical Processing),简称OLAP)的前世今生及发展方向。正是由于多维分析技术在业务分析系统的核心功能中的不可替代性,随着商业智能系统的深入应用,分析系统的数据量呈指数级增长,原有依赖硬盘IO处理性能(包括传统数据库、多维立方体文件)的多维分析技术遭遇到性能瓶颈。与此同时,随着服务器内存价格的下降,一种新的基于内存的OLAP技术架构出现了。这种新架构既能够保证类似于MOLAP方式的高性能,也能基于更大的数据量进行分析,还不用定期将数据库里的数据刷新到OLAP服务器来防止数据过期。这种新的体系架构当之无愧地成为大数据环境下搭建多维分析功能的流行选择,而IBM Cognos的Dynamic Cubes就是它的代表作。

动态立方体(Dynamic Cubes)作为一种新的技术架构最先应用在Cognos的10.2.0版本。下面我们以Cognos的11.0版本来看看怎样对动态立方体进行性能调优。

影响因素

动态立方体是以原有ROLAP技术为基础,使用服务器内存作缓存的一种新型技术架构。它的响应性能的影响因素包括。

数据仓库(数据集市):由于DynamicCubes的事实表数据都存储在数据仓库中,因此,有时数据仓库的性能好坏会影响前端多维分析查询的响应速度。在数据仓库的多维数据模型中,需要注意:

  • 维表中的连接事实表的代理键的数据类型应该采用integer类型
  • 维表中的各个层级的层级键的数据类型应该采用integer类型

2.数据库:提高数据库的查询性能,有助于提高最终多维分析展现的响应速度。

  • 有时候多维分析的性能严重依赖于数据库运行大数据量多任务查询任务的性能
  • 数据库基于的硬件资源(内存、CPU及IO)应该考虑到大数据量并行查询的性能,因此基于物理机的数据库性能当然比基于虚拟机的更优
  • 尽量少用或者不用视图,因为视图的数据不是物理存在的
  • 最好采用分析型的MPP数据库,因为多维分析都是针对大数据量的汇总查询
  • 采用列存储技术的数据库对于大量并发并联查询性能更优
  • 要确保查询性能最优化,可以通过数据库的性能分析监控、执行计划分析等工具
  • 索引的设计,对于非MPP数据库,索引的设计对于查询性能影响很大

动态立方体性能调优

1.由于动态立方体使用机器内存和CPU进行性能增强,所以在对应用服务器的硬件进行评估时应该为将来的性能扩展留一定的预留空间。硬件评估可以通过Cognos提供的建模工具Cube Designer里的“评估硬件需求”功能初步估算。如下图所示。

2.在多维立方体模型设计时,使用模型验证功能,可以知道影响性能的问题所在。可能的问题有:连接字段类型、星形模型与雪花模型、过滤器的使用、视图的使用等等。如下图所示。

3.评估模型的复杂度。如果多维模型的维度和度量很多,数据量也很大,可以通过设计聚合表或者聚合内存来提升查询性能。动态立方体会通过聚合感知技术找到最合适的聚合数据集进行查询以提高查询性能。如下图所示。

4.JVM设置。动态立方体使用Java虚拟机作为内存管理的容器载体,所以Cognos也提供了一些JVM堆设置来优化数据查询性能。你可以在Cognos Administration界面上找到Query Service服务进行参数调整。如下图所示。

5.您还可以通过Cognos的Dynamic Query Analyzer (DQA)工具来对动态立方体的查询性能进行评估并得到优化建议。在进行评估之前,记得将Dynamic Cubes的工作日志打开,如下图所示。

结束语

如需了解更多,请猛击以下链接,发现惊喜!

http://bigdata.evget.com/

大数据环境下的多维分析技术相关推荐

  1. 机器智能加速器:大数据环境下知识工程的机遇和挑战 | 清华李涓子教授

    导读:知识图谱已经成为推动人工智能发展的核心驱动力之一.本文选自清华大学计算机科学与技术系教授.清华-青岛数据科学研究院科技大数据研究中心主任李涓子老师于2017年12月20日在阿里联合中文信息学会语 ...

  2. XFS:大数据环境下Linux文件系统的未来

    本文讲的是XFS:大数据环境下Linux文件系统的未来,Linux有好多种件系统,但往往最受关注的是其中两种:ext4和btrfs.XFS开发者Dave Chinner近日声称,他认为更多的用户应当考 ...

  3. 大数据环境下数据科学的知识体系

    数据科学概论 随着互联网的飞速发展,大数据(Big Data)的概念和技术成为当下流行的领域. 数据科学(Data Science)这一体系也随着大数据的崛起成为讨论热点.在各大招聘网站上," ...

  4. 李涓子 | 机器智能加速器:大数据环境下知识工程的机遇和挑战

    本文转载自公众号:数据派THU. 导读:知识图谱已经成为推动人工智能发展的核心驱动力之一.本文选自清华大学计算机科学与技术系教授.清华-青岛数据科学研究院科技大数据研究中心主任李涓子老师于2017年1 ...

  5. 大数据环境下的存储系统构建:挑战、方法和趋势

    大数据环境下的存储系统构建:挑战.方法和趋势 陈游旻, 李飞, 舒继武 清华大学计算机科学与技术系,北京 100084 摘要:互联网规模的迅速扩展促使全球数据总量呈现爆炸式的增长.物联网.电子商务等新 ...

  6. XFS:大数据环境下Linux文件系统的未来?

    XFS:大数据环境下Linux文件系统的未来? XFS开发者Dave Chinner近日声称,他认为更多的用户应当考虑XFS.XFS经常被认为是适合拥有海量数据的用户的文件系统,在空间分配方面的可扩展 ...

  7. 如何保障大数据环境下的数据安全

    大数据正在为安全分析提供新的可能性,对海量数据的分析有助于更好地跟踪网络异常行为,对实时安全和应用数据结合在一起的数据进行预防性分析,可防止诈骗和黑客入侵.网络攻击行为总会留下蛛丝马迹,这些痕迹都以数 ...

  8. 【知识图谱】大数据环境下知识工程的机遇和挑战

    导读:知识图谱已经成为推动人工智能发展的核心驱动力之一.本文选自清华大学计算机科学与技术系教授.清华-青岛数据科学研究院科技大数据研究中心主任李涓子老师于2017年12月20日在阿里联合中文信息学会语 ...

  9. 大数据环境下互联网行业数据仓库/数据平台的架构之漫谈

    导读: 整体架构 数据采集 数据存储与分析 数据共享 数据应用 实时计算 任务调度与监控 元数据管理 总结 一直想整理一下这块内容,既然是漫谈,就想起什么说什么吧.我一直是在互联网行业,就以互联网行业 ...

最新文章

  1. 43.放苹果(递归练习)
  2. 未处理的异常导致基于 ASP.NET 的应用程序意外退出
  3. 【云栖说第三期】发现大家对能模仿马云声音的ET有兴趣,我们找了阿里四位专家来聊聊ET背后的人工智能...
  4. React Axios的定义,以及使用方式
  5. 动态添加 ajax,ajax动态的添加内容【原创】
  6. CF - 741(C. Arpa’s overnight party and Mehrdad’s silent entering) 二分图构造
  7. TI Davinci DM6441嵌入式Linux移植攻略——UBL移植篇
  8. fceux模拟器linux,超强FC模拟器fceux-2.2.3最新版
  9. 【leetcode】ZigZag Conversion
  10. 互联网红利消退,下一个机会在哪?
  11. 让你每天抽出两小时陪小孩子读书,你能坚持吗?
  12. python爬取斗鱼礼物数据_Python---20行代码爬取斗鱼平台房间数据(上)
  13. 11.3.3 BINARY 和 VARBINARY 类型
  14. html从谷歌浏览器跳转到IE,谷歌浏览器chrome
  15. input框输入的文本类型都是字符串类型
  16. ADSL桥接模式和路由模式的区别
  17. 双十一淘宝美妆消费数据分析
  18. CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below m
  19. php strpos无效,php问题:strpos功能不起作用
  20. 美国电气与计算机工程专业排名,美国大学电气工程专业排名情况

热门文章

  1. 电信公司Mahindra Comviva利用VoltActiveData来部署实时客户价值
  2. SharedPreferences
  3. php+转为文本,PHP将HTML转换成文本的实现代码
  4. UBUNTU 12.04 3D 特效设置(一)
  5. 生成镶嵌数据集涉及的一些概念和工具
  6. 矩阵A^TA(A'A)和AA^T(AA')的性质
  7. 如何用简短几行代码计算自己的体重指数?
  8. JAVA毕业设计公司薪酬管理系统计算机源码+lw文档+系统+调试部署+数据库
  9. 使用ESP8266构建一个简单的温湿度在线监测装置
  10. php.script.shell.1,shell script到底是什么?怎么使用?