转:http://www.jianshu.com/p/21f5a73384d4

原文:6 Rules of Thumb for MongoDB Schema Design: Part 2

By William Zola, Lead Technical Support Engineer at MongoDB

在上一篇文章中我介绍了三种基本的设计方案:内嵌,子引用,父引用,同时说明了在选择方案时需要考虑的两个关键因素。

一对多中的多是否需要一个单独的实体。

这个关系中集合的规模是一对很少,很多,还是非常多。

在掌握了以上基础技术后,我将会介绍更为高级的主题:双向关联和反范式化。

双向关联

如果你想让你的设计更酷,你可以让引用的“one”端和“many”端同时保存对方的引用。

以上一篇文章讨论过的任务跟踪系统为例。有person和task两个集合,one-to-n的关系是从person端到task端。在需要获取person所有的task这个场景下需要在person这个对象中保存有task的id数组,如下面代码所示。

在某些场景中这个应用需要显示任务的列表(例如显示一个多人协作项目中所有的任务),为了能够快速的获取某个用户负责的项目可以在task对象中嵌入附加的person引用关系。

这个方案具有所有的一对多方案的优缺点,但是通过添加附加的引用关系。在task文档对象中添加额外的“owner”引用可以很快的找到某个task的所有者,但是如果想将一个task分配给其他person就需要更新引用中的person和task这两个对象(熟悉关系数据库的童鞋会发现这样就没法保证操作的原子性。当然,这对任务跟踪系统来说并没有什么问题,但是你必须考虑你的用例是否能够容忍)

在一对多关系中应用反范式

在你的设计中加入反范式,可以使你避免应用层级别的join读取,当然,代价是这也会让你在更新是需要操作更多数据。下面我会举个例子来进行说明

反范式Many -< One

以产品和零件为例,你可以在parts数组中冗余存储零件的名字。以下是没有加入反范式设计的结构。

反范式化意味着你不需要执行一个应用层级别的join去显示一个产品所有的零件名字,当然如果你同时还需要其他零件信息那这个应用层的join是避免不了的。

在使得获取零件名字简单的同时,执行一个应用层级别的join会和之前的代码有些区别,具体如下:

反范式化在节省你读的代价的同时会带来更新的代价:如果你将零件的名字冗余到产品的文档对象中,那么你想更改某个零件的名字你就必须同时更新所有包含这个零件的产品对象。

在一个读比写频率高的多的系统里,反范式是有使用的意义的。如果你很经常的需要高效的读取冗余的数据,但是几乎不去变更他d话,那么付出更新上的代价还是值得的。更新的频率越高,这种设计方案的带来的好处越少。

例如:假设零件的名字变化的频率很低,但是零件的库存变化很频繁,那么你可以冗余零件的名字到产品对象中,但是别冗余零件的库存。

需要注意的是,一旦你冗余了一个字段,那么对于这个字段的更新将不在是原子的。和上面双向引用的例子一样,如果你在零件对象中更新了零件的名字,那么更新产品对象中保存的名字字段前将会存在短时间的不一致。

反范式One -< Many

你也可以冗余one端的数据到many端:

如果你冗余产品的名字到零件表中,那么一旦更新产品的名字就必须更新所有和这个产品有关的零件,这比起只更新一个产品对象来说代价明显更大。这种情况下,更应该慎重的考虑读写频率。

在一对很多的关系中应用反范式

在日志系统这个一对许多的例子中也可以应用反范式化的技术。你可以将one端(主机对象)冗余到日志对象中,或者反之。

下面的例子将主机中的IP地址冗余到日志对象中。

如果想获取最近某个ip地址的日志信息就变的很简单,只需要一条语句而不是之前的两条就能完成。

事实上,如果one端只有少量的信息存储,你甚至可以全部冗余存储到多端上,合并两个对象。

另一方面,也可以冗余数据到one端。比如说你想在主机文档中保存最近的1000条日志,可以使用mongodb 2.4中新加入的$eache/$slice功能来保证list有序而且只保存1000条。

日志对象保存在logmsg集合中,同时冗余到hosts对象中。这样即使hosts对象中超过1000条的数据也不会导致日志对象丢失。

通过在查询中使用投影参数 (类似{_id:1})的方式在不需要使用logmsgs数组的情况下避免获取整个mongodb对象,1000个日志信息带来的网络开销是很大的。

在一对多的情况下,需要慎重的考虑读和更新的频率。冗余日志信息到主机文档对象中只有在日志对象几乎不会发生更新的情况下才是个好的决定。

总结

在这篇文章里,我介绍了对三种基础方案:内嵌文档,子引用,父引用的补充选择。

使用双向引用来优化你的数据库架构,前提是你能接受无法原子更新的代价。

可以在引用关系中冗余数据到one端或者N端。

在决定是否采用反范式化时需要考虑下面的因素:

你将无法对冗余的数据进行原子更新。

只有读写比较高的情况下才应该采取反范式化的设计。

下次,我将会告诉你在面对这些方案时该如何抉择。

想学习更多可以点击 “Thinking in Documents”。

转载于:https://www.cnblogs.com/HouZhiHouJueBlogs/articles/4573172.html

MongoDB数据库设计中6条重要的经验法则,part 2相关推荐

  1. MongoDB数据库设计中6条重要的经验法则

    Part 1 原文:6 Rules of Thumb for MongoDB Schema Design: Part 1 By William Zola, Lead Technical Support ...

  2. MongoDB数据库设计中6条重要的经验法则(一)

    "我有丰富的sql使用经验,但是我是个MongoDB的初学者.我应该如何在MongoDB中针对一对多关系进行建模?"这是我被问及最多的问题之一. 我没法简单的给出答案,因为这有很多 ...

  3. MongoDB数据库设计中6条重要经验法则 Part 2

    在上一部分中介绍了三种基本的设计方案:内嵌,子引用,父引用,同时说明了在选择方案时需要考虑的两个关键因素. 1.     一对多中的多是否需要一个单独的实体. 2.     这个关系中集合的规模是一对 ...

  4. 数据库设计中的14个技巧

    数据库设计中的14个技巧     选择自 sirfei 的 Blog 1. 原始单据与实体之间的关系 可以是一对一.一对多.多对多的关系.在一般情况下,它们是一对一的关系:即一张原始单据对 应且只对应 ...

  5. 有关MongoDB数据库设计的问题

    问题一:是否collection越少越好,尽量把关系数据库中分表表示的关系嵌套进文档里? 问题二:如果这样的话,一句SQL能搞定的复杂查询,mongodb也许要查询多次.mongodb的查询速度是否还 ...

  6. 总结数据库设计中的14个技巧

    总结数据库设计中的14个技巧 时间:2010-04-08 21:20来源:草根站长 作者:编辑整理 责任编辑: 雨儿 我要投稿 1. 原始单据与实体之间的关系 可以是一对一.一对多.多对多的关系.在一 ...

  7. [转载]Java数据库设计中的14个技巧

    下述十四个技巧,是许多人在大量的数据库分析与设计实践中,逐步总结出来的.对于这些经验的运用,读者不能生帮硬套,死记硬背,而要消化理解,实事求是,灵活掌握.并逐步做到:在应用中发展,在发展中应用. 1. ...

  8. mysql数据库设计中的14个技巧

    作者: sirfei 链接:https://blog.csdn.net/sirfei 1. 原始单据与实体之间的关系 可以是一对一.一对多.多对多的关系.在一般情况下,它们是一对一的关系:即一张原始单 ...

  9. 数据库设计中的14个关键技巧

    1. 原始单据与实体之间的关系 可以是一对一.一对多.多对多的关系.在一般情况下,它们是一对一的关系:即一张原始单据对应且只对应一个实体.在特殊情况下,它们可能是一对多或多对一的关系,即一张原始单证对 ...

  10. 数据库设计中常见表结构的设计技巧(转)

    2019独角兽企业重金招聘Python工程师标准>>> 一.树型关系的数据表 不少程序员在进行数据库设计的时候都遇到过树型关系的数据,例如常见的类别表,即一个大类,下面有若干个子类, ...

最新文章

  1. ios开发学习-手势交互(Gesture)效果源码分享
  2. velocity入门(三) 注释
  3. 【Python-ML】神经网络激励函数-Sigmoid
  4. EndNote批量实现文献标题首字母大写 附最新版endnote下载
  5. c和python的区别动图_C语言与Python 对程序员的差别到底在哪?
  6. 图论--最短路-- Dijkstra模板(目前见到的最好用的)
  7. ECS 控制台诊断系统
  8. 【Elasticsearch】ELASTICSEARCH集群节点的扩容(移除与添加)
  9. 任正非:华为的岗位没有年龄限制;腾讯微博将于9月28日停止运营;微软关闭Visual Studio Online|极客头条
  10. 笔记本启动关闭小键盘NUM LOCK的N种方法
  11. Unity实现动态资源加载的5种方式
  12. 软件的一些标号及对应版本
  13. 计算机在剪辑方面的应用,多媒体技术对影视后期制作的应用
  14. PPT计算机辅助教学,计算机辅助教学与多媒体课件制作
  15. SLA服务可用性4个9是什么意思?如何保证服务的高可用性 HA(High Availability)?...
  16. 谈谈应聘阿里全流程(良心之作,好评满满)
  17. 百度网盘离线下载分析及实现
  18. 获取微信昵称乱码php,Android 微信登录昵称乱码问题,及获取微信用户信息
  19. Aop简介 Aop术语 SpringAOP
  20. 微信公众号教程-注册发布文章

热门文章

  1. 学考计算机删除键是什么字母,考计算机的童鞋注意啦~计算机基础题答案~
  2. linux进阶之Tomcat服务篇
  3. 【CF870F】Paths 分类讨论+数学
  4. 一个.NET通用JSON解析/构建类的实现(c#)
  5. MySQL创始人发邮件寻求中国帮助
  6. 始终都要覆盖toString()方法
  7. How to improve software performance with NEON
  8. BZOJ1486: [HNOI2009]最小圈
  9. 兜兜转转,回到原点,Hello Mr.my yesterday
  10. bzoj1452 [JSOI2009]Count