MongoDB数据库设计中6条重要的经验法则(一)
“我有丰富的sql使用经验,但是我是个MongoDB的初学者。我应该如何在MongoDB中针对一对多关系进行建模?”这是我被问及最多的问题之一。
我没法简单的给出答案,因为这有很多方案去实现。接下来我会教导你如何针对一对多进行建模。
这个话题有很多内容需要讨论,我会用三个部分进行说明。在第一部分,我会讨论针对一对多关系建模的三种基础方案。在第二部分我将会覆盖更多高级内容,包括反范式化和双向引用。在最后一部分,我将会回顾各种选择,并给出做决定时需要考虑的因素。
很多初学者认为在MongoDB中针对一对多建模唯一的方案就是在父文档中内嵌一个数组子文档,但是这是不准确的。因为你可以在MongoDB内嵌一个文档不代表你就必须这么做。
当你设计一个MongoDB数据库结构,你需要先问自己一个在使用关系型数据库时不会考虑的问题:这个关系中集合的大小是什么样的规模?你需要意识到一对很少,一对许多,一对非常多,这些细微的区别。不同的情况下你的建模也将不同。
Basics: Modeling One-to-Few
一对很少
针对个人需要保存多个地址进行建模的场景下使用内嵌文档是很合适,可以在person文档中嵌入addresses数组文档:
这种设计具有内嵌文档设计中所有的优缺点。最主要的优点就是不需要单独执行一条语句去获取内嵌的内容。最主要的缺点是你无法把这些内嵌文档当做单独的实体去访问。
例如,如果你是在对一个任务跟踪系统进行建模,每个用户将会被分配若干个任务。内嵌这些任务到用户文档在遇到“查询昨天所有的任务”这样的问题时将会非常困难。我会在下一篇文章针对这个用例提供一些适当的设计。
Basics: One-to-Many
一对许多
以产品零件订货系统为例。每个商品有数百个可替换的零件,但是不会超过数千个。这个用例很适合使用间接引用—将零件的objectid作为数组存放在商品文档中(在这个例子中的ObjectID我使用更加易读的2字节,现实世界中他们可能是由12个字节组成的)。
每个零件都将有他们自己的文档对象
每个产品的文档对象中parts数组中将会存放多个零件的ObjectID :
在获取特定产品中所有零件,需要一个应用层级别的join
为了能快速的执行查询,必须确保products.catalog_number有索引。当然由于零件中parts._id一定是有索引的,所以这也会很高效。
这种引用的方式是对内嵌优缺点的补充。每个零件是个单独的文档,可以很容易的独立去搜索和更新他们。需要一条单独的语句去获取零件的具体内容是使用这种建模方式需要考虑的一个问题(请仔细思考这个问题,在第二章反反范式化中,我们还会讨论这个问题)
这种建模方式中的零件部分可以被多个产品使用,所以在多对多时不需要一张单独的连接表。
Basics: One-to-Squillions
一对非常多
我们用一个收集各种机器日志的例子来讨论一对非常多的问题。由于每个mongodb的文档有16M的大小限制,所以即使你是存储ObjectID也是不够的。我们可以使用很经典的处理方法“父级引用”—用一个文档存储主机,在每个日志文档中保存这个主机的ObjectID。
以下是个和第二中方案稍微不同的应用级别的join用来查找一台主机最近5000条的日志信息
所以,即使这种简单的讨论也有能察觉出mongobd的建模和关系模型建模的不同之处。你必须要注意一下两个因素:
Will the entities on the “N” side of the One-to-N ever need to stand alone?
一对多中的多是否需要一个单独的实体。
What is the cardinality of the relationship: is it one-to-few; one-to-many; or one-to-squillions?
这个关系中集合的规模是一对很少,很多,还是非常多。
Based on these factors, you can pick one of the three basic One-to-N schema designs:
基于以上因素来决定采取一下三种建模的方式
一对很少且不需要单独访问内嵌内容的情况下可以使用内嵌多的一方。
一对多且多的一端内容因为各种理由需要单独存在的情况下可以通过数组的方式引用多的一方的。
一对非常多的情况下,请将一的那端引用嵌入进多的一端对象中。
下一次我们将会看到如何使用双向关系和反范式化去提升以上三种基本方案的性能。
MongoDB数据库设计中6条重要的经验法则(一)相关推荐
- MongoDB数据库设计中6条重要的经验法则
Part 1 原文:6 Rules of Thumb for MongoDB Schema Design: Part 1 By William Zola, Lead Technical Support ...
- MongoDB数据库设计中6条重要经验法则 Part 2
在上一部分中介绍了三种基本的设计方案:内嵌,子引用,父引用,同时说明了在选择方案时需要考虑的两个关键因素. 1. 一对多中的多是否需要一个单独的实体. 2. 这个关系中集合的规模是一对 ...
- 数据库设计中的14个技巧
数据库设计中的14个技巧 选择自 sirfei 的 Blog 1. 原始单据与实体之间的关系 可以是一对一.一对多.多对多的关系.在一般情况下,它们是一对一的关系:即一张原始单据对 应且只对应 ...
- 有关MongoDB数据库设计的问题
问题一:是否collection越少越好,尽量把关系数据库中分表表示的关系嵌套进文档里? 问题二:如果这样的话,一句SQL能搞定的复杂查询,mongodb也许要查询多次.mongodb的查询速度是否还 ...
- 总结数据库设计中的14个技巧
总结数据库设计中的14个技巧 时间:2010-04-08 21:20来源:草根站长 作者:编辑整理 责任编辑: 雨儿 我要投稿 1. 原始单据与实体之间的关系 可以是一对一.一对多.多对多的关系.在一 ...
- [转载]Java数据库设计中的14个技巧
下述十四个技巧,是许多人在大量的数据库分析与设计实践中,逐步总结出来的.对于这些经验的运用,读者不能生帮硬套,死记硬背,而要消化理解,实事求是,灵活掌握.并逐步做到:在应用中发展,在发展中应用. 1. ...
- mysql数据库设计中的14个技巧
作者: sirfei 链接:https://blog.csdn.net/sirfei 1. 原始单据与实体之间的关系 可以是一对一.一对多.多对多的关系.在一般情况下,它们是一对一的关系:即一张原始单 ...
- 数据库设计中的14个关键技巧
1. 原始单据与实体之间的关系 可以是一对一.一对多.多对多的关系.在一般情况下,它们是一对一的关系:即一张原始单据对应且只对应一个实体.在特殊情况下,它们可能是一对多或多对一的关系,即一张原始单证对 ...
- 数据库设计中常见表结构的设计技巧(转)
2019独角兽企业重金招聘Python工程师标准>>> 一.树型关系的数据表 不少程序员在进行数据库设计的时候都遇到过树型关系的数据,例如常见的类别表,即一个大类,下面有若干个子类, ...
最新文章
- python中面向对象编程简称为_Python基础-面向对象编程
- 例题4-5 引发的static知识点
- 华为Mate 30 Pro再爆猛料:更“大”更高级了
- php-mvc模式(2)
- 黑色商务中国风禅茶一味产品宣传介绍PPT模板
- 山地车中轴进水表现_你知道吗?中轴拧错方向可能会毁了车架!
- 减轻压力保护脊椎,上学路上更轻松,Deuter多特护脊减负双肩背包体验
- 2019「友盟杯」数据分析大赛结果公布
- Kafka SSL 和 ACL 配置
- matlab dbns实现,深度置信网DBNs的源码
- 学生用计算机app,学生方程计算器
- Java修仙道路_JAVA修仙??
- 神经网络(NN)网络构建及模型算法介绍
- php仿u8系统模板_中文分词源码_7urpu8 采用php的源码实现 - 下载 - 搜珍网
- 一键生成各种姿势的火柴人gif:在线录制真人视频即可转换 | 代码开源
- c语言的four是什么意思,【转】一些变态的编程语言
- 解决测试过程中遇到的致命问题
- 2022-9-18把Trie搞出来来,开心开心开心!!!!
- 《WEB服务器——Tomcat》源码学习
- 机器学习管道中的数据定价
热门文章
- 视频知识点(17)- flv.js 实现播放本地视频文件的技巧
- python qt5 增加文本框_PyQt5 文本输入框自动补全 QLineEdit
- 苹果 谷歌 微软 三国混战 附地图详解
- Python:元组使用
- 第一个开源项目---halcon图像显示控件(缩放/roi操作)
- 联想小新触摸板驱动_联想 小新Air 13.3触摸板怎么用?
- Layui table表格操作列,按钮过多时展开点击失效问题解决方法
- 【备忘】es统计用户留存数据,公式都一样,语句和mysql区别很大
- 孙陶然:公司要与员工分享
- 收到字节 Offer,月薪 60k*18薪 ,爽的两夜都没睡着!