db-readings

数据库相关的论文笔记

分布式理论-自问自答

  • GFS阅读问题
  1. 为什么存储三个副本?而不是两个或者四个?

  2. Chunk的大小为何选择64MB?这个选择主要基于哪些考虑?

  3. GFS主要支持append,overwrite操作比较少。为什么这样设计?如何基于一个只支持Append操作的文件系统构建分布式表格系统Bigtable?

  4. 为什么要将数据流和控制流分开?如果不分开,如何实现Append流程?

  5. GFS有时会出现重复记录或者padding,为什么?

  6. Lease是什么?在GFS起什么作用?它与heartbeat有何区别?

  7. GFS append过程中如果Secondary出现故障,如何处理?如果Primary出现故障,如何处理?

  8. GFS Master需要存储哪些信息?Master数据结构如何设计?

  9. 假设服务一千万个文件,每个文件1GB,Master中存储的元数据大概占用多少内存?

  10. Master如何实现高可用性?负载的影响因素有哪些?如何计算一台机器的load值?

  11. Master新建chunk时如何选择ChunkServer?如果新机器上线,load值特别低,是否需要有些特殊考虑?

  12. 如果某台ChunkServer报废,GFS如何处理?

  13. 如果ChunkServer下线后过一会重新上线,GFS如何处理?

  14. 如何实现分布式文件系统的快照操作?

  15. ChunkServer数据结构如何设计?

  16. 磁盘可能出现“位翻转”错误,ChunkServer如何应对?

  17. ChunkServer重启后可能有一些过期的chunk,Master如何能够发现?

  • MapReduce阅读问题
  1. MapReduce和MPP架构的主要区别在哪里?

  2. 如何采用MapReduce实现分布式排序?需要考虑什么问题?

  3. 如何设计Map Worker存储中间结果的数据结构?

  4. Reduce Worker执行过程中如果数据量超过内存怎么处理?

  5. Master数据结构如何设计?

  6. 如何实现Map任务本地化?

  7. Master如何切分任务?

  8. 为什么要有backup task?

  • Bigtable阅读问题
  1. GFS可能出现重复记录或者padding,Bigtable如何处理这种情况使得对外提供强一致性模型?

  2. 为什么Bigtable设计成Root、Meta、User三级结构,而不是两级或者四级结构?

  3. 读取某一行用户数据,最多需要几次请求?分别是什么?

  4. 如何保证同一个tablet不会被多台机器同时服务?

  5. Tablet在内存中的数据结构如何设计?

  6. 如何设计SSTable的存储格式?

  7. minor、merging、major这三种compaction有什么区别?

  8. Tablet Server的缓存如何实现?

  9. 如果tablet出现故障,需要将服务迁移到其它机器,这个过程需要排序操作日志。如何实现?

  10. 如何使得tablet迁移过程停服务时间尽量短?

  11. tablet分裂的流程是怎样的?

  12. tablet合并的流程是怎样的?

分布式 理论/工程实现

  • 分布式系统原理介绍
  • 分布式系统工程实践

转载于:https://www.cnblogs.com/weloveshare/p/8727194.html

数据库相关的论文笔记相关推荐

  1. [论文总结] 农业工程领域中App和Web相关应用论文笔记

    文章目录 1. Tomato leaf segmentation algorithms for mobile phone applications using deep learning 2. Int ...

  2. 2019 DGF(深度引导滤波网络) 相关的论文笔记

    文章目录 *Fast End-to-End Trainable Guided Filter* *KeyPoint* *overview* *keywords* *extends* 摘要 引言 相关工作 ...

  3. 医学图像彩色化相关--20201208论文笔记Colorization of CT images to improve tissue contrast for tumor segmentation

    1.Colorization of CT images to improve tissue contrast for tumor segmentation 彩色CT图像以提高肿瘤分割的组织对比度 摘要 ...

  4. 给大家分享在校外也能免费用CNKI知网、万方等数据库下载相关学术论文与期刊的方法

    今天给大家分享在校外也能免费用CNKI知网.万方等数据库下载相关学术论文与期刊的方法,小编亲试,绝对管用,至少目前是管用的~ 1.打开手机"支付宝",搜索"浙江省图书&q ...

  5. Deep Learning论文笔记之(八)Deep Learning最新综述

    Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...

  6. Deep Learning论文笔记之(六)Multi-Stage多级架构分析

    Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些 ...

  7. Deep Learning论文笔记之(一)K-means特征学习

    Deep Learning论文笔记之(一)K-means特征学习 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但老感 ...

  8. 论文笔记:CLIP:Learning Transferable Visual Models From Natural Language Supervision详解

    paper:https://arxiv.org/abs/2103.00020 代码:GitHub - openai/CLIP: Contrastive Language-Image Pretraini ...

  9. 论文笔记:HIE-SQL:History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsing

    论文笔记:HIE-SQL: History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsin ...

最新文章

  1. IIS7 设置读取、脚本和可执行文件的执行权限的步骤
  2. 关于联通短信发送程序(SGIP协议)没有收到返回状态报告的报告(使用WireShark分析)
  3. Linux常用的基本命令head、tail、tar、grep、date、cal(二)
  4. 以下关于单模光纤的说法中,正确的是( )
  5. Android6.0------权限申请RxPermissions
  6. 设置 shell 脚本中 echo 显示内容带颜色
  7. python complex函数def_【Python3】Python函数
  8. python创建数据库表_Python 操作数据库(1)SQL基础
  9. ASP.NET中使用JSON方便实现前台与后台的数据交换
  10. 一文带你认识MindSpore新一代分子模拟库SPONGE
  11. 雷军微博抽奖送蔚来汽车,中奖用户等9个月仍未兑现,蔚来官方回应...
  12. ubuntu14.04.5安装paramiko模块pip install paramiko出现一堆问题的解决过程
  13. PKM全民推广系列三:PKM搜索
  14. 计算机应用基础考试excel操作题,自学考试_《计算机应用基础》_上机操作_模拟练习题...
  15. AutoCAD软件应用
  16. 出现Please make sure you have the correct access rights and the repository exists.问题解决
  17. dart 爬取 妹子图 豆瓣影评
  18. java html邮件_java发送html模板邮件
  19. Oracle使用游标更新数据 Oracle游标之select for update和where current of 语句
  20. 分享我成为GDE(Google开发者专家)的经历

热门文章

  1. 每天一道LeetCode-----根据中序遍历和后序遍历重构二叉树
  2. 每天一道LeetCode-----有序数组右移n位后查找某个元素
  3. 缺失的第一个正数—leetcode41
  4. arm汇编解析—qnnpack卷积实现
  5. android入门知识,android基础知识学习笔记
  6. 获取系统特殊文件夹的路径
  7. 单向链表的C语言实现与基本操作
  8. hihoCoder #1445 : 后缀自动机二·重复旋律5
  9. 增长量计算n+1原则_土方量计算方法
  10. C语言内存字节对齐小结