转自:http://siteguide.jzxue.com/jianzhanjingyan/200910/08-2877.html

我们知道,对于一个大型门户网站来说,可伸缩性是非常重要的,怎么样在纵向和横向有良好的可伸缩性,就需要在做架构设计的时候考虑到一个分的原则,我想在多个方面说一下怎么分:

首先是横向的分:

1. 大的网站化解为多个小网站:当我们一个网站有多个功能的时候,可以考虑把这个网站拆分成几个小模块,每一个模块可以是一个网站,这样的话我们到时候就可以很灵活地去把这些网站部署到不同的服务器上。

2. 静态动态分离:静态文件和动态文件最好分离开成2个网站,我们知道静态网站和动态网站对服务器来说压力的侧重不同,前者可能重IO后者重CPU,那么我们在选择硬件的时候也可以有侧重,而且静态和动态内容的缓存策略也不一样。典型的应用,我们一般会有独立的文件或图片服务器。

3. 按照功能来分:比如有一个模块是负责上传的,上传操作很消耗时间,如果和其它应用混在一起的话很可能,一点点访问就会使服务器瘫痪,这种特殊的模块应该分开。安全的不安全的也要分开,还需要考虑到以后SSL的购买。

4. 我们不一定要全部用自己的服务器,搜索、报表可以依靠别人的服务,比如google的搜索和报表服务,自己做的不一定比得过别人,服务器带宽都省了。

其次是纵向的分:

1. 文件也相当于数据库,IO的流量可能比数据库还大,这也算是纵向级别的访问,上传的文件图片一定要和WEB服务器分开。当然,数据库和网站都放在一个服务器上的很少了,这是最基本的。

2. 对于涉及到数据库访问的动态程序来说,我们可以使用一个中间层(所谓的应用层或逻辑层)来访问数据库(部署在独立的服务器上),最大的好处就是缓存和灵活性。缓存的内存占用比较大,我们要把它和网站进程分开,而且这样做我们可以很方便的去改变一些数据访问的策略,即使到时候数据库有分布的话在这里可以做一个调配工作,这样灵活性就很大了。还有好处是中间层可以做电线网通桥梁,可能网通访问双线再访问电信会比网通直接访问电信服务器快。

有人说我不分,我可以做负载均衡,对,是可以的,但是如果分的话,同样的10台机器肯定比不分10台机器可以承受更多的访问量,而且对硬件的需求可能不会很高,因为知道需要哪个硬件特别好。争取让每一个服务期都不空闲,又都不是太忙,合理进行组合调整和扩充,这样的系统伸缩性就高了,能根据访问量来调整的前提就是之前有考虑到分,分的好处是灵活性、伸缩性、隔离性以及安全性。

对服务器来说,我们有几点是要长期观察的,任何一点都可能是瓶颈:

1. CPU:动态文件的解析需要比较多的CPU,CPU出现瓶颈就要看是不是哪个功能过长时间占用线程,如果是就分出去。或者就是每一个请求处理时间不长,但是访问量很高,那么就加服务器。CPU是好东西,不能让他干等,不做事情。

2. 内存:缓存从IIS进程独立出去,一般对WEB服务器来说内存不够的情况不是很多。内存比磁盘快,要合理利用。

3. 磁盘IO:用性能监视器找到哪些文件IO特别大,找到了就分到独立的一组文件服务器上去,或者直接做CDN。磁盘慢,大规模读取数据的应用靠缓存,大规模写入数据的应用可以靠队列来降低突发的并发。

4. 网络:我们知道,网络的通讯是比较慢的,比磁盘还慢,如果是做分布式缓存,分布式计算的话,要考虑到物理服务器之间网络通讯的时间,当然,在流量大了以后,这可以提高系统的接纳能力一个等级。静态内容可以借助CSD分担一部分,在做服务器假设的时候还要考虑中国特色的电信网通情况以及防火墙。

对SQL SERVER数据库服务器来说[UPDATE]:

其实还是水平分割和纵向分割,一个二维表,水平分割就是横过来切一刀,纵向分割就是竖直切一刀:

1、纵向分割就是,我们不同的应用可以分到不同的DB中,不同的实例中,或者说把某个拥有很多字段的表拆分成小表。

2、横向分割就是,某些应用可能不负载,比如用户注册,但是用户表会非常大,可以把大表分开。可以采用表分区,数据存储在不同文件上,然后再部署到独立物理服务器增加IO吞吐以改善读写性能,土一点的做法就是自己定期把老的数据存档。表分区的另外一个优势可以增加数据查询速度,因为我们的页索引可以有多层了,就像一个文件夹中的文件不要太多,多分几层文件夹一样。

3、还可以通过数据库镜像、复制订阅、事物日志,把读写分开到不同的镜像物理数据库上,一般来说够用,如果还不行可以用硬件来实现数据库的负载均衡。当然,对于BI,我们可能还会有数据仓库。

架构上考虑到了这些之后,流量大了,就可以在这个的基础上再去调整或者做WEB服务器或者应用服务器的负载均衡。很多时候我们都是在重复发现问题-》找到瓶颈-》解决这个过程。

典型的架构如下:

动态WEB服务器配好点的CPU,静态WEB服务器和文件服务器磁盘好点

应用服务器内存大点,缓存服务器也是,数据库服务器当然内存和CPU都要好

转载于:https://www.cnblogs.com/k1988/archive/2010/05/12/2165653.html

大型门户网站架构设计的可伸缩性相关推荐

  1. 国内大型门户网站架构分析-静态化网站架构

    <国内大型门户网站架构分析>共分两部分,原文作者写于2004年!但对目前大型网站架构仍有很好的参考意义! 大型社区网站的架构 浅析大型门户网站的架构 如何做镜像服务器 域名双线路智能负载均 ...

  2. 国内大型门户网站架构分析-静态化网站架构-sina、sohu静态化网站架构揣测

    http://hi.baidu.com/injava/blog/item/08b186ef22519beacf1b3e59.html <国内大型门户网站架构分析>共分两部分,原文作者写于2 ...

  3. [读书笔记]大型分布式网站架构设计与实践.分布式缓存

    前言:本书是对分布式系统架构涉及到的相关技术的一本科普书籍.由于很难作为开发参考,只能但求了解.所以通篇浅读,对分布式系统进行大致的了解.因为写的非常好,感觉非常有意思,自己也做不出总结.所谓的读书笔 ...

  4. 大型分布式网站架构设计与实践

    阅读文本大概需要3分钟. SOA和RPC 随着互联网规模发展,面向服务的体系架构(SOA)成为主流的架构方式,SOA的本质思想是高内聚.低耦合地实现分治,各个系统之间通过服务的方式进行交互,这样保证了 ...

  5. java路由架构_《大型分布式网站架构设计与实践》读书笔记之 服务的路由和负载均衡...

    服务的路由和负载均衡 公共的业务被拆分出来,形成可共用的服务,最大程度的保证了代码和逻辑的复用,避免重复建设,这种设计也被成为SOA(Service-Oriented Architecture) SO ...

  6. 大型分布式网站架构设计与实践3

    第3章 互联网安全架构 3.1 常见的web攻击手段 3.1.1 XSS攻击 1.xss攻击的全称是跨站脚本攻击,即攻击者在网页中嵌入恶意脚本程序,当用户打开该网页时,脚本程序便开始在客户端的浏览器上 ...

  7. 大型分布式网站架构设计与实践 笔记

    一.分布式系统的基础设施 二.面向服务的架构 三.面向安全性的架构 四.面向稳定性的架构 1.在线日志分析 2.集群监控   转载于:https://www.cnblogs.com/renwei/p/ ...

  8. 大型分布式网站架构设计与实践 第一章《面向服务的体系架构(SOA)》

    第一章 面向服务的体系架构(SOA) 伴随着互联网的快速发展和演进,不断变化的商业环境所带来的五花八门.无穷无尽的业务需求,使得原有的单一应用架构越来越复杂,越来越难以支撑业务体系的发展,因此,系统拆 ...

  9. 后台开发经典书籍--大型分布式网站架构设计与实践

最新文章

  1. AI公共政策成全球热点,美国ITI发布《人工智能政策原则》|AI观察
  2. node.js linux shell,bash – Node.js Shell脚本和参数
  3. 【控制】《自动控制原理》胡寿松老师-第3章-线性系统的时域分析法
  4. 浅析人工智能的数学基础(文末送书!)
  5. 第一次使用Linux服务器所栽之坑
  6. react-router的使用(一)——URL的hash、HTML5的history、Router的基本使用
  7. 显示菜单栏_mac菜单栏不显示了,如何设置?
  8. pyspark分类算法之逻辑回归模型实践【binomialLogisticRegression+multinomialLogisticRegression】
  9. php 银联支付-app
  10. 公安部就《易制爆危险化学品治安管理办法》征求意见
  11. 学习使用 OpenCV 中的函数 cv2.kmeans() 对数据进行分类
  12. Synopsys工具安装之二【SCL License】
  13. python3爬取拉钩招聘数据
  14. MongoDB笔记之简单的增删改查
  15. python身份证号码共18位_18位身份证校验
  16. GBase 8a MPP Cluster 维护-日志篇
  17. 激光旋律(Laser melody)
  18. C语言实现—学生成绩管理系统
  19. Android R Framework wifi扫描场景总结
  20. 生存资料校准曲线calibration curve的绘制

热门文章

  1. JavaScript设计模式学习——builder pattern(建造者模式)
  2. Numpy、Scipy、matplotlib、scikit-learn等常用学习链接
  3. [原创]按键小精灵9通用去广告破解补丁
  4. 各种编程语言的深度学习库整理
  5. AlphaGo背后的搜索算法:蒙特卡罗树搜索 alphago 代码
  6. Vue CLI 3.0脚手架如何在本地配置mock数据
  7. [CF413D]2048
  8. 022变量,cp,mv,查看文本命令
  9. CentOS6.4_X86_64 安装Drupal-7.31必须成功版!
  10. 十一、Android学习第十天——项目开始(转)