已经有读者在迫不及待的问怎么去掉了IOE,别急,在去掉IOE之前还有很长的路要走。行癫他们买回来小型机之后,我们用上了Oracle,七公带着一帮 DBA在优化SQL和存储,行癫带着几个架构师在研究数据库的扩展性。Oracle本身是一个封闭的系统,用Oracle怎么做扩展?用现在一个时髦的说 法就是做“分库分表”。

我们知道一台Oracle的处理能力是有上限的,它的连接池有数量限制,查询速度跟容量成反比。简单的说,在数据量上亿、查询量上亿的时候,就到它的极限 了。要突破这种极限,最简单的方式就是多用几个Oracle数据库。但一个封闭的系统做扩展,不像分布式系统那样轻松。我们把用户的信息按照ID来放到两 个数据库里面(DB1/DB2),把商品的信息跟着卖家放在两个对应的数据库里面,把商品类目等通用信息放在第三个库里面(DBcommon)。这么做的目的除了增加了数据库的容量之外,还有一个就是做容灾,万一一个数据库挂了,整个网站上还有一半的数据能操作。

数据库这么分了之后,应用程序有麻烦了,如果我是一个买家,买的商品有DB1的也有DB2的,要查看“我已买到的宝贝”的时候,应用程序怎么办?必须到两 个数据库里面分别查询出来对应的商品。要按时间排序怎么办?两个库里面“我已买到的宝贝”全部查出来在应用程序里面做合并。还有分页怎么处理?关键字查询 怎么处理?这些东西交给程序员来做的话会很悲催,于是行癫在淘宝的第一个架构上的作品就来解决了这个问题,他写了一个数据库路由的框架DBRoute,这 个框架在淘宝的Oracle时代一直在使用。后来随着业务的发展,这种分库的第二个目的——容灾的效果就没有达到。像评价、投诉、举报、收藏、我的淘宝等 很多地方,都必须同时连接DB1和DB2,哪个库挂了都会导致整个网站挂掉。

上一篇说过,采用EJB其实是和Sun的工程师妥协的结果,在他们走了之后,EJB也逐渐被冷落了下来。在05、06年的时候,spring大放异彩,正好利用spring的反射(IoC)模式替代了EJB的工厂模式,给整个系统精简了很多代码。

上一篇还说过,为了减少数据库的压力,提高搜索的效率,我们引入了搜索引擎。随着数据量的继续增长,到了2005年,商品数有1663万,PV有8931 万,注册会员有1390万,这给数据和存储带来的压力依然山大,数据量大,性能就慢。亲,还有什么办法能提升系统的性能?一定还有招数可以用,这就是缓存 和CDN(内容分发网络)。

你可以想象,九千万的访问量,有多少是在商品详情页面?访问这个页面的时候,数据全都是只读的(全部从数据库里面读出来,不写入数据库),如果把这些读操 作从数据库里面移到内存里,数据库将会多么的感激涕零。在那个时候我们的架构师多隆大神,找到了一个基于 Berkeley DB 的开源的缓存系统,把很多不太变动的只读信息放了进去。其实最初这个缓存系统还比较弱,我们并没有把整个商品详情都放在里面,一开始把卖家的信息放里面, 然后把商品属性放里面,商品详情这个字段太大,放进去受不了。说到商品详情,这个字段比较恐怖,有人统计过,淘宝商品详情打印出来平均有5米长,在系统里 面其实放在哪里都不招人待见。笔者清楚的记得,我来淘宝之后担任项目经理做的第一个项目就是把商品详情从商品表里面给移出来。这个字段太大了,查询商品信 息的时候很多都不需要查看详情,它跟商品的价格、运费这些放在一个表里面,拖慢了整个表的查询速度。在05年的时候,我把商品详情放在数据库的另外一张表 里面,再往后这个大字段被从数据库里面请了出来,这也让数据库再一次感激涕零。

到现在为止,整个商品详情的页面都在缓存里面了,眼尖的读者可能会发现现在的商品详情不全是“只读”的信息了,这个页面上有个信息叫“浏览量”,这个数字 每刷新一次页面就要“写入”数据库一次,这种高频度实时更新的数据能用缓存吗?如果不用缓存,一天几十亿的写入,数据库会怎么样?一定会挂掉。那怎么办? 亲……先不回答你(下图不是广告,让你看看浏览量这个数据在哪里)

CDN这个工作相对比较独立,跟别的系统一样,一开始我们也是采用的商用系统。后来随着流量的增加,商用的系统已经撑不住了,LVS的创始人章文嵩博士带 人搭建了淘宝自己的CDN网络。在本文的引言中我说过淘宝的CDN系统支撑了800Gbps以上的流量,作为对比我们可以看一下国内专业做CDN的上市公 司ChinaCache的介绍——“ChinaCache……是中国第一的专业CDN服务提供商,向客户提供全方位网络内容快速分布解决方案。作为首家获 信产部许可的CDN服务提供商,目前ChinaCache在全国50多个大中城市拥有近300个节点,全网处理能力超过500Gbps,其CDN网络覆盖 中国电信、中国网通、中国移动、中国联通、中国铁通和中国教育科研网等各大运营商。”——这样你可以看得出淘宝在CDN上面的实力,这在全世界都是数一数 二的。另外因为CDN需要大量的服务器,要消耗很多能源(消耗多少?在前两年我们算过一笔帐,淘宝上产生一个交易,消耗的电足以煮熟4个鸡蛋)。这两年章 文嵩的团队又在研究低功耗的服务器,在绿色计算领域也做了很多开创性的工作。淘宝CDN的发展需要专门一个章节来讲,想先睹为快的可以看一下笔者对章文嵩 的专访:http://qing.weibo.com/1866752224/6f4460e033000jme.html

回想起刚用缓存那段时间,笔者还是个小菜鸟,有一个经典的错误常常犯,就是数据库的内容更新的时候,忘记通知缓存系统,结果在测试的时候就发现我改过的数 据怎么在页面上没变化呢。后来做了一些页面上的代码,修改CSS和JS的时候,用户本地缓存的信息没有更新,页面上也会乱掉,在论坛上被人说的时候,我告 诉他用ctrl+F5刷新页面,然后赶紧修改脚本文件的名称,重新发布页面。学会用ctrl+F5的会员对我佩服的五体投地,我却惭愧的无地自容。

有些技术的发展是顺其自然的,有些却是突如其来的。到2007年的时候,我们已经有几百台应用服务器了,这上面的java应用服务器是weblogic, 而weblogic是非常贵的,比这些服务器本身都贵。有一段时间多隆研究了一下jboss,说我们换掉weblogic吧,于是又省下了不少银两。那一 年,老马举办了第一届的“网侠大会”,会上来的大侠中有一位是上文提到的章文嵩,还有一位曾经在jboss团队工作,我们也把这位大侠留下了,这样我们用 起jboss更加有底气了。

这些杂七杂八的修改,我们对数据分库、放弃EJB、引入Spring、加入缓存、加入CDN、采用开源的Jboss,看起来没有章法可循,其实都是围绕着提高容量、提高性能、节约成本来做的,由于这些不算大的版本变迁,我们姑且叫它2.1版吧,这个版本从构图上来看有3只脚,是不是稳定了很多?

架构图如下:

淘宝技术发展5(Java时代:坚若磐石)相关推荐

  1. 淘宝技术发展(Java时代:脱胎换骨)

    2019独角兽企业重金招聘Python工程师标准>>> 我的师父黄裳@岳旭强曾经说过,"好的架构图充满美感",一个架构好不好,从审美的角度就能看得出来.后来我看了 ...

  2. 淘宝技术发展(分布式时代:服务化)

    在系统发展的过程中,架构师的眼光至关重要,作为程序员,把功能实现即可,但作为架构师,要考虑系统的扩展性.重用性,这种敏锐的感觉,有人说是一种代码洁癖.淘宝早期有几个架构师具备了这种感觉.一指开发的We ...

  3. 淘宝历程七--淘宝技术发展(分布式时代:服务化)

    在系统发展的过程中,架构师的眼光至关重要,作为程序员,把功能实现即可,但作为架构师,要考虑系统的扩展性.重用性,这种敏锐的感觉,有人说是一种代码洁癖.淘宝早期有几个架构师具备了这种感觉.一指开发的We ...

  4. 淘宝技术发展 - 子柳撰写

    http://kb.cnblogs.com/page/132724/ 目录 一.引言 二.个人网站 三.Oracle/支付宝/旺旺 四.淘宝技术发展(Java时代:脱胎换骨) 五.淘宝技术发展(Jav ...

  5. 转自cnblogs 淘宝技术发展

    看后深有感触,转帖共赏之: 目录 一.引言 二.个人网站 三.Oracle/支付宝/旺旺 四.淘宝技术发展(Java时代:脱胎换骨) 五.淘宝技术发展(Java时代:坚若磐石) 六.淘宝技术发展(Ja ...

  6. [转] 淘宝技术发展

    作者: 赵超 来源:http://blog.sina.com.cn/s/blog_633219970100x9cc.html 目录 一.引言 二.个人网站 三.Oracle/支付宝/旺旺 四.淘宝技术 ...

  7. 淘宝技术发展[转载]

    [原文地址:http://kb.cnblogs.com/page/132724/#c2] 一.引言 光棍节的狂欢 "时间到,开抢!"坐在电脑前早已等待多时的小美一看时间已到 201 ...

  8. 淘宝技术发展之路(本人强烈推荐)

    目录 一.引言 二.个人网站 三.Oracle/支付宝/旺旺 四.淘宝技术发展(Java时代:脱胎换骨) 五.淘宝技术发展(Java时代:坚若磐石) 六.淘宝技术发展(Java时代:创造技术-TFS) ...

  9. 淘宝技术发展 —— 前言

    光棍节的狂欢 "时间到,开抢!"坐在电脑前早已等待多时的小美一看时间已到2011年11月11日零时,便迫不及待地投身于淘宝商城一年一度的大型网购促销活动-- "淘宝双11 ...

  10. [转载]淘宝技术发展--值得学习!

    .引言 光棍节的狂欢 "时间到,开抢!"坐在电脑前早已等待多时的小美一看时间已到 2011 年 11 月 11 日零时,便迫不及待地投身于淘宝商城一年一度的大型网购促销活动 -- ...

最新文章

  1. 鸟哥的Linux私房菜基础学习篇(第二版)第十二章课后习题与答案
  2. linux查看vxlan命令,[svc]linux上vxlan实战
  3. curl http header_PHP如何解析header头部信息
  4. 计算机软件系统包括应用软件和什么,计算机软件系统包括什么
  5. 结果显示窗口如何缩小_Proe草绘时提示“截面再生失败。不合适的尺寸”如何处理?...
  6. Java线程池(2) - 线程池的功能需求、设计、实现
  7. ife2015 深度克隆题目
  8. botley编程机器人测评_好物测评:五岁小孩都能上手的智能编程机器人有多好玩?动手又动脑!...
  9. [KALI] 开启ssh远程连接
  10. linux强制格式化命令选项,linux格式化命令如何使用
  11. iPad除了用来吃喝玩乐,还能能写代码了?
  12. html5 css 插入视频,HTML+CSS入门 HTML网页中插入视频各种方法
  13. 三消游戏算法图文详解
  14. 迷途emlog模板全站好看的变色模板源码(内含搭建教程)
  15. R语言中的cor和cov
  16. windows本地git关联远程gitlab仓库
  17. “思特奇杯”编程之星初赛
  18. 数据分析之学术前沿分析 任务1:论文数据统计
  19. C语言字符串处理函数 strchr()和 strstr()的区别及使用
  20. 【数电】常用组合逻辑电路模块总结

热门文章

  1. 微信小程序如何打开微信客服
  2. python 预编译_python 预编译
  3. 直播这么火,但最先赚大钱的恐怕是企业级直播
  4. mysql tcp ip 连接失败_mysql连接不成功解决方法汇总
  5. “位格”和“三位一体”的解释
  6. Oasis 与 ThetaNuts 建立合作关系 | 为 DeFi 2.0 开辟道路
  7. go中的time包及时间格式化问题
  8. sql服务启动不了(解决方法之一)
  9. 转 AI教程 logo
  10. sun键盘没有stop键_Sun ALOM使用指南