DNS服务器 - 转换成IP地址
负载均衡的第一步:通过DNS解析域名时,将你的访问分配到不同的入口,同时尽可能保证你所访问的入口是所有入口中可能较快的一个。
成功访问实际的入口IP地址,这时产生了一个PV(Page View,页面访问量)
生成淘宝首页页面的服务器可能有成百上千台。你的一次访问会被分配给其中的一台服务器完成。这个过程要保证公正、公平、平均。其中最关键的便是LVS(Linux Virtual Server,世界上最流行的负载均衡系统之一。)
浏览器并发加载的资源数量是有限的。淘宝网首页需要加载126个资源。所以前端开发人员往往会将上述这些资源文件分布在多个域名下,变相绕过浏览器的限制。同时也为CDN工作做准备。
淘宝网在全国各地建立了数十个甚至上百个CDN节点,利用一些手段保证你访问的(主要指JS,CSS,图片等)站点是离你最近的CDN节点,这样便保证了大流量的分散以及在各地访问的加速。
大量内容分发与同步的技术。
海量静态图片文件:为了快速存取这些文件,淘宝开发了分布式文件系统TFS(TaoBao File System)来处理这类问题。
中文搜索的分词。
购物意图分析:主搜索会呈现出完全不同的结果。
主搜索系统列出搜索结果,这是由一千多台搜索服务器完成的。
商品详情快照的保存和快速调用:这其中又涉及数套系统的共同协作,其中较为重要的是Tair(淘宝自主研发的分布式KV存储方案)
访问行为会被记录下来。访问日志记录是最重要的记录之一。为了快速、及时、同步地传输这些日志数据,淘宝研发了TimeTunnel,用于进行实时的数据传输。然后交给后端系统进行报表等操作。
浏览数据、交易数据以及其他很多数据记录都会被存储在阿里巴巴集团的数据仓库中。
其中有些数据使用了压缩比高达1:120的极限存储技术。
之后这些数据会通过一个叫做云梯的基于Hadoop的由3000多台服务器组成的超大规模数据系统,以及一个基于阿里巴巴集团自主研发的ODPS系统的数据系统,不断进行分析和挖掘。

浏览淘宝网页背后所发生的事情相关推荐

  1. Web前端设计与开发课程设计:简易淘宝网页设计

    实验日期:2022-09-23 (一)大作业要求 综合运用所学知识,完成一个Web前端项目.内容和功能不做具体限定,主题可以是商业公司网站.学校网站或电商网站等. 技术要求: 掌握HTML5的基本结构 ...

  2. 当你访问淘宝的时候,发生了什么?

    [导读]当你在浏览器上,指尖轻轻输入 www.taobao.com 以后发生了什么?本文从你按下浏览器的确定键开始分析,一直到你如何找到商品结束.适合各类读者了解你仅仅访问一次淘宝的首页,所涉及到的技 ...

  3. 一张图讲清楚淘宝直播背后技术( 赠送多媒体前端手册)

    简介: 2020年,直播带货火爆全网.想一探淘宝直播背后的前端技术?本文将带你进入淘宝直播前端技术的世界. 对于大多数前端工程师来说,音视频技术是一个比较少涉足的领域,本文涵盖了流媒体技术中的文本.图 ...

  4. 一张图讲清楚淘宝直播背后的前端技术 | 赠送多媒体前端手册

    2020年,直播带货火爆全网.想一探淘宝直播背后的前端技术?本文将带你进入淘宝直播前端技术的世界. 对于大多数前端工程师来说,音视频技术是一个比较少涉足的领域,本文涵盖了流媒体技术中的文本.图形.图像 ...

  5. 简单使用Python爬虫爬取淘宝网页商品信息

    最近在学习爬虫,本人还是入门级的小白,自己跟着老师写了一些代码,算是自己的总结,还有一些心得,跟大家分享一下,如果不当,还请各位前辈斧正. 这是代码: # 导入库 import requests im ...

  6. 淘宝直播背后刀刃“砍”在哪?刘涛以2700万GMV收官

    距离刘涛刘一刀上一次直播时隔将近1个礼拜,12月份月刘涛刘一刀共直播了3场.2020年刘涛最后一场直播销量创本月最高,为18.53万,带货GMV为0.27亿,这场观看PV为31.94万的直播中有哪些& ...

  7. 揭秘淘宝网背后的复杂技术

    对于淘宝网而言,2012年的"双十一"是一个交易里程碑,是一个购物狂欢日,在这个"神棍节"里,淘宝网(包括天猫网)一共创下191亿元的交易额,在交易的背后隐藏着 ...

  8. 如何使用C#调用淘宝网页自动搜索,翻页和点击商品

    这一篇将说明如何使用C#和WPF浏览器控件来完成淘宝自动搜索,翻页,自动点击的操作 首先说明下,我在实现过程中使用的控件,一个是浏览器WebBrowser,一个是按钮Button,还有单选按钮Radi ...

  9. 使用selenium模仿手机浏览器访问淘宝网页

    众所周知,selenium模拟浏览器进行页面访问是爬虫工具中较好用的方法.通过模拟浏览器可以很方便的访问很多需要通过登录验证才能访问的网页. 我们通过selenium其中访问h5手机端网页的办法解决这 ...

最新文章

  1. Android 应用进行性能分析/APP/系统性能分析
  2. 灭霸来了!微软发布BugLab:无需标注,GAN掉bug
  3. Python-面向对象编程
  4. 如何在 Azure 中的 Linux 经典虚拟机上设置终结点
  5. InvalidateRect()、UpdateWindow()、RedrawWindow()区别
  6. CONFIGURE RETENTION POLICY
  7. Shell脚本语言与编译型语言的差异
  8. 2014年9月计算机二级mysql真题_2017年9月全国计算机二级MySQL考试章节练习题
  9. Pytorch —— 权值初始化
  10. List对象集合的遍历、对象赋值和向前台传递
  11. bind_param 类怎么写_情感类自媒体怎么写?你不知道的情感类文章4大禁忌!
  12. 获取当前jvm的进程号
  13. 【jQuery笔记Part2】04-jQuery淡入淡出动画右下角广告案例
  14. Hibernate深入浅出(六)事务2——锁locking
  15. MatLab 求平均值,方差,标准差
  16. [Python]网络爬虫学习笔记,爬取豆瓣妹子上妹子的照片
  17. 2020年中国激光切割运控系统需求现状及竞争格局分析,高功率快速增长「图」
  18. 创维广电服务器无线,创维酷开电视连接有线和无线上网教程
  19. 【Visual C++】游戏开发五十四 浅墨DirectX教程二十一 视觉的诡计:公告板(Billboard)技术
  20. 系列篇|单目结构光三维成像系统的标定方法

热门文章

  1. System.Security.SecurityException: 未找到源,但未能搜索某些或全部事件日志。不可 访问的日志: Security
  2. ubuntu下安装windows adobeflash播放器插件
  3. Oracle数据库之子程序和包(八)
  4. tomcat Error :but has failed to stop it,This is very likely to create a memory leak.
  5. jsp脚本自学及总结
  6. erp打印面单 php实现,利用店小秘ERP处理Shopee虾皮订单及打印面单
  7. 图形学(5)多边形的扫描转换(下)
  8. 深度学习基础:SVD奇异值分解及其意义【转】
  9. sku设计mysql_SKU数据库设计
  10. 计蒜客-1664-口袋的天空(MST)