淘宝技术——探究寻秘 前言
这其实是《淘宝技术这十年》的读书笔记,该书以时间为脉络讲述了淘宝这十年来的技术迭代,是一本了解互联网名词、技术的好书。
本文从书的第0章开始将遇到的计算机、互联网名词进行一一介绍,并附上进一步了解的链接,也算是增加自己对整个系统架构的熟悉程度和知识储备。

目录

  • 第0章 引言
    • Hadoop分布式计算集群
    • CDN网络
    • PV、UV
    • LVS:Linux Virtual Server
      • 轮询/加权轮询算法
    • 浏览器资源并发下载数量限制
    • TFS:Taobao File System
    • 搜索系统介绍
    • TimeTunnel
    • 淘宝云梯分布式计算平台
      • ODPS数据存储、挖掘
      • 数据挖掘

第0章 引言

Hadoop分布式计算集群

Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFS与MapReduce
HDFS是一个分布式文件系统:引入存放文件元数据信息的服务器Namenode和实际存放数据的服务器Datanode,对数据进行分布式储存和读取。
MapReduce是一个分布式计算框架:MapReduce的核心思想是把计算任务分配给集群内的服务器里执行。通过对计算任务的拆分(Map计算/Reduce计算)再根据任务调度器(JobTracker)对任务进行分布式计算。
参考链接:
https://blog.csdn.net/qq_32649581/article/details/82892861

CDN网络

CDN的全称是Content Delivery Network,即内容分发网络。CDN是构建在现有网络基础之上的智能虚拟网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。CDN的关键技术主要有内容存储和分发技术。
参考链接:
CDN是什么?使用CDN有什么优势? https://www.zhihu.com/question/36514327/answer/1604554133

PV、UV

PV,page view,页面访问量;
UV,unique view,用户访问量;

LVS:Linux Virtual Server

即Linux虚拟服务器,是由章文嵩博士主导的开源负载均衡项目,目前LVS已经被集成到Linux内核模块中。该项目在Linux内核中实现了基于IP的数据请求负载均衡调度方案,其体系结构如图所示:

参考链接:
https://blog.csdn.net/weixin_40470303/article/details/80541639

轮询/加权轮询算法

参考链接:
https://blog.csdn.net/JMW1407/article/details/107787546

浏览器资源并发下载数量限制

浏览器的网络请求资源数是针对单一域名的。不同浏览器,不同http协议版本允许的网络请求资源数是不一样的(具体自行百度),不过总的来说在2-8个之间。
参考链接:
实验证明:
https://www.cnblogs.com/skyweaver/p/6091063.html
简单解释:
https://blog.csdn.net/u010080235/article/details/99978360

TFS:Taobao File System

TFS(Taobao File System)是一个高可扩展、高可用、高性能、面向互联网服务的分布式文件系统,主要针对海量的非结构化数据。

参考链接:
https://baike.baidu.com/item/TFS/5561187?fr=aladdin

搜索系统介绍

搜索系统主要包括:分词、数据查询、数据排序。其架构图如图所示:

其中,分词主要包括建立词库、词义分析,以及搜索纠错。

产品经理:
http://www.woshipm.com/pd/3422975.html
或者:
https://zhuanlan.zhihu.com/p/24083308

TimeTunnel

TimeTunnel(简称TT)是一个基于thrift通讯框架搭建的实时数据传输平台,具有高性能、实时性、顺序性、高可靠性、高可用性、可扩展性等特点(基于Hbase)。
目前TimeTunnel在阿里巴巴广泛的应用于日志收集、数据监控、广告反馈、量子统计、数据库同步等领域。
参考链接:
https://blog.csdn.net/pelick/article/details/26265663

淘宝云梯分布式计算平台

参考链接:
https://blog.csdn.net/uxiAD7442KMy1X86DtM3/article/details/90819717

ODPS数据存储、挖掘

开发数据处理服务(Open Data Processing Service,简称ODPS),2016年后更名MaxComputer。ODPS是一种由阿里云自主研发,针对TB/PB级数据、实时性要求不高的分布式处理服务。主要服务于批量结构化数据的存储和计算,可以提供海量数据仓库的解决方案以及针对大数据的分析建模服务。
CSDN
https://blog.csdn.net/helloxiaozhe/article/details/79590647
简书
https://www.jianshu.com/p/963e23880d01

数据挖掘

数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘过程模型步骤主要包括定义问题、建立数据挖掘库、分析数据、准备数据、建立模型、评价模型和实施。下面让我们来具体看一下每个步骤的具体内容:

python实战
https://www.cnblogs.com/zhuPython/p/9466770.html
你用 Python 做过什么有趣的数据挖掘/分析项目? - 何明科的回答 - 知乎 https://www.zhihu.com/question/28975391/answer/82797746
你用 Python 做过什么有趣的数据挖掘/分析项目? - 挖数的回答 - 知乎 https://www.zhihu.com/question/28975391/answer/100796070

(未完待续)

淘宝技术这十年——互联网技术大全!相关推荐

  1. 淘宝如何隐藏店铺首页宝贝让同行看不到商品链接,分享最新屏蔽淘宝天猫PC电脑端代码技术

    淘宝如何隐藏店铺首页宝贝让同行看不到商品链接,分享最新屏蔽淘宝天猫PC电脑端代码技术 之前发布的老技术大家就不要尝试了,已经失效了,我们经过不懈努力终于研究出可以代替之前旧版屏蔽技术,此技术截止目前为 ...

  2. 安卓项目实践——仿淘宝界面(二)——底部导航栏技术(Fragment实现)

    安卓项目实践--仿淘宝界面(一)--底部导航栏技术(Fragment实现) 1.实现效果展示 2.技术简述 该导航栏主要使用Fragment技术实现,关于Fragment的介绍大家可以自行百度,导航栏 ...

  3. NLP:自然语言处理技术近十年发展技术更迭的简介、案例之详细攻略(持续更新)

    NLP:自然语言处理技术近十年发展技术更迭的简介.案例之详细攻略(持续更新) 目录 自然语言处理技术近十年发展技术更迭的简介.案例

  4. 淘宝发布年度十大同款:钟南山哑铃、奥特曼变身器、嫦娥五号暖宝宝入选

    12月28日消息,淘宝发布年度十大同款,嫦娥五号同款暖宝宝.钟南山院士同款哑铃.丁真同款耳环等现象级爆款入选榜单. 据了解,"健康"是今年大家最想得到的"同款" ...

  5. NLP:自然语言处理技术近十年发展技术更迭的简介、案例之详细攻略(持续更新)daiding待更新

    NLP:自然语言处理技术近十年发展技术更迭的简介.案例之详细攻略(持续更新) 目录 自然语言处理技术近十年发展技术更迭的简介.案例

  6. 淘宝网店装修模板尺寸大小及格式大全

    淘宝网店装修模板尺寸大小及格式大全 淘宝店铺装修在用大量图片的时候你是否注意到,如果尺寸不对则会变形或者无法上传呢?那么你知道淘宝店铺在装修不同页面所对应的尺寸是多少,格式是什么吗?今天淘宝学堂带来淘 ...

  7. 你刚才淘宝上买衣服---具体分析技术工艺(淘宝页面显示处理的页面)

    声明:文章和保存之前看到在计算机网络中的文件,有没有办法找到原文地址.在该声明.为了上网project教师致敬. 你找到新的一年.所以,我想给你女朋友买一件毛衣,你打开www.taobao.com.这 ...

  8. 揭秘在淘宝买东西背后的复杂技术

    对于淘宝网而言,2012年的"双十一"是一个交易里程碑,是一个购物狂欢日,在这个"神棍节"里,淘宝创下191亿元的交易额,在交易的背后隐藏着哪些复杂技术? 你发 ...

  9. 【行业参考】大数据背景下的淘宝核心数据库建设与OceanBase技术探讨

    声明: 本文为转载(信息来源:三星应用社区-CSDN),文章标题为本博自拟,与来源无关.本文仅作参考,如有版权问题,请与博主联系删除.请勿转载本文,因转载导致的版权纠纷,与本博无关. 时至今日,&qu ...

最新文章

  1. Linux内存管理 (4)分配物理页面
  2. 关 于 正 则 表 达 式 的 类 习 题
  3. LVS负载均衡-NET、DR模式配置
  4. 数据结构之堆栈与队列
  5. java xstream jar_Java库使用----xstream1.3.1
  6. 无心剑《英语学习漫谈》
  7. 64位树莓派运行linux,树莓派3B+安装64位debian GUN/Linux系统
  8. 避免软件失败的7个关键实践——来自项目管理群的讨论
  9. Python爬虫实战:应用宝APP数据信息采集
  10. 机器学习 - [源码实现决策树小专题]决策树中子数据集的划分(不允许调用sklearn等库的源代码实现)
  11. MongoDB(一)——简介
  12. 连锁行业信息化的现状与问题
  13. 容器技术Docker K8s 52 边缘容器服务(ACK@Edge)-边缘计算和边缘容器
  14. 深度学习(5)之---目标检测综述:R-CNN、mask-RCNN、YOLO、SSD原理详解
  15. python微信加人_真的有专门给微信加人的软件吗?
  16. html excel 2位小数,excel保留两位小数_excel用公式保留2位小数的方法
  17. Python爬虫 使用Selenium爬取腾讯招聘信息
  18. excel根据条件列转行_如何将excel里的一列数据转为一行 excel数据列转行的办法步骤...
  19. 移动电源充电宝新国标GB/T 35590-2017检测报告测试项目
  20. 白月黑羽教程小收获记录-python基础

热门文章

  1. 怎样解决Mac电脑中的“AppStore无法下载软件”问题?
  2. Qt文本编辑器开发------纯代码实现
  3. Python获取链家二手房源数据信息
  4. Nginx网站服务——安装及页面优化步骤
  5. Kafka生成者/消费组详解
  6. /u200B 8203 Zero-width space 问题
  7. stm32f103c8t6控制蓝牙模块实现led灯亮灭
  8. 应用与机遇 | 陀螺财经正式发布「2019年度内容精选报告(中)」
  9. DDR4 Spec 第四章 4.17-4.18
  10. 现货黄金技术培训:减少无谓