2019独角兽企业重金招聘Python工程师标准>>>

当下,随着存储技术的飞速发展,各大公司都推出了云存储服务。但因为是免费面向大众的,无论微软的OneDrive还是百度的云网盘,好多人都难理解他们如何支撑起如此庞大的存储空间。就百度网盘而言 ,每个用户都可以免费得至少两个T的空间。其实百度并没有财力雄厚到为每个良好公民够买一个2T的硬盘,我们上传最多的无非是文本、图片、音频和视频,其中视频容量最最大,百度公司只要搞定“视频”这一关就足以撑起这一庞大的商业应用。据我自己总结,这背后主要有三点主要策略!
      1.第一点,也是都能猜到的一点,大部分用户面对这2T的容量自然不会一下全部用完,据统计平均每个用户只上传了50~60M的文件,那么剩下的空间自然不会给你闲在那,百度也不傻,自然是存放其他人的上传文件。其实具体实施时,百度有一个存储器集群专门存放用户文件,我们每个人的空间都是一个虚拟(virtual)硬盘,而且它的大小是弹性的,按需分配,所有人的文件按上传时间顺序依次存放。而在终端用户上还显示的是连续的2T空间,这样宝贵的服务器硬盘空间不就节省出来了吗?
      2.第二点,程序员发现,与邮箱不同,网盘里大家上传的内容有很多重复,尤其是电影电视剧,常常对于一个视频有上千次的重复上传。那么机会来了,显然只要对同一种文件存放一份,用户们共享它即可。但是计算机如何识别两个相同的文件呢?光比较文件名当然不行,这时厂商会利用哈希算法(Hash)算出每个文件的哈希值,哈希值相同则文件相同,要知道文件改变一个字符就会对哈希值产生天差地别的变化。然而如果每个文件上传时都计算的话,服务器的cpu很容易负荷超载,于是聪明的程序员想到一个办法,就是让客户机自己算,算完后再一起上传,这样算出之后若发现已经有重复就干脆不用上传了,直接在用户界面标记“秒传”。所以程序员写了个小软件或小插件,美其名曰“上传控件”,下载后会访问我们的cpu,成功圆事儿!
      3.第三点,也是最强的一招,先要说到我们为什么要上传那些电影等视频了。比如好多人会把上传一些从优酷下载下来的视频和音乐,一个原因是看地方便,另一个原因是为了收藏老视频,防止哪天网上再也找不到了(或者要收费)。但百度知道这些视频网站的更新策略啊,百度资深的合作伙伴们会向百度提供视频的地址,并提供快速通道。这样一来借他人之手,百度网盘无需花费一个字节就可以实现各大网站视频的海量存储!!

——By Jim

转载于:https://my.oschina.net/jinhengyu/blog/1572077

【★】百度网盘背后的真实策略!相关推荐

  1. 【#9733;】百度网盘背后的真实策略!

          当下,随着存储技术的飞速发展,各大公司都推出了云存储服务.但因为是免费面向大众的,无论微软的OneDrive还是百度的云网盘,好多人都难理解他们如何支撑起如此庞大的存储空间.就百度网盘而言 ...

  2. php解析百度云真实地址吗,百度网盘怎么获取真实下载链接 百度云资源真实地址解析教程...

    百度网盘是非常强大的,但是一些违规的资源禁止通过百度云下载,而且在百度云网盘中也不能查看,这就比较鸡肋了,除非找到资源的真实地址,将资源下载到本地,特此,小编为大家整理了一篇可以帮助你查找获取百度云资 ...

  3. 查找百度网盘资源的真实地址

    (function(){ var _id    = 309847; var isHome = $('a[title="我的卡包"]').html();   # 修改此处:资源所在文 ...

  4. JAVA获取百度网盘下载真实地址

    这是一个java写的获取百度网盘真实下载链接进行下载的程序.  程序里面一些参数拼接是根据浏览器抓包来的.具体的抓包方法网上一大堆,可以参考.这里给出了源码和导出的jar包.  url网址使用于百度分 ...

  5. 获取百度网盘下载真实地址

    这是一个java写的获取百度网盘真实下载链接进行下载的程序. 程序里面一些参数拼接是根据浏览器抓包来的.具体的抓包方法网上一大堆,可以参考.这里给出了源码和导出的jar包. url网址使用于百度分享的 ...

  6. 百度网盘的大数据应用案例

    为什么80%的码农都做不了架构师?>>>    百度提供了海量数据存储,个人几乎不用花费什么代价就可以获得数T的存储空间,个人使用绰绰有余.申请百度云空间可以通过这里进行,顷刻之间2 ...

  7. Java百度网盘创建链接,java获取百度网盘真实下载链接的方法

    本文实例讲述了java获取百度网盘真实下载链接的方法.分享给大家供大家参考.具体如下: 目前还存在一个问题,同一ip在获取3次以后会出现验证码,会获取失败,感兴趣的朋友对此可以加以完善. 返回的Lis ...

  8. 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 - 电子书下载 -(百度网盘 高清版PDF格式)...

    赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美-[美]查尔斯·韦兰 在线阅读                   百度网盘下载(bkgy) 书名:赤裸裸的统计学:除去大数据的枯燥外衣,呈现真 ...

  9. 【教程】百度网盘小程序如何获取真实的链接和提取码

    转载请注明出处:小锋学长生活大爆炸[xfxuezhang.cn] 目录 前景提要 获取链接 获取提取码 前景提要 微信收到一个百度网盘的二维码或者小程序,微信上点开根本找不到可以下载的地方,打开百度网 ...

最新文章

  1. 安装TokuDB引擎
  2. .NET Core中间件的注册和管道的构建(1)---- 注册和构建原理
  3. 机器学习中基本线性代数
  4. ssis导入xml_使用XML文件配置SSIS包
  5. 虚拟环境下对SQL Server安全性的考虑
  6. 案例-三角形(CSS3)
  7. 百度文档免费下载+PDF转word
  8. pdf批量下载网页文件,多种情景
  9. python numpy 下载地址
  10. excel 组合框控件使用方法
  11. C++第14周项目1 - 动物怎么叫
  12. Matrix Operations -- Transpose +Determinant + Adjugate+ Inverse + Gram-Schimidt +LUP + QR + Eigen
  13. 【力扣-动态规划入门】【第 4 天】45. 跳跃游戏 II
  14. springboot二手交易平台 毕业设计-附源码290915
  15. Jenkins 插件中心国内镜像源发布
  16. UOS(unity operating system)统一操作系统
  17. studing(来自转载)
  18. 【元胞自动机】元胞自动机超车换道【含Matlab源码 359期】
  19. 调研分析:全球与中国汽车内室照明模组市场现状及未来发展趋势
  20. mysql不可重复读李子_李子木_09d1

热门文章

  1. python控制结构实验结果分析_实验1_Python语法及控制结构
  2. linux rc文件是什么,linux通常使用的 rc 和 .(点)文件
  3. 【论文阅读】基于未知传播模型的信息源检测问题 2017年AAAI国际先进人工智能协会
  4. linux桌面隐藏鼠标,如何隐藏鼠标光标
  5. linux apache中文名称图片,linux下解决apache不支持中文名的方法详解!
  6. 点乘 线性代数_如果看了这些还不懂线性代数,你就来锤我和广坤
  7. 学生信息管理系统c语言课设,学生信息管理系统C语言课设.doc
  8. idea新建java工程
  9. 9.Java 面试题整理(UML 方面 )
  10. 蓝桥杯练习题:对给定整数基于斐波拉契数列构造字符串