前言

在百度准备进行HTTPS站点部署之前,网上介绍HTTPS的文章并不多,更鲜有分享在大型互联网站点部署HTTPS的实践经验,我们在考虑部署HTTPS时也有重重的疑惑。本文将为大家介绍百度进行HTTPS部署的实践和一些权衡,希望以此抛砖引玉。

协议层以外的实践工作

1全站覆盖HTTPS的理由

很多刚接触HTTPS的会思考,我是不是只要站点的主域名换了HTTPS就可以?答案是不行。

HTTPS的目的就是保证传输过程的安全,如果只有主域名上了HTTPS,但是主域名加载的资源,比如JS,CSS,图片没有上HTTPS,会怎么样?

从效果上来说,没有达到保证网站传输过程安全的目的,因为你的JS,CSS,图片仍然有被劫持的可能性,如果这些内容被篡改/嗅探了,那么就失去了HTTPS的意义了。

浏览器在设计上早就考虑的这样的情况,会有相应的提示。具体的实现依赖浏览器,例如地址栏锁形标记从绿色变为黄色,阻止这次请求,或者直接弹出非常影响用户体验的提示(主要是IE),用户会感觉厌烦,疑惑和担忧安全性。

很多用户看见这个链接会习惯性的点”是”,这样非HTTPS的资源就被禁止加载了。非IE的浏览器很多也会阻止加载一些危害程度较高的非HTTPS资源(例如JS)。所以若是没有做到全站HTTPS覆盖,很多情况下连网站的基本功能都无法正常使用。

2站点的区别

很多人刚接触HTTPS的时候,觉得不就是部署证书,让Web Server支持HTTPS就行了吗。

实际上对于不同的站点来说,HTTPS的部署方式和难度有很大的区别。对于一个大型站点来说,让Web Server支持HTTPS,以及对Web Server在HTTPS协议特性上做一些优化,在迁移的工作比重上,可能只占到20%-40%。

我们考虑以下几种情况下,部署HTTPS的方案。

1简单的个人站点

简单的定义:资源只从本站的主域或者主域的子域名加载

比如axyz的个人blog,域名是axyzblog.com。加载主域名下的JS和图片。

这样的站部署HTTPS,在已有证书且Web Server支持的情况下,只需要把主域名替换为HTTPS接入,然后把资源连接修改为https://或者//。

2复杂的个人站点

复杂的定义:资源需要从外部域名加载

这样就比较麻烦了,主域资源容易适配HTTPS,在CDN上加载的资源还需要CDN服务商支持HTTPS,因此需要迁移的朋友还要了解自己使用的CDN是否提供了这项能力。

CDN使用HTTPS常见的方案有:

  1. 网站主提供私钥给CDN,回源使用HTTP。

  2. CDN使用公共域名,公共的证书,这样资源的域名就不能自定义了。回源使用HTTP。

  3. 仅提供动态加速,CDN进行TCP代理,不缓存内容。

  4. Cloudflare提供了Keyless SSL的服务,能够支持不愿意提供私钥,不想使用公共的域名和证书却又需要使用CDN的站点了。

3简单的大型站点

简单的定义:资源只从本站的主域,主域的子域,或者自建/可控的CDN域名加载,几乎没有第三方资源。如果网站本身的特性就如此,或愿意改造为这样的类型,部署HTTPS就相对容易,Google、Twitter都是非常好的范例。

优点:已经改成这样的站点,替换HTTPS就比较容易。

缺点:如果需要改造,那么要很大的决心,毕竟几乎不能使用多样化的第三方资源了。

4复杂,访问速度重要性稍低的大型站点

复杂的定义:从本站的非主域,或者第三方站点的域名有大量的第三方资源需要加载,多出现在一些平台类,或者有复杂内容展现的的网站。

访问速度要求:用户停留时间长或者强需求,用户对访问速度的耐受程度较高。比如门户,视频,在线交易类(比如火车票机票商城)网站。

这样的站点,可以努力推动所有相关域名升级为支持HTTPS。我们用下图举例说明下这样修改会导致一个网站的链接发生怎样的改变。

负责流量接入的团队将可控的接入环境改造为HTTP和HTTPS都支持,这样前端工程的工作相对就少一些。大部分时候将链接从http://替换为//即可,在主域名是HTTPS的情况下,其它资源就能自动从HTTPS协议下加载。一些第三方资源怎么办?一般来说只有两种选择,一是迁移到自己的CDN或者IDC,二是强制要求第三方自己能支持HTTPS。

以全站HTTPS接入的Facebook举例。第三方厂商想在Facebook上线一个游戏,Facebook:请提供HTTPS接入吧。第三方想:能赚钱啊,还是提供下HTTPS接入吧。所以,足够强势,有吸引力,合作方也有提供HTTPS的能力的话,这是完全可行的。如果你的平台接入的都是一些个人开发者,而且还赚不到多少钱的情况下,这样就行不通了。

优点:前端改动相对简单,不容易出现HTTPS下还有HTTP的资源问题。

缺点:通常这样的实现下,用户的访问速度会变慢,比如从2.5秒变为3秒,如上述的理由,用户还是能接受的。对第三方要求高。

5复杂,访问速度有严格要求的大型站点

复杂的定义:同上。

访问速度要求:停留时间不长,用户对访问速度的心理预期较高

但是如果用户把网站当作工具使用,需要你很快给出响应的时候,这样的实现就不好了。后续几个部分我们介绍下这些优化的抉择。

3域名的选择

域名对访问速度的影响具有两面性:域名多,域名解析和建立连接的时间就多;域名少,下载并发度又不够。

HTTPS下重建连接的时间成本比HTTP更高,对于上面提到的简单的大型站点,可以用少量域名就能满足需求,对于百度这样富展现样式较多的搜索引擎来说,页面可能展示的资源种类太多。而不同类型的资源又是由不同的域名(不同的产品或者第三方产品)提供的服务,换一个词搜索就可能需要重新建立一些资源的SSL链接,会让用户感受到卡顿。

如果将域名限制在有限的范围,维持和这些域名的连接,合并一些数据,加上有SPDY,HTTP/2来保证并发,是可以满足我们的需求的。

4连接复用

连接复用率可以分为TCP和SSL等不同的层面,需要分开进行分析和统计。

1连接复用的意义

HTTP协议(RFC2616)规定一个域名最多不能建立超过2个的TCP连接。但是随着互联网的发展,一张网页的元素越来越多,传输内容越来越大,一个域名2个连接的限制已经远远不能满足现在网页加载速度的需求。

目前已经没有浏览器遵守这个规定,各浏览器针对单域名建立的TCP连接数如下:

表1  浏览器单域名建立的最大并发连接数

从上表看出,单个域名的连接数基本上是6个。所以只能通过增加域名的方式来增加并发连接数。在HTTP场景下,这样的方式没有什么问题。但是在HTTPS连接下,由于TLS连接建立的成本比较高,增加并发连接数本身就会带来较大的延迟,所以对域名数需要一个谨慎的控制。

特别是HTTP/2即将大规模应用,而HTTP/2的最大特性就是多路复用,使用多个域名和多个连接无法有效发挥多路复用和压缩的特性。

那HTTPS协议下,一张网页到底该有多少域名呢?这个其实没有定论,取决于网页需要加载元素个数。

2预建连接

既然从协议角度无法减少握手对速度的影响,那能不能提前建立连接,减少用户可以感知的握手延迟呢?当然是可以的。思路就是预判当前用户的下一个访问URL,提前建立连接,当用户发起真实请求时,TCP及TLS握手都已经完成,只需要在连接上发送应用层数据即可。

最简单有效的方式就是在主域下对连接进行预建,可以通过请求一些静态资源的方式。但是这样还是不容易做到极致,因为使用哪个连接,并发多少还是浏览器控制的。例如你对a域名请求一个图片,浏览器建立了两个连接,再请求一张图片的时候,浏览器很大概率能够复用连接,但是当a域名需要加载10个图片的时候,浏览器很可能就会新建连接了。

3SPDY的影响

SPDY对于连接复用率的提升非常有效,因为它能支持连接上的并发请求,所以浏览器会尽量在这个链接上保持复用。

4其他

可以尝试一些其他方法,让浏览器在访问你的网站之前就建立过HTTPS连接,这样Session能够复用。例如HSTS可以有效的减少跳转时间,但对于复杂的网站来说,开启HSTS需要考虑很多问题。

5优化的效果

从百度的优化经验来看,如果不开启HSTS,用户在浏览器直接访问主域名,再通过302跳转到HTTPS,增加的时间平均会有400ms+,其中302跳转和SSL握手的因素各占一半。但是对于后续的请求,我们做到了对绝大部分用户几乎无感知。这400ms+还有很多可以优化的空间,我们会持续优化用户的体验。

HTTPS迁移遇到的一些常见问题

1传递(Referrer)

我们可以把自己的网站替换为HTTPS,但是一般的站点都有外链,要让外链都HTTPS目前还不太现实。很多网站需要从Referrer中判断流量来源,因此对于搜索引擎这样的网站来说,Referrer的传递还是比较重要的。如果不做任何设置,你会发现在HTTPS站点中点击外链并没有将Referrer带入到HTTP请求的头部中(http://tools.ietf.org/html/rfc7231#section-5.5.2)。现代的浏览器可以用meta标签来传递Referrer。

对于不支持meta传递Referrer的浏览器,例如IE8,我们怎么办呢?

可以采用再次跳转的方法,既然HTTPS下不能给HTTP传递Referrer,我们可以先从HTTPS访问一个可控的HTTP站点,把需要传递的内容放到这个HTTP站点的URL中,然后再跳转到目标地址。

2Form提交

用户有时需要将Form提交到第三方站点,在第三方站点是HTTP的地址时,浏览器会有不安全的警告。这个问题可以采取和Referrer的跳转传递相似的逻辑。

但这并不是完美的解决方法,因为增加了不安全的因素(劫持,隐私泄露等)。理想情况还是需要用户升级符合最新规范的浏览器,以及推进更多的站点迁移至HTTPS。

3视频播放

简单来说,如果你使用HTTP的协议来播放视频,那么浏览器仍然会有不安全的提示。所以你有两种选择,一是让视频源提供HTTPS,二是使用非HTTP的协议,如RTMP协议。

4用户异常

在HTTPS迁移的过程中,也会有不少热心的用户向我们反馈遇到的各种问题。

常见的有以下的一些情况:

  1. 用户的系统时间设置错误,导致提示证书过期。

  2. 用户使用Fiddler等代理进行调试,但是没有添加这些软件的根证书,导致提示证书非法。

  3. 用户使用的DNS为公共DNS或者跨网设置DNS,一些请求被运营商作为跨网流量拦截。

  4. 连通性有问题。我们发现一个小运营商的HTTPS失败率奇高,又没法联系到他们,只能不对他们进行HTTPS的转换。

  5. 慢。有时由于网络环境的因素,用户打开其他网站也慢,Ping任意网站都耗时500-2000ms。这时HTTPS自然也会很慢。

总  结

对于复杂的大型网站来说,HTTPS的部署有很多工作要完成。

虽然面对着困难和挑战,但有着充足的动力支持着我们前进:HTTPS上线后,劫持等原因导致的用户功能异常,隐私泄露的反馈大幅减少。

热心的用户经常会向我们反馈遇到的各种问题。在以前,有时即使我们确定了是劫持的问题,能够解决问题的方法也非常有限。每当这种时候,自己总会产生一些无力感。

HTTPS的全站部署,给我们提供了能解决大部分问题的选项。能让一个做技术的人看到自己的努力解决了用户的问题,这就是最棒的收获。

HTTPS没有想像中难用和可怕,只是没有经过优化,与大家共勉。

文章整理自百度HTTPS技术联合团队

↓↓↓ 点击"阅读原文" 【了解更多精彩内容】

百度HTTPS部署实践相关推荐

  1. 分布式大数据多维分析引擎:Kylin 在百度地图的实践

    2019独角兽企业重金招聘Python工程师标准>>> 1. 前言 百度地图开放平台业务部数据智能组主要负责百度地图内部相关业务的大数据计算分析,处理日常百亿级规模数据,为不同业务提 ...

  2. TVM优化c++部署实践

    TVM优化c++部署实践 使用TVM导入神经网络模型: 模型支持pytorch , tensorflow , onnx, caffe 等.平时pytorch用的多,这里给一种pytorch的导入方式. ...

  3. nginx http请求强转https 无www强转www服务 过百度https认证

    文章目录 1 介绍 2 nginx.conf 配置 2.1 http 转https 2.2 https无www强转www 3 过百度https认证 1 介绍 为了让网站个安全,我们通常会安装https ...

  4. 基于 Docker 和 GitLab 的前端自动化部署实践笔记

    基于 Docker 和 GitLab 的前端自动化部署 实践笔记 随着接触的项目越来越多,在部署测试流程上重复耗时工作也越来越多,所以对前端工作的CI/CD实现愈发迫在眉睫. 前端开发由于三大框架的崛 ...

  5. tftp 服务器 ip_360Stack裸金属服务器部署实践

    女主宣言 裸金属特性是一种将物理设备作为资源提供给租户的云计算服务,租户通过该服务可申请.管理和配置相应的物理设备资源,本文将介绍360Stack裸金属服务器的部署实践. PS:丰富的一线技术.多元化 ...

  6. 时空大数据实践之GeoWave安装部署实践

    2019独角兽企业重金招聘Python工程师标准>>> 时空大数据实践之GeoWave安装部署实践 GeoWave是由国家地理空间情报局(NGA)与RadiantBlue和Booz ...

  7. 360Stack裸金属服务器部署实践

    女主宣言 裸金属特性是一种将物理设备作为资源提供给租户的云计算服务,租户通过该服务可申请.管理和配置相应的物理设备资源,本文将介绍360Stack裸金属服务器的部署实践. PS:丰富的一线技术.多元化 ...

  8. 持续集成与持续部署实践_持续集成和部署的3个最佳实践

    持续集成与持续部署实践 本文涵盖了三个关键主题:自动化CI / CD配置,将Git存储库用于常见的CI / CD工件以及对Jenkins管道进行参数设置. 术语 首先是第一件事: 让我们定义一些术语. ...

  9. Zabbix 4.2.5 安装部署实践详解

    一.安装 1.安装CentOS操作系统,并配置网络 2.安装Zabbix官方源 rpm -ivh http://repo.zabbix.com/zabbix/4.2/rhel/7/x86_64/zab ...

最新文章

  1. 计算机中的机器码就是二进制数,高电单片机习题(答案)
  2. 基于android公交车线路查询论文文献,本科毕业论文---基于android的手机公交线路查询系统.doc...
  3. android button 行间距,android – 如何减少TextView行间距
  4. 静态方法获取spring的bean实例
  5. Navicat常用快捷键
  6. Yii 2.0 权威指南 (4) 使用 Gii 生成代码
  7. gradle下载很慢
  8. 简述网卡的作用和工作原理_网卡的工作原理(要简短的)
  9. 分享43个职场必备excel函数!(内含详细案例解析及教程参考)
  10. 网页截图及TDK抓取
  11. 编码器如何推流给虎牙直播平台
  12. Rxjava(2.操作符)
  13. 创建微信小程序日期和时间的组件
  14. MATLAB数学建模-规划模型总结| MATLAB求解
  15. 11:ERNIE-VIL:KNOWLEDGE ENHANCED VISION-LANGUAGE REPRESENTATIONS THROUGH SCENE GRAPH
  16. mysql修改时区为utc
  17. mysql外键(FK)及其外键关联操作reference
  18. 【渝粤题库】陕西师范大学152113 统计学 作业
  19. pandownload,TuTDown网盘不限速下载
  20. 渗透测试-----信息收集(通过DNS解析找IP地址、CDN、IP查询、IP物理地址、搜索引擎、网站信息收集)

热门文章

  1. mysql事务如何保证持久性_详解MySQL事务持久性实现
  2. Android 增量编译总结
  3. 机器学习之神经网络与支持向量机
  4. 红旗Linux系统安装步骤
  5. 2020年高教社杯全国大学生数学建模C题中小微企业信贷决策(Matlab代码)
  6. Redis?它主要用来什么的
  7. Dell服务器通电自启动
  8. idea集成h2的问题
  9. 编译器中,光标变宽,输入字符会替换掉原字符
  10. 图解CyclicBarrier运动员接力赛