本文转自:http://www.cnblogs.com/TankXiao/archive/2012/12/12/2794160.html  粉字部分为个人添加

本文介绍一些HTTP代理服务器的概念和工作原理

阅读目录

  1. 什么是代理服务器
  2. Fiddler就是个典型的代理
  3. 代理作用一:FQ
  4. 代理作用二:匿名访问
  5. 代理作用三:通过代理上网
  6. 代理作用四:通过代理缓存,加快上网速度
  7. 代理作用五:儿童过滤器
  8. IE代理设置:手动设置代理
  9. IE代理设置:使用自动配置脚本(PAC)
  10. IE代理设置:自动探测设置(WPAD)
  11. 代理认证,407状态码
  12. 使用代理服务器的安全问题
  13. 如何搭建代理服务器

什么是代理服务器

Web代理(proxy)服务器是网络的中间实体。 代理位于Web客户端和Web服务器之间,扮演“中间人”的角色。

HTTP的代理服务器即是Web服务器又是Web客户端。

Fiddler就是个典型的代理

Fiddler 是以代理web服务器的形式工作的,它使用代理地址:127.0.0.1, 端口:8888. 当Fiddler退出的时候它会自动注销代理,这样就不会影响别的程序。

代理的作用一, FQ

很多人都喜欢用Facebook, 看youTube。但是我们在天朝,天朝有The Great of Wall(长城防火墙),屏蔽了这些好网站。  怎么办?   通过代理来跳墙,就可以访问了。

自己去寻找代理服务器很麻烦, 一般都是用FQ软件来自动发现代理服务器的。

代理的作用二, 匿名访问

经常听新闻,说”某某某“在网络上发布帖子,被跨省追缉了。   假如他使用匿名的代理服务器,就不容易暴露自己的身份了。

http代理服务器的匿名性是指: HTTP代理服务器通过删除HTTP报文中的身份特性(比如客户端的IP地址, 或cookie,或URI的会话ID), 从而对远端服务器隐藏原始用户的IP地址以及其他细节。 同时HTTP代理服务器上也不会记录原始用户访问记录的log(否则也会被查到)。

代理的作用三, 通过代理上网

比如局域网不能上网, 只能通过局域网内的一台代理服务器上网。

代理的作用四, 通过代理缓存,加快上网速度

大部分代理服务器都具有缓存的功能,就好像一个大的cache, 它有很大的存储空间,它不断将新取得数据存储到它本地的存储器上, 如果浏览器所请求的数据在它本机的存储器上已经存在而且是最新的,那么它就不重新从Web服务器取数据,而直接将存储器上的数据传给用户的浏览器,这样就能显著提高浏览速度。

代理的作用五:儿童过滤器

很多教育机构, 会利用过滤器代理来阻止学生访问成人内容。

IE代理设置:手动设置代理

IE浏览器可以手动设置代理, 很简单,指定一个IP地址和端口就可以了。 如下图。

工具 -> Internet选项 -> 连接 -> 局域网设置 (快捷键)

假如代理服务器的IP地址改变了,或者端口号改变了。 难道要几百个客户端的浏览器去修改浏览器设置? Impossable  这太难维护了。  下面还有一种更高级点的方法。

IE代理设置:使用自动配置脚本(PAC)

手动配置代理很简单,但是不灵活。 只能指定一个代理服务器,而且不支持故障转移。

在大公司里一般都使用PAC文件来配置。只需要指定PAC文件的URL就可以了, 如图:

PAC(Proxy Auto Config)文件是一个小型的JavaScript程序的文本文件,后缀为.dat。

当浏览器访问网络的时候,会根据PAC文件中的JavaScript函数来选择恰当的代理服务器。

sample_pac.dat文件的内容

function FindProxyForURL(url, host) {if (url.substring(0, 5) == "http:") {// 应该使用指定的代理return "PROXY proxy:80";}else if (url.substring(0, 4) == "ftp:") {return "PROXY fproxy:80";}else if (url.substring(0, 7) == "gopher:") {return "PROXY gproxy";}else if (url.substring(0, 6) == "https:") {return "PROXY secproxy:8080";}else {// 直连,不经过任何代理return "DIRECT";}
}

IE代理设置:自动探测设置(WPAD)

浏览器只要选中“自动检测设置”, 就可以使用WPAD协议, WPAD会自动找到PAC文件的URL。  WPAD会使用一系列的资源发现技术(DHCP,DNS等)去寻找PAC文件。

代理认证,和407状态码

代理服务器也可以需要权限认证, HTTP定义了一种名为代理认证(Proxy authentication)的机制。 这种机制可以阻止对内容的请求。

当浏览器访问需要认证的代理时, 代理服务器会返回407 Authorization Required,告诉浏览器输入用户名和密码。

代理认证跟HTTP基本认证是一样的机制, 如需了解代理认证的机制,请看[HTTP协议基本认证]

使用代理服务器的安全问题

代理服务器和抓包工具(比如Fiddler)都能看到http request中的数据。 如果我们发送的request中有敏感数据,比如用户名,密码,信用卡号码。这些信息都会被代理服务器看到。所以非常危险。 所以我们一般都是用HTTPS来加密Http request.  这样代理服务器就看不到里面的数据了。(why??)

如何搭建代理服务器

可以使用CCproxy, 和Squid 来搭建代理服务器。

#HTTP协议学习# (七)代理相关推荐

  1. 爬虫入门学习(七)IP学习与代理池构建

    爬虫入门学习(七)IP学习与代理池构建 1 IP简介 2 IP被封的原因 3 应对IP被封的策略 3.1 伪造User-Agent 3.2 设置线程等待sleep() 3.3 伪造Cookies 3. ...

  2. 极客HTTP协议学习笔记破冰篇(1-7)

    极客HTTP协议学习笔记破冰篇(1-7) 前言 各篇章笔记链接 一.学习笔记 1.HTTP的前世今生 2.HTTP是什么 3.与HTTP相关的各种概念(上) 4.与HTTP相关的各种概念(下) 5.常 ...

  3. 《透视 HTTP 协议学习》摘录

    透视 HTTP 协议学习 01 | 时势与英雄:HTTP的前世今生 1989 年,任职于欧洲核子研究中心(CERN)的**蒂姆·伯纳斯 - 李(Tim Berners-Lee)**发表了一篇论文,提出 ...

  4. 片上总线协议学习(1)——SiFive的TileLink与ARM系列总线的概述与对比

    link 片上总线协议学习(1)--SiFive的TileLink与ARM系列总线的概述与对比 finally 27 人赞同了该文章 一.背景介绍 随着超大规模集成电路的迅速发展,半导体工业进入深亚微 ...

  5. 网络协议学习笔记 · 22

    IPv6 · 流媒体 · 即时通讯 · 缓存 · 网络爬虫 VPN 作用 VPN与代理的区别 实现原理(隧道协议) 网络爬虫 简易实例 robots.txt 无线网络 缓存(Cache) 响应头 请求 ...

  6. http协议学习系列

    http协议学习系列 1. 基础概念篇 1.1 介绍 HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写.它的发展是万维网协会(World Wide Web C ...

  7. GSMA SGP.21协议学习

    GSMA SGP.21协议学习 1简介 1.1概述 本文档提供了一种体系结构方法,作为所有市场中设备的远程SIM配置的建议解决方案.体系结构的主要目标是为设备的远程SIM配置提供必要的凭据以获取移动网 ...

  8. Virtual-Network--—DHCP协议学习以及对应报文分析

    文章目录 Virtual-Network---DHCP协议学习以及对应报文分析 转载 1. DHCP 简介 1.1 DHCP 作用 1.2 DHCP 工作机制 2. DHCP 交互流程 2.1 正常交 ...

  9. 学习前端和后端必学之HTTP协议学习

    1.HTTP协议学习目标: (1).调试AJAX应用"看不见摸不着"的错误 (2).进行Web访问优化---高阶面试题 2.面试题:浏览器中输入www.taobao.com直到看到 ...

  10. AXI 总线协议学习笔记(4)

    引言 前面两篇博文从简单介绍的角度说明了 AXI协议规范. AXI 总线协议学习笔记(2) AXI 总线协议学习笔记(3) 从本篇开始,详细翻译并学习AXI协议的官方发布规范. 文档中的时序图说明: ...

最新文章

  1. 关于MVC/P 的简单介绍
  2. Python编程基础:第五节 用户输入User Input
  3. 12月13日 什么是help_method,session的简单理解, find_by等finder method
  4. python 示例_Python条件类| release()方法与示例
  5. 罗永浩:如果没有特斯拉和马斯克 激动人心的电动车时代不会这么早的到来
  6. gcc,make和cmake
  7. Java大对象lob_JavaEE JDBC 读写LOB大对象
  8. python批量转换数据类型_玩转python 各种数据类型的转换
  9. HTTP 304状态码
  10. Linux下点阵汉字的字模读取与显示
  11. 计算机里比较器原理,数值比较器,数值比较器的作用和原理是 - 电子发烧友网...
  12. openAL在C++下的易用封装,调用直接播放3D音频,模拟3D音效
  13. 浏览器JSON的插件(JSON-handle)使用问题
  14. GB/T 20984-2022《信息安全技术 信息安全风险评估方法》解读
  15. (第二章)HTML基本标记
  16. Nginx配之负载均衡、缓存、黑名单和灰度发布
  17. Android Studio 支持安卓手机投屏
  18. 11. 形态学膨胀、腐蚀、开运算、闭运算
  19. pstack命令使用说明
  20. 经典CVE:破壳漏洞

热门文章

  1. 对话科大讯飞刘聪:深度学习在中国是否“过火”?
  2. Python 之 Matplotlib (二)figure
  3. 数字孪生卫星:概念、关键技术及应用
  4. Hinton口中破解宇宙终极秘密的GPT-3厉害在哪?这有篇涂鸦详解
  5. 日本面向未来的特定科技领域技术预见分析
  6. 3D器官和骨骼将使移植清单成为历史
  7. 5G、物联网和AI结合的究极形态是什么?一文看尽智能连接在5大领域的12个典型案例!...
  8. Waymo十周年:多尔戈夫讲述从被嘲笑到硕果累累
  9. 德国再出颠覆性发明,这次要安排我们的快递
  10. 智能连接:5G、AI和IoT的组合如何改变美洲