代理服务原理很简单,就拿浏览器与web服务器来说。无非是A浏览器

发request给B代理,B代理再把request把送给C web服务,然后C的reponse->B->A。

要写web代理服务就要先了解下http协议,当然并不要多深入,除非要实现强大的功能:修改XX信息、

负载均衡等。http请求由三部分组成:请求行、消息报头、请求正文;

详细的网上有,想了解可以看看。下面是一个正常的GET请求头(Cookie部分本人没截屏,使用的系统w7):

可以看到首行:GET是请求方法, /是路径,在后面是协议版本;第二行以后是请求报头,都是键值对形式;

GET方法没有正文。post有正文,除此之外,请求方法头部基本一致,每一行结尾都是\r\n。

基本的请求方法,如下:

GET        请求获取Request-URI所标识的资源

POST      在Request-URI所标识的资源后附加新的数据

HEAD      请求获取由Request-URI所标识的资源的响应消息报头

PUT         请求服务器存储一个资源,并用Request-URI作为其标识

DELETE   请求服务器删除Request-URI所标识的资源

TRACE     请求服务器回送收到的请求信息,主要用于测试或诊断

CONNECT 保留将来使用

OPTIONS  请求查询服务器的性能,或者查询与资源相关的选项和需求

但是使用代理后,从代理服务上得到的请求如下:

与第一张图片对比一下,有什么不同......第一行的资源路径不对。当浏览器上设置代理请求时把整个url都作为资源路径了,所以我们要把域名删掉,然后代理服务器在把修改后的请求发送给目标

web服务器。就这么简单,当然CONNECT方法特别,要特别对待,所以先说其他方法。

基本的思路:

1、代理服务器运行监听,当有客户端浏览器请求到来时通过accept()获得client句柄(或者叫描述符);

2、利用client描述符接收浏览器发来的request,分离出第一行为了修改第一行和获得method,

要去掉的的部分,除去http://的部分用targetHost表示吧。

3、通过第2步能够获得方法method、request和targetHost,这一步可以根据不同的method做不同的处理,

由于GET、POET、PUT、DELETE等除了CONNECT处理基本一致,所以处理首行,比如:

GET http://www.a.com/ HTTP/1.1

替换为

GET / HTTP/1.1

此时targetHost也就是红色的部分,默认的请求80端口,此时port为80;如果targetHost中有端口(比如www.a.com:8081),

就要分理处端口,此时port为8081。然后根据targetHost和port连接到目标服务器target了,实现代码如下:

def getTargetInfo(self,host): #处理targetHost获得网址和端口,作为返回值。

port=0

site=None

if ':' in host:

tmp=host.split(':')

site=tmp[0]

port=int(tmp[1])

else:

site=host

port=80

return site,port

def commonMethod(self,request): #处理除CONNECT以外的方法

tmp=self.targetHost.split('/')

net=tmp[0]+'//'+tmp[2]

request=request.replace(net,'') #替换掉首行不必要的部分

targetAddr=self.getTargetInfo(tmp[2]) #调用上面的函数

try:

(fam,_,_,_,addr)=socket.getaddrinfo(targetAddr[0],targetAddr[1])[0]

except Exception as e:

print e

return

self.target=socket.socket(fam)

self.target.connect(addr) #连接到目标web服务

4、这一步就好办了,根据第三步处理后的request就可以self.target.send(request)发送给web服务器了。

5、这一步web服务器的reponse反响通过代理服务直接转发给客户端就行了,本人用了非阻塞select,可以试试epoll。

基本步骤就是这样,使用的方法函数可以改进,比如主函数部分使用的多线程或者多进程,怎样选择......

但是思路差不多都是这样啦。想测试的话,chrome安装SwitchySharp插件,设置一下,代理端口8083;

firefox插件autoproxy。

对于connect的处理还在解决中(如果有博友帮助就更好了),所以现在这个代理程序不支持https协议。

代理服务可以获得http协议的所有信息,想了解学习http,利用代理服务器是个不错的方法。

下面附上代码

#-*- coding: UTF-8 -*-

import socket,select

import sys

import thread

from multiprocessing import Process

class Proxy:

def __init__(self,soc):

self.client,_=soc.accept()

self.target=None

self.request_url=None

self.BUFSIZE=4096

self.method=None

self.targetHost=None

def getClientRequest(self):

request=self.client.recv(self.BUFSIZE)

if not request:

return None

cn=request.find('\n')

firstLine=request[:cn]

print firstLine[:len(firstLine)-9]

line=firstLine.split()

self.method=line[0]

self.targetHost=line[1]

return request

def commonMethod(self,request):

tmp=self.targetHost.split('/')

net=tmp[0]+'//'+tmp[2]

request=request.replace(net,'')

targetAddr=self.getTargetInfo(tmp[2])

try:

(fam,_,_,_,addr)=socket.getaddrinfo(targetAddr[0],targetAddr[1])[0]

except Exception as e:

print e

return

self.target=socket.socket(fam)

self.target.connect(addr)

self.target.send(request)

self.nonblocking()

def connectMethod(self,request): #对于CONNECT处理可以添加在这里

pass

def run(self):

request=self.getClientRequest()

if request:

if self.method in ['GET','POST','PUT',"DELETE",'HAVE']:

self.commonMethod(request)

elif self.method=='CONNECT':

self.connectMethod(request)

def nonblocking(self):

inputs=[self.client,self.target]

while True:

readable,writeable,errs=select.select(inputs,[],inputs,3)

if errs:

break

for soc in readable:

data=soc.recv(self.BUFSIZE)

if data:

if soc is self.client:

self.target.send(data)

elif soc is self.target:

self.client.send(data)

else:

break

self.client.close()

self.target.close()

def getTargetInfo(self,host):

port=0

site=None

if ':' in host:

tmp=host.split(':')

site=tmp[0]

port=int(tmp[1])

else:

site=host

port=80

return site,port

if __name__=='__main__':

host = '127.0.0.1'

port = 8083

backlog = 5

server = socket.socket(socket.AF_INET,socket.SOCK_STREAM)

server.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)

server.bind((host,port))

server.listen(5)

while True:

thread.start_new_thread(Proxy(server).run,())

# p=Process(target=Proxy(server).run, args=()) #多进程

# p.start()

python中socket实现代理功能_python实现代理服务功能实例相关推荐

  1. python中socket模块常用吗_python中socket模块详解

    socket模块简介 网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为一个socket.socket通常被叫做"套接字",用于描述IP地址和端口,是一个通信 ...

  2. python中socket模块常用吗_python网络学习笔记——socket模块使用记录

    此文章记录了笔者学习python网络中socket模块的笔记. 建议初次学习socket的读者先读一遍socket模块主要函数的介绍. socket模块的介绍可以参考笔者的前一篇关于socket官方文 ...

  3. [转载] python中dtype的使用规范_Python numpy.dtype() 使用实例

    参考链接: Python中的numpy.extract The following are code examples for showing how to use . They are extrac ...

  4. python中zip()函数的用法_Python zip()函数用法实例分析

    本文实例讲述了python zip()函数用法.分享给大家供大家参考,具体如下: 这里介绍python中zip()函数的使用: >>> help(zip) Help on built ...

  5. python中关于命名的例子_Python 命名规范入门实例

    这篇文章主要为大家详细介绍了Python 命名规范入门实例,具有一定的参考价值,可以用来参考一下. 对python这个高级语言感兴趣的小伙伴,下面一起跟随512笔记的小编两巴掌来看看吧! 一,包名.模 ...

  6. [转载] python中for语句用法_详解Python中for循环的使用_python

    参考链接: 在Python中将else条件语句与for循环一起使用 这篇文章主要介绍了Python中for循环的使用,来自于IBM官方网站技术文档,需要的朋友可以参考下 for 循环 本系列前面 &q ...

  7. python中sys模块有问题_python中sys模块之输入输出错误流

    import sys sys.stdout.write("msg")   # 控制台白色字体打印 普通输出流 sys.stderr.write("msg") # ...

  8. Python中socket解读

    操作系统底层原理 操作系统:(Operating System,简称OS)是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在"裸机"上的最基本的系统软件,任何其他软件都必须 ...

  9. Python学习,python中socket解读

    操作系统底层原理 操作系统:(Operating System,简称OS)是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在"裸机"上的最基本的系统软件,任何其他软件都必须 ...

最新文章

  1. matlab索引程序,Matlab索引到逻辑索引
  2. 【Linux 内核 内存管理】优化内存屏障 ② ( 内存屏障 | 编译器屏障 | 处理器内存屏障 | 内存映射 I/O 写屏障 )
  3. 成功解决CatBoostError: Invalid type for cat_feature cat_features must be integer or string, real number
  4. 情感分析之电影评论分析-基于Tensorflow的LSTM
  5. python 如何放心干净的卸载模块
  6. 贪心算法之高级钟点秘书会议安排问题
  7. mysql复制的工作原理及主从复制的实现
  8. volatile用法
  9. 查找算法:斐波那契查找算法实现及分析
  10. [WP8] ListBox的Item宽度自动填满
  11. js 高级 prototype
  12. Leetcode每日一题:1095.find-in-mountain-array(山脉数组中查找目标值)
  13. SQLite-database disk image is malformed问题的解决
  14. 微信支付 (APP端开发)
  15. python 英语分词_Python实现中英文分词
  16. 【SQL】SQL的基础语法
  17. 计算机技术比武优秀获奖感言,技能比赛获奖感言范文
  18. 如何让邮件变的更安全?邮箱安全中心在哪里?
  19. 音视频开发——概述(含TUTK demo iOS)
  20. 基于Redisson实现的延时队列RedissonDelayedQueue实现websocket服务端心跳监听

热门文章

  1. 让0球平局怎么算_半场16中5+0助攻+空气球,欧文威化,看看众美媒怎么说?
  2. Java获取文件路径获取访问路径、域名、项目名、请求入参
  3. WebService的相关概念1
  4. IOS开发基础知识--碎片8
  5. 消除软硬件鸿沟,芯客网完美支持智能硬件在移动互联时代的爆发
  6. linux boot procedure
  7. 10个可以简化开发过程的MySQL工具
  8. [转]asp.net(c#)生成验证码 点击可刷新
  9. 安装工程图形算量离我们还多远
  10. CSS定位—position:fixed