【P2P网络】BitTorrent协议中文版3

2024-04-28 04:27:06

Tracker HTTP/HTTPS Protocol

Tracker是一个响应HTTP GET请求的HTTP/HTTPS服务。这个请求包含来自客户端的度量信息，这些信息能够帮助Tracker全面地统计torrent。Tracker的响应包含一个peers列表，这个列表能够帮助客户端加入到torrent中。Base URL由元数据文件(即以.torrent为后缀的文件)中定义的announce URL组成，然后使用标准的CGI方式将这些请求参数追加到这个URL后面(CGI方式即在announce URL后面紧跟一个’?’，然后是一个以’&’分隔的’param=value’序列)。

注意：URL中的所有二进制数据(特别是info_hash和peer_id)必须适当地进行转义。这意味着不在集合{0-9, a-z, A-Z, ‘.’, ‘-’, ‘_’, ‘~’}中的字节必须以’%nn’方式编码，其中nn是这个字节的十六进制值。

对于一个20字节的散列值 “\x12\x34\x56\x78\x9a\xbc\xde\xf1\x23\x45\x67\x89\xab\xcd\xef\

x12\x34\x56\x78\x9a”，其正确的编码形式是“%124Vx%9A%BC%DE%F1%23Eg%89%AB%CD%EF

%124Vx%9A“。

Tracker Request Parameters

从客户端发送到Tracker的请求包含如下参数：

l info_hash：URL编码的20字节SHA1散列，这个散列是元信息文件中info键所对应的值的SHA1散列。注意info键所对应的值是一个B编码的dictionary，关于info键的定义请参考我的上一篇博文。

l peer_id：使用URL编码的20字节串，用于标识客户端的唯一ID，由客户端启动时生成。这个ID可以是任意值，甚至可能是二进制数据。目前没有生成该ID的标准准则，尽管如此，实现者必须保证该ID对于本地主机是唯一的，因此可以通过包含进程ID和启动时记录的时间戳(timestamp)来达到这个目的。关于这个字段的常用客户端编码，请参考我的下一篇博文。

l port：客户端正在监听的端口号。为BitTorrent协议保留的端口号是6881-6889。如果不能使用该区间的数字建立端口号，客户端有可能拒绝建立连接。

l uploaded：客户端已经上传的总量(从客户端发送’started’事件到Tracker算起)，以十进制ASCII表示。尽管官方规范没有显式指定，大部分情况下是指已经下载的字节总数。

l downloaded：已下载的字节总量(从客户端发送’started’事件到Tracker算起)，以十进制ASCII表示。尽管官方规范没有显式指定，大部分情况下是指已经下载的字节总数。

l left：客户端还没有下载的字节数，以十进制ASCII表示。

l compact：如果设置为1，表示客户端接收压缩的响应包。这时peers列表将被peers串代替，在这个peers串中，每个peer占六个字节。这六个字节的前四个字节表示主机信息(以大端表示即以网络字节序)，后两个字节表示端口号(以大端表示即以网络字节序)。需要注意的是，为了节约带宽，有些Tracker只支持返回压缩的响应包，如果没有将compact设置为1，Tracker将拒绝这个请求或者如果请求中不包括compact=0这个参数，Tracker将返回压缩的响应包。

l no_peer_id：表示Tracker将省略peers dictionary中的id字段。如果启用compact，那么就会忽略这个选项。

l event：如果指定的话，必须是started, completed, stopped和空(和不指定的意义一样)中的一个。如果一个请求不指定event，表明它只是每隔一定间隔发送的请求。

n started：第一个发送到Tracker的请求其event值必须是该值。

n stopped：如果正常关闭客户端，必须发送改事件到Tracker。

n completed：如果下载完毕，必须发送改事件到Tracker。如果客户端启动之前，已经下载完成的话，则没有必要发送该事件。Tracker仅仅基于该事件增加已经完成的下载数。

l ip：(可选)，客户主机的IP地址，点分十进制IPv4或者RFC3513指定的十六进制Ipv6地址。注意：一般情况下这个参数没有必要，因为IP地址可以从HTTP请求中得到。只有当请求中的IP地址不是客户端的IP地址时，才需要这个参数(只有客户端通过代理和tracker 交互时才会发生这种情况)。如果客户端和Tracker都在NAT网关的同一侧，这个时候这个参数就是必要的。原因是Tracker会公布不能路由的客户端物理地址。因此客户端必须显示指出自己的IP地址，以将信息公布给外部的peers。不同的Tracker对待该参数的方式不同。一些Tracker只有当请求中的IP地址在RFC1918空间才使用它，有一些则无条件使用，另一些则根本不使用。如果是Ipv6地址，它表示这个客户端只能通过IPv6交互。

l numwant：(可选)，客户端希望从Tracker接受到的peers数，如果省略，则默认是50个。

l key：(可选)，不和其他用户共享的附加标识。当客户端IP地址改变时，可以使用该标识来证明自己的身份。

l trackerid：(可选)，如果之前的announce包含一个tracker id，那么当前的请求必须设置该参数。

Tracker Response

Tracker以”text/plain”文本响应客户端的请求，这个响应文本由B编码的dictionary组成，而这个dictionary则包含如下的键(key)：

l failure reason：如果dictionary中包含这个键(key)，那么其他的键(key)就不会出现，该键(key)对应的值是一个可读的错误消息，它告诉用户的请求为什么会失败。(字符串类型)

l warning message：(新加入，可选) 类似于failure reason，但是即使存在这个键，这个响应还会正常地处理下去。warning message显示为一个错误。(字符串类型)

l interval：客户端每隔一定间隔就会向Tracker发送一个请求，这个键(key)以秒为单位指出这个间隔的大小。(整数类型)

l min interval：(可选)，最小的请求间隔，它表示客户端不能在这个时间间隔之内向Tracker重发请求。 (整数类型)

l tracker id：客户端发送其下一个请求时必须返回给Tracker的一个字符串。如果缺失，但是上一个请求发送了tracker id，那么不要丢弃旧值，重复利用即可。

l complete：完成整个文件下载的peers数，即做种者的数量。 (整数类型)

l incomplete：非做种的peers数(还没有完成该文件下载的peers数)，即“占他人便宜者”数。(整数类型)

l peers：(dictionary model) 该键(key)对应的值是一个dictionary list(列表)，该list中的每一个dictionary都包含如下的键(key)：

n peer id：peer自己选择的用来标识自己的ID，上文在描述Tracker请求时已经说明。 (字符串类型)

n ip：peer的IP地址，可以是Ipv6/Ipv4/DNS name。(字符串类型)

n port：peer的端口号。(整数类型)

l peers：(binary model) 不是使用上面描述的dictionary model，binary model下，该键(key)对应的值可以有多个六字节组成的字符串。这六个字节中的前四个是IP地址，后两个是端口号。IP地址和端口号均以网络字节序(大端)表示。

综上所述，默认情况下peers列表的长度是50，如果torrent中的peers比较少，那么这个列表长度会更短。否则如果torrent中的peers比较多，那么tracker就得从这些peers中随机选择一些放入响应中。当响应请求时，Tracker需要使用一个智能的机制来进行peer选择。例如：向做种者报告种子就得避免(意思说如果没有好的机制，就有可能出现这种情况)。

如果有一个事件发生(即stopped或者completed)或者客户端需要获得更多的peers时，客户端发送请求的频率肯定高于指定的间隔。尽管如此，不断地向Tracker发送请求以获得更多的peers绝对不是一个好主意。如果一个客户端想在其响应中包含一个更长的peer列表，那么它应该通过指定numwant参数来达到目的。

BitTorrent实现者注意：30个peers已经是一个很大的数目了，官方的客户端版本3在peers少于30的情况，会积极地向Tracker建立连接已获得更多的peers，但是如果客户端已经有55个peers的情况下，客户端将拒绝和Tracker建立连接。这个值的选择对于性能非常重要。当一个片(piece)已经下载完成后，客户端需要将HAVE消息(参考下文)发送给大多数活跃的peers。结果是广播通信的代价与peers数量成正比。这个数高于25之后，新加入的peers不太可能提升下载速度。强烈建议UI设计者使这个数模糊和很难修改，因为这样做没有任何作用。

Tracker 'scrape' Convention
按照惯例：大部分Tracker支持另一种形式的请求，这种方式查询Tracker正在管理的给定torrent(或者所有的torrent)。这种方式通常被称为”scrape page”，因为这种方式会自动进行另一个单调乏味的流程：”screen scraping” Tracker的统计页。

类似于上面描述的URL，scrape URL也是一个HTTP GET方法。尽管如此，它们的Base URL是不相同的。想要得到scrape URL，请使用如下步骤：从announce URL开始，找到该announce URL中的最后一个’/’，如果该’/’之后的内容不是’announce’，那么说明这个Tracker不支持scrape。如果这个Tracker支持scrape，那么使用’scrape’代替’announce’就可以得到scrape页。

例：(announce URL -> scrape URL)

~http://example.com/announce -> ~http://example.com/scrape

~http://example.com/x/announce -> ~http://example.com/x/scrape

~http://example.com/announce.php -> ~http://example.com/scrape.php

~http://example.com/a -> (scrape not supported)

~http://example.com/announce?x2%0644 -> ~http://example.com/scrape?x2%0644

~http://example.com/announce?x=2/4 -> (scrape not supported)

~http://example.com/x%064announce -> (scrape not supported)

scrape URL可以作为可选参数info_hash(上文描述的一个20字节值)的一个补充。但是这样限制了Tracker向那个特殊的torrent发送报告。否则tracker正在管理的所有torrent的统计数据将会返回。强烈建议软件编写者尽可能使用info_hash参数，这样就能够减少Tracker的负载和带宽。

你也可以指定多个info_hash参数给Tracker (得支持多个info_hash参数)。这不是官方规范的一部分，但是已经成为了实际标准，例如：

http://example.com/scrape.php?info_hash=aaaaaaaaaaaaaaaaaaaa&info_hash=bbbbbbbbbbbbbbbbbbbb&info_hash=cccccccccccccccccccc

这个HTTP GET方法的响应是一个’text/plain’或者有时候是用gzip压缩的文本，这个文本由一个B编码的dictionary组成，这个dictionary包含如下的键(key)：

l files：这是一个B编码的dictionary，在该dictionary中，每一个torrent文件都有其相应的键/值，这个键/值是相应torrent文件的统计数据。每一个键(key)由20字节的二进制info_hash组成。而该键所对应的值也是dictionary，它包含如下的键(key)：

n complete：完成文件下载的peer数，即做种者的数量。(整数类型)

n downloaded：已向tracker注册的下载完成的总次数("event=complete"，即一个客户端完成了下载) 。(整数类型)

n incomplete：非做种的peers数(还没有完成该文件下载的peers数)，即“占他人便宜者”。 (整数类型)

n name：(可选的)，torrent的内部名，由.torrent文件中info键所对应值中的name指定。

注意这个响应有三层dictionary嵌套。例如：

d5:filesd20:....................d8:completei5e10:downloadedi50e10:incompletei10eeee

表示....................是一个20字节的info_hash，有5个做种者，5个正在下载者以及50个已经完成的下载。

Unofficial extensions to scrape(scrape的非正式扩展)

下面的响应键是非官方的。因为它们都是非官方的，因此都是可选的。

l failure reason：可读的错误信息，这个信息告诉客户端请求失败的原因(字符串类型)。使用该键的知名客户端：Azureus。

l flags：这是一个B编码的dictionary，它包含多个标志。flags键对应的值是另一个嵌套的dictionary，可能包含如下键(key)：

n min_request_interval：这个键所对应的值是一个整数，该整数指定两个scraping操作之间的最小间隔秒数。发送该键(key)的知名Tracker是BNBT。使用该键(key)的知名客户端是Azureus。

【P2P网络】BitTorrent协议中文版3相关推荐

区块链P2P网络协议演进过程
区块链是以加密机制.储存机制.共识机制等多种技术组成的分布式系统,可以在无中心服务器的情况下实现相互信任的点对点交易功能.区块链最大的特点是去中心化和分布式,区块链共识机制使得参与节点共同为系统提供服 ...
p2p服务器的协议,P2P文件传输协议之BitTorrent协议
BitTorrent协议是支持网络当中数据的上下传输的一个P2P文件传输协议.那么基于这个协议的BT软件大家肯定更不会陌生.但是它却有着更为广泛的使用,尤其是在一些大型网络数据交换平台中,也常常会使用 ...
IPFS网络是如何运行的(p2p网络)
图片来自wiki IPFS是一个p2p网络,先来看看BitTorrent的p2p网络是如何工作的? 想要bt下载一个文件,首先你需要一个种子文件torrent,种子文件包含至少一个 Tracker(一 ...
第10讲 | 深入区块链技术（二）：P2P网络
在上一篇文章中,我大致讲解了一下区块链技术的几个核心要素.P2P网络协议.分布式一致性算法(共识机制).加密签名算法.账户与存储模型.今天我们就来看看区块链技术的第一个核心要素:P2P网络. 如果我们 ...
BitTorrent协议与MagNet协议原理
BitTorrent协议 1.简介 BitTorrent(简称BT)是一个文件分发协议,每个下载者在下载的同时不断向其他下载者上传已下载的数据.而在FTP,HTTP协议中,每个下载者在下载自己所需文件 ...
P2P网络——网络模型概述
P2P网络模型一.常见网络模型 1.随机网络:随机网络的研究是基于随机图理论的. 2.规则网络:常见的规则网络有最近邻耦合网络和星形耦合网络. 3.小世界网络二. ...
kademlia算法学习(区块链P2P网络设计)
如今很多P2P网络的实现都采用DHT的方式实现查找,其中Kademlia(简称Kad)算法由于其简单性.灵活性.安全性成为主流的实现方式.下面我们就来详细分析这个应用于比特币和以太坊P2P网络中的Ka ...
谈BitTorrent协议中的DHT方法
背景:P2P.BT协议 1.P2P方法的思想和产生原因 P2P全称Peer to Peer.要想理解p2p首先要了解另一种更原始的结构:C/S结构. C/S结构中,C指client,S指server. ...
BitTorrent (协议)
BitTorrent (协议) http://zh.wikipedia.org/wiki/BitTorrent_(%E5%8D%8F%E8%AE%AE) BitTorrent协议(简称BT,俗称比特洪 ...

最新文章

热门文章