前端时间想看一些日更的电视剧, 但是网上找资源有点儿困难, google一圈儿之后发现了DHT和磁力链, 感觉是好东西, 但是能找到的搜索站基本都有些不和谐的小广告,用起来胆战心惊, 于是就想用自己之前买的虚拟机搭建一个纯净版的网站, 方便自己,也造福广大网友们.

目前网站已经试运行, http://www.91pph.com. 欢迎大家捧场.

下面说一下网站搭建流程:

  • 购买虚拟主机, 比较坑的是有两种一种只能通过FTP上传文件,另外一种可以远程连接, 建议购买后者, 不然你会感觉很不爽.
  • 备案, 比较麻烦, 但是国内建站都有这个要求, 而且服务提供商都有客服帮助你
  • 编写DHT爬虫,我是用Python写的, 爬虫可以获取infohash码, 效率很高, 单线程一天也能搂个几万条
  • 通过infohash获取种子文件信息, 这个繁琐的地方在于要了解bep_0010, bep_0009协议
  • 有了infohash和文件信息就有了数据源,后面就是暂时的问题
  • 我用PHP传递数据
  • 后续考虑用Elasticsearch进行存储搜索,效率可能会好一些

对于理解BT有帮助的一些网站或者项目

DHT磁力链数据爬取和资源搜索站的搭建相关推荐

  1. python linux下载磁力链_Python爬取80s网电影名称及迅雷(磁力)链接

    更多教程请移步至:洛凉博客 大家可以登录下www.80s.tw网站,观察页面菜单. 最开始我是想把菜单下所有页面的都爬一遍.想想还是有点复杂. image.png 但是最开始通过匹配,这些菜单的链接都 ...

  2. 链家网沈阳二手房数据分析——从数据爬取到数据分析

    数据爬取主要是通过使用requests实现的,鉴于爬取数据的流程简单以及电脑的性能所限,没有使用scrapy框架,而是使用where循环手动控制页码的形式,每次爬取5页信息,并将信息写入.csv文件中 ...

  3. 结合Selenium 和 Requests完成动态数据爬取

    Selenium 简介 Selenium是一个用于Web应用程序测试的工具.Selenium测试直接调用操作浏览器,就像真正的用户在操作一样.支持的浏览器包括IE(7, 8, 9, 10, 11),M ...

  4. [Python]网站数据爬取任务

    Python爬虫作业:网站数据爬取任务 从以下网址(包括但不限于下列网络或应用)中爬取数据,以核实的形式存储数据,并进行分析(不一定是计算机角度的分析,可写分析报告),或制作词云图. 一.文本数据 酷 ...

  5. 爬取电影资源之应用下载篇

    经过"爬取电影资源之网页爬取篇"的介绍,我们能够自动获取6V电影网每天推荐的电影资源.现在,我们就做一个应用程序实现电影的自动爬取与下载,如下图: 设计思路: 制作一个按钮&quo ...

  6. Python爬虫实战系列(一)-request爬取网站资源

    Python爬虫实战系列(一)-request爬取网站资源 python爬虫实战系列第一期 文章目录 Python爬虫实战系列(一)-request爬取网站资源 前言 一.request库是什么? 二 ...

  7. Python 大数据分析疫情:如何实现实时数据爬取及 Matplotlib 可视化?

    作者 | 杨秀璋 来源 | CSDN博客专家Eastmount 责编 | 夕颜 思来想去,虽然很忙,但还是挤时间针对这次肺炎疫情写个Python大数据分析系列博客,包括网络爬虫.可视化分析.GIS地图 ...

  8. 【Python爬虫】2022年数学建模美赛B题数据爬取

    2022年数学建模美赛B题数据爬取 背景 2022年的美赛刚刚落下帷幕,该题的一个主要难点在于数据的获取.很多人无法找到有效的数据,或者是无法获取数据. 比如找到了如下米德湖的水文数据,但是发现并没有 ...

  9. python网易云热歌榜歌曲信息爬取(iframe框架内数据爬取,src为空)

    为一线医护人员加油! 为武汉加油! 为中国加油! 为世界加油! 此爬虫是本人参考了了一位前辈的文章,并修改和优化了代码: 1.改为python3环境: 2.优化了抓取的歌曲时长中带一长串小数的问题: ...

  10. 基于python的自媒体和官媒数据爬取、可视化分析及云词图制作

    创作不易,如果以下内容对你有帮助,别忘了点一个赞,让更多的小伙伴能看到吧~~ 1. 问题描述 为了研究自媒体和官媒的传播新闻<武汉快递小哥汪勇的先进事迹>的及时性和传播力度,对比两种传播途 ...

最新文章

  1. matlab的实用与仿真,MATLAB建模与仿真实用教程
  2. PlayFramework入门教程
  3. Android自定义属性、控件三步法
  4. jQuery使用(十五):when()方法的使用
  5. spring security 认证与权限控制
  6. html语言闪烁特效代码,css3 文字闪烁特效代码
  7. Linux多线程实践(4) --线程特定数据
  8. CTF中遇到不知道文件类型_遇到孩子厌学不知道怎么沟通?做好这些策略,孩子肯定爱学...
  9. Linux音频驱动-OSS和ALSA声音系统简介及其比较
  10. 计算机无法创建新文件夹,使用win10系统时,发现无法新建文件夹怎么办,学会这招即可修复...
  11. java 裁剪 pdf_java使用itext按页码拆分pdf文件
  12. c语言计算sum,C++ partial_sum(STL partial_sum)部分和计算方法详解
  13. python中eval函数的用法
  14. Redis学习之Master/Salve十一
  15. 80秒验证13亿个身份证号码,包含省市县验证
  16. zTree的简单用法
  17. 【Java】基于TA-Lib技术分析指标研究
  18. Virtual Shard
  19. android校园超市平台英文文献,校园超市系统的设计与实现.doc
  20. Oracle数据迁移MySQL

热门文章

  1. GenBank数据格式
  2. WIN10笔记本任务栏无反应(卡住)有效解决方法
  3. [程序员学英语]英语句子结构
  4. 鹰式价差matlab,鹰式套利:关于蝶式套利的模型 求一个比较详细的解释,为什么…...
  5. 楚纳电动车禁入电梯管控系统-电梯阻车原理
  6. NPOI Word插入图片的方法
  7. 信息系统项目管理-项目变更管理-十六
  8. Swift5使用KVC报setValue:forUndefinedKey
  9. Barrett reduction
  10. QT软件ICON图标在线制作