概述

网盘搜索引擎是近年来非常流行的工具,最近在知乎上看到不上关于网盘引擎的帖子,笔者今天决定对网盘搜索引擎原理,技术做个大揭秘,一方面是对不熟悉搜索引擎原理的朋友做个答疑,二是指出各种引擎的优缺点以让朋友们今后在选择你钟爱的引擎时能够心中有数。

目前国内外网盘搜索引擎实现原理大体就两种——爬虫程序爬取数据供搜索,调用google,bing三方接口搜索。前者的典型代表如比较流行的去转盘网,盘搜搜…后者的典型代表如胖浩子,西林街等。
然而现在调用google API接口搜不到任何关于网盘的东西了,估计是实施了封锁。

爬虫方式

笔者先从技术比较复杂的有自己爬虫程序的网盘搜索引擎说起,拿做的比较好的去转盘网为例:
去转盘 支持百度网盘,360网盘,电驴,旋风等主流下载方式,界面方块话,简洁有力,提供用户分享功能,正努力成长为业界一流。

技术实现

该引擎的数据是通过爬虫程序爬取百度网盘,然后将数据存储到数据库中,索引然后供用户搜索。笔者关注这个站比较久了,broom团队最近也公开了去转盘网的很多技术,也正如笔者所说。以下是我在知乎上看到的两篇相关博客,懂技术的可以看看,不懂技术的朋友跳过即可。

  • python爬虫之爬百度网盘开源
  • Lucene+Jave 中文分词,代码直接可用
    前者正是他们的爬虫程序,后者就是我所说的索引程序。
    以前百度提供用户列表API,这样爬起来比较容易,然而现在不行了,因为百度关闭了用户列表API,而且反爬机制更加严格了,如果要爬的话需要购买代理IP了。

优缺点

该类站的优点:搜索速度快,资源较新;缺点:死链多,资源少;
接下来说说调用第三方接口的引擎,这回拿大家都比较熟悉的西林街为例

调用Google接口

胖浩子网盘搜索引擎,界面简洁清新,搜索结果多,自动检测死链

技术实现

该引擎的技术比较简单,对计算机稍有了解的朋友都可以做,他的原理是展示网站先去google申请搜索引擎接口(需要翻墙),当用户将搜索内容提交给展示网站后,展示网站又将搜索内容提交给google引擎,google引擎搜索之后把数据返回给展示网站。国内做这种网站都需要一个翻墙空间,数据从中国跑到美国搜好又回到中国,这也就是为什么这类引擎用起来有延迟感的原因。

优缺点

该类站的优点:死链少,资源多;缺点:用起来略卡,新资源少;

结尾

笔者这里只是拿两种原理下的典型代表做个解释,其他的引擎以此类推就可以了,如果你想了解更过的话建议去这个导航站:点我,这个上面有很多网盘搜索引擎站,你可以尝试访问几个,找到你的钟爱 ,谢谢你阅读此文。

网盘搜索引擎原理大揭秘相关推荐

  1. 基于设计原理与理念和实践的ElasticSearch学习、ELK日志收集、网盘搜索引擎

    目录 基于设计原理与理念和实践的ElasticSearch学习 一.ES基础入门 ElasticSearch是什么? ES优点: ES缺点: ElasticSearch应用场景 ElasticSear ...

  2. 你所不知道的网盘搜索引擎

    参考: 涔歌 特别说明,不同网盘搜索引擎搜录内容.搜索算法.提供的功能不同造成搜索结果差异较大,找不到时可以多尝试几个. 推荐 盘多多: http://www.panduoduo.net Bdsola ...

  3. python网盘搜索引擎_打造一个蓝奏云网盘搜索引擎

    目前存在的网盘搜索引擎好多,可以归于两类: 1.搜索引擎索引 2.爬虫入库索引 第一种:搜索引擎索引 这种索引方式是目前比较主流的方式,依靠百度,谷歌建立索引链接,当用户进行搜索的时候,网盘搜索引擎会 ...

  4. 16 个百度网盘搜索引擎

    0.云盘狗-百度云网盘搜索 地址:http://www.yunpangou.com/ 备注:无需登录,可直接打开 1.小可搜搜 - 有你更方便 地址:https://www.xiaokesoso.co ...

  5. 2019年最新网盘搜索引擎汇总

    生命不息,搜索不止!对于经常上网的当代人来说,搜索引擎可以极大的提高一个人的上网效率,相当于延长了自己的生命(真的假的???). 网盘作为一种存储各种冷热门资源的载体,其对各种资源的收录程度也越来越完 ...

  6. 诗人般的机器学习,ML工作原理大揭秘

    诗人般的机器学习,ML工作原理大揭秘 https://www.cnblogs.com/DicksonJYL/p/9698208.html 选自arXiv 作者:Cassie Kozyrkov 机器之心 ...

  7. 15 个百度网盘搜索引擎

    1.云铺子 - 百度网盘搜索引擎 地址:http://www.yunpz.net/ 查看方式:直接打开 推荐指数:★★★★★ 备注:聚合类,体验好,推荐! 2.橘子盘搜-好用的影视资源搜索引擎 地址: ...

  8. 网盘搜索引擎以及网盘分享社区地址

    网盘搜索引擎: http://www.soupan.info/ http://www.pansoso.com/ http://www.58wangpan.com/ https://www.xiaoso ...

  9. 百度网盘搜索引擎神器哪些网站比较好用

    整理了一些2022年还可以使用,个人感觉还不错的八大网盘搜索神器分享给大家,网址的百度搜一下就能找到. 1.轻便搜索 集合了百度网盘.阿里云盘等主流网盘资源非常丰富,2022年新出来的一个本人感觉最好 ...

  10. 网盘搜索_就用网盘传奇-最有效的百度网盘搜索引擎

    网盘搜索_就用网盘传奇-最有效的百度网盘搜索引擎 https://jidanso.com/

最新文章

  1. FPGA与ASIC:它们之间的区别以及使用哪一种?
  2. 卷积神经网络(CNN)代码实现(MNIST)解析
  3. 修改centos等linux的hostname-永久生效
  4. 当心啊!仅仅50行Python,就可以在手机端看小姐姐的电脑桌面!
  5. nodejs 代替python_Python/NodeJS坑记
  6. mysql数据库应用的权限层级_涂抹MySQL--第5章 MySQL数据库中的权限体系 - 5.3权限级别(1)...
  7. python读取文件路径中有中文_转 python 读取中文文件名/中文路径
  8. C语言入门经典(第5版)
  9. Web Worker API
  10. Eclipse配置Tomcat详细教学|Eclipse和Tomcat的下载安装
  11. GB35114---SM3withSM2证书生成及读取(一)
  12. ai python视频教程_2017AI人工智能时代基础实战python机器学习深度学习算法全套视频教程...
  13. RAID-6技术详解
  14. 战胜拖延症的利器—Product Backlog
  15. 小程序下拉刷新没有响应
  16. Linux 驱动开发 六十六:多点触控(MT)协议
  17. OSChina 周五乱弹 ——下完雨朕的江山都湿了
  18. 中国联通物联网平台能力介绍
  19. PHP上传用户头像及头像的缩略图
  20. github项目之仿小猪巴士车牌显示

热门文章

  1. USB、UART、SPI PCI/PCIE等总线速率
  2. Unity 使用谷歌内购的密钥( license key )
  3. 注释一下blk_update_request函数
  4. 网络SSID是什么意思
  5. 怎样批量将图片转成PDF格式?图片转换PDF操作方法
  6. 大连腾飞五期的企业_云存储腾飞的五个想法
  7. 用html创建数独,数独做不出来怎么办
  8. Vue教程(三十九)vue-cli2脚手架安装
  9. 100种网站推广方法全集
  10. CentOS安装gotop