From:https://blog.csdn.net/ejinxian/article/details/74081716

当我们想要搜索某些内容时,我们第一个想到的就是打开Google、百度或必应这类的搜索引擎。但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐藏在深网的内容。据不完全统计,深网的信息量为表层网络的500倍。那么,深网主要都包含了些什么内容呢?其实,深网主要包括的都是些,例如需要某些条件如注册、付费,才能访问的内容,如数据库和某些服务等。而常规搜索引擎通常只会对静态网页进行抓取,而对于这些存储在数据库中的内容,对其而言几乎是不可见的。其次,当我们使用Google时,Google还可能对我们的活动轨迹进行跟踪。这对于要求匿名的用户而言,也是不可接受的。

为什么Google搜索不到深网的内容?

这是因为所有的Deb网站(.onion)都是没有索引的,而正常的搜索引擎通常都是通过目标网页索引来获取内容的。因此对于没有索引的搜索结果则不会被Google所收录。此外,在搜索过程中还会和服务器建立连接,这样对我们的隐私和安全也带来了一定的隐患。

“据研究人员介绍,只有4%的互联网对公众可见,剩下的96%的网站和数据则隐藏在Deep web。”

此外,深网中还包含了许多非法内容,例如毒品,武器交易,高度成熟的黑客工具,色情,军事机密等。

robots文件

robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件会告诉蜘蛛程序,在服务器上什么文件是可以被查看/禁止查看的。如果某些页面被设为不可查看,那么搜索引擎也是无法正常获取到的。

说了这么多,那么有没有既可以保证高度匿名性,又可以获取到深网内容的搜索引擎呢?下面,我将为大家推荐十款比Google,必应更加“强大”搜索引擎:

1. pipl

Pipl是一款为搜索网络上的人物信息而生的搜索引擎。不同于传统意义上的搜索引擎,Pipl是专为检索“深网”上的信息而设计的。Pipl的爬虫能够与可搜索的数据库打交道,从中提取个人信息、联系方式、成员名录、科学出版物、法院记录以及其它很多“深网”内容。

Pipl目前提供五种方式搜索方式搜索特定人物:名字、Email地址、用户名、电话号码以及还处于BETA版的商业搜索。

Pipl所关注的不仅仅是找到更多的结果,它还通过高级语言分析和排名算法将与你搜索关键词最相关最匹配的结果以简单的单页形式展示给你。

2. My Life

MyLife是一个全面的成年人资料数据库,可以根据姓名、年龄、邮编等信息来查询你想要找的人。

MyLife的服务可以通过整合Twitter、Facebook、LinkedIn、Friendster和Flickr等社交网站的数据,帮助用户在互联网上找人。MyLife用户是免费注册,但如果要使用单身搜索、查看谁在搜索自己等高级功能,用户就需要付费。

MYLIFE网站还推出了一个全新的个人关系管理系统(PRM),是一个基于浏览器的服务,让用户在同一个内容流里就能看到Facebook、Twitter和LinkedIn的订阅源并进行答复、“赞”、转推等操作。

3. Yippy

Yippy是一个将多个搜索引擎信息结合在一起,然后得出统计结果的集成化搜索引擎。如果你想检索暗网的信息,Yippy便是一个不错的工具。暗网因其存储在专用网络而被屏蔽难以发现,而Yippy提供的搜索结果将帮助你发现不被传统搜索引擎检索到的隐藏网站。

4. Surfwax

SurfWax是一个元搜索引擎,能限定最多返回结果条数和排序方法,检索速度一般。该搜索引擎有一个显著特点,即点击每条结果左边的“网址按钮”图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置。可以把搜索结果和文件存储起来以备后用。此外,焦点字(FocusWords)功能提供搜索词在各种不同含义下的同义词/近义词、上位词、下位词的列表,辅助选择词语检索。

5. Way Back Machine

通过Wayback Machine可以搜索某一特定网站过去(从1996年到现在)的样子。实现对Web过去的存档要求一百太字节的存储空间,并包含一百亿个网页!网页存档起初是由Alexa项目的负责人收集的。你可以在你的电脑上安装一个提供网站信息和排名的工具栏。

在Wayback Machine网站上,你可以搜索和链接你喜欢的网站,看它们过去的样子,你会发现它们像时间“快照”一样保存着。例如,你可以看到whatis.com网站在1996年的样子,也可以看见它在1997年及以后的样子。

6. Google Scholar

GoogleScholar学术搜索专门在期刊论文、理论摘要及其他学术著作文献中进行搜索,内容从医学、物理学到经济学、计算机科学等等,横跨多个学术领域以及大量书籍和整个网络中的学术性的文章。它虽然不支持中文,但可以用拼音搜索国内学者在国际刊物上发表的文章。这个搜索引擎搜索国外的资料非常方便,输入一个学者的名字,就可以搜索出其全部在网上的文章,并且可以知道在哪个数据库,以及该篇文章被多少篇其它文章所引用,以及所引用文章的目录等等。同时该学者所著的书也都有显示,并告知该书被哪些图书馆所收藏,或其它可能获得的商业途径。

GoogleScholar的搜索结果可以过滤掉普通搜索结果中的大量垃圾信息,排列出文章的不同版本以及被其他文章所引用的次数,还可以通过引用链接方便的找到与搜索结果关联的其它相关学术资料,对于学生、学者以及其他需要经常查阅学术文章的人来说是非常实用的。

7. DuckDuckgo

害怕信息被泄露,想要匿名访问互联网?DuckDuckGo将是你的首选!DuckDuckGo不会保存你的任何浏览信息、社交文件、邮件等,这也是跟Google最大的区别。DuckDuckGo的用户非常喜欢像「zero-click」这样的功能,快速无线下拉设计真的是懒人福利。更棒的是,DuckDuckGo并沒有像Google那么多广告,以及经常弹出广告等问题。DuckDuckGo甚至还配备了自己的Tor出口中继,帮助Tor用户提高搜索性能。

8. Fazzle

Fazzle是一个支持英文发文和荷兰文的元搜索引擎。它即可进行一般的网址搜索,又有一个主题目录可提供专题的资源搜索。其前身为SearchOnline著名元搜索引擎。

9. not Evil

不像其他的Tor搜索引擎,not Evil是一个不以营利为目的的搜索引擎。它是专门设计用于搜索暗网内容的搜索引擎,堪称暗网中的谷歌。此外,它的安全性体验度也做的非常的到位。既没有多余的广告推送,也不会对用户的搜索行为进行跟踪。再加上其不断更新的搜索算法,用户很容易就能通过它找到想要的内容或信息。值得一提的是,在此之前该项目被人们广泛的称为TorSearch。

10. Start Page

StartPage是由Ixquick推出的一个托管在美国和荷兰的搜索引擎服务,通过免费匿名代理提供谷歌搜索和图片搜索结果,号称是世界上最安全的保密型搜索引擎。该搜索引擎非常注重把对用户隐私的保护,它不会收集和分享任何用户的资料。

在Startpage,Ixquick的隐私与谷歌的搜索结果紧密相连。你可以放心使用这些来自世界上最受欢迎的搜索引擎搜索的结果,并受到Ixquick的隐私保护,这是世界上最大的私有搜索引擎。并且还受到了第三方权威机构——欧洲的联盟隐私倡议机构EuroPriSe的认证。 2008年7月14日,Ixquick被授予第一个欧洲隐私认证。

Google 和 bing 都无法替代的10大深网搜索引擎相关推荐

  1. Google和百度都无法替代的10大深网搜索引擎

    全世界只有3.14 % 的人关注了 数据与算法之美 当我们想要搜索某些内容时,我们第一个想到的就是打开Google.百度或必应这类的搜索引擎.但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐 ...

  2. Google和必应都无法替代的10大深网搜索引擎

    当我们想要搜索某些内容时,我们第一个想到的就是打开Google.百度或必应这类的搜索引擎.但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐藏在深网的内容.据不完全统计,深网的信息量为表层网络 ...

  3. [转]Google和必应都无法替代的10大深网搜索引擎

    当我们想要搜索某些内容时,我们第一个想到的就是打开Google.百度或必应这类的搜索引擎.但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐藏在深网的内容.据不完全统计,深网的信息量为表层网络 ...

  4. google、bing、baidu、shodan、censys、ZoomEye 搜索引擎 高级用法

    Google guide :http://www.googleguide.com/advanced_operators_reference.html 相关资料: :http://www.bubuko. ...

  5. Google需警惕苹果Apple TV的10大原因

    坊间长期流传的苹果电视(Apple TV)未来数年或畅销,直接威胁Google和Android.围绕苹果电视的传言达到一个新的高度.几乎每一天都有一条苹果电视新功能.发布日期及价格等消息出炉.苹果电视 ...

  6. 每个程序员都该知道的10大编程格言

    编程格言1:无风不起浪 (There is no smoke without fire) 编程格言2:预防为主,治疗为辅(An ounce of prevention is worth a pound ...

  7. 程序员都应该知道的 10 大算法

    目录 算法一:快速排序法 算法二:堆排序算法 算法三:归并排序 算法四:二分查找算法 算法五:BFPRT(线性排查) 算法六:DFS(深度优先搜索) 算法七:BFS(广度优先搜索) 算法八:Dijks ...

  8. 程序员应该知道的10大编程格言

    作者 | BarryWang 来源 | https://www.cnblogs.com/barrywxx/p/4399007.html 每个程序员都该知道的10大编程格言(Kevin Pang): 编 ...

  9. 解读电商平台10大促销活动类型

    2019独角兽企业重金招聘Python工程师标准>>> 每到节假日,各大电商平台都在做活动搞促销,作为运营的你,知道电商平台都有哪些商品促销类型吗?每种活动都有哪些需要注意的吗?今天 ...

  10. 全家桶10大软件PS/AE/AI/PR/CAD/AU/CDR/C4D/3DMAX/UG自学视频教程合集

    如果说现代职场人士升职加薪无望的话,你要好好反省自己有没有专长和精通的技术,如果不知道应该具备哪些技能的话,看到本篇文章将是你的幸运,因为,所有靠技术升职加薪的大咖,基本上都是精通以下10大职场软件操 ...

最新文章

  1. 作为一个程序员,数学对你到底有多重要(转)
  2. Linux 5.4 rc1发布: 正式支持Leez P710开发板(转载)
  3. (转)base64编码(严格说来,base64不算作加解密算法)
  4. 霍因科技获首届全国信创产业生态创新奖
  5. Mybatis_day1
  6. 智能一代云平台(三十一):mybatis加入分页
  7. 从乘法求导法则到BPTT算法
  8. 企业如何选择电信、双线、多线/三线、BGP线路?他们的区别是什么?
  9. 从数据仓库到数据集市
  10. 前端:JavaScript (五)XML DOM
  11. 一个基于Python的体重BMI计算程序
  12. 响铃:只做“连接器”,企业微信如何实现“人即服务”
  13. MySQL的yum源
  14. c语言---15 循环语句do while()
  15. 加载.node文件报错:no suitable image found. unknown file type, first eight bytes
  16. java 排秩,求秩排序(计数排序) | 学步园
  17. Java代码的三板斧
  18. 假日阴谋论,黄金关键点
  19. Adobe flash plugin插件的安装
  20. 游戏显示计算机丢失文件怎么办,安全系统检测到游戏文件缺失或损坏,请获取正确文件进行替换。怎么办?...

热门文章

  1. Could not autowire. No beans of 'Iface' type found. less... (Ctrl+F1) Inspection info:Checks autowi
  2. 3、SPSS做非参数检验
  3. 【PS】抠图,通道抠图
  4. HTML合并表格(单元格)
  5. ceph 知识技能树
  6. 服务器装系统报0x0000005d,Win8系统安装过程中提示ErrorCode:0x0000005D怎么办
  7. 外网/公网出口IP查询方法汇总
  8. cs服务器搭建(cobaltstrike)
  9. admi后台 vue_vue-ele-admin后台管理系统框架__布局
  10. 揭秘 | 直播美颜不靠脸 靠的是阿里云程序员?