开源搜索引擎 种子搜索

很久以前,互联网很小,只有几个人可以将它们编入索引,这些人收集了所有网站的名称和位置,并按页面或印刷书籍中的主题列出了它们。 随着万维网网络的发展,“网络响动”惯例得到了发展,在该惯例中,具有类似主题,主题或敏感性的站点捆绑在一起,形成了通往每个成员的循环路径。 环中任何站点的访问者都可以单击按钮以转到环中的下一个或上一个站点,以发现与其兴趣相关的新站点。

过了一会儿,互联网似乎变得不合时宜了。 每个人都在线,那里有很多冗余和垃圾邮件,无法找到任何东西。 Yahoo和AOL,CompuServe以及类似的服务具有独特的方法,但是直到Google出现后,现代模型才得以普及。 根据Google的说法,应该通过搜索引擎对互联网进行索引,排序和排名。

为什么选择开源替代品?

但是也许出于隐私方面的考虑,或者因为您希望为使互联网更加独立而做出的贡献,您不愿意使用Google或DuckDuckGo。 如果这对您有吸引力 ,那么可以考虑加入YaCy (对等互联网索引器和搜索引擎)。

安装YaCy

要安装并尝试YaCy,请首先确保已安装Java。 如果您使用的是Linux,则可以按照《 如何在Linux上安装Java》一文中的说明进行操作。 如果您使用的是Windows或MacOS,请从AdoptOpenJDK.net获取安装程序。

安装Java后, 下载适用于您平台的安装程序 。

如果您使用的是Linux,请解压缩tarball并将其移至/ opt目录:

 $  sudo tar --extract --file  yacy_ * z --directory / opt 

根据下载的安装程序的说明启动YaCy。

在Linux上,启动在后台运行的YaCy:

 $  / opt / yacy / startYACY.sh & 

在Web浏览器中,导航到localhost:8090并搜索。

将YaCy添加到您的URL栏

如果您使用的是Firefox Web浏览器,则只需单击几下,即可在Awesome Bar(即URL字段的Mozilla名称)中将YaCy设置为默认搜索引擎。

首先,将专用搜索栏显示在Firefox工具栏中(如果尚未显示)(您不必使搜索栏保持可见;只需要激活它足够长的时间即可添加自定义搜索引擎)。 搜索栏位于Firefox右上角“ 自定义”菜单中的“汉堡”菜单中。 在Firefox工具栏上显示搜索栏后,导航至localhost:8090 ,然后单击刚刚添加的Firefox搜索栏中的放大镜图标。 单击选项将YaCy添加到您的Firefox搜索引擎。

完成此操作后,您可以在Firefox首选项中将其标记为默认值,或者仅在Firefox搜索栏中执行的搜索中选择性地使用它。 如果将其设置为默认搜索引擎,则可能不需要专用的搜索栏,因为Awesome Bar也使用默认引擎,因此可以将其从工具栏中删除。

P2P搜索引擎如何工作

YaCy是一个开源的分布式搜索引擎。 它是用Java编写的,因此可以在任何平台上运行,并且可以执行Web爬网,索引和搜索。 这是一个对等(P2P)网络,因此每个运行YaCy的用户都将努力跟踪互联网的变化。 当然,没有单个用户拥有整个互联网的完整索引,因为这将需要一个数据中心来容纳,但是该索引在所有YaCy用户中都是分布式且冗余的。 它与BitTorrent非常相似(因为它使用分布式哈希表或DHT来引用索引条目),所共享的数据是单词和URL关联的矩阵。 通过混合哈希表返回的结果,没人能告诉谁搜索了哪些单词,因此所有搜索在功能上都是匿名的。 它是用于无偏见,无广告,未跟踪和匿名搜索的有效系统,您可以通过使用它来加入。

搜索引擎和算法

为互联网建立索引的行为是指将网页分成单数个单词,然后将页面的URL与每个单词相关联。 在搜索引擎中搜索一个或多个单词将获取与查询关联的所有URL。 这是YaCy客户端在运行时所做的一件事。

客户端要做的另一件事是为您的浏览器提供搜索界面。 您可以将网络浏览器指向localhost:8090来搜索YaCy,而不是在要搜索时导航到Google。 您甚至可以将其添加到浏览器的搜索栏中(取决于浏览器的可扩展性),因此可以从URL栏中进行搜索。

YaCy的防火墙设置

首次开始使用YaCy时,它可能在“初级”模式下运行。 这意味着您的客户端爬网的站点仅对您可用,因为其他YaCy客户端无法访问您的索引条目。 要加入P2P体验,必须在路由器的防火墙中打开端口8090,如果正在运行,则必须在软件防火墙中打开端口。 这称为“高级”模式。

如果您使用的是Linux,则可以在通过防火墙增强Linux中找到有关计算机防火墙的更多信息。 在其他平台上,请参考操作系统的文档。

互联网服务提供商(ISP)提供的路由器上几乎总是启用防火墙,并且这里有太多种类的防火墙无法准确记录。 大多数路由器都提供了在防火墙中“戳破”的选项,因为许多流行的联网游戏都需要双向流量。

如果您知道如何登录路由器(通常为192.168.0.1或10.1.0.1,但可能会因制造商的设置而异),则登录并查找配置面板来控制防火墙端口转发应用程序

找到路由器防火墙的首选项后,将端口8090添加到白名单。 例如:

如果路由器正在进行端口转发,则必须使用相同的端口将传入的流量转发到计算机的IP地址。 例如:

如果由于某种原因无法调整防火墙设置,那就可以了。 YaCy将继续以初级模式运行并作为P2P搜索网络的客户端运行。

自己的互联网

使用YaCy搜索引擎可以做的不仅仅是被动搜索。 您可以强制抓取代表性不足的网站,可以请求对网站进行网络抓取,可以选择使用YaCy进行本地搜索,等等。 你必须在的因特网看起来像什么更好的控制。 高级用户越多,索引的网站越多。 索引的网站越多,所有用户的体验就越好。 加入!

翻译自: https://opensource.com/article/20/2/open-source-search-engine

开源搜索引擎 种子搜索

开源搜索引擎 种子搜索_使用开源搜索引擎自定义您的互联网相关推荐

  1. 搜索引擎登录工具_用开源搜索引擎定制你的互联网

    很久以前,互联网很小,小到几个人就可以索引它们,这些人收集了所有网站的名称和链接,并按主题将它们分别列在页面或印刷书籍中.随着万维网网络的发展,形成了"网站环"形式,具有类似的内容 ...

  2. wpf开源ui引用步骤_吸引开源社区的5个步骤

    wpf开源ui引用步骤 受欢迎的聊天服务HipChat的母公司Atlassian成立于2002年, 当时只有两个人. 十三年后,我们遍及全球的1300多人. 这种增长迫使我们需要围绕一个联系点组织我们 ...

  3. 三大开源社区是哪几个_进入开源社区的4个技巧

    三大开源社区是哪几个 我成长的两个最大的梦想是成为一名消防员或一名太空探索者. 尽管我没有做任何一件事情,但我还是前者,他是加利福尼亚州消防局Cal Fire的预防志愿者,而后者则通过阅读我可以得到的 ...

  4. php多关键词精确查找,搜索引擎,全文搜索_请问有没有搜索引擎能做到Like级别的任意关键词精确查询?,搜索引擎,全文搜索,lucene,elasticsearch,百度 - phpStudy...

    请问有没有搜索引擎能做到Like级别的任意关键词精确查询? 举个例子,对于新闻[http://tech.163.com/15/0323/07/ALCIH40U000915BF.html],在正文中,按 ...

  5. 开源阅读书源_安卓开源无广告追书神器阅读App

    身边很多朋友都喜欢在无聊的时候用手机看小说,非常便携,又可以打发时间.但普遍的痛点就是没有一款舒适的app,要么文件过大,要么广告太多,非常影响观感,导致好多经典的武林绝学也无心修炼.那么今天我给大家 ...

  6. 采用开源技术的好处_采用开源的6个技巧

    采用开源技术的好处 开源代码以较低的成本推动了更多开发人员的协作创新,这就是联邦机构采用"开源优先"模式的原因. 实际上,总务管理局(General Services Admini ...

  7. ffmpeg开源工具的使用_使用开源工具玩龙与地下城

    ffmpeg开源工具的使用 我一直有两个活动的角色扮演游戏(RPG)会话. 一种是传统的面对面游戏,我们在我的厨房餐桌旁玩. 另一个通过Google Hangouts和一个网站Roll20.net在线 ...

  8. 致谢 开源开发者的贡献_对开源做出的贡献如何使我成为更好的开发人员,以及如何做到这一点...

    致谢 开源开发者的贡献 by Luciano Strika 通过卢西亚诺·斯特里卡(Luciano Strika) 对开源做出的贡献如何使我成为更好的开发人员,以及如何做到这一点 (How contr ...

  9. wpf开源ui引用步骤_完善开源产品策略的6个步骤

    wpf开源ui引用步骤 假设您有一个想要快速传播的开源软件构想. 为了吸引用户,您必须确保您的产品制作精良并具有所有正确的功能. 您还需要确保人们了解您的项目为何存在以及他们为什么应该对此感兴趣. 尽 ...

最新文章

  1. 程序员自学到底有没有用?网友们吵翻了...
  2. 一文看懂MYCAT数据库服务器!
  3. selenium+Headless Chrome实现不弹出浏览器自动化登录
  4. ateq测漏仪f620说明书_上海壁挂式测漏仪安全使用说明,煤气房报警器安装安全使用说明...
  5. 开博第一篇,聊聊 最基本的 “==” 与 “===”区别
  6. java开发_Runtime
  7. svn版利用什么技术实现_金葱粉涂料印花利用了什么技术?
  8. mysql 连接 iOS_iOS连接mysql数据库及基本操作
  9. 通俗理解“Schmidt正交化”和“正交矩阵” 此博文包含图片 (2015-05-19 09:50:47) 施密特正交化在空间上是不断建立垂直于原次维空间的新向量的过程。 如图β2垂直于β1(1维)
  10. pajek软件使用方法_双全科技|管家婆管理库存必备“序列号”,管家婆软件的使用方法...
  11. matlab混叠现象与频率分辨率,连续时间信号频谱分析研究及MATLAB实现
  12. mysql 绕过权限检查_跳过权限检查,强制修改mysql密码
  13. apesv100数据库_生物信息学相关数据库资源介绍..ppt
  14. C语言:求不确定科目数的加权平均分
  15. 计算机的用户和密码在哪里看,电脑b站(哔哩哔哩)怎么查看自己的账号和密码?登录地址在哪找到?...
  16. 当你在搜索框按下enter的一刹那发生了什么?
  17. 计算机怎么重装win7,手把手教你电脑怎么重装系统
  18. [配置]keepalived配置高可用虚拟IP不通
  19. 通信软件基础B-重庆邮电大学-Java-编程实现一个简单的聊天程序-多线程编程实现
  20. ZOJ 3886 Nico Number (线段树)

热门文章

  1. 基于Java的商城购物系统
  2. ppt关闭受保护视图
  3. pikachu~~~CSRF(get,post,token)
  4. 时间序列模型预测_时间序列预测,使用facebook先知模型预测股价
  5. 大二学生2021的坎坷之路(他会晋升吗?)
  6. 'net' 不是内部或外部命令,也不是可运行的程序 或批处理文件。'net' 不是内部或外部命令,也不是可运行的程序 或批处理文件。
  7. Java实现 LeetCode 838 推多米诺(暴力模拟)
  8. Java常用工具类(六):文件、资源、IO流工具类
  9. 三星 android 4.4 kitkat 刷机包,三星 Galaxy S III LTE(i9305) 刷机包 CM11 KitKat 安卓Android4.4 非官方版...
  10. 键盘驱动系列---JIURL键盘驱动 3