在2022年如何将整个维基百科下载到U盘中

flash-drive

你有没有想过把整个维基百科下载到U盘中,用来离线访问?

经过几个小时的试错,我最终下载成功了,下面分享一下整个过程,还挺简单的。

跟着本文做下来,你就能保存维基百科的所有页面,大概600万页,这样你就可以不受网络连接的限制,访问人类知识的总和!

维基百科允许下载吗?

首先,下载维基百科的全部内容供个人使用是否合法?

答案是:是的,你可以下载维基百科(根据维基百科声明[1])。尽管我并不需要,但是在某些情况下甚至可以将文本内容用于商业目的[2]

wikipedia-download

有多个方法可以下载维基百科的数据存档。存档也有多种文件格式,可以用不同的开源阅读器用来查看这些文件。

如果你想自己研究所有这些技术细节,你可以去看这里[3]

我经过多次尝试,找到一个最简便的方法,下面就是我摸索到的,下载整个维基百科的最佳方法。

如何将维基百科下载到U盘上:

Wikipedia

注:别看到技术名词就觉得很复杂,不是这样的,任何人都可以用10分钟完成整个过程!

#1 - 你要先有一个U盘

目前维基百科的英文存档文件约为95GB(译注:中文大约22GB)。这意味着你需要一个128GB的U盘来保存。

如果你的电脑有足够的存储空间,也不一定需要存在U盘上。但对大多数人来说,95GB会占用相当大一部分硬盘空间,所以存储在外部盘上是更合理。

#2 - 将你的U盘格式化为 exFat 文件系统(很简单的!)。

大多数U盘的存储格式都是称为 FAT32 文件系统的东西。绝大多数情况下使用没有问题,但缺点是每个文件的大小限制仅为 4GB,这对于 95GB 的维基百科文件存档来说太小了。

绕过这个问题的方法是使用使用 exFAT 文件系统的闪存盘,它没有每个文件 4GB 的限制。

你可以选择。

a. 买一个已经是 exFAT 格式的 U盘

这是最简单的选择。如果你就是为了保存维基百科存档而购买一个新的U盘,那就买一个 exFAT 格式的,这样可以节省你的时间。

记得选择 exFAT 格式,容量为 128GB。

b. 将现有的 FAT32 盘重新格式化为 exFAT

如果你已经有了一个容量足够的U盘,把它插入你的电脑,右键点击U盘,检查文件系统类型。如果不是 exFAT 格式,你需要在下载维基百科之前将其重新格式化。这个页面[4]介绍了在PC、Mac、Linux 电脑上格式化U盘的的简单说明。

请注意,重新格式化将删除 U盘上的所有东西,所以删除前记得备份里的内容。

(另外:如果你有一个 NTFS 文件系统的U盘,也没有 4GB 的上限,可以直接用。但是 NTFS 主要适用于 Windows 电脑。ExFAT 同时适用于 Windows 和 Mac,这就是为什么我推荐这种类型。)

#3 - 下载 Kiwix 阅读器和维基百科数据存档

现在你有一个 exFAT 格式化的U盘,可以准备下载存档文件和阅读器了。

Kiwix.org[5] 是一个由志愿者维护的开源软件项目,可以下载并离线查看网站。免费使用,是维基百科推荐的阅读器之一。

下载 Kiwix 阅读器软件,请到这个页面[6],选择你的操作系统,并按照指示下载。

kiwix

下载完阅读器,就开始下载维基百科文件存档,打开这个页面[7](译注:链接打开默认是英文存档,可以在页面内筛选不同语言的存档),点击蓝色的下载按钮,然后选择”直接下载“。

kiwix-download

保存时,选择保存到你的U盘。

注意:如果文件自动开始下载,并没有让你选择在哪里保存,你可能需要调整你的浏览器设置为 "在下载前询问每个文件的保存位置"。Chrome 浏览器的设置方法请看这里[8]

#4 - 等待下载完成

即使网速很快,这一步骤可能也需要几个小时才能完成。

除了你的网速,还受限于你U盘的写入速度。

我的建议是让它自己下载着,去看一部电影,过几个小时再回来看看。

#5 - 完成了!

维基百科文件下载完成后,就差不多结束了。只需按照以下步骤即可阅读。

双击 Kiwix 阅读器的安装文件,按照提示进行安装。阅读器安装完毕后,打开它,会给你一个 "选择一个文件"的选项来查看。从U盘中选择维基百科文件,几秒钟就会加载完成。恭喜你!现在无论你在哪里都能离线查看维基百科了!

使用 Kiwix 阅读器,像使用在线版本的维基百科一样。有搜索功能,而且不同页面之间的链接也可以点击跳转。

妥了

现在你已经把维基百科的所有内容都下载到了U盘上。现在你可以放心在任何时候、任何地方查看任何内容。

如果你经常旅行,或者住在一个网络不稳定的地区,或者只是为了预防网络出问题,这个U盘就特别方便。

无论你制作维基U盘的原因是什么,我都希望你学习顺利。祝你探索愉快!

原文链接:https://planetofthepaul.com/wikipedia-download-usb-flash/

翻译:公众号(PlayerYK)

参考资料

[1]

维基百科声明: https://en.wikipedia.org/wiki/Wikipedia:Database_download

[2]

用于商业目的: https://en.wikipedia.org/wiki/Commercial_use_of_Wikimedia_projects

[3]

下载维基百科的方式: https://en.wikipedia.org/wiki/Wikipedia:Database_download

[4]

格式化U盘: https://recoverit.wondershare.com/partition-management/fat32-to-exfat-on-windows-mac-linux.html

[5]

Kiwix.org: http://Kiwix.org

[6]

下载 Kiwix: https://www.kiwix.org/en/download/

[7]

维基百科存档列表: https://library.kiwix.org/?lang=eng&category=wikipedia

[8]

修改浏览器下载位置: https://td.wku.edu/TDClient/34/Portal/KB/ArticleDet?ID=3395

在2022年如何将整个维基百科下载到U盘中相关推荐

  1. 把一个dataset的表放在另一个dataset里面_使用中文维基百科语料库训练一个word2vec模型并使用说明...

    ​本篇主要介绍如何通过中文维基百科语料库来训练一个word2vec模型. 相关资料下载: 中文维基百科下载地址:https://dumps.wikimedia.org/zhwiki/ WikiExtr ...

  2. 使用中文维基百科语料库训练一个word2vec模型

    本篇文章主要介绍如何通过中文维基百科语料库来训练一个word2vec模型. 相关资料下载: 中文维基百科下载地址:https://dumps.wikimedia.org/zhwiki/20180720 ...

  3. 使用中文维基百科语料库训练一个word2vec模型 12.1

    转自:https://blog.csdn.net/sinat_29957455/article/details/81432846 本篇文章主要介绍如何通过中文维基百科语料库来训练一个word2vec模 ...

  4. 利用Gensim训练关于英文维基百科的Word2Vec模型(Training Word2Vec Model on English Wikipedia by Gensim)

    Training Word2Vec Model on English Wikipedia by Gensim 更新:发现另一篇译文:中英文维基百科语料上的Word2Vec实验,该译文还提供了中文维基百 ...

  5. 基于中文维基百科的词向量构建及可视化

    你将使用Gensim和维基百科获得你的第一批中文词向量,并且感受词向量训练的基本过程. 词向量原理详解请参考: 词向量技术原理及应用详解(一) 词向量技术原理及应用详解(二) 词向量技术原理及应用详解 ...

  6. WikiTaxinbsp;离线中英文维基百科数据…

    维基百科 (Wikipedia) 对很多人来说绝对是一个知识的宝库!维基百科拥有海量权威的资料供我们查询,也许我们每个人都梦想着把维基百科下载下来实现离线查询.甚至装在U盘里,以方便随时随地查询.对于 ...

  7. 【转】下载安装离线版维基百科

    下载安装离线版维基百科 不需要一定要挂在网路上 <嗯 , 硬碟空间要够大 , 如果妳想要下载英文版的 维基百科 , 如果是中文版的也不小 维基百科 > 合不合法? 当然合法 , 在合理的使 ...

  8. 【历史上的今天】1 月 15 日:维基百科上线;信息安全大师出生;英特尔推出 Viiv

    整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2022 年 1 月 15 日,在 2016 年的今天,海尔收购美国通用家电,创下了中国家电企业海外收购之最:作为 ...

  9. 维基百科上的算法和数据结构链接很强大

    突然发现维基百科上的算法和数据结构比百度百科强多啦,图文并茂. 其实这个网站不错:http://www.sorting-algorithms.com 冒泡排序: bubble冒泡的意思 http:// ...

  10. mediawiki java api_维基百科 MediaWiki API 解析

    使用开放的 API 做一个自己的小项目,是一个很好的学习方法.但好像开放的 API 选择并不多.这里给大家多一个选择,简单介绍一下维基百科使用的 MediaWiki API. 简介 先简单介绍几个容易 ...

最新文章

  1. Python垂直翻转图像(Vertically Flip Image)
  2. CentOS6 修改主机名的规范步骤
  3. 常用和不常用端口一览表收藏
  4. 要活多久才能赚回你交的养老金
  5. c语言软件幻化,python字符串处理
  6. ajax 传递arraybuffer,jQuery $ .ajax或$ .load是否允许responseType arrayBuffer?
  7. double在mysql中是什么类型_为什么PVC输送带深受企业的青睐?
  8. 实例手册_平法钢筋算不清?钢筋工程量清单编制与应用手册,海量实例看就懂...
  9. JavaSE学习笔记--Item1 注解Annotation
  10. ActiveMQ(19):高级特性之独有消费者(Exclusive Consumer)
  11. tar命令下的--exclude
  12. 虚幻4渲染编程(材质编辑器篇)【第六卷:各向异性材质玻璃材质】
  13. 厉害了!支付宝逆天升级,可一键撤回被骗转账 网友:干得好!
  14. list转Tree和手动过滤TreeNode
  15. emui11优先体验鸿蒙系统,华为EMUI 11正式发布,可优先体验鸿蒙系统
  16. java 姓名_Java生成随机姓名、性别和年龄的实现示例
  17. codeforce 332B Maximum Absurdity
  18. 弹性云服务器能起到什么作用?
  19. java hgetall_redis的hGetAll函数的性能问题(记Redis那坑人的HGETALL)
  20. STM32F103C8T6实现CAN通讯与直流编码电机转速闭环控制

热门文章

  1. 【人性】豆豆三部曲之《背叛》、《遥远的救世主》和《天幕红尘》
  2. CSS实现文本居中和块级元素居中
  3. Office/Wps日常操作小技巧
  4. ICT融合和创新带来制造业的持续变革
  5. 计算机cims的英语全称是什么,计算机集成制造系统(CIMS),computer integrated manufacturing system,音标,读音,翻译,英文例句,英语词典...
  6. C语言中如何求三角形最大正弦值,余弦定理求三角形面积
  7. Android隐藏桌面图标,不显示应用图标
  8. 1KB快捷方式病毒的解决方法
  9. requests 职友集招聘信息爬虫
  10. 美国十大毕业典礼演讲:记着你总会死去……