下载安装离线版维基百科

不需要一定要挂在网路上
<嗯 , 硬碟空间要够大 , 如果妳想要下载英文版的 维基百科 , 如果是中文版的也不小 维基百科 >

合不合法? 当然合法 , 在合理的使用范围内

环境的准备: ( 以下是以在 Ubuntu 环境下作说明 , Windows 其实应该也适用 )
请参阅我的

在UBuntu 7.10 上安装设定 UBuntu Mediawiki

http://tw.myblog.yahoo.com/jw!9b0o7zqYEQTp3BKYq3oYpZO.gQ--/article?mid=578&prev=583&next=567

说明 , 并且将 Mediawiki 安装设定完成

注意:
在要继续往下作之前 , 如果你已经在你的 Mediawiki 上有编辑一些页面了 , 请你自己想办法把它备份下来 , 因为接下的动作可能清掉你原有的页面 ....

八道程序完成下载安装好你的离线版维基百科....< 不过你的硬碟空间要留够 ...>

(1)下载离线版维基百科
下载 维基百科备份档
到官方网站页面 http://download.wikipedia.org/
选择 连结 Database backup dumps ( http://download.wikipedia.org/backup-index.html )

在此页面中 ,
如果是中文版维基百科 , 寻找 zhwiki
如果要英文版维基百科 , 寻找 enwiki

这里我们使用 中文版维基百科 作范例
到此页面中
http://download.wikipedia.org/zhwiki/20071119/
All pages, current versions only.
pages-meta-current.xml.bz2 239.6 MB
( http://download.wikimedia.org/zhwiki/20071119/zhwiki-20071119-pages-meta-current.xml.bz2 )
将它下载下来 , 下载完成后 , 千万不要把它解压缩 ...

(2)清除相关既有页面资料
使用 MySQL QueryBrowser 连线 MySQL
Server Hostname: localhost
UserName: root
Password: XXXX
然后资料库选择 wikidb
输入以下指令 , 并执行
delete from page;
delete from revision;
delete from text;

(3)准备汇入工具所需要的环境
在这里 , 你必须要安装好 JDK , (Ubuntu 下套件管理程式选择 sun-java5-jdk , 如果套件管理程式有附件套件提示需要选择 , 也请选要安装 )
而且 MySQL JDBC Driver 也需要安装 (Ubuntu 下套件管理程式选择 libmysql-java ( 这是 JDBC Driver for MySQL) , 如果套件管理程式有附件套件提示需要选择 , 也请选要安装 )

(4)下载汇入工具
请下载此工具 , 到你的机器上 , 假设下载到你的桌面上
http://download.wikimedia.org/tools/mwdumper.jar

(5) 汇入动作前的注意事项
在这里因为是只汇入中文部份的维基百科条目( 档案只有几百 MB) , 所以有些相关的参数设定 , 都只需要预设值就可以执行

如果你是要汇入英文版的维基百科 , 那包含 MySQL , 跟 Java 的参数都需要再微调

(6)执行汇入动作
以下动作 , 会跟你的电脑速度有关 , 可能至少要作一两个小时 , 不过在同时间 , 你还是可以使用电脑
现在开启一个命令列视窗 , ( 我们假设下载下来的资料档跟汇入工具都放在桌面上 )
输入以下指令( 下面这是一行指令 )
java -jar mwdumper.jar --format=sql:1.5 zhwiki-20071119-pages-meta-current.xml.bz2 | mysql -u root -p wikidb
接着会出现 Enter Password , 请输入你的 MySQL 的 root 的密码

接着 就会开始进行汇入流程 , 有点久 , 所以请有点耐心
在汇入完成后....

(7)下载 Mediawiki 需要的 extensions
ㄟ还不能好好的看到离线版的维基百科 ,
我们还需要下载Mediawiki 的相关 extensions

我们需要透过 SVN 去取回相关的 extensions , 当然透过 Firefox 从 Web 介面也可以取回
到这个网址
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions

请对应以下 目录结构 , 在你的本机的 /var/lib/mediawiki1.10 下的手动建立四个子目录
extensions/
+->ParserFunctions
+->Cite
+->CategoryTree
+->wikihiero
然后到上述网址
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/ParserFunctions/
把之下的 php 档下载并放到对应的目录下
extensions/
+->ParserFunctions/

(以下类推 , 自己作 )
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/Cite/
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/CategoryTree
http://svn.wikimedia.org/svnroot/mediawiki/trunk/extensions/wikihiero

如果你想要使用 SVN 一次把目录跟档案拉回来也是可以 , 请参考最下方的参考文件说明

(8)修改 LocalSettings.php
执行以下指令
sudo gedit /etc/mediawiki1.10/LocalSettings.php
加上以下几行
require_once("$IP/extensions/ParserFunctions/ParserFunctions.php");
$wgUseTidy=true;
require_once("$IP/extensions/Cite/Cite.php");
$wgUseAjax = true;
require_once("$IP/extensions/CategoryTree/CategoryTree.php");
require_once("$IP/extensions/wikihiero/wikihiero.php");
然后存档离开

*注意事项 :
在Windows 上修改 LocalSettings.php 要小心 , 特别是如果你用记事本 (NOTEPAD.exe) 修改存档的话 ,
小心出现存档后 , 你的 Mediawiki 会出现 甚么 header 已输出的错误讯息 ,
那是因为php 会预设使用 UTF-8 编码存档 , 但是 Windows 上的 UTF-8 据说有些古怪 ...,
如果你不幸碰到了 , 请下载 UltraEdit 试用版 , 来重新开启 Localsettings.php
然后透过 UltraEdit 的转码功能 转换 , 然后存档

(9)开启你的 Mediawiki , 就可以看到离线版的中文维基百科
http://localhost/mediawiki

使用心得, 发现有些分类还是没有在本机上 , 而且发现简体中文的条目数竟然多过繁体中文 , 所以像是有些公司的介绍 , 即便是全球化公司 , 上面的内容也只提到大陆的据点 , 而不会提到台湾

*参考资料
官方网页参考资料
http://meta.wikimedia.org/wiki/Data_dumps
<这一篇 , 有十分详尽的参数修改说明 , 包含 MySQL 参数的修改 , 如果你要汇入英文版的维基百科 , 建议照着作 >

这里就提到为甚么要提供维基百科的 dump 出来

Wikimedia provides public dumps of our wiki's content:

· for archival/backup purposes

· for offline use <-- 为了可以离线使用

· for academic research

· for republishing (don't forget to follow the license terms)

· for fun! <-- 为了高兴 , 好吧 ...

所以个人安装 离线版的维基百科来使用是完全合法的.... 不过要注意授权

我参考的另一边大陆网友的说明文章( 架设 Wikipedia 的本地镜像 )
http://www.xxlinux.com/linux/article/network/server/20070904/9623.html

终于把它写完了, 我的步骤基本上都是测试过的 , 包含 MySQL 没有像参考网页那样去异动任何参数 , 也可以成功完成 ( 刚好因为 中文维基的档案比较小 几百 MB)

好吧... 好好享受你的离线版维基百科
<其实 , 我只是想要离线看 编辑手册 ....>

【转】下载安装离线版维基百科相关推荐

  1. Kiwix:离线的维基百科

    Kiwix让您能够随身携带完整的维基百科!无论您搭乘船只,还是身处偏僻的地区,抑或身陷囹圄,Kiwix都使您能够接触到全人类的知识.您不需要连接因特网,因为所有的资料都储存在您的电脑,优盘或者DVD中 ...

  2. ◆百度百科 for Mdict ◆ 2010年4月版 百度百科离线版 百度百科单机版

    百度百科离线版 百度百科单机版 百度百科手机版 百度百科 for Mdict 文件名: baike2010.mdx 文件大小: 2.43 GB   (2,613,635,878 字节) HASH值: ...

  3. WikiTaxinbsp;离线中英文维基百科数据…

    维基百科 (Wikipedia) 对很多人来说绝对是一个知识的宝库!维基百科拥有海量权威的资料供我们查询,也许我们每个人都梦想着把维基百科下载下来实现离线查询.甚至装在U盘里,以方便随时随地查询.对于 ...

  4. Xamarin.Forms教程下载安装Windows版的Xamarin开发工具

    Xamarin.Forms教程下载安装Windows版的Xamarin开发工具 下载安装Windows版的Xamarin开发工具 本节将讲解如何下载并安装Windows版的Xamarin开发工具. 下 ...

  5. 下载安装纯净版火狐浏览器的步骤

    下载安装纯净版火狐浏览器的步骤如下: 1.网址输入:https://ftp.mozilla.org/,进入后点击pub/ 2.进入后选择firefox/ 3.进入后选择releases/ 4.进入后是 ...

  6. 【What if 系列】纸质版维基百科

    提问: 如果你要把整个维基(英语)百科打印出来,那么你需要多少台打印机才能赶上网络版本的更新速度? -- Marein Könings 回答: 就这么点就够了: (如果有有一天你回到家,发现客厅里有一 ...

  7. Google Chrome在Windows7安装离线版

    前言 今天因为旧版chrome老是要报更新,所以安装了个新版,因为被墙原因,许多网友会遇到一些安装chrome的问题,所以今天分享一下安装教程. 安装chrome 1.前往chrome官网,可以看到链 ...

  8. 怎么安装自己的维基百科(How to mirror Wikipedia)

    某些情况下,你可工作在一个全内网环境中,但你可能需要通过维基查找一些资料,每次都想尽办法,通过层层审批将外网下载的资料拷贝的内网费时费力.其实,维基百科提供了一种在你自己的内容安装一份维基的拷贝的方法 ...

  9. CentOS 下载安装离线程序包

    在一些内网或局域网环境中,无法通过 yum install xxx 进行程序包的下载安装. 需要从具有外网环境的电脑上下载离线程序包,拷贝至内网环境中手动安装. 1. 下载程序包 方法一:使用 yum ...

最新文章

  1. 【干货书】图、网络与算法
  2. 一致性hash算法_分布式寻址算法
  3. Android 记住密码和自动登录界面的实现(SharedPreferences 的用法)(转载)
  4. GNS3与SecureCRT关联问题
  5. 聊聊rocketmq的RemotingException
  6. Visdom数据可视化工具绘制Loss曲线
  7. Python函数的动态参数
  8. 不能将参数转化为lparam_反渗透纯水机是将自来水直接转化为超纯水的装置
  9. CSS实现段落首行缩进、1.5倍行距、左右对齐
  10. stream pipe的原理及简化源码分析
  11. Mybatis配置文件注释
  12. ROS导航之参数配置和自适应蒙特卡罗定位
  13. 互联网晚报 | 4月11日 星期一 | 苏州放宽住房限售;苹果确认开始在印度生产iPhone 13;民航局将上报民航专项检查方案...
  14. 【书摘】一种基于Git的版本管理方案
  15. c#winform窗口页面一打开就加载的方法
  16. 利用通用权限管理系统底层解决数据从不同库的导入导出问题
  17. mysql死锁 等待时间_mysql死锁,等待资源,事务锁,Lock wait timeout exceeded; try restarting transaction解决...
  18. shell 获取数组第一个 最后一个元素
  19. 微星主板黑苹果_黑苹果安装教程:准备磁盘+主板BIOS设置——墨涩网
  20. 云课堂 php代码,基于ThinkPHP二开高仿网易云课堂整站PHP源代码

热门文章

  1. 决定定位和相对定位的区别
  2. 基于ensp的ospf-vlink实验
  3. UI设计师未来的4个发展方向
  4. 生成模型之VAE与VQ-VAE
  5. 怎么把png图片压缩到100k以内,3个工具高效处理
  6. hcip笔记(GRE,MGRE的介绍与配置)
  7. 至强服务器系统配置截图,至强服务器操作系统
  8. pytorch学习之GAN生成MNIST手写数字
  9. 巨杉数据库5.0携手同方软银促进金融科技创新
  10. 香港计算机硕士面试,香港大学计算机专业面试指南