因为想离线浏览www.tutorialspoint.com
—An Indian Website
因为Teleport收费
所以只好使用免费的自由软件

帮助信息

$ wget --help
可以显示详细的

命令

$ sudo wget -r -H -Dtutorialspoint.com -np -k -p www.tutorialspoint.com

选项

-r, –recursive specify recursive download 默认5级目录 可通过 -l number改动
-H, –span-hosts go to foreign hosts when recursive
不加-H选项时,不会识别<a href="/apex/index.htm" title="Learn Apex Programming">Learn Apex</a>这样的超链接。测试可以接受<link href=开头的超链接,很confusing,下面是来自gnu网站的说法

wget gnu manual ftp://ftp.gnu.org/old-gnu/Manuals/wget-1.8.1/html_chapter/wget_4.html
-H span to any host
-D limit spanning to certain domain sudo wget -rH -Dserver.com http://www.server.com/ 下载www.server.com,同时允许下载images.server.com
你也可以 -Ddomain1.com,domain2.com --exclude-domains sunsite.domain1.com

-k, –convert-links make links in downloaded HTML or CSS point to local files 将下载的html页面中链接转换为指向本地文件的链接
–convert-file-only convert the file part of the URLs only(usual only known as the basename)

-p, –page-requisites get all images, etc. needed to display HTML page 下载所有图片等页面显示元素
–strict-comments turn on strict (SGML) handling of HTML comments
-np, –no-parent don’t ascend to the parent directory不追溯至父级
-nc, –no-clobber skip downloads that would download to existing files thus overwriting them 断点续传
-A, –accept=LIST comma-separated list of accepted extensions

后续问题

下下来后,发现没有更正全部的超链接。
比如要访问 file:///Users/username/Documents/www.tutorialspoint.com/index.html里,仍然包含了href=”www.tutorialspoint.com/apex/index.htm”
所以构思把网页放到本地服务器localhost上,离线时修改dns解析到下载的网页。
修改 /etc/hosts 文件

127.0.0.1   example.com             alias.example.com
127.0.0.1   www.tutorialspoint.com  tutorialspoint.com

添加最后一行即可
如果是Mac 根据hosts(5) manual page /etc/hosts文件是由mDNSResponder使用。重置DNS缓存方法为:
sudo dscacheutil -flushcache
我的OS X 10.10发现修改完hosts就直接生效了

用wget递归下载网站 离线浏览相关推荐

  1. 扒网站工具 linux,wget 递归下载整个网站(网站扒皮必备)

    wget 递归下载整个网站(网站扒皮必备) 有时间看到别人网站的页面比较漂亮,就想给扒皮下来,学习学习.分享一个我常用网站扒皮命令wget 这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接 ...

  2. wget 递归下载整个网站

    wget命令详解 wget命令用来从指定的URL下载文件.wget非常稳定,它在带宽很窄的情况下和不稳定网络中有很强的适应性,如果是由于网络的原因下载失败,wget会不断的尝试,直到整个文件下载完毕. ...

  3. 抓起整个网站离线浏览的软件Teleport Pro

    百科名片 Teleport Pro由美国Tennyson Maxwell公司开发,曾被PC Magazine评为"编辑选择奖".ZDNet评为五星.它可以完全或部分下载一个网站上的 ...

  4. Fiddler插件开发 - 实现网站离线浏览功能

    有这么一种应用场景: 你是做前端或APP开发的,需要调用服务端提供的接口,接口只能在公司内网访问:在公司外就无法调试代码了. 想在公司外访问怎么办呢? 如果在公司的时候将所有接口的响应内容都保存起来, ...

  5. 用wget下载网站,实现离线浏览

    资料来源:http://www.truevue.org/linux/wget-download-website 想下一些LSF的文档,windows下的离线浏览有teleport等软件可以选择,Lin ...

  6. wget下载网站的目录

    $ wget -c -r -nd -np -k -L -p -A c,h www.xxx.org/pub/path/ -c  断点续传 -r  递归下载,下载指定网页某一目录下(包括子目录)的所有文件 ...

  7. 用linux下常用命令wget进行整站下载(递归下载至本地)

    为什么80%的码农都做不了架构师?>>>    这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接. wget加上参数之后,即可成为相当强大的下载工具. wg ...

  8. 如何下载网站以供离线访问

    In this tutorial I will teach you how to download website for offline access. 在本教程中,我将教您如何下载网站以供离线访问 ...

  9. 使用wget命令镜像网站

    因为内容其实并不多,所以我干脆直接上原文了.做为一个PHP(拍***)的User,抠模版实在太常见了,所以....找啊找,想不到,工具原来一直就在我们身边 原文地址:http://blog.china ...

最新文章

  1. NOI2011 道路修建
  2. 如何修复无效的目标版本:Maven Build中的1.7、1.8、1.9或1.10错误
  3. 3ds max删除了对象后,还是将原来所有对象输出的原因
  4. 集成学习之参数调整策略
  5. 小米自然语言处理工程师招聘条件与自己的对应整理
  6. spring2.X(1)--新特性介绍
  7. PHP防止数字太大转化为科学计数法的方法
  8. centos7火狐浏览器上不了网_网络问题备忘:能ping通,就是上不了网
  9. iOS逆向之利用Xcode重签名
  10. 计算机系统结构02325知识点,02325计算机系统结构复习资料.doc
  11. Nosql部署集群环境创建 Redis 集群管理集群
  12. linux获取软电话信息,完整的SIP软电话工程实施过程
  13. LabVIEW视觉功能模块下载
  14. MySQL服务无法启动,服务没有报告任何错误--解决方案
  15. 眼见为实(2):介绍Windows的窗口、消息、子类化和超类化
  16. 【错误记录】Kotlin 报错 ( Some kotlin libraries attached to this project were compiled with a newer kotlin )
  17. Word中在囗中打勾或打叉的方法介绍
  18. python脚本AttributeError: module 'xxxx' has no attribute 'xxxxx'错误解决办法
  19. 用迭代器遍历map 集合
  20. 微信小程序云开发之微信支付

热门文章

  1. ## modelsim与quartus 2 联合仿真,出现Error loading design
  2. 最新版本火狐浏览器如何导入书签?
  3. marker 头像 高德地图_手机地图导航软件高德地图1.如何下载高德地图
  4. python实训报告万能模板_实习报告万能模板
  5. SaaSBase:最受欢迎的HR人力资源软件有哪些(上篇)
  6. 关于Java面向对象的理解
  7. 开源项目推荐-私人网盘系统项目
  8. html表格两个竖直排列,基于elementUI竖向表格、和并列的案例
  9. 如何去掉文本中的标点符号
  10. PHP:JSON函数json_encode详解