获取网页html内容

一、前言:转载地址

今天写个简单的程序,根据指定的 URL 来抓取相应的网页内容,然后存入本地文件。这个程序会涉及到网络请求和文件操作等知识点,下面是实现代码:

二、代码

package mainimport ("fmt""io/ioutil""net/http""os"
)func main() {//待获取的网页数据//url := os.Args[1]url := "https://blog.csdn.net/qq_36025814/article/details/85061666"// 根据URL获取资源res, err := http.Get(url)if err != nil {fmt.Fprintf(os.Stderr, "fetch: %v\n", err)os.Exit(1)}// 读取资源数据 body: []bytebody, err := ioutil.ReadAll(res.Body)// 关闭资源流res.Body.Close()if err != nil {fmt.Fprintf(os.Stderr, "fetch: reading %s: %v\n", url, err)os.Exit(1)}// 控制台打印内容 以下两种方法等同fmt.Printf("%s", body)fmt.Printf(string(body))// 写入文件ioutil.WriteFile("site.txt", body, 0644)
}

三、代码说明

上面的代码中,我们引入了 net/http 网络包,然后调用 http.Get(url) 方法获取 URL 对应的资源,之后读取出资源数据,然后在控制台打印,并将内容写入到本地文件中。

需要注意的是,在读取资源数据完毕后,应该及时将资源流关闭,避免出现内存资源的泄露。

另外,在处理异常时,我们使用了 fm.Fprintf() 这个方法,它是格式化三大方法之一:

  • Printf: 格式化字符串并输出到 os.Stdout 中。
  • Fprintf: 格式化字符串并输出到指定文件设备中,所以参数比 Printf 多一个文件指针 FILE*。
  • Sprintf: 格式化字符串并输出到指定字符串中,所以参数比 Printf 多一个 char*,那就是目标字符串地址。

四、运行完程序,在当前目录中会生成一个 site.txt 文件。

获取网页html内容相关推荐

  1. python 打开网页开发者工具_Python获取网页指定内容(BeautifulSoup工具的使用方法)...

    page = urllib2.urlopen(url) contents = page.read() #获得了整个网页的内容也就是源代码 print(contents) url代表网址,content ...

  2. 抓取html的内容,js获取网页选中内容(包含html代码)

    例子,js获取网页选中的内容. 复制代码 代码示例: function getSelectedContents(){ if (window.getSelection) { //chrome,firef ...

  3. 黄聪:C#获取网页HTML内容的三种方式

    C#通常有三种方法获取网页内容,使用WebClient.WebBrowser或者HttpWebRequest/HttpWebResponse. 方法一:使用WebClient static void ...

  4. python 获取网页的内容

    1.安装pip 我的个人桌面系统用的linuxmint,系统默认没有安装pip,考虑到后面安装requests模块使用pip,所以我这里第一步先安装pip. 1 $ sudo apt install ...

  5. java如何获取网页全部内容

    URL获取 之前在项目中,遇到这样一个问题.需要读取一个网页的内容,却发现只读取到了网页内容的一部分. 下面是代码: public static void read1(String urlStr) { ...

  6. python使用requests库获取网页的内容

    网站地址:https://www.k374.com/index.php 网站内容如下: 第一步导入requests库,使用它访问网页获取到源代码 内容如下: import requests r = r ...

  7. python 使用xpath获取网页标签内容

    获取指定html的标签内容 打开网页的开发者模式,得到路径标签,然后加上/text() 即可得到标签的文本内容//*[@id="sonsyuanwen"]/div[1]/h1 对于 ...

  8. java获取网页的内容_java获取网页内容

    package DC.Utility; import java.io.BufferedReader; import java.io.InputStreamReader; public class Ge ...

  9. 正则表达式获取网页文本内容

    为什么80%的码农都做不了架构师?>>>    微信小程序中不能直接渲染 HTML 页面,后台 CGI 返回的公众号文章的内容是 HTML 页面,需要将 HTML 标签滤除,同时要保 ...

  10. C++ 与 php 的交互 之----- C++ 异步获取 网页文字内容,异步获取 php 的 echo 值。...

    已搬迁至 http://www.cnblogs.com/linguanh/p/4543836.html 如果您认为这篇文章还不错或者有所收获,您可以通过扫描一下下面的支付宝二维码 打赏我一杯咖啡[物质 ...

最新文章

  1. 解决Mac Pro上IDEA卡顿的问题
  2. python共享内存和分布式实现异步加载数据
  3. python从入门到精通学习笔记_Python从入门到精通之基础概念
  4. Quartz-异常处理
  5. spark读取文件源码分析-2
  6. P4331 [BalticOI 2004]Sequence 数字序列(左偏树)
  7. compareto 和_清洁责任–摆脱均等,compareTo和toString
  8. 前端工程师应该掌握哪些技能才方便找工作?
  9. oracle 时间按季度,ORACLE时间字段取年、月、日、季度
  10. matlab monte carlo,Monte Carlo Simulation
  11. JAVA总结实录01 : 异常处理 try-catch-finally
  12. Movavi Screen Capture Studio 10.2.0 特别版 Mac 屏幕录像工具
  13. 电脑的Mac地址怎么查看
  14. SQL-根据生日计算年龄
  15. jsp页面中Table表格首列合并同类项的脚本调用方法
  16. 因果推理(causal inference)中的ATT和ATE有什么区别?
  17. SIMetrix教程-005.SIMetrix导入第三方库;SIMetrix导入模型
  18. 宁做创业狼,不做打工狗!
  19. Win10客户端远程桌面连接win2008server
  20. GAN的应用-SRGAN图像超分辨率重构、U-net结构和字“姐”跳动学习心得

热门文章

  1. mysql漏洞如何打补丁_WordPress 5.1 CSRF to RCE 漏洞详解
  2. 【解题报告】图论基础练习(一)
  3. 数据结构c语言版算法知识点,2020考研计算机《数据结构(C语言版)》复习笔记(3)...
  4. mysql建立软链接_MySQL(一)安装
  5. 顶部固定不动 下部分滚动_彻底解决背景跟随弹窗滚动问题
  6. oracle 创建视图_Oracle 中视图的创建和处理方法
  7. 小型的搜索引擎设计_广州网站设计工作室-赛致信息科技
  8. 评委输入的密码如果不正确,当错误的次数达到5次时,该评委的账号会被锁定.如何解锁呢?
  9. php 自学提升进阶路线,瓶颈
  10. phpstudy apache启动不了,也不报错误日志