刚刚玩了一下 goquery 看到最近抓知乎数据的比较多。那我也抓一个玩玩。

我也不跟人家 比数据量什么的了。也不证明golang是最好的语言

只是单单的做练手了

package mainimport ("fmt""github.com/PuerkitoBio/goquery"
)type Book struct {Title  string //标题Img    string //图片地址Author string //作者Sell   string //价格Url    string //访问链接
}func main() {var (url string = "https://www.zhihu.com/publications")//使用 goquery 创建 dom 对象query, query_err := goquery.NewDocument(url)if query_err != nil {fmt.Println(query_err)}data_arr := make(map[int]Book, 100)//查看元素发现 他是一个大的 ul 那么我们直接 找到这个对象就好了。//每一本书的数据 为一个 li 那么直接对 li的元素进行遍历就好了//需要设置两个参数 i 为当前是第几个元素 s 为当时元素对象query.Find("ul[class=\"publications-list  weekly\"]").Eq(0).Find("li").Each(func(i int, s *goquery.Selection) {a := s.Find("a").Eq(0)a.Next()r := Book{}//获取对应 跳转链接r.Url, _ = a.Attr("href")//获取书的名字r.Title = a.Find(".publications-item-title").Eq(0).Text()//获取书的图片r.Img, _ = a.Find(".publications-item-image").Eq(0).Attr("src")//获取书的作者r.Author = a.Find(".publications-item-author").Eq(0).Text()//获取书的售价r.Sell = a.Find(".publications-item-promotion").Eq(0).Find("span").Eq(0).Text()data_arr[i] = r})for k, v := range data_arr {fmt.Println(k, v)}}

golang 使用 goquery 抓取 知乎周刊相关推荐

  1. python学习-抓取知乎图片

    python学习-抓取知乎图片 #!/bin/usr/env python3__author__ = 'nxz'""" 抓取知乎图片 webdriver Chromedr ...

  2. Scrapy Python爬虫实战:抓取知乎问题下所有回答!

    今天趁摸鱼的时候玩了会知乎,突然看到一个非常有意思的话题 单身狗不知道还能干什么,所以特地把这些数据都抓下来,看看不除了第二杯半价还能干什么? 创建scrapy项目 前面教程概念讲的我嘴都麻了,估计大 ...

  3. java爬虫 抓取知乎,java爬虫抓取知乎推荐总是乱码

    求助java爬虫抓取知乎推荐总是乱码 仿照http://blog.csdn.net/pleasecallmewhy/article/details/17630063写一个简单的抓取知乎推荐(http: ...

  4. Zotero 抓取知网文献失败解决办法梳理(针对问题:更新Translator无效,更新茉莉花插件无效,卸载Zotero无效,使用学校VPN访问知网)

    Zotero 抓取知网文献失败解决办法梳理(针对问题:更新Translator无效,更新茉莉花插件无效,卸载Zotero无效,使用学校VPN访问知网) 问题背景 解决方案一 解决方案二 解决方案三 说 ...

  5. python 抓取知乎

    刚入门python,本着就是干的原则,从小项目开始. 今天在抓取网页的时候遇到了问题. import urllib.requesturl="http://www.fafu.edu.cn&qu ...

  6. scrapy抓取知乎话题v0.1

    一.简介 抓取知乎某一子话题,赞同人数超过10的会被抓取.回答ID.赞同人数.回答时间.内容.提问被保存到mysql数据库中,支持更新(多次抓取时对于同一回答的ID只更新赞同人数). usage: s ...

  7. Python爬虫实战一:抓取知乎问题下所有回答

    代码是最近(2021.09)新写的~ 需求 任务需求:抓取知乎问题下所有回答,包括其作者.作者粉丝数.回答内容.时间.回答的评论数.回答赞同数以及该回答的链接. 分析 以最近比较引人关注的" ...

  8. Python爬虫实战,requests模块,Python实现抓取知乎热点话题

    前言 利用Python实现抓取知乎热点话题,废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: requests模块: re模块: pandas模块: lxml模 ...

  9. python 赚钱 知乎_爬虫实战:抓取知乎问题 “大学生如何赚到一万元”

    最近对赚钱的话题很感兴趣,在知乎上关注了很多"赚钱"相关的问题,高质量的有不少,但是夹杂着私货的也不少.不过知乎的数据比较全,我们完全可以用来做文本分析. 爬虫的原理我就不细讲了, ...

  10. scrapy——抓取知乎

    主要目标是: ·       从如何评价X的话题下开始抓取问题,然后开始爬相关问题再循环 ·       对于每个问题抓取标题,关注人数,回答数等数据 1    创建项目 $ scrapy start ...

最新文章

  1. 你知道Java的四种引用类型吗?
  2. 青龙羊毛——宝石星球(教程)
  3. 通过pycharm使用git
  4. 组队开发第二周第一次会议
  5. Linux安装配置Redis CentOS 7 下安装Redis
  6. Jenkins打包之本地远程自动打包教程
  7. lvm-snapshot:基于LVM快照的备份
  8. 除了中国,原来还有这么多国家采用十二生肖的啊~| 今日最佳
  9. yolov5安装pip install requirements.txt,pycocotools安装报错
  10. 关于System.FormatException异常
  11. 50行代码实现的一个最简单的基于 DirectShow 的视频播放器
  12. Power Query Advanced Editor键盘快捷键
  13. 惯量比多少合适_详解】伺服电机负载惯量比的合理取值汇总
  14. linux+极点五笔输入法,CentOS系统安装极点五笔输入法
  15. 2018软工实践——团队答辩
  16. java和ccnp哪个难_新版思科网络工程师CCNP的通过率是多少?
  17. jQuery 经典表单应用
  18. 罗斯蒙特2088G2S22A1M5B4Q4压力变送器
  19. 最好的C#教程和参考书
  20. Linux安装IPFS

热门文章

  1. MTK6589编译出错
  2. 2010年中国互联网十大事件
  3. C++Windows连点器制作
  4. 连点器---鼠标连续点击(c语言)
  5. react自定义鼠标右键菜单
  6. 【转载文章】原 DOS命令学习(从入门到精通)_____附加自己学习笔记
  7. 福昕软件发布福昕高级PDF编辑器 for Linux
  8. 华硕主板装系统蓝屏_华硕台式电脑蓝屏怎么重装系统 华硕台式电脑蓝屏重装系统步骤...
  9. tablepc是什么平板电脑_iPad不是平板!想买Tablet PC的看过来
  10. 基于单片机的空气质量(PM2.5)监测系统设计(#0423)