页面解析需要用到goquery但是资料比较少,我从网上搜到一些,然后再写一些自己的总结,以供大家参考(持续更新)

转载请注明出处:http://www.cnblogs.com/SSSR/p/6346496.html

博客:

http://ju.outofmemory.cn/entry/131743 例子比较多

http://www.threeperson.com/users/1/articles/2051

https://www.progville.com/go/goquery-jquery-html-golang/

http://blog.csdn.net/liangguangchuan/article/details/53928570

http://www.golangtc.com/t/55a5fa5ab09ecc22f60000dc

http://www.tuicool.com/articles/ENJviyA

godoc:https://godoc.org/github.com/PuerkitoBio/goquery

函数基础:

NewDocument 创建对应 传递要抓取的url即可

goquery.NewDocumentFromNode 通过goquery的节点创建
Find 查找获取当前匹配的每个元素的后代
Eq 选择第几个
Attr 获取对应的标签属性
AttrOr 获取对应的标签属性。这个可以设置第二个参数。获取的默认值 如果获取不到默认调用对应默认值
Each 遍历每一个元素
Text 获取当前对应的文本
Html 获取当前对象的标签
AddClass 添加 class 不过用来抓取有点鸡肋不知道为何要写这个
Children 返回所有子元素
Filter 过滤标签元素
Prev 获取上一个元素
Next 获取下一个元素

Get(i int)获取第几个节点

最常用的是Find函数:参考jQuery方法:http://www.runoob.com/jquery/jquery-ref-selectors.html

其参数可以为好多内容,".article"则表示标签的class,"#article"则表示标签的ID。

"h3"则表示是查找标签是h3的,"h3 a"则表示查找到<a>标签。

dhead.Find("meta[name=description]") 表示查找meta标签,并且name="description"

text := doc.Find("div.profile-navbar").Find("span.num").Eq(1).Text()//div是标签名.profile-navbar是class的值,也可以是div#id;items := doc.Find("div#zh-list-answer-wrap").Find("h2.zm-item-title")

query.Find("#plist .list-h:nth-child(1) > li")//#plist 表示ID=plist,.list-h表示class=list-h,nth-child(1)表示属于其父元素的第二个子元素的所有元素(有待测试),>li表示直接子元素中的所有li,

.Html()表示的是当前标签内部的html代码,而不包括当前标签自己,意思是内部的HTML,例如当前查到找一个标签a,如果想通过.Html()查看一下他是否有href是看不到的,要查看他的父级标签(Parent)的Html才能看到

.Text()是这个节点下所有的节点的文本,那么如果只想看本节点的文本,不看它的子节点的文本呢?????

dcharset.Eq(1).Attr("content") 表示dcharset是一个标签集合,找第2个(索引从0开始)的属性值

tag.HasClass("origin_image")  有class的。

转载于:https://www.cnblogs.com/SSSR/p/6346496.html

幽灵蛛(pholcus)(三)--goquery学习资料相关推荐

  1. 【总结】从视频到图文,代码实战,有三AI-GAN学习资料汇总!

    GAN无疑是这几年深度学习领域里最酷的技术,不管是理论的研究,还是GAN在图像生成,图像翻译,语音图像等基础领域的应用,都非常的丰富.我们公众号输出过非常多的GAN相关资源,本次做一个简单汇总,我们平 ...

  2. 【通知】有三AI带学习资料的固态硬盘最后5个

    还记得今年年中时发布的有三AI定制版固态硬盘吗,年前最后一期还有5个,2个大号,3个小号,先到先得,下面是硬盘相关的具体细节介绍. 硬盘产品细节 本次我们的产品为固态移动硬盘,注意是固态硬盘,不是普通 ...

  3. 国科大学习资料--最优化计算方法(王晓)--第三次作业答案

    国科大学习资料–最优化计算方法(王晓)–第三次作业答案 国科大学习资料–最优化计算方法(王晓)–第三次作业答案 国科大学习资料–最优化计算方法(王晓)–第三次作业答案 ![在这里插入图片描述](htt ...

  4. 国科大学习资料--模式识别与机器学习(黄庆明)--第三次作业答案

    国科大学习资料–模式识别与机器学习(黄庆明)–第三次作业答案 国科大学习资料–模式识别与机器学习(黄庆明)–第三次作业答案 国科大学习资料–模式识别与机器学习(黄庆明)–第三次作业答案 ======= ...

  5. android 学习笔记(三) Android学习路线之3.2 游戏程序员的学习资料

    看到一篇文章,总结一个游戏程序员的学习资料,作者是一个大二的学生,很羡慕作者大二时就有这么清晰的职业目标.我大学学的是自动化专业,大学时也算博览群书,可惜现在大多不知道遗忘在那个角落了.毕业后,单片机 ...

  6. 国科大学习资料–图像处理(彭思龙、杨戈)--第三次作业

    国科大学习资料–图像处理–第三次作业(彭思龙)(附完整代码) 答案仅供参考,严禁转载抄袭 题目 编一个程序实现如下功能: 1.读入一幅指纹图像(自己找): 2.对图像进行二值化(方法自定,可以是阈值法 ...

  7. 日语学习资料 - 万叶集 三本

    万叶集 (汉译上下册).pdf    https://pan.baidu.com/s/10ivQWFXzBVjW8MKd-sxL9A    t5xq 万叶集--赵乐甡全译本.pdf    https: ...

  8. go学习资料以及开源代码

    Go 语言方面的大牛,或者优秀 Go 项目的组织 mattn - 写了数百个 Go 项目,盛产优质项目 Unknwon - gogs/macaron 等项目作者,<The Way to Go&g ...

  9. 教程 | 一文读懂自学机器学习的误区和陷阱(附学习资料)

    来源:机器学习与统计学 本文约6296字,建议阅读10分钟. 本文为你指出一些自学的误区,推荐学习资料,提供客观可行的学习表并给出进阶学习的建议. 后台回复"20190426"获取 ...

  10. 独家 | 一文带你上手卷积神经网络实战(附数据集学习资料)

    原文标题:Understanding deep Convolutional Neural Networks with a practical use-case in Tensorflow and Ke ...

最新文章

  1. python subprocess_python subprocess - 刘江的python教程
  2. 【计网】计算机网络-物理层【理论1-2】
  3. java ecj_java - 在Maven构建中使用Eclipse Java Compiler(ecj) - 堆栈内存溢出
  4. 使用C# (.NET Core) 实现装饰模式 (Decorator Pattern) 并介绍 .NET/Core的Stream
  5. java爬取国家统计局之统计用区划和城乡划分代码(省市区三级)
  6. 新出行超级产业链之交通工具变革(网址导航)
  7. SD卡分区Linux,使用MiniTool Partition Wizard对SD卡进行EXT4格式分区
  8. springboot 配置文件加密
  9. 猿创征文|【算法入门必刷】数据结构-栈(二)
  10. Google Chrome Helper CPU占用过高的解决办法
  11. Adobe Flash player Activex控件问题解决方法
  12. RMAN Encrypted Backups
  13. 账单php,php 处理微信账单
  14. tesla p100 linux,服务器(Tesla P100)Ubuntu16.04+显卡驱动+cuda8.0+cudnn7.0.5
  15. kafka完整集群安装
  16. 帝国搜索模板不支持php,解决帝国CMS搜索模板不支持灵动标签的方法
  17. 【Android 逆向】函数拦截 ( 使用 cache_flush 系统函数刷新 CPU 高速缓存 | 刷新 CPU 高速缓存弊端 | 函数拦截推荐时机 )
  18. STM32F103中文参考手册PDF
  19. excel——数据透视表教程
  20. ORA-12528: TNS: 监听程序: 所有适用例程都无法建立新连

热门文章

  1. 【翻译】StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation
  2. vmware运行虚拟机ubuntu,电脑就重启
  3. 让传感器数据在三维地图上显示,更直观,更震撼!
  4. Android应用切换皮肤功能实现
  5. 大学生创新创业大赛案例_七大学生创新创业大赛样本示例
  6. 交通灯系统设计 educoder实训项目 logisim实现
  7. 每天定时检测404链接
  8. Excel 通过DDE与INTOUCH通信,数据格式
  9. Word 一级标题与二级标题的标号不同一问题
  10. 1、微信公众平台注册