1.依赖

       <dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.13.1</version></dependency>

2.工具类

解析网页,拿到数据,放到list集合里面

public List<Content> parseJD(String keyword) throws IOException {List<Content> contentList = new ArrayList<>();//获得请求String url = "https://search.xx.com/Search?keyword="+keyword;//解析地址,如果30s内解析不到就会报错// jsoup返回的 document 对象就是 js浏览器里面的document对象Document parse = Jsoup.parse(new URL(url), 30000);//先获取id=J_goodsList的大的一个商品divElement elementById = parse.getElementById("J_goodsList");//再获取包含一个个商品的li标签Elements li = elementById.getElementsByTag("li");//循环这个li,这里的li包含的就是一个个商品,商品有价格,名称,店铺名,图片地址等等for (Element element : li) {//为了用户体验,一般大厂的网页图片都懒加载,刚开始只会加载一个默认图片,正在的图片地址在这个data-lazy-img 里面,而不是在src里面String img = element.getElementsByTag("img").eq(0).attr("data-lazy-img");String price = element.getElementsByClass("p-price").eq(0).text();String name = element.getElementsByClass("p-name").eq(0).text();String shop = element.getElementsByClass("p-shopnum").eq(0).text();Content content = new Content();content.setImg(img);content.setPrice(price);content.setTitle(name);content.setShop(shop);contentList.add(content);}return contentList;}

3.相关实体类

@Data
public class Content {//myBatis-plus 的id自增@TableId(type = IdType.AUTO)private Integer id;private String title;private String price;private String img;private String shop;
}

[会写代码的健身爱好者成长史]之Jsoup的简单使用相关推荐

  1. [会写代码的健身爱好者成长史]之spring-security

    目录 1.什么是spring-security? 2.准备工作 2.1 添加依赖 2.2 相关实体类 2.3 sql建表语句 2.4 相关工具类 2.4.1 Jwt 2.4.2 redis工具类(但是 ...

  2. [会写代码的健身爱好者成长史]之Elasticsearch

    目录 1.安装 2.安装elasticsearch可视化工具 3.ik分词器 5.关于 elasticsearch的curd 1.创建一个索引 2.查询索引库 3.修改索引库内容 4.删除所有库 6. ...

  3. 已经是公元2023年了,一定还有这么写代码的人儿。看看是如何把简单的事情搞复杂的。

    先来一道开胃菜. public class XXService {... private Boolean isTax(PurchaseBillItem purchaseBillItem) {if (p ...

  4. 编程同写作,写代码只是在码字

    编程同写作,写代码只是在码字 原文作者: Phodal Huang  原文链接 看到一篇文章<We Are Typists First, Programmers Second>,日期是20 ...

  5. ClownFish:比手写代码还快的通用数据访问层

    最近花了二个月的业余时间重写了我以前的通用数据访问层, 由于是重写,所以我给这个项目取了个新名字:ClownFish 如果需要了解ClownFish的使用方法,请点击ClownFish 使用说明 Cl ...

  6. 写代码后你胖了几斤?(程序员健身的独特方式)

    原文链接 你觉得噼里啪啦敲键盘写代码时的你,是 屠龙的勇士.登塔的先锋! 然而屏幕前这个形容憔悴的你,更像刚 从80年代僵尸片的片场领了盒饭回来 . 你在幻想中严词拒绝了产品经理瞎改需求的要求,并把他 ...

  7. 程序员健身总动员:写代码后你胖了几斤?

    原文链接 你觉得噼里啪啦敲键盘写代码时的你,是 屠龙的勇士.登塔的先锋! 然而屏幕前这个形容憔悴的你,更像刚 从80年代僵尸片的片场领了盒饭回来 . 你在幻想中严词拒绝了产品经理瞎改需求的要求,并把他 ...

  8. 可旋转的2K显示器,写代码逼格要到位,免费包邮送到家

    写代码如果有两个显示器事件很爽的事情,如果再来一个2K超清并且可以旋转的显示器.那会不会更爽呢! 阅读代码的时候将显示器竖着旋转一目了然,代码BUG多不多不重要,逼格先到位! 所以,小编联合几位公众号 ...

  9. 我为什么晚上写代码?

    摘要:作为一个有点追求的程序员,应该每天练习写代码,而夜深人静的时候,似乎比较合适,至少对我来说是这样. 我可真没时间写代码 写代码是我的工作,也是我的兴趣,本来以为,我应该可以一直写下去. 然而,现 ...

最新文章

  1. Ubuntu18.04+CUDA10.2 深度学习开发环境配置指南
  2. 在SAP CDS view上添加扩展字段后激活,背后的实现原理
  3. linux文件编程(open、write、read、creat、lseek函数)
  4. php脚本来创建一个表,PHP - SQL脚本创建器
  5. Mysql 行前自动排序_mysql 取得行号后再排序
  6. python自动化测试框架哪个好_Python 自动化测试框架unittest与pytest的区别
  7. 【转载】手动删除引用nuget如何还原
  8. Ubuntu 使用 Smina 对接教程
  9. Apache OpenNLP(二)
  10. 计算机中汉字的顺序用什么牌,最常用汉字频率排序
  11. 最小 的浏览器 界面最精简 大小只有 压缩后只有7K 多
  12. Linux平台Libyuv使用指南
  13. PyTorch-04梯度、常见函数梯度、激活函数Sigmoid;Tanh;ReLU及其梯度、LOSS及其梯度、感知机(单层感知机)、感知机2(多输出的)、链式法则、MLP反向传播推导、2D函数优化实例
  14. mysql查询成绩表中课程编号升序_数据库的常见题型--------------(查询)
  15. 通过CSS实现 文字渐变色 的两种方式
  16. 猴子分桃子,递归算法简练通俗易懂
  17. 移动端cpu天梯图2020_笔记本CPU排行天梯图2020
  18. EverNote开源协议-Android
  19. HDMI 2.1的traning流程
  20. 【Java后端】读取文件夹中的图片转成base64编码并写入properties文件

热门文章

  1. LeetCode 575. Distribute Candies
  2. Product-based Neural Networks
  3. 公交语音播报调试第四天
  4. 公交语音播报调试第三天
  5. 推荐13个优秀的网站检测工具
  6. 机房安全监控设备连接图及指令发送
  7. wow plugins zhange
  8. VMware被博通收购后:大中华区总裁上任仅9个月突然离职
  9. 阿里云mysql事件启动_mysql 启动事件-阿里云开发者社区
  10. 腾讯控股:一家被低估了的全球科技巨头