这是主要对Jsoup 的方法熟悉,Jsoup 学习推荐
下面就是爬取数据的有关代码:

String link = null;   // 书的链接String title = null;  // 书的名称String score = null;  // 书的评分String num = null ;   // 获取评价人数Document content = Jsoup.connect("https://book.douban.com/top250").get();//Elements pl2 = content.getElementsByClass("item");Elements pl2 = content.select(".item");int i=1;for (Element element:pl2){Element links = element.getElementsByTag("a").first();Element putureUrl = element.getElementsByTag("img").get(0);Element star = element.getElementsByClass("star clearfix").get(0);Element pl21 = element.getElementsByClass("pl2").get(0);Element controller = element.getElementsByClass("quote").get(0);link = links.attr("href");        // 获取电影的链接String url = putureUrl.attr("src");title = pl21.child(0).html();    // 获取电影名称String content1 = controller.child(0).html();  //简介score = star.child(1).html();     // 获取电影评分num = star.child(2).html();       // 获取评价人数System.out.println(i+++"\t"+link +"\t图片地址:"+ url+"\t" + title + "\t评分" + score + "\t" + num+"\t"+content1);}

运行的结果如下:`

java是由Jsoup实现网络爬虫(爬取豆瓣书评top25)的书籍数据相关推荐

  1. 一、网络爬虫----爬取豆瓣网前250条数据

    一.爬虫的基本流程 发起请求 通过HTTP库向目标站点发起请求,也就是发送一个Request,请求可以包含额外的header等信息,等待服务器响应 获取响应内容 如果服务器能正常响应,会得到一个Res ...

  2. 网络爬虫-爬取指定城市空气质量检测数据

    爬取指定城市空气质量检测数据 网站链接 → https://www.aqistudy.cn/historydata/ 以月数据为例,见下图: 然后我们通过console调试可以发现 这个网页在item ...

  3. 利用定向网络爬虫爬取豆瓣电影top250【Python】

    最近在外地实习,闲来无事学了一下requests库和BeautifulSoup,掌握基本用法之后试着爬取了一下豆瓣电影top250,中间也参考了不少其他大佬的博客,所以最后写出来的代码也都大同小异吧, ...

  4. 网络爬虫爬取拉勾招聘网

    网络爬虫爬取拉勾招聘网 搭配好环境 复制以下代码 # -*- coding: utf-8 -*- """ Created on Mon Sep 7 21:44:39 20 ...

  5. python网络爬虫_Python网络爬虫——爬取视频网站源视频!

    原标题:Python网络爬虫--爬取视频网站源视频! 学习前提 1.了解python基础语法 2.了解re.selenium.BeautifulSoup.os.requests等python第三方库 ...

  6. python如何爬虫网页数据-python网络爬虫爬取网页内容

    1.什么是网络爬虫? 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自 ...

  7. 如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  8. python朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)

    前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...

  9. python抓取朋友圈动态_如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)...

    原标题:如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下) 前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往 ...

最新文章

  1. 7-3 逆序的三位数(C语言)
  2. python练手小游戏_Python小游戏练手EMS员工项目自学者练习
  3. abap--REUSE_ALV_GRID_DISPLAY事件子过程和cl_gui_grid类的事件对应关系
  4. 网络进阶:用了HTTPS就安全了吗?HTTPS 会被抓包吗?
  5. thymeleaf 获取yml中的值_Thymeleaf模板引擎学习
  6. script language=javascriptwindow.location.href=http://blog.securitycn.net/script
  7. python将字典写入txt文件_将一个字典写入txt文件并将其读回来?
  8. c51为啥要宏定义时钟_c51时钟
  9. 北理计算机学院接受转专业条件,【知乎北理】在北理珠,我能转专业吗?
  10. App 快捷方式——创建快捷方式
  11. 怎么实现html网页爱心动态,想着网页上做动态爱心怎么做
  12. 身份证号提取年龄方法python_身的解释|身的意思|汉典“身”字的基本解释
  13. Xcode build解密
  14. win7下硬盘安装Ubuntu 14.04
  15. Python爬虫 爬取豆瓣电影TOP250
  16. 电脑右下角没有USB图标,不能退出
  17. 最新多功能校园表白墙源码 LoveWall V2.0Pro
  18. RibbonGatewayopenFeign
  19. 华三交换机IRF:2台交换机+BFD方式MAD监测
  20. word2vec 词向量

热门文章

  1. 购房还清款额月份计算
  2. 基于Proteus8.9的8086+8255A
  3. 目前流行的计算机硬盘容量多少,电脑硬盘买什么容量的性价比最高?
  4. 思科CCNA2pka实验报告
  5. 解决react在安装antd之后出现Module not found: Can't resolve './locale' in。。。的问题
  6. 医院计算机怎么评职称,设计院怎么评职称
  7. centos8系统升级后,ZFS提示The ZFS modules are not loaded
  8. CS224W 图机器学习(二)--图上的传统机器学习方法
  9. 【C#进阶三】C#正则表达式的使用及常用案例(Regex.IsMatch、Regex.Match,match.NextMatch、Regex.Matches、Regex.Replace等)(实践篇)
  10. 用C语言做出你自己的七夕表白程序!