可以看到这里id为k_total的元素值不同,爬出来是1,网页源码是55。

附还未完成的代码:import requests

from bs4 import BeautifulSoup

import re

head={

'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36',

'Referer':'http://m.manhuaju.com/maoxian/zujienvyou/420624.html'

}

baseurl=r'http://m.manhuaju.com/maoxian/zujienvyou/'

find_link=re.compile('

def process(url):

r = requests.get(url=url, headers=head)

soup = BeautifulSoup(r.content, 'html.parser')

return soup

def askurl():

soup=process(baseurl)

url_eve=soup.find_all(name='ul',class_="Drama autoHeight")

url_eve_2=''.join('%s'%id for id in url_eve)

link=re.findall(find_link,url_eve_2)

link_re = list(reversed(link))

return link_re

def getdata():

for i in range(1):

result=(r"http://m.manhuaju.com"+askurl()[i])

print(result)

each_page=process(result)

print(each_page)

getdata()

初学爬虫,希望大佬们不吝赐教,感谢。

PS:还有一个问题,这个网站的图片格式似乎被加密过,单爬取打不开,还请大佬们点拨如何解密。

python爬网页源码_python爬虫爬取网页的内容和网页源码不同?相关推荐

  1. python request返回的响应_Python爬虫库requests获取响应内容、响应状态码、响应头...

    首先在程序中引入Requests模块 import requests 一.获取不同类型的响应内容 在发送请求后,服务器会返回一个响应内容,而且requests通常会自动解码响应内容 1.文本响应内容 ...

  2. python requests 状态码_Python爬虫库requests获取响应内容、响应状态码、响应头

    更多python教程请到: 菜鸟教程www.piaodoo.com 人人影视www.sfkyty.com 16影视www.591319.com 星辰影院www.591319.com 首先在程序中引入R ...

  3. python构造响应头_Python爬虫库requests获取响应内容、响应状态码、响应头

    首先在程序中引入Requests模块 import requests 一.获取不同类型的响应内容 在发送请求后,服务器会返回一个响应内容,而且requests通常会自动解码响应内容 1.文本响应内容 ...

  4. python爬虫源码_Python—爬虫:王者荣耀全套皮肤【附源码】

    怎么获取全套皮肤?用钱买,或者用爬虫爬取下来~虽然后者不能穿.这个案例稍微复杂一点,但是一个非常值得学习的项目. 具体实现思路: 分析网页源代码结构 找到合适的入口 穷举访问并解析 爬取所有英雄所有皮 ...

  5. python爬取网页数据流程_Python爬虫爬取数据的步骤

    爬虫: 网络爬虫是捜索引擎抓取系统(Baidu.Google等)的重要组成部分.主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份. 步骤: 第一步:获取网页链接 1.观察需要爬取的多 ...

  6. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  7. python爬贴吧回复_Python爬虫——抓取贴吧帖子

    对珊瑚老哥保证了自己会尽量补档动画MTV吧的资源,有空应该研究下爬虫了. 不要在意头图,我不会假借各位对某个动漫的爱好然后坑人的.无论是电磁炮吧主那种拿电磁铁糊弄人的奸商,还是逸站靠小林做幌子卖收费破 ...

  8. python手机壁纸超清_python爬虫 爬取超清壁纸代码实例

    简介 壁纸的选择其实很大程度上能看出电脑主人的内心世界,有的人喜欢风景,有的人喜欢星空,有的人喜欢美女,有的人喜欢动物.然而,终究有一天你已经产生审美疲劳了,但你下定决定要换壁纸的时候,又发现网上的壁 ...

  9. php抓取html元素内容 采集网页

    网页抓取就像搜索引擎一个可以去自动抓取其它服务器上的内容了,下面我整理的几个php常用做法,大家一起来看看. 抓取某一个网页中的内容,需要对DOM树进行解析,找到指定节点后,再抓取我们需要的内容,过程 ...

最新文章

  1. 基于Golang的简单web服务程序开发——CloudGo
  2. jmeter对自身性能的优化
  3. 分享.NET 3.5的书籍下载(2009-04-01更新Silverlight 2书籍打包)
  4. Git 学习第二天(一)
  5. 关于pagehelper分页
  6. 天池-新闻推荐-Baseline
  7. Volley源码学习2--cache类
  8. Quartus17下使用Modelsim10进行仿真
  9. RGB与YUV格式(四)
  10. HTML5块元素标签的使用
  11. 8086CPU(汇编语言,王爽)
  12. eas账号是什么意思_请问帐号和账号有什么区别,具体怎么用?
  13. 桌面上计算机程序包能删吗,不小心卸载了windows驱动程序包(电脑上别乱清理了)...
  14. python vue+flask 跨域请求
  15. 人工智能技术发展概述
  16. LTE提高了频谱利用率吗?
  17. java 关键字 保留字_什么是Java关键字和保留字?
  18. 菌外膜囊泡包载的阿霉素纳米粒|巨噬细胞膜囊泡包四氧化三铁二氧化硅纳米粒
  19. This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the foll
  20. SOFTWARE DOWNLOAD

热门文章

  1. go语言 C语言系的更容易,语法接近。
  2. 单片微型计算机系统应用和开发特点,单片微机原理及应用 徐春辉 电子工业出版社习题答案.doc...
  3. 数据库 mysql 表设计,数据删除
  4. 原生ajax XMLHTTPRequest()
  5. typora背景变黑
  6. GoogleNet - Going deeper with convolutions
  7. 记一次信息泄露(被美团泄露出去的)和被诈骗经历
  8. LeetCode 232. Implement Queue using Stacks--用2个栈来实现一个队列--C++解法
  9. anaconda下安装ffmpeg
  10. linux系统中的文件传输