from    bs4     import BeautifulSoup
from selenium import webdriver
import timedef     main():driver = webdriver.Firefox()#用FireFox来渲染,chrome也可以,不过还要下载相应的exe文件driver.get('http://book.km.com/chapter/1462907_3.html')//小说的内容是用ajax取得的,普通的静态下载不下来time.sleep(4)srcCode = driver.page_source#获取渲染后的源码soup = BeautifulSoup(srcCode,"lxml")article = soup.find('div',{"class":"article-body"})#查找文章的位置if article!=None:print(article.text)
if      __name__=="__main__":main()


这里的一篇好文章:selenium用法

python爬取动态网页的内容相关推荐

  1. python爬取动态网页图片

    爬取某知名网站图片(爬取动态网页) python爬取动态网页图片 python爬取动态网页图片 环境: python3.pycharm 库: requests.urllib.json 思路: 1.分析 ...

  2. 用python爬取动态网页上的图片(百度图片)

    用python爬取动态网页上的图片(百度图片) 参考B站一个视频,视频链接: https://www.bilibili.com/video/BV1Va4y1Y7fK?share_source=copy ...

  3. python爬取动态网页_python爬取动态网页数据,详解

    原理:动态网页,即用js代码实现动态加载数据,就是可以根据用户的行为,自动访问服务器请求数据,重点就是:请求数据,那么怎么用python获取这个数据了? 浏览器请求数据方式:浏览器向服务器的api(例 ...

  4. Python爬取动态网页实例讲解

    笔者在做爬虫作业时,遇到了一个动态网页,分析代码网页源代码时因此就少了许多需要的元素.下面用一个实例来记录一下爬取动态网页的步骤. 实例:股票定向爬虫 这个实例目标是从东方财富网获取股票列表,然后根据 ...

  5. python爬取动态网页图片_python爬虫之爬取动态加载的图片_百度

    运行坏境 python3.x 选择目标--百度 当我们在使用右键查看网页源码时,出来的却是一大堆JavaScript代码,并没有图片的链接等信息 因为它是一个动态页面嘛.它的网页原始数据其实是没有这个 ...

  6. python爬虫怎么爬同一个网站的多页数据-请问爬虫如何爬取动态页面的内容?

    现在网页大多是动态网页,尤其是内容丰富,值得爬取的网站,几乎无一例外是动态的,比如狗东.淘宝和知乎,而且还有不少反爬手段,这些都大大提升了爬虫难度,尤其是淘宝,为了反爬不惜影响到正常用户使用. 面对这 ...

  7. chrome动态ip python_用Python爬虫爬取动态网页,附带完整代码,有错误欢迎指出!...

    系统环境: 操作系统:Windows8.1专业版 64bit Python:anaconda.Python2.7 Python modules:requests.random.json Backgro ...

  8. python动态页面元素爬取_爬取动态网页python+Web kit

    上一篇文章爬取动态网页python+selenium+webdriver介绍了爬取动态网站的一种模拟浏览器的方法,该方法的优劣也很明显 优: 可以模拟任何人的操作,输入账号密码,点击登录等等操作 劣: ...

  9. Python之网络爬虫(selenium爬取动态网页、爬虫案例分析、哈希算法与RSA加密)

    文章目录 一.selenium爬取动态网页 二.爬虫案例分析 三.哈希hash算法与RSA加密 一.selenium爬取动态网页 1.动态网页认知 爬虫其实就是在模仿浏览器的行为 应对要多次数据的交互 ...

最新文章

  1. win10应用开发——如何判断应用是在手机上运行还是电脑上运行
  2. 微信小程序页面上面的名字怎么改_微信小程序改名方法,小程序名称设置规范...
  3. Js跨域请求jquery的jsonp方式
  4. DataGrid中的高级ToolTip
  5. 李笑来 css,李笑来都想投资千万美金的ACSS通证即将强势登陆奇点交易所
  6. pycharm matplotlib 图片显示
  7. vivo C/C++工程师视频面试总结 20180802
  8. 检查电脑是否被安装***三个小命令
  9. mysql删除所有存储过程_mysql 删除所有存储过程
  10. CentOS 7 怎样安装或升级最新的内核?
  11. c++中的c_str()函数
  12. 条码软件如何制作SCC-14条形码
  13. 清华计算机录取通知书,清华送出第一批录取通知书,这些被刷屏的学霸,有怎样的成长密码...
  14. linux的SIGCHLD信号
  15. java.util.zip 类 ZipEntry
  16. HP小型机系统管理员必读
  17. 【STM32篇】驱动MXL90614红外测温模块
  18. 工作五年以上的程序员,应该干些什么
  19. 贝叶斯优化调参-Bayesian optimiazation原理加实践
  20. Matlab中遇到~=

热门文章

  1. 成功解决ModuleNotFoundError: No module named 'HTMLParser'
  2. 成功解决Ubuntu下的make: gcc: Command not found Makefile:85: recipe for target 'obj/gemm.o' failed make: **
  3. MAT之GA:GA优化BP神经网络的初始权值、阈值,从而增强BP神经网络的鲁棒性
  4. BZOJ3697: 采药人的路径(点分治)
  5. 静态方法和实例化方法的区别 -转载
  6. 洛谷U4807抽水机[最小生成树]
  7. IAR之函数和变量的绝对地址定位
  8. Linux内核中断底半部处理--工作队列
  9. cmake (2)build方面的指令
  10. 多索引表 (4)multi_index.hpp源代码