抓取文章数据保存在本地

#coding=utf-8
import urllib
import redef getHtml(url):page = urllib.urlopen(url)html = page.read()return htmldef getImg(html):reg = r'src="(.+?\.jpg)" pic_ext'imgre = re.compile(reg)imglist = re.findall(imgre,html)x = 0for imgurl in imglist:urllib.urlretrieve(imgurl,'%s.jpg' % x)x+=1html = getHtml("http://www.chtml.cn/")
#这里可以直接保存到数据库中,作为测试这里打印给大家看
print getImg(html)

python抓取页面数据实例相关推荐

  1. 爬虫抓取页面数据原理(php爬虫框架有很多 )

    爬虫抓取页面数据原理(php爬虫框架有很多 ) 一.总结 1.php爬虫框架有很多,包括很多傻瓜式的软件 2.照以前写过java爬虫的例子来看,真的非常简单,就是一个获取网页数据的类或者方法(这里的话 ...

  2. 知乎爬虫之4:抓取页面数据

    git爬虫项目地址( 终于上传代码了~~~~关注和star在哪里):https://github.com/MatrixSeven/ZhihuSpider(已完结) 附赠之前爬取的数据一份(mysql) ...

  3. python 抓取网页数据

    python 抓取网页数据 此文解决如何从不同网页爬取数据的问题及注意事项,重点说明requests库的应用. 在开始之前,要郑重说明一下,不是每一个网页都可以爬取数据哦.有的网页涉及个人隐私或其他敏 ...

  4. java 爬数据工具 知乎_知乎爬虫之4:抓取页面数据

    本文由博主原创,转载请注明出处:知乎爬虫之4:抓取页面数据 咱们上一篇分析了知乎的登陆请求和如何拿到粉丝/关注的请求,那么咱们这篇就来研究下如何拿利用Jsoup到咱们想要的数据. 那么咱们说下,首先请 ...

  5. PHP利用正则表达式抓取页面数据

    PHP利用正则表达式抓取页面数据 (记录一下,00后程序员第一天写博客,2021/4/1) (抓取招头标网站中的数据) <?php header('Content-Type:text/html; ...

  6. python抓取美女图片实例

    原文链接:python抓取美女图片实例 python脚本编程,和php类似,主要是作web项目及脚本抓取图片和文章.日志分析等,python比较有名的web开发框架有Django.Tornado.we ...

  7. python抓取动态数据 A股上市公司基本信息

    1.背景 之前写的抓取A股所有上市公司信息的小程序在上交所网站改版后,需要同步修改 pyton2.7.9 2.分析过程 以抓取宇通客车[600066]信息为例 打开网址http://www.sse.c ...

  8. vs2015编写python爬虫_使用Python抓取网页数据(一)

    iOS python 爬虫 LoL 学习iOS开发有一段时间了,最近想做一个自己的App玩玩,自己比较喜欢玩LOL,所以想试着做一个LOL资料库的App,那么问题来了,这么多英雄,物品等数据怎么获取呢 ...

  9. python抓取数据库数据_Python爬虫抓取东方财富网股票数据并实现MySQL数据库存储...

    Python爬虫可以说是好玩又好用了.现想利用Python爬取网页股票数据保存到本地csv数据文件中,同时想把股票数据保存到MySQL数据库中.需求有了,剩下的就是实现了. 在开始之前,保证已经安装好 ...

最新文章

  1. 合并两个有序数组(重新开始)
  2. 普通平键的主要尺寸有_快来收下这份家装尺寸表,衣柜不再鸡肋
  3. iOS程序启动过程笔记
  4. error MSB8008: 指定的平台工具集(v110)未安装或无效。请确保选择受支持的 PlatformToolset 值
  5. C#事件(Event)的理解
  6. Java黑皮书课后题第10章:10.21(被5或6整除)找出能被5或6整除的大于Long.MAX_VALUE的前10个数字
  7. python3下载文件
  8. ios高级开发之多线程(一)
  9. PRML-系列一之1.2
  10. jQuery环境搭建
  11. Android ListView中 每一项都有不同的布局
  12. 数据库开发 - 事务 死锁分析与解决
  13. 关于本地缓存localstorage与sessionStorage 数组 (array)字符串(string) 对象(object)的存储技巧和注意事项...
  14. mysql pxc搭建_MySQL(PXC)集群搭建
  15. 计算机设备管理没有打印机,win7电脑找不到打印机设备怎么办
  16. 英文字体“磅”(Point)和中文字号的关系
  17. BERT模型--transflow转为pytorch
  18. 上传文件到gitee仓库的步骤
  19. 第二章 Selenium-API操作
  20. RenderSystem_Direct3D9_d 不能加载

热门文章

  1. 阿里云MVP第六期发布——覆盖全球20多个国家和地区,成为数字化转型的中坚力量...
  2. GoldenGate单向复制配置(支持DDL复制)
  3. 使用Laravel Eloquent ORM 时如何查询表中指定的字段
  4. Java对象转出json并过滤指定属性
  5. java的System.getProperty()方法可以获取的值
  6. Google Protobuf 开发指南
  7. WPF 自定义 MessageBox (相对完善版 v1.0.0.6)
  8. 软件测试基础知识(三)
  9. centos5.3安装vmware
  10. 【转载】指导教师的WZ132