爬取菜鸟教程最新文章标题以及查看链接并写入excel文件中

-- coding:utf-8 --

2018年3月24日

爬取菜鸟教程最新文章列表并写入Excel中

导入爬虫库,正则库、Excel库

from urllib import request

import re

from openpyxl import Workbook

临时存储爬取的内容

wenjian=[["标题","链接"]]

爬取功能

def gettitle():

response=request.urlopen(url)

html=response.read().decode("utf-8")

re_zz=re.compile(r'

.?href="(.?)">(.?)

list=re_zz.findall(html)

for address,title in list:

wenjian.append([title,address])

存储功能

def cunchu():

wb=Workbook()

sheet=wb.active

sheet.title="菜鸟教程"

for i in range(0,len(wenjian)):

for j in range(0,2):

sheet.cell(row=i+1, column=j+1).value = wenjian[i][j]

wb.save("菜鸟教程.xlsx")

入口函数

if name == "main":

for i in range(1,26):

print("正在爬去第%s页....."%i)

url="https://c.runoob.com/examples/page/%s" %i

gettitle()

print("第%s页爬取完毕!"%i)

print("开始存储")

cunchu()

print("写入完毕!")

python爬虫菜鸟教程-Python爬虫学习100练001相关推荐

  1. python爬虫菜鸟教程-Python数据分析,学习路径拆解及资源推荐

    原标题:Python数据分析,学习路径拆解及资源推荐 关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类: 一类是提供各种资源的推荐,比如书单.教程.以及学习的先后顺序: 另一类是 ...

  2. python爬虫菜鸟教程-Python 应该怎么学?

    不多BB,直接上干货! 现在很多学校都已经将Python作为入门的编程语言了,在目前特别火的机器学习.人工智能领域,Python可以说是标配的编程语言. 所以我由浅入深的整理了一些Python的资源和 ...

  3. python qt5菜鸟教程-Python 网络编程

    关于简单实例 Mac 上运行不出来,有几个报错,做了下修改. server.py #!/usr/bin/python # -*- coding: UTF-8 -*- import socket # 建 ...

  4. python爬虫菜鸟教程-python爬虫项目(新手教程)之知乎(requests方式)

    -前言 之前一直用scrapy与urllib姿势爬取数据,最近使用requests感觉还不错,这次希望通过对知乎数据的爬取为 各位爬虫爱好者和初学者更好的了解爬虫制作的准备过程以及requests请求 ...

  5. python菜鸟基础教程-终于懂得python入门菜鸟教程

    Python语言是一种典型的脚本语言,简洁,语法约束少,接近人类语言.有丰富的数据结构,例如列表.字典.集合等.具有可移植性,支持面向过程和面向对象编程,并且开源.以下是小编为你整理的python入门 ...

  6. python基础教程菜鸟教程-终于懂得python入门菜鸟教程

    Python语言是一种典型的脚本语言,简洁,语法约束少,接近人类语言.有丰富的数据结构,例如列表.字典.集合等.具有可移植性,支持面向过程和面向对象编程,并且开源.以下是小编为你整理的python入门 ...

  7. python菜鸟基础教程-python基础菜鸟教程,Python的基础语法

    原标题:python基础菜鸟教程,Python的基础语法 什么是Python?Python是一门简单直观的编程语言,并且目前是开源的,可以方便任何人使用. Python的开发哲学:用一种方法,最好是只 ...

  8. python基础教程菜鸟教程-python基础菜鸟教程,Python的基础语法

    原标题:python基础菜鸟教程,Python的基础语法 什么是Python?Python是一门简单直观的编程语言,并且目前是开源的,可以方便任何人使用. Python的开发哲学:用一种方法,最好是只 ...

  9. python网站开发教程,python在线编程网站

    python学习网站哪个好? python学习网站[达内教育]好,该机构不仅有丰富的教学经验,而且有丰富的Python项目实战经验,会从模拟的Python项目出发,依托真实的Python业务项目,进行 ...

最新文章

  1. 机器学习“七宗罪”:影响可信度的七个常见错误
  2. Oracle RAC 环境下的连接管理(转) --- 防止原文连接失效
  3. python基础7 (来自廖雪峰的官方网站)
  4. 的tree用法_linux命令tree用法
  5. python 线程池_Python线程池及其原理和使用(超级详细)
  6. Django redis的使用
  7. JFlow CCFlow工作流引擎北京培训邀请函
  8. 架构师未来性的基础:简单性
  9. python是什么意思-Python中%是什么意思?python中百分号如何使用?
  10. vue项目中使用axios发送请求
  11. windows10 配置深度学习环境
  12. windowsXP sp3 升级包
  13. 热血传说复古传奇老显示服务器维护,《复古传奇之热血传说》新系列地图,新的装备即将出现...
  14. java 两个图片相似度_JAVA比较两张图相似度
  15. 新概念英语精讲 钟平 pdf_新概念英语三()
  16. java 检测点击事件控件_iCheck控件ifClicked和ifChanged事件的讨论
  17. Docker和Jenkins构建项目总结
  18. showtext matlab,使用MATLAB 2019 App Design 工具设计一个 电子日记App
  19. python求根公式_python与代数
  20. Java学习-面向对象进阶

热门文章

  1. Scrapy选择器和持久化
  2. 信息资源管理——总结
  3. 禁用linux的密码策略
  4. WebComponent魔法堂:深究Custom Element 之 从过去看现在
  5. dts无法识别excel中的数字值?
  6. QT Creator5.14软件的安装与使用(Win7与Ubuntu20.04)
  7. Vijos P1304 回文数【回文+进制】
  8. 树莓派视频监控 —— 使用 mjpg
  9. 物品的名字、品牌的认识
  10. 中英文对照 —— 生物学基本概念