题目:
获取豆瓣TOP250电影的中英文名、港台名、导演、上映年份、电影分类以及评分,将数据存入文档。
代码:

import codecs
import csv
import refrom requests_html import HTMLSessionbase_url = "https://movie.douban.com/top250?start="
# 获取请求对象
session = HTMLSession()
result_list = []def filter(s):if s:s = s.strip()s = re.sub('\s+', ' ', s)s = s.replace(" / ", "/")if s[0] == "/":s = s[1:]s = s.strip()return sfor i in range(0, 10):url = base_url + str(i * 25)response = session.get(url)html = response.htmldiv = html.xpath('//*[@class="grid_view"]', first=True)div_list = div.xpath('//li')for d in div_list:z_name = filter(d.xpath('//div/div[2]/div[1]/a/span[1]/text()', first=True))e_name = filter(d.xpath('//div/div[2]/div[1]/a/span[2]/text()', first=True))g_name = filter(d.xpath('//div/div[2]/div[1]/a/span[3]/text()', first=True))info_list = d.xpath('//div/div[2]/div[2]/p/text()')# 省略部分代码,回复获取else:print(url, z_name, info_list)
csv_file = codecs.open('data/movie_test.csv', 'w', encoding='utf-8')
writer = csv.writer(csv_file)
for d in result_list:writer.writerow((d['中文名'], d['英文名'], d['港台名'], d['导演'], d['上映年份'], d['分类'], d['评分']))
csv_file.close()

输出结果:

python 网络爬虫 1.2 获取豆瓣TOP250电影的中英文名、港台名、导演、上映年份、电影分类以及评分,将数据存入文档。相关推荐

  1. python 网络爬虫 1.3 获取中国天气网8-15天的天气信息,包含: 日期,天气,温度,风力. 将数据存入文档。

    题目: 获取中国天气网8-15天的天气信息,包含: 日期,天气,温度,风力. 将数据存入文档. 代码: from requests_html import HTMLSessionurl = " ...

  2. Python网络爬虫:爬取豆瓣上《小王子》书评

    本文为南大<用Python玩转数据>学习笔记 用到的库或模块: 1.Requests第三方库 用于中小型网络爬虫的信息抓取. 基本方法: requests.get() 请求获取指定YRL位 ...

  3. Python 网络爬虫与信息获取(二)—— 页面内容提取

    1. 获取超链接 python获取指定网页上所有超链接的方法 links = re.findall(b'"((http|ftp)s?://.*?)"', html) links = ...

  4. Python 网络爬虫与信息获取(一)—— requests 库的网络爬虫

    1. 安装与测试 进入 cmd(以管理员权限),使用 pip 工具,pip install requests 进行安装: 基本用法: >> import requests >> ...

  5. python下载电影天堂视频_一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接...

    点击上方"IT共享之家",进行关注 回复"资料"可获赠Python学习福利 [一.项目背景] 相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的 ...

  6. 一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接

    [一.项目背景] 相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的下载,而且不能直观的知道最近电影更新的状态. 今天小编以电影天堂为例,带大家更直观的去看自己喜欢的电影,并且下载下来 ...

  7. python爬虫教程视频下载-利用Python网络爬虫获取电影天堂视频下载链接【详细教程】...

    相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的下载,而且不能直观的知道最近电影更新的状态. 今天以电影天堂为例,带大家更直观的去看自己喜欢的电影,并且下载下来. [二.项目准备] ...

  8. 利用Python网络爬虫获取电影天堂视频下载链接【详细教程】

    相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的下载,而且不能直观的知道最近电影更新的状态. 今天以电影天堂为例,带大家更直观的去看自己喜欢的电影,并且下载下来. [二.项目准备] ...

  9. python下载电影天堂视频教程_一篇文章教会你利用Python网络爬虫获取电影天堂视频下载链接|python基础教程|python入门|python教程...

    https://www.xin3721.com/eschool/pythonxin3721/ [一.项目背景] 相信大家都有一种头疼的体验,要下载电影特别费劲,对吧?要一部一部的下载,而且不能直观的知 ...

最新文章

  1. Oracle的共享封闭 独占封闭和共享更新封闭 (1)
  2. POJ - 3581 Sequence(后缀数组)
  3. 体育测试数据绘图软件,原创健身运动体育测试数据统计app界面
  4. JS中for in 与 for of
  5. 信息学奥赛C++语言: 数字方阵
  6. 用MATLAB将矩阵数据写入txt文件中,打开乱码原因
  7. python16-前端之课堂笔记
  8. 超声主瓣,旁瓣,栅瓣概念解析
  9. Android 四大组件学习之Service四
  10. 【2022最新版】Java基础面试题总结(70道题含答案解析)
  11. MFC之打开(开发)映美精相机
  12. Introduction to 3D Game Programming with DirectX 12 学习笔记之 --- 第二十一章:环境光遮蔽(AMBIENT OCCLUSION)
  13. SecureCRT方向键不可用
  14. Archlinux arm的国内镜像源(for Banana Pi / Raspberry Pi , etc)
  15. vs2017配置opencv4.2及QTcreator配置opencv4.2在界面显示图像
  16. 计算机论文字数要求吗,2016年夏季学期计算机(软件)学院学年论文字数、页数及格式要求.doc...
  17. 没想到吧!玩游戏还能学习编程,这15款编程游戏你一定要看看
  18. java的字典序排序_java实现字典序排序
  19. 【G4基础08】GPS-2-Macro Commands宏命令
  20. Nginx 之父已被释放!

热门文章

  1. C/C++指令集介绍以及优化(主要针对SSE优化)
  2. 设置Word2007默认打开所有文档的显示比例为100%
  3. 100个python算法超详细讲解:黑白子交换
  4. 烟、是一种感情,烟能够忘记一切,也能想起一切
  5. JavaScript 鼠标滚轮事件(实现导航栏上滚显示)
  6. android 标题导航栏,NavigationBar
  7. 三层交换机配置静态路由
  8. openshift 页面-图形化基础介绍
  9. LeetCode每日一题——427. 建立四叉树
  10. 广州火车站网上订票系统-2011年春运订票指南