博问上到有人问的,后自己帮他代码修正了一下,其实蛮简单的一个爬虫

代码以及思路

from requests_html import htmlsession

session = htmlsession() #定义一个session对象,和reuqests模块中的session是一样的

def get_movie():

movie_list=[]

for i in range(0, 10): #前250名

print(f'{i+1}页')

link = f'https://movie.douban.com/top250?start={i*25}' #这里呢稍微点几页你就知道规律了

print(link)

response = session.get(link) #这里很多人都有误区总是喜欢加user-agen,个人感觉他反爬的时候用到这个再加,人家都没设这方面的反爬加了也没啥意义

div_list = response.html.find('.info') #你也可以获取info类下的电影信息

for each in div_list:

movie = each.text #获取里面所有字符串

movie_list.append(movie) #加列表你可以存数据库,这随意

return movie_list

if __name__ == '__main__':

print(get_movie())

希望与广大网友互动??

点此进行留言吧!

python爬取豆瓣电影排行榜_爬取豆瓣电影排名的代码以及思路相关推荐

  1. python爬取b站排行榜_抓取+硒元素,获得Bilibili排行榜(紧急列表)(动态加载),scrapyselenium,获取,哔哩,应援...

    目标数据: 爬虫代码: # -*- coding: utf-8 -*- import scrapy from bilibili_yy.items import BilibiliYyItem impor ...

  2. python爬取b站排行榜_实时爬取B站排行榜并保存为表格——每周一个爬虫小教程系列...

    从这周开始,每周来一个爬虫小教程,希望对你们有所帮助,这次的目标是B站排行榜至于爬取什么内容,目前感觉就把序号,名称以及评分爬取下来吧(因为我是边写教程边写代码的) 这次需要用到的知识:Request ...

  3. Python爬虫-CSDN博客排行榜数据爬取

    文章目录 前言 网络爬虫 搜索引擎 爬虫应用 谨防违法 爬虫实战 网页分析 编写代码 运行效果 反爬技术 前言 开始接触 CTF 网络安全比赛发现不会写 Python 脚本的话简直寸步难行--故丢弃 ...

  4. python爬取表格数据匹配_爬取表格类网站数据并保存为excel文件

    本文转载自以下网站:50 行代码爬取东方财富网上市公司 10 年近百万行财务报表数据 https://www.makcyun.top/web_scraping_withpython6.html 主要学 ...

  5. python猫眼电影分析_抓取猫眼电影

    注意:抓取内容之前一定要查看下Robots协议 1.准备工作 1>第一步,安装python,安装requests.json库. 2.抓取分析 1>接下来我们打开网页分析下猫眼电影排行榜 2 ...

  6. 下取整函数的含义_向上取整⌈⌉和向下取整⌊⌋符号含义及应用

    向上取整, 运算称为 Ceiling,用数学符号 ⌈⌉  (上有起止,开口向下)表示,. 向下取整,运算称为 Floor,用数学符号⌊⌋(下有起止,开口向上)表示. 注意,向上取整和向下取整是针对有浮 ...

  7. 同大取大同小取小口诀图解_不等式取值口诀

    不等式就是用大于,小于,大于等于,小于等于连接而成的数学式子.不等式的取值口诀为同大取大,同小取小.大大小小没有解,大小小大取中间. 不等式取值口诀 同大取大,同小取小. 大大小小没有解,大小小大取中 ...

  8. 用python写一个有AI的斗地主游戏(二)——简述后端代码和思路

    源码请看我的Github页面. 这是我一个课程的学术项目,请不要抄袭,引用时请注明出处. 本专栏系列旨在帮助小白从零开始开发一个项目,同时分享自己写代码时的感想. 请大佬们为我的拙见留情,有不规范之处 ...

  9. python爬取音乐网站排行榜_通过Python轻松访问音乐网站歌曲,python,爬取

    准备工作: 1.在已经安装python开发环境的情况下,还需安装第三方库:requests,安装教程可以参考: 2.对目标网站进行分析,获取目标文件链接 目标文件:第一页中的20个音乐文件 获取到歌曲 ...

最新文章

  1. 激光雷达(LiDAR)点云数据知多少?
  2. Qt程序启动画面播放(gif与swf两种动画格式)
  3. 调试中的一些Python错误
  4. 选购工业交换机时,工业交换机的IP等级多少比较合适?
  5. Windows Server 2008 R2 安全加固
  6. 1.790E308java_java基础知识总结
  7. python keyboard库_python利用 keyboard 库记录键盘事件
  8. LeetCode(852)——山脉数组的峰顶索引(JavaScript)
  9. 搭建移动端布局框架:整合flex
  10. 分布式事务处理学习报告
  11. 牛客《机器学习》习题收集整理
  12. Android开发中需要用到的常见APP对应包名
  13. TCTrack: Temporal Contexts for Aerial Tracking
  14. 英语高考听力测试软件,高考英语听力训练app
  15. 沁恒微USB蓝牙单片机CH573F初步熟悉
  16. 半孔板设计需要注意细节问题
  17. 风控数据来源及分析技巧
  18. 我的世界java版高效率刷怪塔_我的世界超高效率刷怪塔制作教程 砍怪砍到手抽筋...
  19. 【文章】夏至——郭敬明
  20. Adreno Profiler 提取手机游戏资源

热门文章

  1. HDU 5666 Segment 数论+大数
  2. 利用Pattern和Mather来禁止特殊字符的输入
  3. Mysql查询高速缓存区
  4. 求平均值 Avg.java
  5. 华为牛人在华为工作十年的感悟!--总结[华为的10年工作]
  6. css hack 记录
  7. zabbix-server无法启动
  8. VBA代码执行过程中,显示程序的运行状态
  9. php opcodes 还原代码,深入理解PHP原理之Opcodes(PHP执行代码会经过的4个步骤是什么)...
  10. 【Linux】SecureCRT中按退格键出现^H