前言

嗨喽,大家好呀~这里是爱看美女的茜茜呐

素材、教程、代码、插件安装教程我都准备好了,直接点击此处跳转文末名片领取

环境:

  • python 3.8

  • pycharm 2022.3专业版

模块:

  • requests

第三方模块安装:

requests 是导入数据请求模块,属于第三方模块,

需要在cmd里面或者pycharm终端里面进行安装 pip install requests 安装。

代码实现步骤:

  1. 发送请求

  2. 获取数据

  3. 解析数据

  4. 保存数据

采集网站:

代码展示:

(这里网址我就屏蔽啦~你们自行添加或文末名片获取完整代码)

导入数据请求模块

import requests

请求链接

url = 'https:// ******** /mtangdou/home/feed?page=2&num=32&uuid=1672409139172_3256'

伪装

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}

发送请求

response = requests.get(url=url, headers=headers)

for循环遍历, 键值对取值

for index in response.json()['data']:video_id = index['vid'] # videoIDtitle = index['title'] # 标题print(video_id, title)

字符串格式化方法, 把ID传入到字符串中

    link = f'https://******/mtangdou/video/play?vid={video_id}&uuid='

发送请求获取json数据

    json_data = requests.get(url=link, headers=headers).json()

字典取值 提取播放链接

    play_url = json_data['data']['play_url']print(play_url)

伪装请求头

    headers_1 = {'Referer': 'http://******/','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'}

发送请求 获取视频二进制数据

    video_content = requests.get(url=play_url, headers=headers_1).content

数据保存

    with open('video\\' + title + '.mp4', mode='wb') as f:f.write(video_content)

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦

Python案例: 采集糖豆网站的数据内容相关推荐

  1. Python就业前景怎么样?来用Python采集一下招聘网站的数据信息吧

    前言 学习python的就业前景怎么样呢,不妨我们用python来采集一些招聘网的数据信息,看看行情怎么样 前期准备 模块使用 requests pandas pyecharts 开发环境 版 本: ...

  2. Python批量采集亚马逊商品数据 (含完整源代码)

    前言 嗨喽 ! 大家好吖,这里是魔王~ 亚马逊公司,是美国最大的一家网络电子商务公司,位于华盛顿州的西雅图 是网络上最早开始经营电子商务的公司之一,亚马逊成立于1994年 今天教大家用Python批量 ...

  3. 单身福利专场, Python采集某相亲网站美女数据

    前言 嗨喽~大家好呀,这里是魔王呐 ❤ ~! 现在,广大年轻人到了一定年纪,一定会引来父母的念叨 不是让相亲就是让结婚的,与其父母念叨,不如自己找一个 到时候问起来,就说再接触呢~~ 今天我们就来用p ...

  4. 什么品种的猫最受欢迎?Python爬取猫咪网站交易数据

    本篇文章是关于某化妆品企业的销售分析.从分析思路开始带大家一步步地用python进行分析,找出问题,并提出解决方案的整个流程. 以下文章来源于修炼Python 作者:叶庭云 Python爬虫.数据分析 ...

  5. Python爬虫-采集某车平台二手车数据

    前言 本文是该专栏的第19偏,后面会持续分享python的干货知识,记得关注. 想要获取汽车价格信息的平台有很多,或者是想购买新车又或是想置换新车的朋友来说,能及时了解汽车的价格行情那是自然非常方便, ...

  6. Python案例——采集专栏文章保存成pdf

    前言 嗨喽,大家好呀~这里是爱看美女的茜茜呐 环境使用: python 3.8 >>>>>> 运行代码 pycharm 2022.3 >>>> ...

  7. Python 批量采集 shopee 虾皮商品详情数据、多站点整站实时采集

    一.如何通过手动方式查看 shopee 商品详情页面的数据 1.Shopee 商品详情 API 接口(item_get - 获得 Shopee 商品详情接口),ShopeeAPI 接口代码对接可以获取 ...

  8. Python之采集速卖通商品数据

    访问网页类: 1.模拟浏览器登陆,获取cookies 2.利用requests访问页面源码 3.cookies具有时效性,如果超出设定时间则重新登陆并更新它 class Browser:req = N ...

  9. 利用爬虫爬取看看豆网站站的数据信息

    其实很早我就开始关注爬虫技术,这两天特别学习了一下,并且做了一个简单的demo.爬取了看看豆网站的数据信息.总共11751本书,爬取了不到3个小时,基本每秒爬取1条.速度慢的原因主要是单线程,使用my ...

最新文章

  1. 怎么判断间隙过渡过盈配合_什么是配合间隙过盈过渡配合
  2. rsync+inotify-tools实现文件的实时同步
  3. 最短路径问题(Floyd算法)
  4. Python2.x爬虫入门之URLError异常处理
  5. CCF201409-5 拼图(30分)
  6. swift date 计算差_[Swift 设计模式] 适配器
  7. Linux下搭建FTP服务器笔记
  8. 【Redis】Redis 使用 redisson 做分布式锁 复盘 maven 依赖 netty 冲突
  9. 修改linux默认语言
  10. 析构函数为虚函数的必要性
  11. SPI FLASH 波形测量演示实例
  12. 迄今为止最优秀的配色R包
  13. E4A影视APP源码电视盒子酷点TV版4.5 后端对接苹果cms
  14. C语言二级题库(刷题软件+60套真题+填空题+大题)2022年9月份新题第三套
  15. HBase2.x_base
  16. 计算机专业专科可以进的国企,专科毕业生想进国企?这三大专业不要错过,成功率高达60%...
  17. 虚拟服务器hydra,使用hydra构建六大服务器及混合服务器
  18. 什么事,是你当了领导才明白的?
  19. 说说电商直播的一些优势
  20. 运动健身行业门店运营管理解决方案

热门文章

  1. POI excel 单元个的内容 自适应行高
  2. android 矢量图 背景 ui,Android:使用矢量图图标库+9-patch图进行UI设计
  3. 软件需求:ERP溯源管理系统,生产型企业管理软件,集物料、产品、采购、生产、进销存
  4. windows黑客编程系列(九):使用ntdll.dll中并未公开的API进行压缩
  5. J1939故障码诊断说明
  6. tp5分页后数据处理
  7. 211非计算机专业如何转行IT?加入超级实习生就行吗?
  8. 分享一下电信IPCC 41.1 IPCC
  9. 求医问药 ESB助力医疗SOA完美落地
  10. Android App Crash详解