python爬取淘宝网课,打开web控制台,发现有个链接可以下载到对应的内容,下载的格式是m3u8,用文本打开里面是许多.ts链接,当然百度后得知可以直接下个vlc然后下载,但是还是想用python试一试。

我得做法是自己从网页上将15节课的获取m3u8的链接复制粘贴到一个文本里;然后用requests.get.text  分别写入15个空文本中;接着从每个文本将链接(可以获取到.ts视频的链接)遍历为列表之后,再用列表中的每个url进行r=requests.get()。但是此时的r.status_code是404,获取不到r.content。但是我要是直接将可以获得.ts视频的链接直接复制粘贴为url,此时这个链接便可以获取到对应的视频,求解答这是怎么回事?

import linecache
import requests
import os
#i need learn about the re module
#观察发现每个文本都是第六个开始为.ts链接,直到倒数第二个,每个两链接之间隔一个注释

for name in range(15):
    filename3='E:/pycharm/python crawler--taobao‘s internet courses/txt/'+str(name)+'.txt'
    ts_url_list = linecache.getlines(filename3)
    os.makedirs('E:/pycharm/python crawler--taobao‘s internet courses/' + str(name) + '/')
    for num in range(5,len(ts_url_list),2):
        print(ts_url_list[num])
        r=requests.get(str(ts_url_list[num]))
        if r.status_code == 200:
            path_name = 'E:/pycharm/python crawler--taobao‘s internet courses/' + str(name) + '/' + str(num) + '.mp4'
            with open(path_name,'wb') as file_object:
                file_object.write(r.content)
                file_object.close()

        else:
            print(r.status_code)
            break

python 爬取淘宝网课相关推荐

  1. 用Python爬取淘宝网商品信息

    用Python爬取淘宝网商品信息 转载请注明出处 网购时经常会用到淘宝网 点我去淘宝但淘宝网上的商品琳琅满目,于是我参照中国大学 MOOC的代码写了一个爬取淘宝网商品信息的程序 代码如下: impor ...

  2. python爬淘宝app数据_一篇文章教会你用Python爬取淘宝评论数据(写在记事本)

    [一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. [二.项目准备工作] 准备Pycharm,下载安装等,可以参考这篇文章 ...

  3. python电商数据挖掘_利用Python爬取淘宝商品并数据挖掘与分析实战!此乃大型项目!...

    项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...

  4. python爬取淘宝商品图片

    python爬取淘宝商品的图片 话不多说,直接上代码: from selenium import webdriver from selenium.webdriver.common import key ...

  5. Python爬取淘宝女模特信息

    前言 Python爬取淘宝美女信息下载本地并同时存储mysql数据库,存储数据库用到了pymysql模块,sql语句简单好用,直接上代码,源码请点链接Python-Spiders文集. 项目结构: 本 ...

  6. 第一篇博客,python爬取淘宝信息

    python爬取淘宝信息 本人只是刚学python的菜鸟,代码不规范及需改进的地方请指教 我们直接看代码吧!哈哈 import requests from bs4 import BeautifulSo ...

  7. Python爬虫实战(5)-爬取淘宝网服装图片(Selenium+Firefox)

    前言 今天我们巩固一下前面学过的知识,通过Selenium+Firefox实现模拟浏览器并自动翻页,爬取图片并写入本地文件中. 以搜索"女装"为例,自动爬取"女装&quo ...

  8. 用Python爬取淘宝2000款套套,我发现了一个重要秘密

    点击上方"码农突围",马上关注,每天早上8:50准时推送 真爱,请置顶或星标 一.淘宝商品信息爬取 这篇文章主要是讲解如何爬取数据,数据的分析放在下一篇.之所以分开是因为爬取淘宝遇 ...

  9. python爬取淘宝商品做数据挖掘

    作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159 项目内容: 本项目选择 淘宝商品类目:零食 数量:一共100页,44 ...

最新文章

  1. linux centos 7 bash升级到5.0
  2. 【原创】MySQL 返回更新值(RETURNING)
  3. 同行不支持鸿蒙系统,鸿蒙系统虽好,但也需要国内同行支持
  4. 解决:-source 1.6 中不支持 diamond 运算符 [ERROR] (请使用 -source 7 或更高版本以启用 diamond 运算符)
  5. putty如何登陆oracle,利用putty的SSH tunnel连接Oracle
  6. 最近,华为应用市场上线了一个服务
  7. pathlib2 Path glob rglob的最新研究成果
  8. chrome谷歌浏览器离线安装axure插件打开页面原型
  9. php getimagesize 导致系统变慢
  10. windows10关闭系统更新方法总结
  11. Git Bash 下进行快速复制粘贴
  12. [C/C++]跳格子游戏 - 2019校招编程刷题
  13. MATLAB和Python求解非线性常微分方程
  14. java代码审计_Java代码审计入门篇
  15. Drupal7_2:安装drupal
  16. 低代码对比分析,从工程化上看产品的优劣
  17. 亚马逊 CTO 预测2021:八大技术趋势改变世界
  18. 摩尔斯电码(Python字典实现)
  19. 赝势平面波计算机软件,第3章 赝势平面波方法(i).doc
  20. 【小河今学 | JavaScript + JQuery】音乐播放器4-音量调整、单曲循环、全部循环

热门文章

  1. a计权声功率级计算公式_超高层建筑气动噪声总声压级和A计权声压级的计算
  2. Java:现实世界中最流行的10个Java应用程序示例
  3. 互联网公司产品经理要求及需要掌握的技能
  4. 安全运维到安全运营的转变
  5. 面试中java 知识点
  6. C#生成条形码图片的简单方法
  7. HTTP请求返回状态码
  8. indesign页眉如何左右分布_InDesign排版技巧
  9. 煤气检测与报警程序C语言,基于单片机的煤气检测报警系统毕业设计.doc
  10. 小程序中如何实现即时通信聊天功能?