现在大部分的影视系统都支持自动化采集,只需要在后台配置即可。但是如果需要个性化采集,比如我们对采集资源关联了豆瓣评分信息,而这种关联一般是一条条的电影信息去和豆瓣信息匹配的,此时采用自动化采集就有问题了。今天我们就谈下如何自己封装自动化采集代码。
1)调用原始视频资源,获取视频列表信息,一般api就会返回视频列表信息。如 "page":{ "pageindex":"1","pagecount":"970","pagesize":"40", "recordcount":"38762"}。从上面的信息,可以看出当前的视频共970页,每页40条,共38762条记录。至此,通过在url里通过get传递参数,比如参数pnu m代表指定记录的指针,total代表总数,即recordcount值,当当前的pnum不超过total时,采集视频记录,并且把指针增加1,移动到下一条记录。
2)如何实现url自动跳转呢?很简单,我们只要使用到<script language='javascript'>function refresh(){location.href = '/caiji/today.php?url=".$_GET['url']."&pnum=".$pnum."&total=".$total."';}setTimeout('refresh()', 20000);</script>。其中的20000代表20秒后,自动刷新页面location.href地址。
3) 采集还有最重要的一块,即怎样把视频采集到视频库里呢?其实很简单,我们只要找到影视系统的采集时的url即可。比如以博士影院使用的苹果影视系统,找到后台采集时使用的地址:/admin.php/admin/collect/api.html?ac=cjhide&cjflag=".$cjflag."&cjurl=".$cjurl."&h=&t=&ids=".$vodid."&wd=&type=&mid=&param=&page=&limit=。然后我们通过curl模拟采集即可。ps:可以使用抓包工具获取采集使用的页面地址。
4) 虽然找到了后台视频采集地址,但采集肯定都是登陆状态下才行,为了不和日常的管理帐号冲突,我们新建一个独立的采集用户,然后也用curl模拟登陆,并记录cookies信息,这样就能采集电影信息了。![在这里插入图片描述](https://img-blog.csdnimg.cn/20191121210018160.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2thb2thb3FpYW5n,size_16,color_FFFFFF,t_70)

IT漫话第四篇:电影网站自动化采集相关推荐

  1. 用python实现苹果cms电影网站的自动采集

    苹果cms电影网站的自动采集 用苹果cms搭建的电影网站,采集影片可以通过后台的自定义资源库链接资源网站.这种方式简单易操作.但是问题是采集的时候只有两种属性可以选择,一是可以选择影片类型,二是可以有 ...

  2. 海外多语言国际婚恋相亲网站开发制作,第四篇

    第一篇:https://blog.csdn.net/weixin_43144260/article/details/113852613 第二篇:https://blog.csdn.net/weixin ...

  3. python在线电影网站-四

    VISION在线电影网站一4 目录 django具体实现 一.新建项目 配置环境 新建项目 启动Django项目 二.Django根据数据库表生成Model 1.修改setting文件 2.根据数据库 ...

  4. 爬虫第四篇-爬虫对网站改版快速解决思路

    采集数据时难免遇到采集网站的页面改版,快速解决页面改版对解析的影响对业务稳定性有重要影响 ##页面改版的影响 针对不同的解析网站,影响程度不一,一般资讯类影响最小,表格类和报告类影响最大 资讯类网站 ...

  5. HTML5期末大作业:在线电影网站设计——电影速递网(12页面)含登录注册HTML+CSS+JavaScript

    HTML5期末大作业:在线电影网站设计--电影速递网(12页面)含登录注册HTML+CSS+JavaScript 临近期末, 你还在为HTML网页设计结课作业,老师的作业要求感到头大?HTML网页作业 ...

  6. HTML5期末大作业:电影网站设计——电影资讯博客(5页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 web学生网页设计作业源码

    HTML5期末大作业:电影网站设计--电影资讯博客(5页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 web学生网页设计作业源码 常见网页设计作业 ...

  7. HTML5期末大作业:电影网站设计——漫威电影(2页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 web学生网页设计作业源码...

    HTML5期末大作业:电影网站设计--漫威电影(2页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 web学生网页设计作业源码 常见网页设计作业题材 ...

  8. HTML5期末大作业:电影网站设计——指环王:护戒使者(13页) HTML+CSS+JavaScript

    HTML5期末大作业:电影网站设计--指环王:护戒使者(13页) HTML+CSS+JavaScript 期末作业HTML代码 学生网页课程设计期末作业下载 web网页设计制作成品 大学生毕设网页设计 ...

  9. HTML5期末大作业:在线电影网站设计——我不是药神电影介绍(4页) HTML+CSS+JavaScript 大二实训大作业HTML源码...

    常见网页设计作业题材有 ​​个人. 美食. 公司. 学校. 旅游. 电商. 宠物. 电器. 茶叶. 家居. 酒店. 舞蹈. 动漫. 明星. 服装. 体育. 化妆品. 物流. 环保. 书籍. 婚纱. 军 ...

最新文章

  1. CVPR 2020 | 基于多智能体RL实现多轮连续交互,IteR-MRL使图像分割算法达到医用标准...
  2. mybatis-plus中的问题总结
  3. 通过python里面的pyautogui自动化控制鼠标和键盘操作
  4. 处理大并发的30条数据库规范
  5. SAP Spartacus Definition of Done
  6. 实验心得_大肠杆菌原核表达实验心得(上篇)
  7. 新版手机浏览器_夸克浏览器发布全新3.0版,AI技术创新智能化信息服务
  8. 95-35-010-Topic-Topic的新建 源码解析
  9. jQuery Mobile中滑动块range的data-*选项
  10. Java 面向对象 之 多态实例2
  11. Clojure 学习入门(5)- 关键字
  12. 用Asp.net制作顶部导航控件
  13. css的写法 有点凌乱(养成这习惯 神马浏览器兼容都是浮云 so easy)
  14. 从Slice_Header学习H.264(三.2)--相关细节之 参考图像列表
  15. unity 自动生成脚本
  16. 在Postfix里给邮箱定虚拟别名
  17. 对现有计算机应用的建议,对计算机课程的建议
  18. R中怎么做加权最小二乘_R方的理解与用法
  19. python背景色渐变_Python 生成纯色或渐变色图片
  20. 如何认识和投身 Web 3.0?

热门文章

  1. 工业互联网:2 设备端(3)
  2. 图像去噪 - 使用自编码器或GAN模型在含噪声图像上进行去噪处理。
  3. 加油站通过AI算法完成智能化改造解决方案
  4. CUDA stream 与 CUDA event 详解
  5. matlab fmincon 怎样停止,请教:matlab 中关于 fmincon 函数问题
  6. WebGIS空间寻径算法设计(车辆自驾导航算法)
  7. Unity3D 场景切换异步加载进度
  8. 网安学习Day15-MISC(上)
  9. 活动抽奖Java抽奖算法
  10. 300万年薪招不到人,谁能胜任首席安全官?