获取永久资源网电影分类下每页的URL

from selenium import webdriverdef reseach_list():driver=webdriver.Chrome() #调用chrome浏览器head_url = 'http://www.yongjiuzy1.com/?m=vod-type-id-'middle_url = '-pg-'till_url = '.html'url_list = []href_list = []movie_name = []main_data =[]for i in range(1):for j in range(1):url_list.append(head_url+str(i+1)+middle_url+str(j+1)+till_url)for items in url_list:driver.get(items)for link in driver.find_elements_by_xpath('//*[@id="data_list"]/tr/td[1]/a'):href_list.append(link.get_attribute('href'))movie_name.append(link.get_attribute('text'))main_data.append(href_list)   main_data.append(movie_name)   return main_data
reseach_list()

获取电影名

main_data = reseach_list()
print(main_data[1])
L = []
for items in main_data[1]:L.append(items[0:-10])
print(L)
main_data.append(L)
print(main_data[2])

获取电影播放地址

from selenium import webdriverdriver=webdriver.Chrome() #调用chrome浏览器href_list = main_data[0]movie_list = []
for link in href_list:driver.get(link)for link in driver.find_elements_by_xpath('/html/body/div[4]/div[2]/div/div/ul/li[2]/input'):movie_list.append(link.get_attribute('value'))
#     for url in driver.find_elements_by_xpath('/html/body/div[4]/div[2]/div/div/ul/li/input'):
#     url_list.append(link.get_attribute('textContent'))
# print(url_list)
def move(url_list):list_ = []for url in url_list:list_.append(url[5:])return list_
move(movie_list)

电影资源详细信息爬取相关推荐

  1. 用Scrapy对豆瓣top250进行电影详细信息爬取

    简述 为了练习简单的Pandas操作,我用Scrapy爬取了豆瓣Top250的电影信息.Top250页面展现的电影信息和具体电影页面所呈现的内容有些不同(比如演员信息),所以爬取总共用了两部分代码.此 ...

  2. 爬取电影资源之网页爬取篇(python)

    不知道大家平常喜不喜欢待在宿舍一个人看电影? 作为一个高龄屌丝,电影对我来说是必不可少的.平常无聊时自己一个人待在宿舍看看电影,看看书. (人闲下来就会胡思乱想,不能让寂寞侵蚀自己的内心) 其实还是喜 ...

  3. python找电影资源_Python爬虫爬取BT之家找电影资源

    head.jpg 一.写在前面 最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越 ...

  4. python爬电影资源_Python爬虫爬取BT之家找电影资源

    一.写在前面 最近看新闻说圣城家园(SCG)倒了,之前BT天堂倒了,暴风影音也不行了,可以说看个电影越来越费力,国内大厂如企鹅和爱奇艺最近也出现一些幺蛾子,虽然目前版权意识虽然越来越强,但是很多资源在 ...

  5. Python之财富自由——天天基金数据爬取并导入excel(详细信息爬取)

    一位泉州小哥近日喜提热搜"一万多买了1314只基金每只10块,买了好几天,第一次花钱花到手抽筋" 投资界有句名言,不要把鸡蛋全部放在一个篮子里,但你见过,有人装鸡蛋的篮子,比鸡蛋还 ...

  6. 哔哩哔哩分区视频详细信息爬取(三连、播放量、标签)等

    因为上手练习一个自己的数据分析项目,因此需要爬取数据.经历过两个版本的更新后,终于写出了第三版.期间也学会了selenium库的运用,API接口的调用,IP池等. 确定目标 因为想要一个量大的数据集, ...

  7. 案例-浙江省律师综合管理平台信息爬取

    爬取浙江省律师综合管理平台上的律师事务所+律师基本信息,截止2018-08-06依然有效,直接运行即可 library("RCurl") library("XML&quo ...

  8. 大数据信息资料采集:影视网站资源数据信息采集爬取

    大数据信息资料采集:影视网站资源数据信息采集爬取 发展 影视作为电影艺术和电视艺术的统称,是现代科学技术与艺术相结合的产物.通过画面.声音.蒙太奇.故事情节等语言 来传达与表现. 例如经典影视作品:由 ...

  9. 【记录爬虫实战过程】入门学习·详细过程·爬取天气信息并通过pyecharts进行可视化展示1

    文章目录 前言 正文 1.导入对应模块 2.确定爬取的网站 3.得到数据 4.数据处理 5.将所得数据写入CSV 完整代码 补充:数据可视化 前言 入门学习这个部分是跟着b站教学视频做的,记录了所有过 ...

最新文章

  1. 麦肯锡报告摘译:未来成功城市的14个特征
  2. 物理主机安装linux的方法
  3. 【Protocol Buffer】Protocol Buffer入门教程(三):proto3与proto2的区别
  4. 虚拟主机linux系统404,虚拟主机404页面的设置方法!
  5. linux下c/c++实例之十socket简单应用
  6. php添加填空,PHP之preg_replace_callback(),将填空题的[[]]替换成______
  7. QT5开发的程序打包发布
  8. spring boot http status 400_kubernetes configmap 热更新spring-boot应用
  9. mysql sum 删除_如果mysql磁盘满了,会发生什么?还真被我遇到了~
  10. java oa系统消息推送_第三方系统向泛微OA系统推送消息
  11. 计算机组成原理——存储器容量扩展(字扩展、位扩展、字位扩展)
  12. 监督学习-分类模型1-线性分类器(Linear Classifiers)
  13. 跨国面板数据(1960-2020)十三:GDP、人均GDP、国民收入、储蓄(excel、stata版)
  14. 今天是10月24日程序员节,祝所有程序员节日快乐!
  15. Win8.1开始菜单Classic Shell 4.0上手
  16. 卸载ubuntu系统,恢复win10单系统【win10+Ubuntu20.04双系统】
  17. 《中国民生银行天眼日志平台架构演进的平凡之路》阅读有感
  18. 显示地图不出来的问题解决
  19. jvm 调优 java 虚拟机 马士兵 马士兵 马士兵 笔记
  20. 负数在计算机中如何表示

热门文章

  1. php扩展cURL执行中途无响应
  2. 单片机C语言零基础入门05 - 逻辑运算
  3. Apache关联Weblogic启动时爆错!libstdc++.so.5
  4. 笔记本修改无线网卡MAC地址
  5. 人工蜂群算法求解TSP旅行商问题C++(2020.11.13)
  6. 20135203齐岳 信息安全系统设计基础第五周学习总结
  7. bootstrapTable 根据条件隐藏某列
  8. Oracle中如何添加date类型的数据
  9. Java搭建实战springboot基于若依项目工时统计成本核算管理源码
  10. 编写js找到一个字符串中指定子字符串的所有位置