问 题

我想爬电影票房的数据,网站是http://www.cbooo.cn/movieweek,我要爬网页最下面的【票房日期:2016-11-14至2016-11-20 单周票房:57271万 单周场次:1463995场 单周人次:1781万】这些数据,代码如下:

from bs4 import BeautifulSoup

import urllib.request

z = input("请输入网址:")

a = urllib.request.urlopen(z).read()

b = BeautifulSoup(a,"html.parser")

c = b.select("#content > div.alldate")

for i in c:

print(i.get_text())

输出结果是

票房日期:

单月票房:万

单月场次:万场

单月人次:万

关键的数据没有啊,这是怎么回事呢,我最想要的是那些数据,怎么弄也没有,跪求解决办法

谢谢

谢谢

谢谢

解决方案

因为你需要的数据是有ajax动态生成的,在html源码中是找不到的,所以需要能够动态加载js工具,你可以用这个

selenium+PhantomJS来执行js的内容,不过这个相对来说比较慢。

不过针对你需要抓取的网站,用游览器抓包发现 发现ajax请求路径是

所以你可以直接发起请求,

urllib.urlopen("http://www.cbooo.cn/BoxOffice/getWeekInfoData?sdate=2016-11-14").read()

不需要用上面的phantomJS。发现返回的json字符串中有你所需要的数据,你需要的数据在最后的data2。

{

"data1": [

{

"MovieRank": "1",

"MovieID": "640103",

"MovieName": "我不是潘金莲",

"WeekAmount": "20531",

"SumWeekAmount": "20553",

"People": "644",

"MovieDay": "3",

"AvgPrice": "32",

"AvgPeople": "27",

"Amount_Up": "0",

"Screen_Up": "0",

"People_Up": "0",

"DefaultImage": "http://www.cbooo.cn/moviepic/229639.jpg",

"Rank_Up": "0",

"WomIndex": "0.00"

},

{

"MovieRank": "2",

"MovieID": "325408",

"MovieName": "奇异博士",

"WeekAmount": "13324",

"SumWeekAmount": "70321",

"People": "380",

"MovieDay": "17",

"AvgPrice": "35",

"AvgPeople": "13",

"Amount_Up": "-51",

"Screen_Up": "-40",

"People_Up": "-51",

"DefaultImage": "http://www.cbooo.cn/moviepic/108737.jpg",

"Rank_Up": "-1",

"WomIndex": "8.32"

},

{

"MovieRank": "3",

"MovieID": "625158",

"MovieName": "比利·林恩的中场战事",

"WeekAmount": "5474",

"SumWeekAmount": "13561",

"People": "122",

"MovieDay": "10",

"AvgPrice": "45",

"AvgPeople": "7",

"Amount_Up": "-32",

"Screen_Up": "-1",

"People_Up": "-42",

"DefaultImage": "http://www.cbooo.cn/moviepic/217130.jpg",

"Rank_Up": "-1",

"WomIndex": "8.20"

},

{

"MovieRank": "4",

"MovieID": "656548",

"MovieName": "深海浩劫",

"WeekAmount": "5441",

"SumWeekAmount": "5441",

"People": "195",

"MovieDay": "6",

"AvgPrice": "28",

"AvgPeople": "12",

"Amount_Up": "0",

"Screen_Up": "0",

"People_Up": "0",

"DefaultImage": "http://www.cbooo.cn/moviepic/216485.jpg",

"Rank_Up": "0",

"WomIndex": "0.00"

},

{

"MovieRank": "5",

"MovieID": "653289",

"MovieName": "航海王之黄金城",

"WeekAmount": "3201",

"SumWeekAmount": "10185",

"People": "116",

"MovieDay": "10",

"AvgPrice": "27",

"AvgPeople": "7",

"Amount_Up": "-54",

"Screen_Up": "14",

"People_Up": "-55",

"DefaultImage": "http://www.cbooo.cn/moviepic/232344.jpg",

"Rank_Up": "-2",

"WomIndex": "8.70"

},

{

"MovieRank": "6",

"MovieID": "627541",

"MovieName": "外公芳龄38",

"WeekAmount": "2129",

"SumWeekAmount": "5635",

"People": "82",

"MovieDay": "10",

"AvgPrice": "26",

"AvgPeople": "7",

"Amount_Up": "-39",

"Screen_Up": "31",

"People_Up": "-39",

"DefaultImage": "http://www.cbooo.cn/moviepic/227040.jpg",

"Rank_Up": "-2",

"WomIndex": "8.03"

},

{

"MovieRank": "7",

"MovieID": "626571",

"MovieName": "勇士之门",

"WeekAmount": "1715",

"SumWeekAmount": "1715",

"People": "56",

"MovieDay": "3",

"AvgPrice": "31",

"AvgPeople": "6",

"Amount_Up": "0",

"Screen_Up": "0",

"People_Up": "0",

"DefaultImage": "http://www.cbooo.cn/moviepic/210856.jpg",

"Rank_Up": "0",

"WomIndex": "0.00"

},

{

"MovieRank": "8",

"MovieID": "633157",

"MovieName": "阿拉丁与神灯",

"WeekAmount": "1338",

"SumWeekAmount": "1338",

"People": "53",

"MovieDay": "3",

"AvgPrice": "25",

"AvgPeople": "9",

"Amount_Up": "0",

"Screen_Up": "0",

"People_Up": "0",

"DefaultImage": "http://www.cbooo.cn/moviepic/231914.jpg",

"Rank_Up": "0",

"WomIndex": "0.00"

},

{

"MovieRank": "9",

"MovieID": "628324",

"MovieName": "驴得水",

"WeekAmount": "818",

"SumWeekAmount": "17104",

"People": "26",

"MovieDay": "24",

"AvgPrice": "31",

"AvgPeople": "9",

"Amount_Up": "-72",

"Screen_Up": "-68",

"People_Up": "-72",

"DefaultImage": "http://www.cbooo.cn/moviepic/236741.jpg",

"Rank_Up": "-4",

"WomIndex": "8.16"

},

{

"MovieRank": "10",

"MovieID": "627597",

"MovieName": "夏有乔木 雅望天堂",

"WeekAmount": "437",

"SumWeekAmount": "15631",

"People": "11",

"MovieDay": "108",

"AvgPrice": "40",

"AvgPeople": "110",

"Amount_Up": "0",

"Screen_Up": "0",

"People_Up": "0",

"DefaultImage": "http://www.cbooo.cn/moviepic/216992.jpg",

"Rank_Up": "0",

"WomIndex": ""

}

],

"data2": [

{

"sDate": "2016-11-14至2016-11-20",

"BoxOffice": "57271",

"ShoCount": "1463995",

"AudienceCount": "1781"

}

] }

扫一扫关注IT屋

微信公众号搜索 “ IT屋 ” ,选择关注与百万开发者在一起

python爬不是网页_用python爬网站数据,为什么只爬到标签,爬不到标签内容呢相关推荐

  1. 用python做公众号网页_使用python一步一步搭建微信公众平台(一)

    最近无聊,想玩玩微信的公众平台,后来发现乐趣无穷啊~ 使用的工具,python 新浪SAE平台,微信的公众平台 你需要先在微信的公众平台与新浪SAE平台上各种注册,微信平台注册的时候需要你拍张手持身份 ...

  2. python爬贴吧回复_(python小白必看!)python爬虫详细讲解:静态单网页的内容爬取 爬取对象:百度贴吧湖北大学吧...

    之前发了一篇关于文件处理小实验的文章,不知道大家有没有看呢?那篇文章真的很关键,之前我本以为没有爬取成功的原因是因为我的文件处理部分出现的问题,后来经过两个小测试之后才发现并不是我的文件处理出现了问题 ...

  3. python爬虫去哪儿网_用python爬虫爬取去哪儿4500个热门景点,看看国庆不能去哪儿...

    引用 那么问题来了,去哪儿玩呢?百度输了个"国庆",出来的第一条居然是"去哪里旅游人少"--emmmmmmm,因缺思厅. 于是我萌生了通过旅游网站的景点销量来判 ...

  4. python函数大全书籍京东_用python爬取京东图书排行榜并进行数据整合

    经常在京东买书,突发奇想,向看看京东畅销图书有哪些,于是,就有有了下面的代码. python版本:3.5 编辑器:jupyter 首页链接:http://book.jd.com/booktop/0-0 ...

  5. 基于python的数据爬取与分析_基于Python的网站数据爬取与分析的技术实现策略

    欧阳元东 摘要:Python为网页数据爬取和数据分析提供了很多工具包.基于Python的BeautifulSoup可以快速高效地爬取网站数据,Pandas工具能方便灵活地清洗分析数据,调用Python ...

  6. 基于python的排课表系统_利用python爬取广西科技大学教务管理信息系统班级课表...

    操作环境 python 3.6.1 pycharm 5.0.3 WampServer 3.0.6 windows 8(64位) 特点 1.中途退出程序或者断网之后重连再次运行不会抓取到重复的课程表 2 ...

  7. python如何爬取sci论文_利用python爬取并翻译GEO数据库

    GEO数据库是NCBI创建并维护的基因表达数据库,始于2000年,收录了世界各国研究机构提交的高通量基因表达数据,现芯片集数据量高达12万以上.想要从这里面挖掘(bai piao)数据,发个sci提前 ...

  8. python notebook右侧网页_《Python web开发》笔记 一:网页开发基础

    网页基础知识 网页的构成 网页由html.css和Javascript构成,html是框架,CSS是样式和装饰,JS则是各项功能实现.我们把网页的组成类比成一栋房子,Html相当于房子的结构,CSS相 ...

  9. python如何爬取实时人流量_使用python爬取微信宜出行人流量数据

    代码地址:https://liujiao111.github.io/2019/06/18/easygo/ 工具介绍: 该工具基于微信中的宜出行提供的数据接口进行爬取,能够爬取一定范围内的当前时间点的人 ...

  10. python爬取豆瓣短评_用python实现豆瓣短评通用爬虫(登录、爬取、可视化分析)

    原创技术公众号:bigsai 前言 在本人上的一门课中,老师对每个小组有个任务要求,介绍和完成一个小模块.工具知识的使用.然而我所在的组刚好遇到的是python爬虫的小课题. 心想这不是很简单嘛,搞啥 ...

最新文章

  1. Java线程详解(2)-创建与启动
  2. 宝鸡文理学院c语言试题,宝鸡文理学院试题电子电磁场与电磁波A
  3. HDU - 1150 Machine Schedule(最小点覆盖-二分图最大匹配)
  4. 宏定义#define
  5. mongobd运行电脑不允许_U盘中的操作系统:Chrome OS,极致简洁超流畅,拯救你的旧电脑...
  6. 混合架构、暗数据...这些云原生安全 bug 稍不留神会带来灾难!
  7. 宜家邮件系统正遭网络攻击
  8. 深入浅出mysql 出版社_深入浅出mysql
  9. 使用谷歌学术镜像查找英文论文、英文论文阅读
  10. CSP201403-1 相反数 (Python)
  11. 【Linux】自动执行Mysql常用命令脚本
  12. 【题解】Priest John's Busiest Day POJ - 3683 ⭐⭐⭐ 【2-SAT 拓扑序】
  13. python画四边形_Matplotlib FigureCanvas:将四边形网格正确地绘制为轴
  14. 无法安装网络计算机加密,非系统分区使用BitLocker加密导致软件无法安装的解决方法...
  15. 【Vue.js】Vue 学习笔记
  16. dataguard 日志的应用
  17. CentOS7 开机进入紧急模式EmergencyMode的解决办法
  18. 为什么带有E-Marker芯片的数据线才是快充数据线?
  19. 粤语区的人如何说好普通话
  20. socket编程实现多人聊天室

热门文章

  1. PHP——AES加解密 +SIGN校验唯一性安全性(Api)
  2. echart柱状图和折线图混合
  3. 计算机信息单位中1GB等于,1gb等于多少mb 1gb换算多少mb
  4. 数据分析师等级主要分为哪几个级别?
  5. 【人机】确认框中的“取消/确定”要如何设计呢?
  6. Windows 10系统System进程占用CPU过高怎么处理?
  7. 拿大厂机器学习岗offer,吐血整理的面试秘籍!
  8. 体验谷歌菜市场镜像版
  9. html5中nav标签(导航链接)的详细介绍
  10. 5gh掌上云计算认证不通过_华为云计算认证考试好考吗?我考华为云计算HCIE的经验分享...