环境

PyCharm 2021.1.2 x64
爬取的目标网页

一、代码

import requests
from bs4 import BeautifulSoup
url = "http://58921.com/alltime/wangpiao"#目标网页
response = requests.get(url)
#print(response.text)
response.encoding = "utf-8"
text = response.text
bs = BeautifulSoup(text,'lxml')
#print(bs)
table = bs.find('table',attrs={'class':'center_table table table-bordered table-condensed'})
#print(table)
thead = table.find('thead')
#print(thead)
tbody = table.find('tbody')
#print(tbody)
f = open('中国电影票房.csv',mode="w",encoding="UTF-8")
ths = thead.find_all('th')
#print(ths),
trs = tbody.find_all('tr')
for th in ths:if th==0:breakf.write(th.text)f.write(",")
f.write("\n")#换行写
for tr in trs:if tr==0:breaktds = tr.find_all("td")for td in tds:if td==0:#最后一个也被写后退出breakf.write(td.text)f.write(",")#换列写f.write("\n")#换行写

二、结果

需要说明的问题

C3没有数据
原因是在网页原代码中这一数据是通过img标签(png格式图片)来显示的,不是网页文本显示的,我的想法是利用python文字识别技术来识别这张图片(识别中文需格外下载中文语言包),之后再写入csv文件。
目前还在努力实现中…

使用python爬取中国电影票房数据并写入csv文件相关推荐

  1. python爬取豆瓣电影信息数据

    题外话+ 大家好啊,最近自己在做一个属于自己的博客网站(准备辞职回家养老了,明年再战)在家里 琐事也很多, 加上自己 一回到家就懒了(主要是家里冷啊! 广东十几度,老家几度,躲在被窝瑟瑟发抖,) 由于 ...

  2. 用 Python 爬取分析每日票房数据

    ♚ 作者:小李子,某外企分析师,主要从事IT行业,但个人非常喜欢电影市场分析,所以经常会写一些电影领域的文章. 博客:http://blog.sina.com.cn/leonmovie 不知不觉又过了 ...

  3. 用Python爬取中国各省GDP数据

    介绍 在数据分析和经济研究中,了解中国各省份的GDP数据是非常重要的.然而,手动收集这些数据可能是一项繁琐且费时的任务.幸运的是,Python提供了一些强大的工具和库,使我们能够自动化地从互联网上爬取 ...

  4. 【Python爬虫】爬取猫眼电影排行榜并存放至csv文件

    在进行本节实战之前,希望您对requests库以及正则表达式有所了解. 运行平台:windows **Python版本: Python3.x ** 一.依赖库的安装 在本节实战之前,请确保已经正确安装 ...

  5. Python爬取豆瓣电影评论数据(通用模板代码)----以《中国医生》为例

    中国医生豆瓣电影评论获取 1 前言 2 数据源分析 3数据爬取(代码实现) 4 结果展示 1 前言   豆瓣是影迷评分.非视频网站,也非购票平台,能长期专门使用豆瓣标记.评价电影的,相对来说是属于影迷 ...

  6. python 爬取猫眼电影网站数据

    完整代码下载:https://github.com/tanjunchen/SpiderProject/tree/master/maoyan python 爬取 movie.douban.com 网站 ...

  7. 爬取豆瓣音乐TOP250数据保存到csv文件和xls文件

    爬取的目标网址:https://music.douban.com/top250 利用lxml库,获取前10页的信息,需要爬取的信息包括歌曲名.表演者.流派.发行时间.评分和评论人数,把这些信息存到cs ...

  8. python爬取豆瓣电影排行榜数据

    电影推荐-豆瓣电影排行榜数据抓取 目标网址:https://movie.douban.com/top250?start= 目标数据描述:(1)排名(2)电影名字 (3)链接 (4)导演人员 (5)评价 ...

  9. python爬取豆瓣电影top250并保存为xlsx_python抓取豆瓣电影Top250数据并写入Excel

    douban python抓取豆瓣电影Top250数据并写入Excel 1.将目标网站上的页面抓取下来 2.将抓取下来的数据根据一定的规则进行提取 create table `tb_movie`( i ...

最新文章

  1. 为啥led灯用一年后暗了很多_想把卤素灯换掉,选LED灯为什么比选氙气灯
  2. 聊聊同步、异步、阻塞与非阻塞
  3. 【XML】XML树形结构
  4. vi保存退出:x与:wq的区别
  5. 【颜色识别】基于matlab GUI机器视觉RGB识别系统【含Matlab源码 951期】
  6. vue-cli搭建项目引入jquery和jquery-weui步骤详解
  7. 一文回顾腾讯数字生态大会·微搭低代码专场
  8. 微信小程序父子组件传值
  9. 工业互联网平台TOP15发布!附15个平台详细介绍!
  10. 德保罗大学计算机专业,德保罗大学计算机、信息与网络安全研究生语言及申请要求-费用-课程设置...
  11. android qq 邮箱格式,QQ邮箱格式是什么_QQ邮箱写法正确格式
  12. HP Cloud Recovery Tool
  13. 迎接互联网的辛迪加时代
  14. 8支团队正在努力构建下一代区块链以太坊Ethereum 2.0
  15. 【Linux】解决VirtualBox下Ubuntu开机后黑屏
  16. pytorch逻辑回归实现
  17. React 原理揭秘总结
  18. Win7文件夹属性没有位置选项怎么解决
  19. 设计和《金瓶梅》——那点不得不说的事
  20. visual c++ 下载地址

热门文章

  1. index、noindex、follow、nofollow的使用说明
  2. 嵌入式软硬件结合(二)——SysTick系统定时器
  3. MultipleOutputs(三)
  4. IDEA版SpringBoot全教程 08 会员管理系统(中)
  5. 隧道变形在线监测过程中应用的光纤应变传感器
  6. 实验---采用SOM网络进行聚类
  7. 32631、32649分别代表什么坐标系?
  8. NtripShare EdgeEngine GNSS边缘解算盒子/模块/软件用户手册
  9. HTML静态网页作业:使用html+css制作北京黎红学院学校网站 (4个页面)
  10. 使用python3爬去360图片