一个最基本最简单的爬虫代码【精简】
爬取豆瓣电影TOP250第一名“肖申克的救赎”的电影名称
最精简的代码,需要学习的可以直接搬运。
用到BeautifulSoup
代码:
#!/usr/bin/python
# -*- coding: UTF-8 -*-import requests
from bs4 import BeautifulSoupmovie_url = 'https://movie.douban.com/subject/1292052/'def download_page(url):headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_12)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36'}data = requests.get(url, headers = headers).contentreturn datadef paser_html(html):soup = BeautifulSoup(html, 'lxml')title = soup.find(property = 'v:itemreviewed').stringreturn titledef main():print(paser_html(download_page(movie_url)))if __name__ == '__main__':main()
运行结果
(C:\Users\ywz20\Anaconda3) C:\Users\ywz20\py_test>python experience.py
肖申克的救赎 The Shawshank Redemption
一个最基本最简单的爬虫代码【精简】相关推荐
- 最简单的爬虫代码 python_最精简的爬虫 --仅需4行代码(python)
最精简的爬虫 --仅需4行代码(python) 刚刚整理了下爬虫系列,于是乎就开始了第一次的技术分享 今天,我们主要讲述的是思路,思路,思路. 相比起,直接贴代码,思路显的更为重要 当初,自己的坑,希 ...
- python最简单的爬虫代码,python小实例一简单爬虫
python新手求助 关于爬虫的简单例子 #coding=utf-8from bs4 import BeautifulSoupwith open('', 'r') as file: fcontent ...
- python简单网页爬虫代码
上面是本人所写的简单爬虫代码,如果喜欢可以拿去用.具体深入的爬虫技术还需要自己去探讨,谢谢!
- 发一个flash+PHP的简单上传代码
示例文件 ========= 1.Flash8: uploader.as --------------------------------------------------------------- ...
- 一个既有趣又简单的整人代码——关机代码
这一篇博客来的比我的预计时间要长啊,在这一周多的时间里,我几乎很少有休息和出去玩耍的时间.说实话,这样忙碌的生活给我的感觉还是蛮好的,让我有一种很充实的感觉,有种自己在与时间赛跑的紧迫的感觉,从而自己 ...
- python简单好看的代码_Python新手写出漂亮的爬虫代码1
初到大数据学习圈子的同学可能对爬虫都有所耳闻,会觉得是一个高大上的东西,仿佛九阳神功和乾坤大挪移一样,和别人说"老子会爬虫",就感觉特别有逼格,但是又不知从何入手,这里,博主给大家 ...
- 今日发现的:一个类似Google Baidu的搜索引擎[C#]代码比较简单
里面实现很简单,当然只能算是一个演示版本吧!不可能有Google Baidu的那么强大.有爬虫代码 Web代码 主要的代码分析如下: /// <summary> /// 取得 ...
- 一段简单的python代码_Python趣味打怪:60秒学会一个例子,147段简单代码助你从入门到大师 | 中文资源...
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 人生苦短,编程苦手,不妨学起Python,感受一飞冲天的快乐. 不要害怕学习的过程枯燥无味,这里有程序员jackzhenguo打造的一份中文 ...
- 一个简单python爬虫的实现——爬取电影信息
最近在学习网络爬虫,完成了一个比较简单的python网络爬虫.首先为什么要用爬虫爬取信息呢,当然是因为要比人去收集更高效. 网络爬虫,可以理解为自动帮你在网络上收集数据的机器人. 网络爬虫简单可以大致 ...
- python简单爬虫代码-最精简的爬虫 --仅需4行代码(python)
最精简的爬虫 --仅需4行代码(python) 刚刚整理了下爬虫系列,于是乎就开始了第一次的技术分享 今天,我们主要讲述的是思路,思路,思路. 相比起,直接贴代码,思路显的更为重要 当初,自己的坑,希 ...
最新文章
- oracle十六进制转数字,16进制如何转化为10进制?
- JSON.parse()出错解决
- 驾照考试:六百公里考试流程与注意事项
- tableau prep builder也是不支持m1芯片。。。
- linux centos7 安装最新版git 教程
- IDEA中Mybatis逆向工程使用方法
- 什么是反射(.NET)[转]
- Android Runnable与Handler和Thread的使用,Handler构造方法弱引用实现
- 100%移植阿里云移动测试技术,竟仅需1周?! ——移动测试专有云(1)
- linux在多个目录跳转,如何做到在多个目录直接游刃有余的进行切换 -- linux 下的目录切换...
- 取消IDEA保存文件,默认删除行尾空格
- 公务员可以做哪些合法正规的兼职
- 电视ping功能测试软件,PingMon(超级Ping监测工具)
- 编程原则:戒虚而务实,谋定而后动
- 'rm' 不是内部或外部命令,也不是可运行的程序 或批处理文件。
- 云服务器/树莓派搭建我的世界Minecraft多人游戏服务器
- 在arcengine中实现图片预览
- SpringBoot和MybatisPlus控制台清爽的一些配置
- 一些网站...........
- 服务安全:如何保证服务器不断电数据不丢失?