爬虫python代码-一则python3的简单爬虫代码
不得不说python的上手非常简单。在网上找了一下,大都是python2的帖子,于是随手写了个python3的。代码非常简单就不解释了,直接贴代码。
代码如下:
#test rdp
import urllib.request
import re
#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录
res = urllib.request.urlopen(url,postdata)
#取得页面html
strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'(.*?)')
for m in p.finditer(strResult):
print (m.group(1))#group(1)是href里面的内容,group(2)是a标签里的文字
关于cookie、异常等处理看了一下,没有花时间去处理,毕竟只是想通过写爬虫来学习python。
本条技术文章来源于互联网,如果无意侵犯您的权益请点击此处反馈版权投诉
本文系统来源:php中文网
爬虫python代码-一则python3的简单爬虫代码相关推荐
- python简单爬虫代码-一则python3的简单爬虫代码
不得不说python的上手非常简单.在网上找了一下,大都是python2的帖子,于是随手写了个python3的.代码非常简单就不解释了,直接贴代码. 代码如下: #test rdp import ur ...
- Python基础的学习和简单爬虫的编写
一.Python基础的学习 观看B站up GenJi是真的想教会你 的视频结合RUNOOB.COM进行学习 二.简单爬虫的编写 爬虫实现的功能: 爬取豆瓣电影top250的电影名称.电影信息.评分.评 ...
- 爬虫python对电脑要求_python人工智能爬虫系列:怎么查看python版本_电脑计算机编程入门教程自学...
本文由简码编程原创,保留所有版权,转载请注明出处. 本python人工智能爬虫系列教程基于Python3.0版本, 将python结合windows桌面开发工具aardio一起做可视化的开发, 用py ...
- ajax简单实例代码,分享Ajax创建简单实例代码
XmlHttp是一套可以在Javascript.VbScript.Jscript等脚本语言中通过http协议传送或从接收XML及其他数据的一套API.XmlHttp最大的用处是可以更新网页的部分内容而 ...
- python3.x简单爬虫(爬取百度壁纸图片下载本地)
一.导读 python的火热大家都是有目共睹的,相信没有一个人不想学习这样牛逼哄哄的技术,无论是技术还是非技术人员.python的魅力太过于强大,今天我给大家介绍一下python3.x里面的一个简单小 ...
- python小实例一:简单爬虫
本文所谓的爬虫就是通过本地远程访问url,然后将url的读成源代码形式,然后对源代码进行解析,获取自己需要的数据,相当于简单数据挖掘.本文实现的是将一个网页的图片爬出保存到本地的过程,例子很简单,用的 ...
- python简单爬虫入库_python用BeautifulSoup库简单爬虫实例分析
会用到的功能的简单介绍 1.from bs4 import BeautifulSoup #导入库 2.请求头herders headers={'User-Agent': 'Mozilla/5.0 (W ...
- 爬虫python和c语言区别_爬虫概述 - Python教程 - C语言网
网络爬虫(又称为网页蜘蛛,网络机器人,更经常的称为网页追逐者),它按照一定的规则自动地抓取网络信息. 1. 产生背景 随着时代的进步,互联网上拥有大量的信息,但是我们该如何高效的获取这些信息成为了一个 ...
- 金融爬虫python网贷_互联网金融爬虫怎么写-第一课 p2p网贷爬虫(XPath入门)
版权声明:本文为博主原创文章,未经博主允许不得转载. 相关教程: 工具要求:教程中主要使用到了 1.神箭手云爬虫 框架 这个是爬虫的基础,2.Chrome浏览器和Chrome的插件XpathHelp ...
最新文章
- javascript onclick中post提交
- 一位83岁独立开发者教会我的道理
- 花17000元在元宇宙里用Linux?这款VR电脑开启预售,头显就是主机的那种,搭载英特尔i7...
- Hinton向量学院推出神经ODE:超越ResNet 4大性能优势
- centos 7 yum安装mysql完整过程记录
- 7-3 棋盘覆盖 (10 分)(思路加详解)Come baby
- sap abap开发从入门到精通_SAP开发-ABAP数据字典(锁)
- 面试中听到这句话是不是代表凉了?
- PX4代码解析(2)
- 小米推出售价 19999 元的 MIX Alpha;高通已向华为重启供货;.NET Core 3.0 发布 | 极客头条...
- IIS7.5 在已有的WEB网站上配置FTP发布
- VMware 共享目录不显示的解决办法
- SQL JDBC下载
- 超越LLMNR /NBNS欺骗 - 利用Active Directory集成的DNS
- 深度学习 个人理解使用余弦相似度对人脸图片识别的过程
- IR2110不具备隔离驱动作用
- OSChina 周五乱弹 —— 闹钟一响就睡觉
- 出圈!迅镭激光切割设备亮相热播剧《麓山之歌》
- 利率浮动值60BP什么意思,利率上浮50bp是什么意思
- 支付宝AR实景红包寻宝攻略