python简单爬虫代码-一则python3的简单爬虫代码
不得不说python的上手非常简单。在网上找了一下,大都是python2的帖子,于是随手写了个python3的。代码非常简单就不解释了,直接贴代码。
代码如下:
#test rdp
import urllib.request
import re
#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录
res = urllib.request.urlopen(url,postdata)
#取得页面html
strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'(.*?)')
for m in p.finditer(strResult):
print (m.group(1))#group(1)是href里面的内容,group(2)是a标签里的文字
关于cookie、异常等处理看了一下,没有花时间去处理,毕竟只是想通过写爬虫来学习python。
本条技术文章来源于互联网,如果无意侵犯您的权益请点击此处反馈版权投诉
本文系统来源:php中文网
python简单爬虫代码-一则python3的简单爬虫代码相关推荐
- 爬虫python代码-一则python3的简单爬虫代码
不得不说python的上手非常简单.在网上找了一下,大都是python2的帖子,于是随手写了个python3的.代码非常简单就不解释了,直接贴代码. 代码如下: #test rdp import ur ...
- python还款程序_使用Python3 编写简单信用卡管理程序
1.程序执行代码: #Author by Andy #_*_ coding:utf-8 _*_ import os,sys,time Base_dir=os.path.dirname(os.path. ...
- python简单爬虫代码-使用Python3.5写简单网络爬虫
<一>用urllib库访问URL并采集网络数据 -1. 直接采集 发送请求,打开URL,打印传回的数据(html文件) - 2. 模拟真实浏览器访问 1)发送http头信息(header) ...
- python爬虫实例-python3.7简单的爬虫实例详解
python3.7简单的爬虫,具体代码如下所示: #https://www.runoob.com/w3cnote/python-spider-intro.html #Python 爬虫介绍 impor ...
- python urllib.request 爬虫 数据处理-使用Python3.5写简单网络爬虫
<一>用urllib库访问URL并采集网络数据 -1. 直接采集 发送请求,打开URL,打印传回的数据(html文件) - 2. 模拟真实浏览器访问 1)发送http头信息(header) ...
- python3爬虫实例-python3.7简单的爬虫实例详解
python3.7简单的爬虫,具体代码如下所示: #https://www.runoob.com/w3cnote/python-spider-intro.html #Python 爬虫介绍 impor ...
- python 系列 03 - 基于scrapy框架的简单爬虫
文章目录 1. scrapy介绍 2 新建爬虫项目 3 新建蜘蛛文件 4 运行爬虫 5 爬取内容 5.1分析网页结构 5.2 关于Xpath解析 5.3 接着解析电影数据 5.4 下载缩略图 5.5 ...
- Python学习教程(Python学习路线):Python3之递归函数简单示例
Python学习教程(Python学习路线):Python3之递归函数简单示例 概述 递归函数即直接或间接调用自身的函数,且递归过程中必须有一个明确的递归结束条件,称为递归出口.递归极其强大一点就是能 ...
- python在线翻译代码_Python 20行简单实现有道在线翻译的详解
简介 主要是尝试简单的使用pyhton的爬虫功能,于是使用有道进行尝试,并没有进行深入的诸如相关api的调用. 以下是需要的POST数据 代码 以下是相关部分的代码: import urllib.re ...
最新文章
- 中国电子学会青少年编程能力等级测试图形化三级编程题:海底寻宝
- python能做什么游戏好-用Python可以做哪些有意思的小游戏呢?
- 计算机在职英语,计算机在职研究生英语教学存在的不足
- python数据统计代码_Python 数据的累加与统计的示例代码
- Log4j快速使用精简版
- 创建 WPF 不规则窗口
- python关系运算符和逻辑运算符的优先级_python中逻辑运算符的优先级问题
- mysql多副本搭建_一个简单的MySQL多实例环境搭建
- 利用遗传算法演化一个棋类游戏的人工智能
- 批处理学习笔记6 - 重定向符和
- date命令 简单使用
- 关于php的一些小知识!
- CSS - 样式以及样式权重
- PMP考试要多少费用
- 分数加减乘除混合运算带答案_分数加减乘除混合运算专项训练
- Shi-Tomasi角点检测
- 机器学习 入门详细解析(三)线性回归、岭回归、逻辑回归、聚类
- SpringCloud 基础架构搭建
- 【Unity】消消乐游戏开发流程
- 微信支付签约委托代扣文档 - 月付会员或者定期支付服务 - APP纯签约
热门文章
- 8-过滤器Filter和监听器Listener
- c++并发编程之thread::join()和thread::detach()(转)
- window.onload 与 jq的$(function(){})区别
- 顶级前端工程师需要具备的经验和最佳实践(这才是市场急需的前端):
- NTKO OFFICE文档控件技术资料(转载)
- Bailian4047 全排列【全排列】
- POJ1029 UVA158 Calendar题解
- POJ NOI0113-30 1的个数【进制】
- CCF201403-2 窗口(100分)
- 稀疏编码(sparse code)与字典学习(dictionary learning)