利用正则表达式编写python 爬虫,抓取网页联系我们电话号码!这里以九奥科技(www.jiuaoo.com)为例,抓取‘联系我们’里面的电话号码,并输出。

#!/usrweilie/bin/python

#coding=utf-8

importre

importurllib

defgethtml(url):#获取网页html

jiuaoopage=urllib.urlopen(url)

html=jiuaoopage.read()

returnhtml

defgetstr(html):#利用正则表达式抓取‘联系我们’链接

r=r'联系我们'#正则表达式

fo=re.compile(r)

str1=fo.findall(html)

returnstr1

defgettel(html):#利用正则表达式抓取电话号码

r=r'\d{3}\-\d{8}'

fo=re.compile(r)

tel=fo.findall(html)

printtel

html=gethtml('http://www.jiuaoo.com/')

str1=getstr(html)

str2='http://www.jiuaoo.com'

foriinstr1:

urlstr=str2+i

html=gethtml(urlstr)

gettel(html)

一个抓取电话号码的小爬虫。

总结

如果觉得编程之家网站内容还不错,欢迎将编程之家网站推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。

如您喜欢交流学习经验,点击链接加入交流1群:1065694478(已满)交流2群:163560250

python正则表达式提取电话号码_利用正则表达式编写python 爬虫,抓取网页电话号码!...相关推荐

  1. python爬取百度贴吧中的所有邮箱_使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号...

    原标题:使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号 不知道大家过年都是怎么过的,反正栏主是在家睡了一天,醒来的时候登QQ发现有人找我要一份贴吧爬虫的源代码,想起之前练手的时候写过一个抓 ...

  2. cutycapt php,PHP利用CutyCapt获取网页快照,抓取网页高清图片快照(教程)

    PHP利用CutyCapt获取网页快照,抓取网页高清图片快照(教程): // +------------------------------------------------------------ ...

  3. python抓取网页电话号码_利用正则表达式编写python 爬虫,抓取网页电话号码!...

    利用正则表达式编写python 爬虫,抓取网页联系我们电话号码!这里以九奥科技(www.jiuaoo.com)为例,抓取'联系我们'里面的电话号码,并输出. #!/usrweilie/bin/pyth ...

  4. python json提取器_【编号0004】爬虫中常用到的数据提取手段

    使用爬虫抓取网上公开的网页数据时,经常需要使用各种技能去解析到手的响应. 本篇文章,重点介绍下,数据提取时,有哪些常见的方法 0. 背景交代 编程语言:Python 提取方式:Python库 1. X ...

  5. python简单爬虫手机号_使用Python编写多线程爬虫抓取邮箱与手机号(2)

    我们的爬虫抓取数据本质上就是不停的发起http请求,获取http响应,将其存入我们的电脑中.了解http协议有助于我们在抓取数据的时候对一些能够加速抓取速度的参数能够精准的控制,比如说keep-ali ...

  6. php抓取curl下载文件,PHP 利用 Curl 函数实现多线程抓取网页和下载文件

    PHP 利用 Curl Functions 可以完成各种传送文件操作,比如模拟浏览器发送GET,POST请求等等,然而因为php语言本身不支持多线程,所以开发爬虫程序效率并不高,因此经常需要借助Cur ...

  7. Java用正则表达式判断学号,利用正则表达式验证学号_利用正则表达式开发动态网页...

    [摘 要]在动态网页设计中,利用正则表达式可以高效.快速地进行开发,本文探讨了在PHP中利用正则表达式进行url地址解析,密码和邮件验证以及文本文件的处理. [关键词]正则表达式 PHP 动态网页 [ ...

  8. python正则表达式排除字符_利用正则表达式排除特定字符串

    查找不以baidu开头的字符串 baidu.com sina.com.cn 正则:^(?!baidu).*$  匹配结果就是第2行,也就是第1行被排除了 这里使用了零宽度断言(?!exp),注意,我们 ...

  9. vs python生成exe文件_使用VScode编写python程序并打包成.exe文件-文件夹变成exe

    1. 下载vscode并安装 2. 配置Python环境 点击左下角的吃了图标,在弹出的菜单中选择extensions,在左上方搜索框内输入"Python",可以看到好多Pytho ...

最新文章

  1. android用java_原来android不是只能用java写软件
  2. 006.递归和分治思想
  3. 鼠标右键转圈圈_win10系统右键一直转圈
  4. 解决Tomcat下IntelliJ IDEA报错java.lang.NoClassDefFoundError: javax/servlet/ServletContextListener
  5. [转]android 获取手机GSM/CDMA信号信息
  6. 卷盘商标复卷检测系统
  7. linux 基础练习题、面试题(二)
  8. 国内电波钟和石英钟表相比有何优势?
  9. 新版谷歌开启flash的方法
  10. 计算机网络基础知识整理
  11. swfobject java_[Java教程]swfobject.js视频播放插件
  12. C/C++经典算法——约瑟夫问题
  13. linux用迅雷下载软件,wine 迅雷下载安装(wine 迅雷极速版)
  14. 我的JavaScript学习之路四:JavaScript数据类型之Number类型(1)
  15. 社交电商的 “比基尼”,被云集跑出会员的力量
  16. 【转载】什么是公网IP、内网IP和NAT转换?
  17. PHPWord Beta 0.6.2 开发者指南
  18. 1-2 李宏毅2021春季机器学习教程-第一节(下)-深度学习基本概念简介
  19. 三分钟了解LAP Framework编程框架
  20. 【转】用TrueType造字程序自己造字

热门文章

  1. nyoj 汉诺塔(一)
  2. ExtJS4.2初识
  3. mac charles永久激活码
  4. Structured Streaming 案例初体验
  5. python面向对象基础-封装
  6. python漏洞检测脚本_一个检测OpenSSL心脏出血漏洞的Python脚本分享
  7. window.open 打开最大化窗口
  8. Harmony 鸿蒙中类AlertDialog的CommonDialog使用
  9. 2018中国互联网——网民谈论榜最具话题性的七大人物
  10. 如何正确曝光。关键:快门、光圈、ISO - [摄影基础]