使用python正则表达式,在一堆各种字符中提取是邮箱名的字符串。

import re

file = open("AT.txt")

c=[]

for line in file.readlines():

contant = re.findall(r"[\w\d\.-_]+(?=\@)",line)

mail=list(set(contant))

for i in mail:

if i != "":

print i

c.append(i)

Num = len(c)

print Num

正则表达式[\w\d\.-_]+(?=\@)解析:

首先理解字符集,字符集所在位置可以是字符集中任意所以开始[\w\d\.-_]代表可以出现则代表邮箱@之前可以出现字母、数字、.、-、_。紧接在[]字符集之后+代表至少要匹配一次,说明@之前可以有多个字符,(?=\@)则表示之前的字符指导@截止,并且@不计算在之内。

list(set(contant))用于去除里面相同的邮箱名

for i in mail:这个for循环体,代表去除re.findall查找结果中的空列表。

python最简单的爬取邮箱地址_python小脚本-提取邮箱相关推荐

  1. Python爬虫系列之爬取某优选微信小程序全国店铺商品数据

    Python爬虫系列之爬取某优选微信小程序全国商品数据 小程序爬虫接单.app爬虫接单.网页爬虫接单.接口定制.网站开发.小程序开发 > 点击这里联系我们 < 微信请扫描下方二维码 代码仅 ...

  2. python爬虫简单实例-爬取17K小说网小说

    什么是网络爬虫? 网络爬虫(Web Spider),又被称为网页蜘蛛,是一种按照一定的规则,自动地抓取网站信息的程序或者脚本. 爬虫流程 先由urllib的request打开Url得到网页html文档 ...

  3. python最简单的爬取邮箱地址_python简单爬虫,抓取邮箱

    最近,老师给了一个练习是,实现一个爬虫,就爬大概100个网页,匹配出邮箱. 于是,我花了几天时间,熟悉熟悉了python,就有了下面这个超级简单的爬虫程序.各种毛病...... 这里先说明一下,pyt ...

  4. python最简单的爬取邮箱地址_python3爬取网页中的邮箱地址

    1.爬虫分析 分析结果对: http://xxx.com?method=getrequest&gesnum=00000001 http://xxx.com?method=getrequest& ...

  5. python最简单的爬取邮箱地址_python爬取邮箱的实例代码

    1 # -*- coding: cp936 -*- 2 import urllib2 3 import re 4 from pyquery import PyQuery as pq 5 from lx ...

  6. python爬取图片-Python超简单的爬取网站中图片

    1.首先导入相关库 importrequestsimportbs4importthreading #用于多线程爬虫,爬取速度快,可以完成多页爬取import os 2.使用bs4获取html中的内容 ...

  7. python爬取地图地址_python爬取了高德地图一些地点的数据,爬出来数据大致情况如下:...

    python爬取了高德地图一些地点的数据,爬出来数据大致情况如下: 下面是基本流程: 1.注册成为高德地图API开发者,网址http://lbs.amap.com/(主要是获取自己的keywords ...

  8. Python爬虫简单运用爬取代理IP

    功能1: 爬取西拉ip代理官网上的代理ip 环境:python3.8+pycharm 库:requests,lxml 浏览器:谷歌 IP地址:http://www.xiladaili.com/gaon ...

  9. python爬取地图地址_Python爬取百度地图poi数据 !

    锵锵锵,我来啦.10天过的好快呀,4月份都已经过了三分之一,我的体重还居高不下,qwq.今天给大家分享python爬取百度地图小区的数据,希望大家看后,可以尝试自己编写爬取自己所在市的中学,公园,银行 ...

  10. Python爬虫实战:爬取YY上漂亮小姐姐视频

    目录 1.目标 2.确定数据所在的url 3.发送网络请求 4.数据解析 5.数据保存 6.爬取其他页数据 1.目标 本次目标是爬取YY(https://www.yy.com/)主页分类中小视频板块, ...

最新文章

  1. 汉诺塔问题---小昝
  2. 拯救莫莉斯[GDOI2014]
  3. [论文泛读] QoS论文两篇(Elsevier09, IEEE05)
  4. gecco 1.1.0稳定版发布,易用的轻量化爬虫
  5. 项目经理应该把30%的时间用在编程上
  6. 从零入门 FreeRTOS 操作系统之任务调度器
  7. OpenResty快速入门
  8. 在linux系统上使用jmeter
  9. python 函数 类 模块
  10. AcWing 116. 飞行员兄弟(二维指数型枚举)
  11. 2009年4月21日 博客更新公告,敬请关注!
  12. CC2640 LaunchPad入门试用-第一篇
  13. bt种子爬虫程序和种子解析(大蟒蛇语言编写)
  14. Powertoys windows 10第三方桌面分块(分区)工具
  15. 2.1 matlab特殊矩阵(零矩阵、幺矩阵、单位矩阵、魔方矩阵、范德蒙德矩阵和希尔伯特矩阵)
  16. 通俗易懂的方式讲解最大流和最小割问题
  17. 从程序员到项目经理转自西门吹雪
  18. Please restart Word to load MathType addin properly;运行时错误53,文件未找到MathPage.WLL
  19. Huffman Tree
  20. 2021-06-08实验室如何正确选择和确认检测方法?

热门文章

  1. ubuntu 19.04源
  2. java段子_Java程序员的内涵段子
  3. Python爬虫:无账号无限制获取企查查信息
  4. MySQL从创建数据库到删库跑路之旅
  5. javascript中用switch判断今天星期几
  6. w ndows无法连接到无线网络,windows无法连接到无线网络,小编教你windows无法连接到无线网络怎么办...
  7. 《五月集训》第二日——字符串
  8. html基础学习笔记
  9. GDSOI2019退役祭
  10. (1)asp。net操作ftp,上传和下载 (2) 长时间提交,在提交后禁止页面按钮 (3) 方便的javascript日历