详解python实现读取邮件数据并下载附件的实例

实现结果图:

实现代码:

#!/usr/bin/python2.7

# _*_ coding: utf-8 _*_

"""

@Author: MarkLiu

"""

import poplib

import email

from email.parser import Parser

from email.header import decode_header

from email.utils import parseaddr

def decode_str(s):

value,charset = decode_header(s)[0]

if charset:

value = value.decode(charset)

return value

def guess_charset(msg):

# 先从msg对象获取编码:

charset = msg.get_charset()

if charset is None:

# 如果获取不到,再从Content-Type字段获取:

content_type = msg.get('Content-Type','').lower()

pos = content_type.find('charset=')

if pos >= 0:

charset = content_type[pos + 8:].strip()

return charset

def get_email_headers(msg):

# 邮件的From,To,Subject存在于根对象上:

headers = {}

for header in ['From','To','Subject','Date']:

value = msg.get(header,'')

if value:

if header == 'Date':

headers['date'] = value

if header == 'Subject':

# 需要解码Subject字符串:

subject = decode_str(value)

headers['subject'] = subject

else:

# 需要解码Email地址:

hdr,addr = parseaddr(value)

name = decode_str(hdr)

value = u'%s ' % (name,addr)

if header == 'From':

from_address = value

headers['from'] = from_address

else:

to_address = value

headers['to'] = to_address

content_type = msg.get_content_type()

print 'head content_type: ',content_type

return headers

# indent用于缩进显示:

def get_email_cntent(message,base_save_path):

j = 0

content = ''

attachment_files = []

for part in message.walk():

j = j + 1

file_name = part.get_filename()

contentType = part.get_content_type()

# 保存附件

if file_name: # Attachment

# Decode filename

h = email.Header.Header(file_name)

dh = email.Header.decode_header(h)

filename = dh[0][0]

if dh[0][1]: # 如果包含编码的格式,则按照该格式解码

filename = unicode(filename,dh[0][1])

filename = filename.encode("utf-8")

data = part.get_payload(decode=True)

att_file = open(base_save_path + filename,'wb')

attachment_files.append(filename)

att_file.write(data)

att_file.close()

elif contentType == 'text/plain' or contentType == 'text/html':

# 保存正文

data = part.get_payload(decode=True)

charset = guess_charset(part)

if charset:

charset = charset.strip().split(';')[0]

print 'charset:',charset

data = data.decode(charset)

content = data

return content,attachment_files

if __name__ == '__main__':

# 输入邮件地址,口令和POP3服务器地址:

emailaddress = 'xxxxxx@163.com'

# 注意使用开通POP,SMTP等的授权码

password = 'xxxxxx'

pop3_server = 'pop.163.com'

# 连接到POP3服务器:

server = poplib.POP3(pop3_server)

# 可以打开或关闭调试信息:

# server.set_debuglevel(1)

# POP3服务器的欢迎文字:

print server.getwelcome()

# 身份认证:

server.user(emailaddress)

server.pass_(password)

# stat()返回邮件数量和占用空间:

messagesCount,messagesSize = server.stat()

print 'messagesCount:',messagesCount

print 'messagesSize:',messagesSize

# list()返回所有邮件的编号:

resp,mails,octets = server.list()

print '------ resp ------'

print resp # +OK 46 964346 响应的状态 邮件数量 邮件占用的空间大小

print '------ mails ------'

print mails # 所有邮件的编号及大小的编号list,['1 2211','2 29908',...]

print '------ octets ------'

print octets

# 获取最新一封邮件,注意索引号从1开始:

length = len(mails)

for i in range(length):

resp,lines,octets = server.retr(i + 1)

# lines存储了邮件的原始文本的每一行,# 可以获得整个邮件的原始文本:

msg_content = '\n'.join(lines)

# 把邮件内容解析为Message对象:

msg = Parser().parsestr(msg_content)

# 但是这个Message对象本身可能是一个MIMEMultipart对象,即包含嵌套的其他MIMEBase对象,

# 嵌套可能还不止一层。所以我们要递归地打印出Message对象的层次结构:

print '---------- 解析之后 ----------'

base_save_path = '/media/markliu/Entertainment/email_attachments/'

msg_headers = get_email_headers(msg)

content,attachment_files = get_email_cntent(msg,base_save_path)

print 'subject:',msg_headers['subject']

print 'from_address:',msg_headers['from']

print 'to_address:',msg_headers['to']

print 'date:',msg_headers['date']

print 'content:',content

print 'attachment_files: ',attachment_files

# 关闭连接:

server.quit()

以上就是python读取邮件并下载邮件附件的实例,如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

python提取邮件附件_详解python实现读取邮件数据并下载附件的实例相关推荐

  1. python变量定义大全_详解python变量与数据类型

    这篇文章我们学习 Python 变量与数据类型 变量 变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念,变量可以通过变量名访问.在 Python 中 变量命名规定,必须是大小写英文,数字 ...

  2. python停止线程池_详解python中Threadpool线程池任务终止示例代码

    需求 加入我们需要处理一串个位数(0~9),奇数时需要循环打印它:偶数则等待对应时长并完成所有任务:0则是错误,但不需要终止任务,可以自定义一些处理. 关键点 定义func函数处理需求 callbac ...

  3. python模块搜索原则_详解python模块路径查找规则及定义

    在python中创建一个模块非常简单,只需要在当前目录下创建一个 .py文件即可,系统自动将其解析成模块,文件名就是模块名.很多我们源码时代的同学都认为在查找模块时优先使用当前目录下的自定义模块.其实 ...

  4. python中index函数_详解python中的index函数用法

    1.函数的创建 def fun(): #定义 print('hellow') #函数的执行代码 retrun 1 #返回值 fun() #执行函数 2.函数的参数 普通参数 :要按照顺序输入参数 de ...

  5. python多线程操作列表_详解Python多线程下的list

    list 是 Python 常用的几个基本数据类型之一.正常情况下我们会对 list 有增删改查的操作,显然易见不会有任何问题.那么如果我们试着在多线程下操作list 会有问题吗? 多线程下的 lis ...

  6. python装饰器由浅入深_详解Python装饰器由浅入深

    装饰器的功能在很多语言中都有,名字也不尽相同,其实它体现的是一种设计模式,强调的是开放封闭原则,更多的用于后期功能升级而不是编写新的代码.装饰器不光能装饰函数,也能装饰其他的对象,比如类,但通常,我们 ...

  7. python repair修复功能_详解Python修复遥感影像条带的两种方式

    GDAL修复Landsat ETM+影像条带 Landsat7 ETM+卫星影像由于卫星传感器故障,导致此后获取的影像出现了条带.如下图所示, 影像中均匀的布满条带. 使用GDAL修复影像条带的代码如 ...

  8. python导入模块介绍_详解Python模块导入方法

    python常被昵称为胶水语言,它能很轻松的把用其他语言制作的各种模块(尤其是C/C++)轻松联结在一起.python包含子目录中的模块方法比较简单,关键是能够在sys.path里面找到通向模块文件的 ...

  9. python换照片底色_详解Python给照片换底色(蓝底换红底)

    现在网上出现了很多在线换底色的网页版工具是这么做的呢?其实用Python就可以实现. 环境要求 Python3 numpy函数库 opencv库 安装 下载适应版本的numpy函数库,我电脑是WIN1 ...

最新文章

  1. phpstorm安装_PHPstorm设置浏览器打开代码
  2. Oracle数据库管理
  3. hihocoder #1617 : 方格取数(dp)
  4. 最小生成树的纠结_交流电之王-ChinaUnix博客
  5. CocoStudio创建动画帧
  6. MATLAB生成M序列和Gold序列
  7. 洞见科技创始人姚明:隐私计算让数据穿上“防护服”的同时,还能充分释放数据价值...
  8. 鹏业安装算量软件支架计算
  9. 网友对sars病毒事件的对话(转)
  10. JavaScript 中的 Symbols 怎么用
  11. 韩天峰php教程,韩天峰 - Swoole4-全新的PHP编程模式
  12. 2023前端vue高频面试题
  13. python PyAutoGUI 模拟鼠标键盘操作和截屏
  14. 又要数数小绵羊(C++) kkmd66
  15. 计网PPT 第八章 互联网上的音频和视频服务
  16. 达梦数据库忘记SYSDBA密码的问题探讨
  17. Berzerk CodeForces - 787C (BFS)题解
  18. 【转】JavaScript入门学习书籍的阶段选择——BY怿飞
  19. PEP 634 – Structural Pattern Matching: Specification
  20. 需求获取方法之观察与文档审查

热门文章

  1. redhat开启telnet后无法连接
  2. 中职计算机基础应用知识,总发中职《计算机应用基础:基础模块》第一单元 计算机基础知识.pptx...
  3. websphere mq 8死信队列测试--队列满了场景
  4. 六点汽车保养小常识 保护爱车必修课
  5. 正菱台体积在线计算机,正多棱台体积,表面积,棱长,斜高,底面积,质量在线计算器_三贝计算网_23bei.com...
  6. 今天我的就业班的生活开始啦~~~
  7. 瑞吉外卖笔记——第03讲Linux软件安装jdk、MySQL、Tomcat和Maven
  8. 思科虚拟机服务器,利用Cisco UCS管理虚拟机网络(上)
  9. python中同级目录下不同py文件之间的调用失败问题
  10. 【10位时间戳转换日期公式】