关于电子邮件乱码

——转摘自中国科学院,作者不详
 
   本文主要介绍邮件乱码产生的主要原因及几种解决方法:

  E-mail编码标准

  由于一个汉字是用两个扩展 ASCII码表示,对DOS、Windows及Unix系统来说,所有英文字母及符号都是用ASCII码来代表,ASCII码只用到每个字节的前7位。而一些电脑系统在通信时不使用8-bit clean传输方式,无法处理8位的数据或把8位数据当作7位来处理,数据就会被破坏。对电子邮件来说,有时候一个邮件在送达收信人的过程中,会经过很多台主机的转发服务,这中间的主机假如有一台不能用8-bit clean的传输方式,就可能出现“乱码”。因此,不论是发送中文文本文件,还是发送EXE可执行文件、图形文件或压缩文件等二进制文件,都应该先进行编码。

  1.UUencode编码

  在早期传送非ASCII码的文件时,最常用的便是这种UU(Unix-to-Unix encoding)编码方式。Uuencode和Uudecode分别是Unix系统中使用的UU编码和解码程序,后来被改写成为在DOS中亦可执行的程序。

  2.MIME编码

  UU编码解决了E-mail传送非ASCII文件的问题,但这种方式并不方便。因而又发展出一种新的编码标准MIME(Multipurpose Internet Mail Extentions),它可以传送多媒体文件,在一封电子邮件中可附加各种格式文件一起送出。

  MIME定义两种编码方式:Base64与QP(Quote-Printable)。QP的规则是对于资料中的7位无须重复编码,仅将8位的数据转成7位。 QP编码适用于非ASCII码的文字内容,例如我们的中文文件。而Base64的编码规则,是将整个文件重新编码成7位,通常用于传送二进制文件。编码的方式不同会影响编码之后的文件大小。而具有 MIME功能的E-mail软件大都能自动判别你的邮件是采用何种编码,然后自动选择用QP或Base64来解码。

  MIME标准现已成为Internet电子邮件的主流。现在最常使用的电子邮件软件Eudora、FoxMail、Netscape Mail、Outlook Express和Internet Mail等都支持MIME编码标准。

  3.Binhex编码

  Binhex的编码方式常用于Mac机器。一般PC上的电子邮件软件,亦多数支持MIME的规格,很少有支持Binhex格式的。在常用的电子邮件软件中,只有Eudora具有这种功能,可直接解读Binhex的编码。

  邮件乱码的主要原因及解决方法

  汉字邮件出现乱码的原因很多,主要的原因是Internet上的某些邮件主机不支持8位(非ASCII码格式)传输,以及因不同的邮件编码,不同设置的电子邮件收发软件,不同语种的操作系统等造成。

  当你收到一封乱码的邮件时,应根据邮件内容中的关键字符,判别其编码方法。不同的乱码,在不同的平台上有不同的解决方法,因此解码前必须先看一下文件的内容,根据特征对文件可能的编码方式(Uuencode、Base64 encode、QP-encode或其它编码方式)进行判断。

  1.Uuencode“乱码”

  Uuencode编码主要来自Unix系统环境的使用者,目前,使用者已经很少。这种软件内部所用的算法为base64。其格式与Base64 encode格式非常相似,它们的差别仅仅在于“信头”部分的不同。

  Uuencode“乱码”大体格式为:

  begin 0600 index.gb

  MH;ZQOL2_PKS#O]3"N/S0PM*[M,ZAOPJCJ,G/U,+2U,"TM<30PM3VN_*XQ+:O …… end

  在乱码前面含有“begin xxx”,后面紧接着编码之前原始文件的名称。接着是已经Uuencode编码的邮件的内容。在乱码内容后面,即最后一行为“end”。

  如果你电脑上的的邮件收发软件不支持UU解码,那么你看到的就是这些Uuencode“乱码”。

  解决Uuencode“乱码”的办法:

  将Uuencode“乱码”邮件转寄到自己的邮箱中,再使用能够支持UU解码的电子邮件接收程序(如Eudora、OutLook Express等)来接收该邮件。

  通过剪贴板将Uuencode“乱码”存入文本文件,改文件名后缀为UUE,然后使用Winzip解码。
将Uuencode“乱码”存入一个文件,然后在DOS下用uudecode.exe程序将文件解码。

  将 Uuencode“乱码”存入一个文件,然后在Windows下用Wincode解码。

  Wincode除支持UU编码外也支持MIME、Binhex等编码格式,应用范围颇为广泛。

  2.Base64 encode“乱码”

  Base64是MIME标准编码之一。Base64 encode编码方式是将3个字节(8位)用4个字节(6位)表示,由于编码后的内容是6位的,因此可以避免第8位被截掉。Base64 encode“乱码”大体格式为:

  MIME-Version:1.0

  Content-Type:text/plain; charset="us-ascii″

  Content-Transfer-Encoding:base64

  Status:R yrE68shis+o/IMTcsrvE3Ljmy9/L47YEzajRtrX-Y1re6zbYnu7Chow0LDQo=3d

  在Base64编码邮件的乱码前一般有如下几部分“信头”:Content-Type(内容类型)、charset(字符集)及Content-Transfer-Encoding(内容传输编码方式)。

  如果你的电子邮件接收程序不支持Base64解码,那么你看到的就是这些Base64 encode“乱码”。

  解决Base64 encode“乱码”的办法:

  将Base64 encode“乱码”邮件存成一个文本文件,改文件名后缀为.UUE,然后使用 Winzip 解码。

  将Base64 encode“乱码”邮件存成一个文件,将文件后缀改为.EML,由OutLook Express 打开,就可以自动解码。

  3.QP-encode“乱码”

  QP-encode(Quoted-Printable Content-Transfer-Encoding)是MIME标准编码之一。由于用这种格式表示的信息,其内容主要都是 ASCII字符集中可以打印的字符,因此名称中含有printable。QP编码的方式,是将一个字节用两个16进制数值表示,然后在前面加“=”。QP-encode“乱码”大体格式为:=d2=bc=b3=b8=d5=db=c4=c4=bc=d2=b5=f6=b1=e5=c9=e7=b6=f8=b0

  采用QP编码方式的邮件很容易进行判别,因为它的内容通常有很多等号“=”,因此不需要看“信头”也可以判断是否为QP编码。

  如果你的电子邮件接收程序不支持QP解码,那么你看到的就是这些QP-encode“乱码”。

  解决QP-encode“乱码”的办法:

  将QP-encode“乱码”邮件转寄到自己的邮箱中,然后用支持QP解码的电子邮件接收程序(如Netscape mail、Eudora、OutLook Express、Becky等)来接收该邮件。

  使用Winzip对Quoted-Printable解码。必须注意:

  (1)在邮件信头中检查、添加这样两行:Mime-Version: 1.0Content-Transfer-Encoding: quoted-printable;

  (2)信头中间不要空行,信头和信体之间要有一个空行。这样形成的文件,改后缀名为UUE,即可双击启动Winzip得到解码。

  4.HZ中文乱码

  由于我们可能使用不同的电子邮件收发软件,因此,来往的邮件内容可能包含着看不懂的乱码,例如,如果看到下面这串乱码,你一定看不懂它的意思:HZ- ~{Q'Hm<~!"SCHm<~!"BrHm<~5D:C0iBB~}

  实际上这是一串“简体中文HZ”编码,如果使用Outlook Express发送邮件时,选用HZ编码,而邮件的接收者使用Eudora来阅读邮件,看到的就是这些乱码。正确的方法是,在撰写邮件窗口中,选择“格式”菜单下的“语言”命令,并选中“简体中文(GB2312)”项,然后发送邮件。

  这时,如果你使用Outlook Express,可以打开“查看”菜单,点击“语言”选项中的“简体中文(GB2312)”项,或者点击工具栏上“语言”后面的向下箭头,选择“简体中文(GB2312)”功能项,屏幕出现一个对话框,单击“是”按钮,应用新的字符集。

  如果你使用Eudora之类的软件,可以使用“南极星”之类的软件,自动转换不同的汉字编码。如果还看不到的话,可将这些编码文本,拷贝到一个文本编辑器中。

  5、“半个汉字”乱码

  汉字的另一个问题是所谓的“半个汉字”乱码。如下面这串乱码:“把砑⒂萌砑⒙蛉砑暮冒槁隆薄* ”

  由于很多英文编辑软件以字符为单位来处理文本,汉字被删除一半后,剩余的部分会和相邻的汉字重新组合,使得文本面目全非。因此,除了在输入、删除的时候注意这种问题外,还要注意不要在英文字处理软件中轻易使用“字符替换”功能,这往往会把一个汉字的后一个字符和相邻汉字的前一个字符当成一个汉字被替换掉。

  对于“半个汉字”乱码,只要将“乱码”邮件存成一个文本文件,然后使用以字符为单位的编辑软件,将“乱码”行的首字符删除,后面的部分就会和相邻的“乱码”重新组合成可识别的汉字。

  如果上述方法不能奏效,那么只好告诉对方正确的发送方式,请对方重新发一份邮件给你。

  三、避免乱码的方法

  现在你已经知道乱码产生的原因和解决办法,希望你在发送邮件时也多为他人着想,别让美好的心愿变成一堆乱码。

  1.选用大众化的邮件收发软件

  由于不同的电子邮件收发软件支持的编码有所不同,收件人和发件人自己定制的一些选项也会各不相同,所以在收到编码的信件后,系统不一定能识别出邮件所用的编码方法。识别不出编码方法,系统自然无法自动解码,这样当你查看信件内容时,就会出现所谓的乱码,使收信人无法阅读该文件。选用大众化的电子邮件收发软件则可以在一定程度上避免不同的编码方法。

  2.使用“附件”功能发送文件

  一般电子邮件收发程序的“附件”功能可以自动对邮件先进行编码,然后再发送。如果收信人的电子邮件收发程序(如Netscape mail、Outlook Express、Eudora、Pegasus等)能够区别邮件的编码方式,则可以自动将邮件解码。

  3.发送重要信息时先发测试信息

  发送重要信息时,为了确认是否无须编码即可发送正文,应该先发送测试信。而且还应确定收件人能否对附件文件进行解码。如果发送已经编码的邮件,则最好添加足够的“信头”信息,以便收件人知道所需的解码方法。

  如果你经常收到由国外发来的邮件,最好事先约定好,使用相同的操作系统;或者全部使用英文信件交流,因为这些操作系统都支持英文,不会产生乱码。

  4.不使用邮件收发软件的特殊编辑功能

  如Outlook Express邮件编辑器是个功能很强的HTML编辑器,你可以编辑五颜六色、各种字体的电子邮件。不过,如果接收方不使用Outlook Express来接收邮件,可能收到的是不易读的HTML源码。解决的方法是,在撰写邮件时,选择“格式”菜单下的“纯文本”选项。如果要将发送格式的缺省值设置为“纯文本”,那么,在Outlook Express主窗口中,打开“工具”菜单,选择“选项”,出现选项设置对话框。单击“发送”选项卡,将邮件发送格式设置为“纯文本”。

电子邮件乱码产生的主要原因及几种解决方法相关推荐

  1. w7计算机防火墙无法更改,win7系统提示防火墙无法更改某些设置错误代码0x8007437的原因及四种解决方法...

    win7系统提示"防火墙无法更改某些设置,错误代码0x8007437",这该怎么办呢?下面脚本之家的小编就带来win7系统提示防火墙无法更改某些设置错误代码0x8007437的原因 ...

  2. win7系统开机出现OEM7GRUB 0.4.4提示无法进入系统的原因及两种解决方法

    source:http://www.jb51.net/os/windows/475464.html win7系统开机出现OEM7GRUB 0.4.4提示无法进入系统的原因及两种解决方法 作者:佚名 字 ...

  3. html5页面打不开原因,有网但是网页打不开是什么原因(原因及2种解决方法)

    本来刚交了宽带网络信用卡年费,并且本地连接表明一切正常情况,却偏要打开网站一直发生难题,换了电脑浏览器和重新启动都失效,应该怎么办呢?不必担心!下边小编给大伙儿梳理了一些相关网络链接一切正常可是不能上 ...

  4. 服务器系统记事本乱码,win7系统记事本出现乱码的五种解决方法

    win7系统自带有记事本功能,它是一个简单的文字编辑器,用户可直接打开记事本记录文字,相信大家对雨林木风win7系统的记事本在熟悉不过.然而有不少win7系统用户在打开记事本的时候出现乱码,这是怎么回 ...

  5. 台式计算机有乱码如何解决,台式电脑键盘乱码的两种解决方法

    台式电脑键盘乱码怎么办?近来,不少用户反馈自己遇到了台式机键盘错乱的情况,输入之后出现一大推错误代码,该怎么解决呢?接下来,就随系统城小编一起看看台式电脑键盘乱码的两种解决方法吧! 台式机键盘乱码解决 ...

  6. Json返回时间中出现乱码问题的两种解决方法

    Json返回时间中出现乱码问题的两种解决方法 参考文章: (1)Json返回时间中出现乱码问题的两种解决方法 (2)https://www.cnblogs.com/hanyinglong/archiv ...

  7. C# 加载图片image --(C#)Image.FromFile 方法会锁住文件的原因及可能的解决方法

    C# 加载图片image --(C#)Image.FromFile 方法会锁住文件的原因及可能的解决方法 参考文章: (1)C# 加载图片image --(C#)Image.FromFile 方法会锁 ...

  8. bs4 乱码_Python BeautifulSoup中文乱码问题的2种解决方法

    解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输出的总是乱码,找了好久找到解决办法,下面分享给大家 首先是代码 复制代码 代码如下: from bs4 im ...

  9. linux安装 中文乱码怎么解决方法,Linux安装GBK/GB2312程序显示乱码的五种解决方法...

    不少用户在Linux系统中安装GBK或GB2312的时候遇到了乱码问题,这主要是系统默认语言是uft8所导致,对于该问题可用五种方法进行解决,接下来是小编为大家收集的Linux安装GBK/GB2312 ...

最新文章

  1. [SDOI2017]天才黑客
  2. 下一站,向冠军冲击!
  3. 用户开始接纳虚拟化双厂商策略
  4. 在两个静态HTML页面之间传递参数的一个方法
  5. shell脚本中常见的几个判断
  6. 赞一个 kindle电子书有最新的计算机图书可买了【Docker技术入门与实战】
  7. 【TWVRP】基于matlab蚁群算法求解带时间窗的多中心车辆路径规划问题【含Matlab源码 112期】
  8. 【报错】Failed to start A high performance web server and a reverse proxy server.
  9. xp系统怎么进pe修改计算机名,U盘装xp_教您怎样用u盘装xp系统
  10. MySQL的JDBC驱动8.0配置
  11. win10user文件夹迁移_Win10纯净版下迁移用户文件的技巧
  12. python实现数据恢复软件手机版下载_知名下载软件,总算出手机版了
  13. centos网卡启动故障报错
  14. ActiveMQ 安装及使用过程
  15. 适用于高级别自动驾驶的驾驶员可预见误用仿真测试
  16. shell一键部署mysql
  17. PHP 自由职业,自由职业者:不止自由,更多自我
  18. SQL server 2005简体中文版下载
  19. 实录:有钱女性私生活
  20. Centos7下joshua6.0.5完整的安装过程

热门文章

  1. Day11:文件和异常
  2. Python安装教程-手把手教你安装python
  3. 2022年天猫七夕价格便宜吗?天猫七夕节有什么优惠?
  4. 【C语言基础入门】2.C语言中四则运算、关系运算、逻辑运算与位运算
  5. ctp新浪股票接口需要注意的几个细节
  6. 双线路-双路由器备份实例
  7. 基于OpencV的轮廓填充算法在3D打印机中的应用
  8. 1179:最小公倍数和最大公约数
  9. 地图商户采集工具如何使用
  10. (MATLAB)一维信号峰值检测findpeaks