编码
邮件头(参见rfc822,rfc2047)只能包含us-ascii字符。邮件头中任何包含非us-ascii字符的部分必须进行编码,使其只包含us-ascii字符。所以使用java mail发送中文邮件必须经过编码,否则别人收到你的邮件只能是乱码一堆。不过使用java mail 包的解决方法很简单,用它自带的mimeutility工具中encode开头的方法(如encodetext)对中文信息进行编码就可以了。
例子:
mimemessage mimemsg = new mimemessage(mailsession);
//让javamail决定用什么方式来编码 ,编码内容的字符集是系统字符集mimemsg.setsubject( mimeutility.encodetext( subject) );
//使用指定的base64方式编码,并指定编码内容的字符集是gb2312
mimemsg.setsubject( mimeutility.encodetext( subject,”gb2312”,”b”));
通常对邮件头的编码方式有2种,一种是base64方式编码,一种是qp(quoted-printable)方式编码,javamail根据具体情况来选择编码方式。
如“txt测试”编码后内容如下:
=?gbk?q?txt=b2=e2=ca=d4
里面有个=?gbk?q?,gbk表示的是内容的字符集,?q?表示的是以qp方式编码的,后面紧跟的才是编码后的中文字符。所以用mimeutility工具编码后的信息里包含了编码方式的信息。
邮件的正文也要进行编码,但它不能用mimeutility里的方法来编码。邮件正文的编码方式的信息是要放在content-transfer-encoding这个邮件头参数中的,而mimeutility里面的方法是将编码方式的信息放在编码后的正文内容中。所以如果你对正文也用mimeutility进行处理,那么其他邮件程序就不会正常显示你编码的邮件,因为其他邮件软件如outlook,foxmail只会根据content-transfer-encoding这个里面的信息来对邮件正文进行解码。
其实,邮件正文部分的编码javamail已经自动帮你做了,当你发送邮件的时候,它会自己决定编码方式,并把编码方式的信息放入content-transfer-encoding这个邮件头参数中,然后再发送。所以你所要做的就是直接把邮件正文的内容放入邮件中就可以了。
对邮件正文的编码方式比较多,包括了base64和qp方式,还有一些如7bit,8bit等等,因为javamail自动为邮件正文编码,所以我就不一一祥叙了。
例子:
//处理邮件正文
mimebodypart mbp=new mimebodypart();
if ( contenttype() == null || contenttype.equals(""))
mbp.settext( content );
else
mbp.setcontent( content, content );
解码
javamail包中的mimeutility工具中也提供了对邮件信息解码的方法,都是以decode开头的一些方法(如decodetext)
例子:
string subject = mimemsg.getsubject();
string chsubject = mimeutility.decodetext(subject);
对于base64和qp编码后信息,decode* 方法能将他们正确的解码,但是,如果指定的字符集不对,那么javamail就会出现错误,不能正确地将其解码。
如有的邮件系统将”txt测试”编码后如下:
=?x-unkown?q?txt=b2=e2=ca=d4
这里指定的字符集是x-unknown,是非明确的字符集,javamail就不能正确的处理了,但是”测试”这两个中文字还是按照gbk字符集编码的,所以你可以手工的将编码方式信息改正确,再用decode*方法来解码。
例子:
if ( str.indexof("=?x-unknown?") >=0 ){
str = str.replaceall("x-unknown","gbk" ); // 将编码方式的信息由x-unkown改为gbk
try{
str = mimeutility.decodetext( str ); //再重新解码
}catch( exception e1){
return str ;
}
decode*方法都是根据在编码信息中包含的编码方式的信息来解码,所以decode*方法对邮件正文解码是无效的,因为邮件正文中不包含编码方式的信息。
同编码一样,邮件正文的解码也是由javamail做了。javamail根据content-transfer-encoding里的信息,来对邮件的正文解码。
客户程序从javamail取得的正文内容字符集为iso-8859-1,所以还要将字符集转换一下,例:
string correctcontent = new string( content.getbytes(“iso-8859-1”),”gb2312”);
correntcontent为正确的邮件正文了
