客户端cookie中文编程(转自yesky.com)
cookie的使用中,我们发现这样一个问题:如果写入cookie的内容是中文(如用户称呼),用服务器端程序(如asp或php)读出完全正确,但是用一般的javascript或vbscript的读cookie函数取出的却是一堆乱码。这是一个棘手的问题,因为在有些情况下,cookie的内容需要在客户机端用脚本语言读取。如果你写入了中文,得到了一堆乱码,是不是感觉很别扭呢?解决这个问题,还要从cookie的存取方式说起。
我们知道,写入cookie内容前需要进行escape(十六进制编码),编码时又是以字节为单位的,这就是问题的关键所在:任何一个汉字都会被拆成两个字节分别编码;而在读cookie时,unescape又以字节单位解码,因此最后每个汉字都变成了两个字节的乱码。怎么办呢?asp或php方式能够正确读出,应该是在unescape解码后,又按照unicode编码把其中的汉字拼了出来。如果这样的话,能不能找到一种变通的方法解决这个问题呢?仔细研究后发现,只要在十六进制codec(编解码)过程中能够保存汉字信息就行了,因而我们需要再外包一层codec过程,方案如下:
1.在escape编码前,把cookie字符串中的每个字符转换为unicode码的字符串形式(用一特殊字符作为字串的分隔符)。
2.在unescape解码后,先把所有unicode字串提取出来,再用对应的函数转换为原字符。
<script language=javascript>
<!–
//编码程序:
function codecookie(str)
{
var strrtn="";
for (var i=str.length-1;i>=0;i–)
{
strrtn+=str.charcodeat(i);
if (i) strrtn+="a"; //用a作分隔符
}
return strrtn;
}
//解码程序:
function decodecookie(str)
{
var strarr;
var strrtn="";
strarr=str.split("a");
for (var i=strarr.length-1;i>=0;i–)
strrtn+=string.fromcharcode(eval(strarr[i]));
return strrtn;
}
//–>
</script>
vbscript版程序如下:
<script language=vbscript>
<!–
"编码程序:
function codecookie(str)
dim i
dim strrtn
for i=len(str) to 1 step -1
strrtn=strrtn & ascw(mid(str,i,1))
if (i<>1) then strrtn trrtn & "a" "用a作分隔符
next
codecookie=strrtn
end function
"解码程序:
function decodecookie(str)
dim i
dim strarr,strrtn
strarr=split(str,"a");
for i=ubound(strarr)-lbound(strarr) to 1 step -1
strrtn=strrtn & chrw(val(strarr(i)))
next
decodecookie=strrtn
end function
–>
</script>
