再谈Java中文问题(2)

2008-02-23 09:49:38来源：互联网阅读 ()

--因为每个字符都大于7位，因此用11位编码：
--11000001 10000100 11000011 10100011
--C1-- 84--　C3--　 A3
--你会找到C1 84 C3 A3 --
　　　　
　　但是我们往往忽略掉这个参数，因此这样往往会有跨平台的问题：
　　--　　例３在中文平台上编译，生成ZhClass
　　--　　例３在英文平台上编译，输出EnClass
　　--1.　 ZhClass在中文平台上执行OK,但是在英文平台上不行
　　--2.　 EnClass在英文平台上执行OK,但是在中文平台上不行
　　原因：
　--1.在中文平台上编译后，其实str在运行态的char[]是0x4F60,　----
　--在中文平台上运行，FileWriter的缺省编码是gb2312,因此
　--CharToByteConverter会自动用调用gb2312的converter,把str转化
　--成byte输入到FileOutputStream中，于是0xC4,0xE3放进了文件。
　--但是如果是在英文平台下，CharToByteConverter的缺省值是8859_1,
　--FileWriter会自动调用8859_1去转化str,但是他无法解释，因此他会
　--输出"?"　----
　--2.　在英文平台上编译后，其实str在运行态的char[]是0x00C4 0x00E3,　----
　--在中文平台上运行，中文无法识别，因此会出现??
　--　　在英文平台上，0x00C4-->0xC4,0x00E3->0xE3，因此0xC4,0xE3被放进了
　--文件
----
1.对于JSP正文的解释：
--Tomcat首先看一下你的叶面中有没有"<%@page include的符号。有，则在相同
--地方设定response.setContentType(..);按照encoding的来读，没有他按照8859_1
--读取文件，然后用UTF-8写成.java文件，然后用sun.tools.Main去读取这个文件，
--（当然它使用UTF-8去读），然后编译成class文件
--setContentType改变的是out的属性，out变量缺省的encoding是8859_1

2.对Parameter的解释
--很不幸Parameter只有ISO8859_1的解释，这个质料可以在Servlet的实现代码中找到。

3.对include的解释
格式的，但是很不幸，由于那个写"org.apache.jASPer.compiler.Parser"的人
在数组JspUtil.ValidAttribute[]忘记加了一个参数：encoding,因此导致不支
持这种方式。你完全可以编译源代码，加上对encoding的支持

总结：

如果你在NT底下，最简单的方法就是欺骗java,不加任何Encoding变量：
<html>
你好<%=request.getParameter("value")%>
</html>

http://localhost/test/test.jsp?value=你

结果:你好你

但这种方法局限性较大，比如对上传的文章分段，这样的做法是死定的，最好的
解决方案是用这种方案：
<%@ page contentType="text/html;charset=gb2312" %>
<html>
你好<%=new String(request.getParameter("value").getBytes("8859_1"),"gb2312")%>
</html>

上一篇： Struts 和 Tiles 辅助基于组件的开发
下一篇： Struts 用户指南（一）

标签：

版权申明：本站文章部分自网络，如有侵权，请联系：west999com@outlook.com
特别注意：本站所有转载文章言论不代表本站观点，本站所提供的摄影照片，插画，设计作品，如需使用，请与原作者联系，版权归原作者所有