再谈Java中文问题(2)
2008-02-23 09:49:38来源:互联网 阅读 ()
--因为每个字符都大于7位,因此用11位编码:
--11000001 10000100 11000011 10100011
--C1-- 84-- C3-- A3
--你会找到C1 84 C3 A3 --
但是我们往往忽略掉这个参数,因此这样往往会有跨平台的问题:
-- 例3在中文平台上编译,生成ZhClass
-- 例3在英文平台上编译,输出EnClass
--1. ZhClass在中文平台上执行OK,但是在英文平台上不行
--2. EnClass在英文平台上执行OK,但是在中文平台上不行
原因:
--1.在中文平台上编译后,其实str在运行态的char[]是0x4F60, ----
--在中文平台上运行,FileWriter的缺省编码是gb2312,因此
--CharToByteConverter会自动用调用gb2312的converter,把str转化
--成byte输入到FileOutputStream中,于是0xC4,0xE3放进了文件。
--但是如果是在英文平台下,CharToByteConverter的缺省值是8859_1,
--FileWriter会自动调用8859_1去转化str,但是他无法解释,因此他会
--输出"?" ----
--2. 在英文平台上编译后,其实str在运行态的char[]是0x00C4 0x00E3, ----
--在中文平台上运行,中文无法识别,因此会出现??
-- 在英文平台上,0x00C4-->0xC4,0x00E3->0xE3,因此0xC4,0xE3被放进了
--文件
----
1.对于JSP正文的解释:
--Tomcat首先看一下你的叶面中有没有"<%@page include的符号。有,则在相同
--地方设定response.setContentType(..);按照encoding的来读,没有他按照8859_1
--读取文件,然后用UTF-8写成.java文件,然后用sun.tools.Main去读取这个文件,
--(当然它使用UTF-8去读),然后编译成class文件
--setContentType改变的是out的属性,out变量缺省的encoding是8859_1
2.对Parameter的解释
--很不幸Parameter只有ISO8859_1的解释,这个质料可以在Servlet的实现代码中找到。
3.对include的解释
格式的,但是很不幸,由于那个写"org.apache.jASPer.compiler.Parser"的人
在数组JspUtil.ValidAttribute[]忘记加了一个参数:encoding,因此导致不支
持这种方式。你完全可以编译源代码,加上对encoding的支持
总结:
如果你在NT底下,最简单的方法就是欺骗java,不加任何Encoding变量:
<html>
你好<%=request.getParameter("value")%>
</html>
http://localhost/test/test.jsp?value=你
结果:你好你
但这种方法局限性较大,比如对上传的文章分段,这样的做法是死定的,最好的
解决方案是用这种方案:
<%@ page contentType="text/html;charset=gb2312" %>
<html>
你好<%=new String(request.getParameter("value").getBytes("8859_1"),"gb2312")%>
</html>
上一篇: Struts 和 Tiles 辅助基于组件的开发
下一篇: Struts 用户指南(一)
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
上一篇:Maven的使用(1)
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash
