【IT168 技术文章】
(一)JSP的中文乱码问题
其根源在于:Web容器(Tomcat)默认的字符处理编码是iso-8859-1,对于需要在浏览器页面上显示中文的JSP程序,
但在程序中并没有指定中文的字符集,那么中文将在浏览器页面上显示为乱码。当然,前面所说的是指在Tomcat服务器下的,其他服务
器有些不是这样的,比如BEA Weblogic和IBM Websphere是从操作系统中取得默认的编码,然后按该编码来转码所有用户请求.Struts中
文问题有三种:发送请求时的中文问题、处理响应结果的中文问题和国际化资源文件的中文问题。
1. 发送请求时的中文问题
客户机向服务器发送请求时,根据所使用浏览器的不同可能会有不同的编码形式。不过通常情况下在请求到达Web容器前要将之转码,
转成某种固定的编码以方便Web应用的处理。这种问题有三种处理方法:
第一种(针对Tomcat 5 对POST请求有效,GET请求无效,因为Tomcat 5 对POST和GET请求时分别处理的)可以采用设置用户请求对象的编码形式,也就是以HttpServletRequest对象的编码的形式来进行用户请求的转码:
//将用户请求转码为GB2312、GB18030、GBK、UTF-8 等型,具体转为什么类型的编码以您的jsp文件的编码方式为准,java、jsp 、js 、css应保持一致的编码方式。这里以GBK为例。
request.setCharacterEncoding("GBK");
第二种(对GET请求有效),可以在Servlet中对用户输入的数据进行转码。Web容器接受到一个请求时,它会将它发往某个处理的Servlet。在Servlet中直接获取用户请求的数据,然后将之转码为需要的格式,例如把数据转换为GBK格式:
String username = request.getParameter("username");
username = new String(username.getBytes("iso-8859-1”), "GBK");
以上两种方法都是很常用的,但第一种是每个页面都要去修改,当JSP页面很多时比较麻烦,第二种就每个发送的数据都要转码,也很麻烦。
第三种,就是采用Filter过滤器方式,将用户的所有请求都通过过滤器进行转码,这种方法就克服了以上两种方法的缺点。代码如下:
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain ) throws IOException, ServletException {
request.setCharacterEncoding("GBK");
//response.setContentType("text/html;charset=GBK");
chain.doFilter(request, response);
}
这里转码为GBK过滤器的主要代码,当然还要把这个类要在web.xml文件中部署。
2. 处理响应结果的中文问题
响应的结果包括Servlet、JSP和HTML三种情况,可以通过以下方式设置响应结果编码:
对于Servlet,可以在Servlet中为其设置响应代码类型,代码如下:
response.setContentType("text/html;charset=GBK"); 也可把这句加到上面的Filter中,如注释掉的部分。
有人说用 response.setCharacterEncoding("GBK"); 无效,必须用 response.setContentType("text/html;charset=GBK"); 本人没试过。
对于JSP,是比较方便的,只需要在JSP最前部分按如下方式声明:
<%@ page contentType="text/html;charset=GBK"%>
对于HTML,其和JSP文件基本类似,也是在页面最前部分按如下方式声明:
<head>
<META HTP-EQUIV="contentType" CONTENT="text/html;charset=GBK">
</head>
3. 国际化资源文件的中文问题
一个Struts应用程序中,可以配置多个资源包,无论是Action、ActionForm还是JSP都可以访问这些包中的资源。资源包就是由扩展名为.properties的文件组成的一组具有相同前缀的文件,如ApplicationResources_zh_CN.properties、ApplicationResources_zh.properties和ApplicationResources.properties。这些文件就构成一个Struts的资源包,它们都有一个统一的前缀ApplicationResources,凡是有相同前缀的资源文件就都属于一个包。
当用MyEclipse编写资源文件时,默认是不能保存中文的,因为默认保存编码的格式是ISO-8859-1,这就需要修改为gb2312或者gbk编码格式。Windons -->Preferences-->General -->Content Types-->Text-->Java Properties File,在最下方把其Default encoding改为"UTF-8”,然后"update”就可以保存中文了。但就这样保存的中文还是不能够在页面上使用的,因为Web容器默认是使用ISO-8859-1,也就会把中文用ISO-8859-1的格式发送给客户页面,显示的还是乱码,这就是JAVA国际化的问题。JAVA是支持unicode编码格式的,unicode是国际统一通用编码,所以不管什么格式的编码转化为unicode编码肯定不会显示乱码的。这个时候就是需要把资源文件的UTG-8编码格式转化为unicode编码格式,而SUN公司又提供了这样的一种工具。在JDK的安装目录bin下,有一个叫native2ascii可执行文件,这个是专门来进行资源文件转码的。打开cmd,进入JDK的bin目录下,把资源文件拷贝到该目录下,执行该命令。比如:
native2ascii –encoding GBK ApplicationResources.properties ApplicationResources_zh_CN.properties 就是把GBK编码格式ApplicationResources.properties转化为unicode编码格式ApplicationResources_zh_CN.properties,这样显示页面时就不会出现乱码了。
(二)Websphere 默认的字符处理编码要看 :
管理控制台--->服务器--->应用程序服务器--->server1--->java和进程管理--->进程定义--->java虚拟机--->通用jvm参数 的设置了,如为,-Dfile.encoding=GB2312 -Dclient.encoding.override=GBK 则是GBK。
我们可以通过如下判定:
用ieHTTPHEADERS 等工具查看POST请求中的请求参数,汉字是经过Encoding的(是按哪种字符集编码要看jsp文件的编码方式了),
由 % 间隔的十六进制数组成,如下 jsp文件的字符集是UTF-8,form 表单提交,用ieHTTPHEADERS 工具查得请求参数为:
struts.token.name=struts.token&struts.token=HPADE1CXRJ0PASL2V7RQFVXJLLFB1OUE&ptoId=244&
orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0&orgId=&oscId=&oscType=H1&ptoType=01&impDate=2009-06-16
&details=%E5%85%B7%E4%BD%93%E6%83%85%E5%86%B5
orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0 经UTF-8 编码的,其中文对应的是"组织名称" ,E7BB84 是"组"的十六进制表示,
E7BB87 是"织"的十六进制表示等。
form表提交后,在ACTION中查看 "组织名称" 变为乱码: "缁勭粐鍚嶇О"
通过以下代码分析:
String JinZhi16 = Integer.valueOf("E7",16).toString(); // 把E7 转为十进制,这里JinZhi16 = 231 ,BB 对应的十进制:187
System.out.println("JinZhi16 = "+JinZhi16);
// 这里的231、187,132等都是通过Integer.valueOf("E7",16).toString()分别把对应的E7、BB、84 等转过来的十进制数字。
byte[] bt = new byte[]{(byte)231,(byte)187,(byte)132,(byte)231,(byte)187,(byte)135,(byte)229,(byte)144,(byte)141,(byte)231,(byte)167,(byte)176};
System.out.println("GB18030 = "+new String(bt,"GB18030"));
System.out.println("GBK = "+new String(bt,"GBK"));
System.out.println("UTF-8 = "+new String(bt,"UTF-8"));
String aa = new String(bt,"GB18030");
System.out.println("GBK = "+new String(aa.getBytes("GBK"),"UTF-8"));
String encoding=System.getProperty("file.encoding");
System.out.println("Default System Encoding: " + encoding);
输出内容:
JinZhi16 = 231
GB18030 = 缁勭粐鍚嶇О
GBK = 缁勭粐鍚嶇О
UTF-8 = 组织名称
GBK = 组织名称
Default System Encoding: UTF-8
我们发现:form表单提交 orgName=%E7%BB%84%E7%BB%87%E5%90%8D%E7%A7%B0(即"组织名称") 到 ACTION ,是 "缁勭粐鍚嶇О"
这样的乱码,而 System.out.println("GB18030 = "+new String(bt,"GB18030")); 输出的也为"缁勭粐鍚嶇О" ,所以可假设其
编码字符集也为GB18030或GBK,用通过System.out.println("GBK = "+new String(aa.getBytes("GBK"),"UTF-8")); 得知确为GBK
或GB18030。GB18030是 GBK的超集,他支持3--4字节的编码,不过这两个标准都支持GB2312-80 。
查看WebSphere的 "通用jvm参数" 的设置了是 -Dfile.encoding=GB2312 -Dclient.encoding.override=GBK
所以最后把-Dfile.encoding=GB2312 -Dclient.encoding.override=GBK 改为
-Dfile.encoding=UTF-8 -Dclient.encoding.override=UTF-8 就可以解决乱码了(对get 和 post 有效)。
修改完上述参数要从起WebSphere的服务,远程登录到安装WebSphere的机器上,你的was发布的ip 就是WebSphere所在的机器, 其用户名和密码同登录到发布was 的WebSphere的控制台一样,因为本来就是同一台机器。登录到WebSphere控制台 ,服务器 ——>应用程序服务器 找到对应的节点名称如 "cncaitKaifaNode03" ,在控制面板 - > 服务 -> 查看以IBM开头的有"cncaitKaifaNode03" 标识的WebSphere服务,重启。
用如下过滤器不管用。
public class ChartFilter implements Filter{
private String encoding = "UTF-8";
public void init(FilterConfig config) throws javax.servlet.ServletException {
String temp = config.getInitParameter("encoding");
encoding = (temp == null) ? encoding : temp;
}
public void doFilter(ServletRequest request,
ServletResponse response,
FilterChain chain ) throws java.io.IOException, javax.servlet.ServletException {
System.out.println("-----------过滤器-----------encoding = "+encoding);
request.setCharacterEncoding(encoding);
response.setCharacterEncoding(encoding);
response.setContentType("text/html; charset="+encoding);
chain.doFilter(request, response);
}
public void destroy() {
}
}
(三)共同问题:
Tomcat 5 和 webSphere6.1 对get请求,如果有奇数个汉字的参数,则紧接着&的下一参数会追加在这个汉字参数后。如:
String url = "/cnca/servlet/update.action?orgName=中国船级社质量认证公司&oscYM=2009-06" ,则取得orgName的值
为中国船级社质量认证公oscYM=2009-06,而oscYM 没有取到值。
解决的简单方法就是在 orgName=中国船级社质量认证公司之后 &oscYM=2009-06之前加一个全角空格。
---------------------------------------------------------------
程序从tomcat迁移至websphere的修改
1.普通应用部署在websphere上中文乱码问题
解决:管理控制台--->服务器--->应用程序服务器--->server1--->java和进程管理--->进程定义--->java虚拟机--->将通用jvm参数设置为:
根据你的jsp java文件的编码是什么而定,如果是UTF-8 则设置为 -Ddefault.client.encoding=UTF-8 -Dclient.encoding.override=UTF-8 -Dfile.encoding=UTF-8 -Duser.language=zh -Duser.region=CN
2.修改hibernate.cfg.xml (针对我的项目cnca(自律))
<property name="connection.datasource">jdbc/cncaprod</property>
以下下是网上搜集的:
在部署文件中设定了jdbc引用名jdbc/sample,jndi名字为jdbc/sample
如果采用如下代码:
javax.sql.DataSource ds = (javax.sql.DataSource)ctx.lookup("java:comp/env/jdbc/sample");
conn = ds.getConnection();
运行就报错:05-7-1 10:02:24:178 CST] 00000031 SystemErr R Naming-Exception: Exception occurred while the JNDI NamingManager was processing a javax.naming.Reference object.
去掉"java:comp/env/”就好了。
解决:确认部署后在概要表空间下的config\cells\CN7642012HNode01Cell\applications目录下相应应用的web.xml文件下有正确的配置JNDI,如:
<b><resource-ref id="ResourceRef_1097466019938"></b>
<res-ref-name>jdbc/yjjndi</res-ref-name>
<res-type>javax.sql.DataSource</res-type>
<res-auth>Container</res-auth>
<res-sharing-scope>Shareable</res-sharing-scope>
</resource-ref>
再查看同目录下的ibm-web-bnd.xmi文件中id是否和上面的id相同,如下(注意粗体部分):
<b><resRefBindings xmi:id="ResourceRefBinding_1097466019938" jndiName="jdbc/yjjndi" loginConfigurationName="DefaultPrincipalMapping">
<bindingResourceRef href="WEB-INF/web.xml#ResourceRef_1097466019938"/></b>
<properties xmi:id="Property_1165956970219" name="com.ibm.mapping.authDataAlias" value="CN7642012HNode01/yjj2c" description="description"/>
</resRefBindings>
3. 对get请求,去掉类似new String(username.getBytes("iso-8859-1”), "GBK"); 的代码段。