js编码处理

yeelor

浏览: 408650 次
性别:
来自: 上海

最近访客更多访客>>

zwlzwl376

我武功这么高

redsnower

caydenliu

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

JAVA代码中 java.net.URLDecoder

java.net.URLEncoder

例： String s ="中国";

s=URLEncoder.encode(s,"UTF-8");

System.out.println(s);

s=URLDecoder.decode(s, "UTF-8");

System.out.println(s);

分别对应于

JavaScript 中的 encodeURI 和 decodeURI 、

encodeURIComponent 和 decodeURIComponent.

原文地址：http://www.blogjava.net/hummer008/articles/213910.html

1. 使用 JS 中的 encodeURIComponent 或 encodeURI 方法。

说明：

encodeURIComponent(String)

对传递参数进行设置。不编码字符有 71 个： ! ， ' ， ( ， ) ， * ， - ， . ， _ ， ~ ， 0-9 ， a-z ， A-Z 。

例：

var url = “<a href=’http://cancait.blog.163.com/name=” + encodeURIComponent(“ 中国 ”) + “’> 中国 </a>”;

encodeURI(String)

对 URL 整体转换。不编码字符有 82 个： ! ， # ， $ ， & ， ' ， ( ， ) ， * ， + ，，， - ， . ， / ， : ， ; ， = ， ? ， @ ， _ ， ~ ， 0-9 ， a-z ， A-Z 。

例：

var url = “<a href=’” + encodeURI(“http://cancait.blog.163.com/name= 中国 ”) + “’> 中国 </a>”;

乱码处理实例：

/////////////////////////////////////////////////////////////////////////////////////

初始页面内容如下 (hello.jsp) ：

/////////////////////////////////////////////////////////////////////////////////////
<%@ page language="java" import="java.util.*" pageEncoding="GB18030"%>
<%String path = request.getContextPath();%>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
   <head>
     <title>AJAX 提交页面 </title>
<meta http-equiv="Content-Type" content="text/html; charset=GB18030">
    <script type="text/javascript">
     function justdo(){
   var post="name= 王力猛 &email=wallimn@sohu.com&bokee=http://wallimn.bokee.com ";
   post = encodeURI(post);
   post = encodeURI(post);// 两次，很关键
   var xmlObj = new ActiveXObject('Msxml2.XMLHTTP');
   var URL = '<%= path%>/page/act.jsp';// 文件名需要调整成测试时的相应位置 ?
   xmlObj.open ('post' ， URL ， true);
   xmlObj.setrequestheader("cache-control" ， "no-cache");
   xmlObj.setrequestheader("Content-Type" ， "application/x-www-form-urlencoded");
   xmlObj.send (post);// 注意 :POST 方式，使用这个来发送内容 ?
    }
    </script>
   </head>
   <body>
   <input type="button" value=" 提交 " onclick="justdo()"/>
    </body>
</html>
/////////////////////////////////////////////////////////////////////////////////////
　　 ajax 请求处理页面（ act.jsp ）的内容如下 :
/////////////////////////////////////////////////////////////////////////////////////
<%@ page language="java" import="java.util.*" pageEncoding="GB18030"%>
<%String path = request.getContextPath();%>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
< %@page import="java.net.URLDecoder"%>
<html>
   <head>
     <title>ajax deal</title>
<meta http-equiv="pragma" content="no-cache">
<meta http-equiv="cache-control" content="no-cache">
<meta http-equiv="expires" content="0">
   </head>
   <body>
   <%
   // 遍历输出参数内容。
   for (Enumeration e = request.getParameterNames(); e.hasMoreElements();) {
    String h = (String) e.nextElement();
    String v = request.getParameter(h);
    String mm =   java.net.URLDecoder.decode(v ， "UTF-8");
    System.out.println(" 请求参数 : " + h + " = " + mm);
   }
    %>
   </body>
</html>
/////////////////////////////////////////////////////////////////////////////////////

说明：

java.net.URLencode 和 java.net.URLDecode 分别对应于 JavaScript 中的 encodeURI 和 decodeURI 、 encodeURIComponent 和 decodeURIComponent.

为什么要连续两次调用 encodeURI(String) 方法呢？是因为 Java 中的 request.getParameter(String) 方法会进行一次 URI 的解码过程，调用时内置的解码过程会导致乱码出现。而 URI 编码两次后， request.getParameter(String) 函数得到的是原信息 URI 编码一次的内容。接着用 java.net.URLDecoder.decode(String str,String codename) 方法，将已经编码的 URI 转换成原文。

2. 使用 JS 中的 escape 方法。

说明：

escape(String)

对 0-255 以外的 unicode 值进行编码时输出 %u**** 格式，其它情况下 escape ， encodeURI ， encodeURIComponent 编码结果相同。

例：

var url = “<a href=’http://cancait.blog.163.com/name=” + escape (“ 中国 ”) + “’> 中国 </a>”;

乱码处理实例：

/////////////////////////////////////////////////////////////////////////////////////

例子跟上面一样。只有这里不同。

(hello.jsp)

post = escape(post);
post = escape (post);// 两次，很关键

(act.jsp)

String h = (String) e.nextElement();
    String v = request.getParameter(h);
String mm =   EscapeUnescape.unescape( v ， "UTF-8");
    System.out.println(" 请求参数 : " + h + " = " + mm);

/////////////////////////////////////////////////////////////////////////////////////

(EscapeUnescape.java)Java 中的 escape 和 unescape. 内容如下：

/////////////////////////////////////////////////////////////////////////////////////

package cn.kgnews.util;

public class EscapeUnescape {

public static String escape(String src) {

int i;

char j;

StringBuffer tmp = new StringBuffer();

tmp.ensureCapacity(src.length() * 6);

for (i = 0; i < src.length(); i++) {

j = src.charAt(i);

if (Character.isDigit(j) || Character.isLowerCase(j)

|| Character.isUpperCase(j))

tmp.append(j);

else if (j < 256) {

tmp.append("%");

if (j < 16)

tmp.append("0");

tmp.append(Integer.toString(j ， 16));

} else {

tmp.append("%u");

tmp.append(Integer.toString(j ， 16));

}

return tmp.toString();

}

public static String unescape(String src) {

StringBuffer tmp = new StringBuffer();

tmp.ensureCapacity(src.length());

int lastPos = 0 ， pos = 0;

char ch;

while (lastPos < src.length()) {

pos = src.indexOf("%" ， lastPos);

if (pos == lastPos) {

if (src.charAt(pos + 1) == 'u') {

ch = (char) Integer.parseInt(src

.substring(pos + 2 ， pos + 6) ， 16);

tmp.append(ch);

lastPos = pos + 6;

} else {

ch = (char) Integer.parseInt(src

.substring(pos + 1 ， pos + 3) ， 16);

tmp.append(ch);

lastPos = pos + 3;

}

} else {

if (pos == -1) {

tmp.append(src.substring(lastPos));

lastPos = src.length();

} else {

tmp.append(src.substring(lastPos ， pos));

lastPos = pos;

}

return tmp.toString();

}

/////////////////////////////////////////////////////////////////////////////////////

说明：

EscapeUnescape.java 类是 Java 中的 escape 和 unescape 。

原理跟上例一样。

3. 用 JavaScript 实现 java 中的 URLencode 跟 URLdecode.

说明：

这种方法服务器端代码不必修改。直接 request.getParameter() 来获取就可以了。

JavaScript 中的 URLencode 跟 URLdecode 实现如下：

/////////////////////////////////////////////////////////////////////////////////////

(UrlEncodeUrlDecode_gecko.js) 非 IE 实现方法如下：

完整代码可到这里下载：

http://www.blueidea.com/user/qswh/qswhU2GB.js

/////////////////////////////////////////////////////////////////////////////////////

var qswhU2GB = […..]; // 此数组为 GB Unicode 对照表

function UrlEncode(str){

var i ， c ， ret="" ， strSpecial="!\"#$%&'()*+ ， /:;<=>?@[\]^`{|}~%";

for(i=0;i<str.length;i++){

if(str.charCodeAt(i)>=0x4e00){

c=qswhU2GB[str.charCodeAt(i)-0x4e00];

ret+="%"+c.slice(0 ， 2)+"%"+c.slice(-2);

}

else{

c=str.charAt(i);

if(c==" ")

ret+="+";

else if(strSpecial.indexOf(c)!=-1)

ret+="%"+str.charCodeAt(i).toString(16);

else

ret+=c;

}

return ret;

}

function UrlDecode(str){

var i ， c ， d ， t ， p ， ret = "";

function findPos(str){

for(var j = 0; j < qswhU2GB.length; j++){

if(qswhU2GB[j] == str){

return j;

}

return -1;

}

for(i = 0;i < str.length;){

c = str.charAt(i);i++;

if(c != "%"){

if(c == "+"){

ret += " ";

}else{

ret += c;

}

}else{

t = str.substring(i ， i+2);i += 2;

if(("0x" + t) > 0xA0){

d = str.substring(i+1 ， i+3);i += 3;

p = findPos(t + d);

if(p != -1){

ret += String.fromCharCode(p + 0x4e00);

}

}else{

ret += String.fromCharCode("0x" + t);

}

return ret;

}

function getSpell(str ， sp){

var i ， c ， t ， ret="";

if(sp==null)sp="";

for(i=0;i<str.length;i++){

if(str.charCodeAt(i)>=0x4e00){

c=parseInt(qswhU2GB[str.charCodeAt(i)-0x4e00] ， 16);

if(c<55290){

for(t=qswhSpell.length-1;t>0;t=t-2)if(qswhSpell[t]<=c)break;

if(t>0)ret+=qswhSpell[t-1]+sp;

}

return ret.substr(0 ， ret.length-sp.length);

}

/////////////////////////////////////////////////////////////////////////////////////

(UrlEncodeUrlDecode_ie.js)IE 实现方法如下：

/////////////////////////////////////////////////////////////////////////////////////

function UrlEncode(str) {

var ret = "";

var strSpecial = " ~!\"#$%&'()*+- ， /:;<=>?[]^`{|}~%";

for (var i = 0; i < str.length; i++) {

var chr = str.charAt(i);

strstr = chr;

execScript("c = hex(asc(strstr))" ， "VBScript");

if (parseInt("0x" + c) > 127) {

ret += "%" + c.slice(0 ， 2) + "%" + c.slice(-2);

} else {

if (strSpecial.indexOf(chr) != -1) {

ret += "%" + c.toString(16);

} else {

ret += chr;

}

return ret;

}

function UrlDecode(str) {

var ret = "";

for (var i = 0; i < str.length; i++) {

var chr = str.charAt(i);

if (chr == "+") {

ret += " ";

} else {

if (chr == "%") {

var asc = str.substring(i + 1 ， i + 3);

if (parseInt("0x" + asc) > 127) {

temp = parseInt("0x" + asc + str.substring(i + 4 ， i + 6));

execScript("rt = chr(temp)" ， "VBScript");

ret += rt;

i += 5;

} else {

temp = parseInt("0x" + asc);

execScript("ret = ret + chr(temp)" ， "VBScript");

i += 2;

}

} else {

ret += chr;

}

return ret;

}

/////////////////////////////////////////////////////////////////////////////////////

(loadcssorjs.js) 自动识别浏览器动态导入 JS/CSS

实现方法如下：

/////////////////////////////////////////////////////////////////////////////////////

Created by CAnca.2007.9.4

function LoadScript(url) {

document.write("<scr" + "ipt type=\"text/javascript\" src=\"" + url + "\" onerror=\"alert('Error loading ' + this.src);\"></scr" + "ipt>");

}

function LoadCss(url) {

document.write("<link href=\"" + url + "\" type=\"text/css\" rel=\"stylesheet\" onerror=\"alert('Error loading ' + this.src);\" />");

}

var sSuffix = /msie/.test(navigator.userAgent.toLowerCase()) ? "ie" : "gecko";

LoadScript("js/UrlEncodeUrlDecode_" + sSuffix + ".js");

使用方法：

将三个 JS 文件放在同目录。在页面导入 loadcssorjs.js 。在要进行编码的地方使用 UrlEncode 方法即可。

例：

//index.html

<html>

<head>

var url = “ http://cancait.blog.163.com/name= ” + UrlEncode (“ 中国人 ”);

window.open(url);

</script>

</head>

<body>

…..

</body>

</html>

三种解决方案的比较：

第一种，在服务器端需要一次 java.net.URLdecode(String) 转码。使用起来，不太方便。

第二种，要建立 Java 版的 escape 跟 uncape 。在服务器端还是需要一次 uncape 转码。使用起来，不太方便。

第三种，是最方便的一种方法。只需要客户端进行编码。服务器端可以不做任何修改。唯一缺点的是： firefox 浏览网页时，要加载一个 150K 的 UrlEncodeUrlDecode_gecko.js 文件。影响了浏览速度。（但本人还是推荐使用这方案。）

总结：

当然， Ajax 实现不乱码，可以不用这三种方案，用这三种方案，只是迫不得已的做法。通常造成乱码的原因有以下几点：

1. xmlhttp 返回的数据默认的字符编码是 utf-8 ，如果前台页面是 gb2312 或者其它编码数据就会产生乱码。

2. post 方法提交数据默认的字符编码是 utf-8 ，如果后台是 gb2312 或其他编码数据就会产生乱码。

解决方法：

推荐方法：由于 Javascript 沿用 java 的字符处理方式，内部是使用 unicode 来处理所有字符的。前台后台都用 utf-8 编码，这样可以省不少麻烦，从根本上解决了乱码问题 . 优点是效率高，而且符合目前的形式， utf-8 编码本身就是一种比较优秀的编码，没有语言限制 . 缺点只能调用自己的后台编码或者其他的 utf-8 的编码。

前台更改为

后台 asp 中第一行加入如下代码

span

分享到：

String 等号==比较和 equals 比较 | Mybatis-There is no getter for property ...

2012-05-29 15:17
浏览 1945
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

js编码处理

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

js编码处理

评论

发表评论

相关推荐

解决jquery 和 prototype 的冲突问题

JS中引用JSTL中的变量

最近访客更多访客>>