参数编码 完全解决方案

参数编码规范

一.摘要

我们经常要在页面传递中文数据,但是往往被文字编码所困惑.有时不了解到底是浏览器编码问题还是服务器编码问题.本文分析了互联网传递数据的编码原理, 并且提出了完善易用的解决方案.

二.原则

避免在get或者post参数时直接传递中文字符.中文参数需要经过编码后再传递.服务器端要使用相同的编码格式进行解码

三.错误观点

1.很多程序员认为url中可以传递中文. 
url中并不能携带中文参数.如果我们在浏览器中输入"http://localhost/?a=中文",感觉上我们在url中带了中文,实际上当按下回车键后,浏览器自动将其中的"中文"汉字进行编码后传递给服务器.

2.当获取中文参数产生了乱码时, 往往首先检查服务器端程序的编码格式.
很多人认为url可以传递中文,不知道浏览器有自动编码的行为, 所以单纯的认为问题出在服务器端.其实即使在服务器端找到了正确的编码格式,我们也不应该轻易地改变服务器的默认编码格式. 

3.传递参数前编码,使用Request对象获取参数时解码
很多的程序员认为认为,传递参数时我们使用UrlEncode等方式编码, 在接收时应该使用UrlDecode解码.这是常见的错误请大家一定要注意,使用默认的Request.QueryString和Request.Form时已经自动执行了一次解码,使用的解码格式是服务器端设置的默认编码格式.

四.原因

传递中文字符时,自动的编码解码格式和浏览器与服务器的设置有关.

测试Firefox3和IE6的Get方式发送中文参数, Firefox默认使用UTF-8格式编码中文参数, 而IE6即使在高级设置中设置了"总是以 UTF-8 发送URL", 仍然自动使用GB2312编码中文参数.

对于服务器端我们可以自由的控制解码的格式.但是往往是通过更改服务器配置进行全局的统一设置.比如对于ASP.NET程序.可以在Web.Config中设置服务器段的编码和解码格式:

<globalization culture="zh-CN" uiCulture="zh-CN" requestEncoding="UTF-8" responseEncoding="gb2312" />

但是我们没法控制浏览器端行为.用户可能使用不同的浏览器.

五.解决方案

1.统一默认的编码格式

(1)设置服务器端的编码格式为UTF-8

(2)传递参数全部进行编码,.服务器端(C#)使用Server.UrlEncode方法,客户端(Javascript)使用encodeURIComponent方法.

说明:

客户端的Javascript函数encodeURIComponent只能使用UTF-8编码格式. 所以需要设置服务器端request和response都为UTF-8.

缺陷是如果某些合作伙伴必须传递其他的编码格式的参数, 则服务器端或获取到乱码.此方案实现简单,适合大部分场景.

2.通过编码参数指定编码格式

为了解决可能存在的无法统一编码格式的问题, 我们使用一个参数"encoding"来显示的指定编码格式.encoding参数需要在所有的请求中传递,无论是get还是post.

(1)对于Javascript客户端编码而言, 仍然使用encodeURIComponent方法编码, 此时指定encoding参数的值为"UTF-8".

(2)对于传入给服务器端的其他编码格式, 比如GB2312, 我们不能使用默认的Request.Form或者QueryString方法进行编码.因为服务器端的编码格式可能设置为了UTF-8.此时使用Request.Form或者QueryString会自动使用服务器端指定的编码格式进行解码. 所以需要使用下面的方法自己处理请求,获取参数:

        /// <summary>
/// 根据指定的编码格式返回请求的参数集合 ziqiu.zhang 2009.1.19
/// </summary>
/// <param name="request">当前请求的request对象</param>
/// <param name="encode">编码格式字符串</param>
/// <returns>键为参数名,值为参数值的NameValue集合</returns>
public static NameValueCollection GetRequestParameters(HttpRequest request, string encode)
{
NameValueCollection result
= null;
Encoding destEncode
= null;

//获取指定编码格式的Encoding对象
if (!String.IsNullOrEmpty(encode))
{
try
{
//获取指定的编码格式
destEncode = Encoding.GetEncoding(encode);
}
catch
{
//如果获取指定编码格式失败,则设置为null
destEncode = null;
}
}

//根据不同的HttpMethod方式,获取请求的参数.如果没有Encoding对象则使用服务器端默认的编码.
if (request.HttpMethod == "POST")
{
if (null != destEncode)
{
Stream resStream
= request.InputStream;
byte[] filecontent = new byte[resStream.Length];
resStream.Read(filecontent,
0, filecontent.Length);
string postquery = destEncode.GetString(filecontent);
result
= HttpUtility.ParseQueryString(postquery, destEncode);
}
else
{
result
= request.Form;
}
}
else
{
if (null != destEncode)
{
result
= System.Web.HttpUtility.ParseQueryString(request.Url.Query, destEncode);
}
else
{
result
= request.QueryString;
}
}

//返回结果
return result;
}

NET技术参数编码 完全解决方案,转载需保留来源!

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。