国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

jsp中文編碼亂碼的分析與解決

2011-08-29 05:39姚竟發(fā)唐小強
科技傳播 2011年24期
關鍵詞:亂碼編碼方式字節(jié)

姚竟發(fā),唐小強

保定電力職業(yè)技術學院,河北保定 071000

0 引言

JSP(Java Server Pages)是由Sun公司倡導、許多公司參與一起建立的一種動態(tài)網(wǎng)頁技術標準,jsp技術采用java作為開發(fā)腳本語言,java本身有著很好的跨平臺性,但是jsp在結(jié)合頁面技術后,最使人頭疼的一個問題就是不能很好的處理中文亂碼問題,在開發(fā)過程中帶來諸多不便,本文從剖析中文亂碼產(chǎn)生的各種原因入手,并給出相應的解決方案。

1 中文亂碼的根源

1)中文的編碼很多,在不同的情況下可能有多種不同的二進制值;

2)在某些應用中傳遞數(shù)據(jù)時,可能把中文轉(zhuǎn)換成其它形式;

3)在一個應用系統(tǒng)中,編碼之間存在各種各樣的轉(zhuǎn)換;

4)在轉(zhuǎn)換過程中需要制定編碼方式;

5)在具體實踐過程中,可能忽略或忘記設置編碼;

6)不同的軟件環(huán)境其編碼設置方式不同也容易導致中文亂碼;

7)編碼工具的多樣性以及對編碼的模糊認識不清。

2 常見的jsp頁面中文亂碼

網(wǎng)上常出現(xiàn)的 JSP/Servlet encoding 問題一般都表現(xiàn)在 browser或應用程序端,如:

瀏覽器中看到的 Jsp/Servlet 頁面中的漢字怎么都成了‘?’;瀏覽器中看到的 Servlet 頁面中的漢字怎么都成了亂碼;JAVA 應用程序界面中的漢字怎么都成了方塊;Jsp/Servlet 頁面無法顯示GBK 漢字;Jsp/Servlet 不能接收 form 提交的漢字;JSP/Servlet 數(shù)據(jù)庫讀寫無法獲得正確的內(nèi)容。

3 中文亂碼產(chǎn)生原因分析

1)在jsp中如果指定了<%@ page contentType="text/html;charset=A" %>,那么在該jsp中所有用到的數(shù)據(jù),如果沒有指定編碼,那么這些數(shù)據(jù)的編碼方式為A。

從request得到的數(shù)據(jù)如果沒有指定request的編碼的話,默認編碼為iso-8859-1。

假設從別的地方得到的數(shù)據(jù)是使用原來初始的編碼的,比如從數(shù)據(jù)庫得到數(shù)據(jù),如果數(shù)據(jù)庫的編碼是B,那么該數(shù)據(jù)的編碼是B而不是A,也不是系統(tǒng)默認的,此時,如果要輸出的數(shù)據(jù)的編碼不是A,那么,很可能顯示亂碼,所以首先要將數(shù)據(jù)正確轉(zhuǎn)化為編碼A,然后再輸出;

2)在jsp中如果沒有指定<%@ page contentType="text/html;charset=A" %>,那么默認的A編碼為iso-8859-1;

3)Servlet中 如 果 執(zhí) 行 了 像 response.setContentType("text/html;charset=A"),說明將response的字符輸出流編碼設置為A,所有要輸出的數(shù)據(jù)的編碼要轉(zhuǎn)化為A,否則就會出現(xiàn)亂碼。Servlet中從request得到的數(shù)據(jù)的編碼和jsp中一樣的,但是在servlet java文件中構造的數(shù)據(jù)是使用是系統(tǒng)默認的編碼(iso-8859-1);servlet中從外部得到的數(shù)據(jù)使用的是原來的編碼,比如從編碼為B的數(shù)據(jù)庫得到的數(shù)據(jù)是編碼為B,不是A,也不是系統(tǒng)默認的編碼。

4 中文亂碼解決方案

4.1 JSP頁面顯示為亂碼

<%@ page contentType="text/html; charset=gb2312"%>,就可以消除亂碼了。

4.2 Servlet接收Form/Request傳遞的參數(shù)時顯示為亂碼

方法1:在使用request獲取參數(shù)前,加上此語句:request.setCharacterEncoding("A"), 此處設置的編碼要和傳遞參數(shù)的頁面采用的編碼方式一致。

方法2:使用過濾器(filter),在doFilter方法中做如下處理:

}同時,在web.xml中配置該過濾器:

4.3 JSP接收Form/Request傳遞的參數(shù)時顯示為亂碼

servlet可以處理中文后,jsp頁面接收Form/Request傳遞的參數(shù)卻仍然顯示為亂碼。

如果你的表單內(nèi)容為

,也就是說沒有指定form的method屬性。而問題就發(fā)生在此,F(xiàn)orm的默認mothod屬性為get. 而get是通過在發(fā)送請求的url后面加?然后加參數(shù)和值來傳遞數(shù)據(jù)的的,編碼格式為ASCII.這就要求我們在傳遞的數(shù)據(jù)中有非ASCII字符或是超過了100個字符,那么你必須使用method="post",否則就會出現(xiàn)亂碼。所以解決方式為:第二種亂碼的解決方式+在發(fā)送頁面的Form中指定method為post。

4.4 數(shù)據(jù)庫中的中文出現(xiàn)亂碼

只要涉及中文的地方全部是亂碼,解決辦法:在數(shù)據(jù)庫的數(shù)據(jù)庫URL中加上useUnicode=true&characterEncoding=gb2312就OK了。

4.5 客戶端讀取數(shù)據(jù)庫中文亂碼

通過數(shù)據(jù)庫客戶端(比如 ODBC 或 JDBC)從數(shù)據(jù)庫服務器中讀取字符串時,客戶端需要從服務器獲知所使用的編碼。當數(shù)據(jù)庫服務器發(fā)送字節(jié)流給客戶端時,客戶端負責將字節(jié)流按照正確的編碼轉(zhuǎn)化成 UNICODE字符串。如果從數(shù)據(jù)庫讀取字符串時得到亂碼,而數(shù)據(jù)庫中存放的數(shù)據(jù)又是正確的。解決的辦法還是通過string = newString(string.getBytes("iso-8859-1"), "GB2312") 的方法,重新得到原始的字節(jié)串,再重新使用正確的編碼轉(zhuǎn)化成字符串。

4.6 頁面在編輯工具中打開時中文亂碼

在編輯工具中打開一個已經(jīng)存在的項目,頁面開始的編碼如果是gb2312,而打開該頁面的工具默認的編碼如果是iso8859-1(例如myeclipse和dreamweaver),這時可能產(chǎn)生亂碼,直接修改編輯工具的編碼方式與原來頁面編碼一致即可。

5 結(jié)論

上面提到的方法應該能解決大部分亂碼問題,如果在其他地方還出現(xiàn)亂碼,可能需要手動修改代碼。解決Java亂碼問題的關鍵在于在字節(jié)與字符的轉(zhuǎn)換過程中,你必須知道原來字節(jié)或轉(zhuǎn)換后的字節(jié)的編碼方式,轉(zhuǎn)換時采用的編碼必須與這個編碼方式保持一致。

[1]劉政.JSP數(shù)據(jù)庫Tomcat產(chǎn)生亂碼解決方案總結(jié)及原因(轉(zhuǎn)一).新浪博客,1994.

[2]孫鑫.servlet/jsp深入詳解.電子工業(yè)出版社,2008.

猜你喜歡
亂碼編碼方式字節(jié)
No.8 字節(jié)跳動將推出獨立出口電商APP
這些真的不是亂碼,是漢字
No.10 “字節(jié)跳動手機”要來了?
簡談MC7字節(jié)碼
混合編碼方式自適應差分進化算法優(yōu)化設計寬帶天線
炫邁:用神奇亂碼勾引你視線
淺談計算機網(wǎng)絡通信中實時差錯控制技術
如何解決Tomcat的亂碼