織夢DEDECMS系統編碼篇之GBK和UTF-8的區別?

在選擇織夢DEDECMS系統之前,總會有不同的版本,其中就有程式的編碼區別,那GBK和UTF-8兩種版本的編碼本質區別是什麼呢?今天小編就講解這兩種編碼的區別。

織夢DEDECMS系統編碼篇之GBK和UTF-8的區別

方法/步驟

首先來看所謂編碼,是以固定的順序排列字元,並以此做為記錄、存貯、傳遞、交換的統一內部特徵,這個字元排列順序被稱為“編碼”。

GBK和UTF-8都是系統的字元編碼。

織夢DEDECMS系統編碼篇之GBK和UTF-8的區別

織夢DEDECMS系統編碼篇之GBK和UTF-8的區別

區別一:

GBK是漢字編碼標準之一,全稱《漢字內碼擴充套件規範》(GBK即“國標”、“擴充套件”漢語拼音的第一個字母,英文名稱:Chinese Internal Code Specification),GBK 亦採用雙位元組表示,總計23940 個碼位,共收入21886個漢字和圖形符號,其中漢字(包括部首和構件)21003 個,圖形符號883 個。

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,又稱萬國碼。由Ken Thompson於1992年建立。現在已經標準化為RFC 3629。UTF-8用1到6個位元組編碼UNICODE字元。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言。

總結:gbk是國家編碼,包含全部中文字元,採用雙位元組方式編碼,無論是中文、英文、字元都採用雙位元組編碼,僅在區分中文的時候將最高位規定為1。utf-8是國際編碼,包含全世界所有國家需要用到的字元,對英文使用一個位元組,中文使用三個位元組來編碼。

織夢DEDECMS系統編碼篇之GBK和UTF-8的區別

對英文使用8位(即一個位元組),中文使用24為(三 個位元組)來編碼。UTF-8包含全世界所有國家需要用到的字元,是國際編碼,通用性強。UTF-8編碼的文字可以在各國支援UTF8字符集的瀏覽器上顯 示。如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支援包。

總結:

1、GBK(國標擴充套件)屬於國家編碼,使用受侷限性,utf8通用性好。

2、UTF-8屬於國際編碼,通用性好,就算外國人用英文瀏覽器也能顯示中文,而無需安裝IE的中文語言支援包。

3、GBK編碼中文(英文)佔2位元組,utf8編碼中文佔三位元組,英文佔1個位元組,GBK編碼要比UTF-8編碼節約資料空間。

注意事項

開心大發現,方便你我他,經驗源生活,實用當收藏

相關問題答案