ISO-10646-UCS-4 |
ISO 10646 |
具有 31 位元碼空間的通用字元集,由 ISO/IEC 10646 標準化為 UCS-4。它與最新版本的 Unicode 碼位圖保持同步。 |
如果在編碼轉換功能中使用此名稱,轉換器會嘗試通過前面的 BOM(位元組順序標記)識別後續位元組的位元組序。 |
ISO-10646-UCS-4 |
UCS-4 |
見上文。 |
與 UCS-4 不同,字串始終假設為大端序形式。 |
ISO-10646-UCS-4 |
UCS-4 |
見上文。 |
與 UCS-4 不同,字串始終假設為小端序形式。 |
ISO-10646-UCS-2 |
UCS-2 |
使用 16 位元編碼空間的通用字元集,由 ISO/IEC 10646 標準化為 UCS-2。它與最新版本的 Unicode 編碼映射保持同步。 |
如果在編碼轉換功能中使用此名稱,轉換器會嘗試通過前面的 BOM(位元組順序標記)識別後續位元組的位元組序。 |
ISO-10646-UCS-2 |
UCS-2 |
見上文。 |
與 UCS-2 不同,字串一律假設為大端序 (Big Endian)。 |
ISO-10646-UCS-2 |
UCS-2 |
見上文。 |
與 UCS-2 不同,字串一律假設為小端序 (Little Endian)。 |
UTF-32 |
Unicode |
32 位元單元寬度的 Unicode 轉換格式,其編碼空間參照 Unicode 的字元集標準。此編碼方案與 UCS-4 並不相同,因為 Unicode 的編碼空間被限制為 21 位元值。 |
如果在編碼轉換功能中使用此名稱,轉換器會嘗試通過前面的 BOM(位元組順序標記)識別後續位元組的位元組序。 |
UTF-32BE |
Unicode |
見上 |
與 UTF-32 不同,字串一律假設為大端序。 |
UTF-32LE |
Unicode |
見上 |
與 UTF-32 不同,字串一律假設為小端序。 |
UTF-16 |
Unicode |
16 位元單元寬度的 Unicode 轉換格式。值得注意的是,UTF-16 不再與 UCS-2 相同,因為自 Unicode 2.0 起引入了代理對機制,UTF-16 現在指的是 21 位元的編碼空間。 |
如果在編碼轉換功能中使用此名稱,轉換器會嘗試通過前面的 BOM(位元組順序標記)識別後續位元組的位元組序。 |
UTF-16BE |
Unicode |
見上文。 |
與 UTF-16 不同,字串一律假設為大端序。 |
UTF-16LE |
Unicode |
見上文。 |
與 UTF-16 不同,字串一律假設為小端序。 |
UTF-8 |
Unicode / UCS |
8 位元單元寬度的 Unicode 轉換格式。 |
無 |
UTF-7 |
Unicode |
一種郵件安全的 Unicode 轉換格式,在 » RFC2152 中有詳細說明。 |
無 |
(無) |
Unicode |
UTF-7 的一種變體,專門用於 » IMAP 協定。 |
無 |
US-ASCII(慣用 MIME 名稱)/ iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII |
ASCII / ISO 646 |
美國資訊交換標準代碼是一種常用的 7 位元編碼。也被標準化為國際標準 ISO 646。 |
(無) |
EUC-JP(慣用 MIME 名稱)/ Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese |
由 US-ASCII / JIS X0201:1997(半形假名部分)/ JIS X0208:1990 / JIS X0212:1990 組合而成 |
顧名思義,此編碼源自 Extended UNIX Code Packed Format for Japanese 的縮寫,主要用於 UNIX 或類似的平台。原始的編碼方案 Extended UNIX Code 是基於 ISO 2022 設計的。 |
EUC-JP 所指的字元集與 OS/2® 和 Microsoft® Windows® 使用的 IBM932 / CP932 不同。若要與這些平台進行資訊交換,請改用 EUCJP-WIN。 |
Shift_JIS(慣用 MIME 名稱)/ MS_Kanji / csShift_JIS |
由 JIS X0201:1997 / JIS X0208:1997 組合而成 |
Shift_JIS 開發於 80 年代初期,當時個人日文文書處理器問世,其目的是為了與舊有的 JIS X 0201:1976 編碼方案保持相容性。根據 IANA 的定義,Shift_JIS 的字元集與 IBM932 / CP932 略有不同。然而,「SJIS」/「Shift_JIS」這些名稱經常被錯誤地用來指稱這些字元集。 |
對於 CP932 編碼映射,請改用 SJIS-WIN。 |
(無) |
由 JIS X0201:1997 / JIS X0208:1997 / IBM 延伸 / NEC 延伸組合而成 |
雖然此「編碼」使用與 EUC-JP 相同的編碼方案,但底層字元集不同。也就是說,某些程式碼點對應的字元與 EUC-JP 不同。 |
無 |
Windows-31J / csWindows31J |
由 JIS X0201:1997 / JIS X0208:1997 / IBM 延伸 / NEC 延伸組合而成 |
雖然此「編碼」使用與 Shift_JIS 相同的編碼方案,但底層字元集不同。這表示某些程式碼點對應的字元與 Shift_JIS 不同。 |
(無) |
ISO-2022-JP(建議的 MIME 名稱)/ csISO2022JP |
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 |
» RFC1468 |
(無) |
JIS |
|
|
|
ISO-8859-1 |
|
|
|
ISO-8859-2 |
|
|
|
ISO-8859-3 |
|
|
|
ISO-8859-4 |
|
|
|
ISO-8859-5 |
|
|
|
ISO-8859-6 |
|
|
|
ISO-8859-7 |
|
|
|
ISO-8859-8 |
|
|
|
ISO-8859-9 |
|
|
|
ISO-8859-10 |
|
|
|
ISO-8859-13 |
|
|
|
ISO-8859-14 |
|
|
|
ISO-8859-15 |
|
|
|
ISO-8859-16 |
|
|
|
byte2be |
|
|
|
byte2le |
|
|
|
byte4be |
|
|
|
byte4le |
|
|
|
BASE64 |
|
|
|
HTML-ENTITIES |
|
|
|
7 位元 |
|
|
|
8 位元 |
|
|
|
EUC-CN |
|
|
|
CP936 |
|
|
|
HZ |
|
|
|
EUC-TW |
|
|
|
CP950 |
|
|
|
BIG-5 |
|
|
|
EUC-KR |
|
|
|
UHC (CP949) |
|
|
|
ISO-2022-KR |
|
|
|
Windows-1251 (CP1251) |
|
|
|
Windows-1252 (CP1252) |
|
|
|
CP866 (IBM866) |
|
|
|
KOI8-R |
|
|
|
KOI8-U |
|
|
|