PHP：支援編碼摘要 - 手冊

**支援的編碼摘要**
IANA 字元集註冊表中的名稱	基礎字元集	說明	額外說明
ISO-10646-UCS-4	ISO 10646	具有 31 位元碼空間的通用字元集，由 ISO/IEC 10646 標準化為 UCS-4。它與最新版本的 Unicode 碼位圖保持同步。	如果在編碼轉換功能中使用此名稱，轉換器會嘗試通過前面的 BOM（位元組順序標記）識別後續位元組的位元組序。
ISO-10646-UCS-4	UCS-4	見上文。	與 `UCS-4` 不同，字串始終假設為大端序形式。
ISO-10646-UCS-4	UCS-4	見上文。	與 `UCS-4` 不同，字串始終假設為小端序形式。
ISO-10646-UCS-2	UCS-2	使用 16 位元編碼空間的通用字元集，由 ISO/IEC 10646 標準化為 UCS-2。它與最新版本的 Unicode 編碼映射保持同步。	如果在編碼轉換功能中使用此名稱，轉換器會嘗試通過前面的 BOM（位元組順序標記）識別後續位元組的位元組序。
ISO-10646-UCS-2	UCS-2	見上文。	與 `UCS-2` 不同，字串一律假設為大端序 (Big Endian)。
ISO-10646-UCS-2	UCS-2	見上文。	與 `UCS-2` 不同，字串一律假設為小端序 (Little Endian)。
UTF-32	Unicode	32 位元單元寬度的 Unicode 轉換格式，其編碼空間參照 Unicode 的字元集標準。此編碼方案與 UCS-4 並不相同，因為 Unicode 的編碼空間被限制為 21 位元值。	如果在編碼轉換功能中使用此名稱，轉換器會嘗試通過前面的 BOM（位元組順序標記）識別後續位元組的位元組序。
UTF-32BE	Unicode	見上	與 `UTF-32` 不同，字串一律假設為大端序。
UTF-32LE	Unicode	見上	與 `UTF-32` 不同，字串一律假設為小端序。
UTF-16	Unicode	16 位元單元寬度的 Unicode 轉換格式。值得注意的是，UTF-16 不再與 UCS-2 相同，因為自 Unicode 2.0 起引入了代理對機制，UTF-16 現在指的是 21 位元的編碼空間。	如果在編碼轉換功能中使用此名稱，轉換器會嘗試通過前面的 BOM（位元組順序標記）識別後續位元組的位元組序。
UTF-16BE	Unicode	見上文。	與 `UTF-16` 不同，字串一律假設為大端序。
UTF-16LE	Unicode	見上文。	與 `UTF-16` 不同，字串一律假設為小端序。
UTF-8	Unicode / UCS	8 位元單元寬度的 Unicode 轉換格式。	無
UTF-7	Unicode	一種郵件安全的 Unicode 轉換格式，在 » RFC2152 中有詳細說明。	無
(無)	Unicode	UTF-7 的一種變體，專門用於 » IMAP 協定。	無
US-ASCII（慣用 MIME 名稱）/ iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII	ASCII / ISO 646	美國資訊交換標準代碼是一種常用的 7 位元編碼。也被標準化為國際標準 ISO 646。	(無)
EUC-JP（慣用 MIME 名稱）/ Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese	由 US-ASCII / JIS X0201:1997（半形假名部分）/ JIS X0208:1990 / JIS X0212:1990 組合而成	顧名思義，此編碼源自 Extended UNIX Code Packed Format for Japanese 的縮寫，主要用於 UNIX 或類似的平台。原始的編碼方案 Extended UNIX Code 是基於 ISO 2022 設計的。	EUC-JP 所指的字元集與 OS/2® 和 Microsoft® Windows® 使用的 IBM932 / CP932 不同。若要與這些平台進行資訊交換，請改用 EUCJP-WIN。
Shift_JIS（慣用 MIME 名稱）/ MS_Kanji / csShift_JIS	由 JIS X0201:1997 / JIS X0208:1997 組合而成	Shift_JIS 開發於 80 年代初期，當時個人日文文書處理器問世，其目的是為了與舊有的 JIS X 0201:1976 編碼方案保持相容性。根據 IANA 的定義，Shift_JIS 的字元集與 IBM932 / CP932 略有不同。然而，「SJIS」/「Shift_JIS」這些名稱經常被錯誤地用來指稱這些字元集。	對於 CP932 編碼映射，請改用 SJIS-WIN。
(無)	由 JIS X0201:1997 / JIS X0208:1997 / IBM 延伸 / NEC 延伸組合而成	雖然此「編碼」使用與 EUC-JP 相同的編碼方案，但底層字元集不同。也就是說，某些程式碼點對應的字元與 EUC-JP 不同。	無
Windows-31J / csWindows31J	由 JIS X0201:1997 / JIS X0208:1997 / IBM 延伸 / NEC 延伸組合而成	雖然此「編碼」使用與 Shift_JIS 相同的編碼方案，但底層字元集不同。這表示某些程式碼點對應的字元與 Shift_JIS 不同。	(無)
ISO-2022-JP（建議的 MIME 名稱）/ csISO2022JP	US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983	» RFC1468	(無)
JIS
ISO-8859-1
ISO-8859-2
ISO-8859-3
ISO-8859-4
ISO-8859-5
ISO-8859-6
ISO-8859-7
ISO-8859-8
ISO-8859-9
ISO-8859-10
ISO-8859-13
ISO-8859-14
ISO-8859-15
ISO-8859-16
byte2be
byte2le
byte4be
byte4le
BASE64
HTML-ENTITIES
7 位元
8 位元
EUC-CN
CP936
HZ
EUC-TW
CP950
BIG-5
EUC-KR
UHC (CP949)
ISO-2022-KR
Windows-1251 (CP1251)
Windows-1252 (CP1252)
CP866 (IBM866)
KOI8-R
KOI8-U

ISO-10646-UCS-4

ISO 10646

具有 31 位元碼空間的通用字元集，由 ISO/IEC 10646 標準化為 UCS-4。它與最新版本的 Unicode 碼位圖保持同步。

如果在編碼轉換功能中使用此名稱，轉換器會嘗試通過前面的 BOM（位元組順序標記）識別後續位元組的位元組序。

ISO-10646-UCS-4

UCS-4

見上文。

與 UCS-4 不同，字串始終假設為大端序形式。

ISO-10646-UCS-4

UCS-4

見上文。

與 UCS-4 不同，字串始終假設為小端序形式。

ISO-10646-UCS-2

UCS-2

使用 16 位元編碼空間的通用字元集，由 ISO/IEC 10646 標準化為 UCS-2。它與最新版本的 Unicode 編碼映射保持同步。

如果在編碼轉換功能中使用此名稱，轉換器會嘗試通過前面的 BOM（位元組順序標記）識別後續位元組的位元組序。

ISO-10646-UCS-2

UCS-2

見上文。

與 UCS-2 不同，字串一律假設為大端序 (Big Endian)。

ISO-10646-UCS-2

UCS-2

見上文。

與 UCS-2 不同，字串一律假設為小端序 (Little Endian)。

UTF-32

Unicode

32 位元單元寬度的 Unicode 轉換格式，其編碼空間參照 Unicode 的字元集標準。此編碼方案與 UCS-4 並不相同，因為 Unicode 的編碼空間被限制為 21 位元值。

如果在編碼轉換功能中使用此名稱，轉換器會嘗試通過前面的 BOM（位元組順序標記）識別後續位元組的位元組序。

UTF-32BE

Unicode

見上

與 UTF-32 不同，字串一律假設為大端序。

UTF-32LE

Unicode

見上

與 UTF-32 不同，字串一律假設為小端序。

UTF-16

Unicode

16 位元單元寬度的 Unicode 轉換格式。值得注意的是，UTF-16 不再與 UCS-2 相同，因為自 Unicode 2.0 起引入了代理對機制，UTF-16 現在指的是 21 位元的編碼空間。

如果在編碼轉換功能中使用此名稱，轉換器會嘗試通過前面的 BOM（位元組順序標記）識別後續位元組的位元組序。

UTF-16BE

Unicode

見上文。

與 UTF-16 不同，字串一律假設為大端序。

UTF-16LE

Unicode

見上文。

與 UTF-16 不同，字串一律假設為小端序。

UTF-8

Unicode / UCS

8 位元單元寬度的 Unicode 轉換格式。

無

UTF-7

Unicode

一種郵件安全的 Unicode 轉換格式，在 » RFC2152 中有詳細說明。

無

(無)

Unicode

UTF-7 的一種變體，專門用於 » IMAP 協定。

無

US-ASCII（慣用 MIME 名稱）/ iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII

ASCII / ISO 646

美國資訊交換標準代碼是一種常用的 7 位元編碼。也被標準化為國際標準 ISO 646。

(無)

EUC-JP（慣用 MIME 名稱）/ Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese

由 US-ASCII / JIS X0201:1997（半形假名部分）/ JIS X0208:1990 / JIS X0212:1990 組合而成

顧名思義，此編碼源自 Extended UNIX Code Packed Format for Japanese 的縮寫，主要用於 UNIX 或類似的平台。原始的編碼方案 Extended UNIX Code 是基於 ISO 2022 設計的。

EUC-JP 所指的字元集與 OS/2® 和 Microsoft® Windows® 使用的 IBM932 / CP932 不同。若要與這些平台進行資訊交換，請改用 EUCJP-WIN。

Shift_JIS（慣用 MIME 名稱）/ MS_Kanji / csShift_JIS

由 JIS X0201:1997 / JIS X0208:1997 組合而成

Shift_JIS 開發於 80 年代初期，當時個人日文文書處理器問世，其目的是為了與舊有的 JIS X 0201:1976 編碼方案保持相容性。根據 IANA 的定義，Shift_JIS 的字元集與 IBM932 / CP932 略有不同。然而，「SJIS」/「Shift_JIS」這些名稱經常被錯誤地用來指稱這些字元集。

對於 CP932 編碼映射，請改用 SJIS-WIN。

(無)

由 JIS X0201:1997 / JIS X0208:1997 / IBM 延伸 / NEC 延伸組合而成

雖然此「編碼」使用與 EUC-JP 相同的編碼方案，但底層字元集不同。也就是說，某些程式碼點對應的字元與 EUC-JP 不同。

無

Windows-31J / csWindows31J

由 JIS X0201:1997 / JIS X0208:1997 / IBM 延伸 / NEC 延伸組合而成

雖然此「編碼」使用與 Shift_JIS 相同的編碼方案，但底層字元集不同。這表示某些程式碼點對應的字元與 Shift_JIS 不同。

(無)

ISO-2022-JP（建議的 MIME 名稱）/ csISO2022JP

US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983

» RFC1468

(無)

JIS

ISO-8859-1

ISO-8859-2

ISO-8859-3

ISO-8859-4

ISO-8859-5

ISO-8859-6

ISO-8859-7

ISO-8859-8

ISO-8859-9

ISO-8859-10

ISO-8859-13

ISO-8859-14

ISO-8859-15

ISO-8859-16

byte2be

byte2le

byte4be

byte4le

BASE64

HTML-ENTITIES

7 位元

8 位元

EUC-CN

CP936

HZ

EUC-TW

CP950

BIG-5

EUC-KR

UHC (CP949)

ISO-2022-KR

Windows-1251 (CP1251)

Windows-1252 (CP1252)

CP866 (IBM866)

KOI8-R

KOI8-U

支援的編碼摘要

發現問題了嗎？

使用者貢獻的註記