2024 年日本 PHP 研討會

支援的字元編碼

目前 mbstring 模組支援以下字元編碼。任何這些字元編碼都可以在 mbstring 函式的 encoding 參數中指定。

此 PHP 擴充功能支援下列字元編碼

  • UCS-4*
  • UCS-4BE
  • UCS-4LE*
  • UCS-2
  • UCS-2BE
  • UCS-2LE
  • UTF-32*
  • UTF-32BE*
  • UTF-32LE*
  • UTF-16*
  • UTF-16BE*
  • UTF-16LE*
  • UTF-7
  • UTF7-IMAP
  • UTF-8*
  • ASCII*
  • EUC-JP*
  • SJIS*
  • eucJP-win*
  • SJIS-win*
  • ISO-2022-JP
  • ISO-2022-JP-MS
  • CP932
  • CP51932
  • SJIS-mac(別名:MacJapanese)
  • SJIS-Mobile#DOCOMO(別名:SJIS-DOCOMO)
  • SJIS-Mobile#KDDI(別名:SJIS-KDDI)
  • SJIS-Mobile#SOFTBANK(別名:SJIS-SOFTBANK)
  • UTF-8-Mobile#DOCOMO(別名:UTF-8-DOCOMO)
  • UTF-8-Mobile#KDDI-A
  • UTF-8-Mobile#KDDI-B(別名:UTF-8-KDDI)
  • UTF-8-Mobile#SOFTBANK(別名:UTF-8-SOFTBANK)
  • ISO-2022-JP-MOBILE#KDDI(別名:ISO-2022-JP-KDDI)
  • JIS
  • JIS-ms
  • CP50220
  • CP50220raw
  • CP50221
  • CP50222
  • ISO-8859-1*
  • ISO-8859-2*
  • ISO-8859-3*
  • ISO-8859-4*
  • ISO-8859-5*
  • ISO-8859-6*
  • ISO-8859-7*
  • ISO-8859-8*
  • ISO-8859-9*
  • ISO-8859-10*
  • ISO-8859-13*
  • ISO-8859-14*
  • ISO-8859-15*
  • ISO-8859-16*
  • byte2be
  • byte2le
  • byte4be
  • byte4le
  • BASE64
  • HTML-ENTITIES(別名:HTML)
  • 7bit
  • 8bit
  • EUC-CN*
  • CP936
  • GB18030
  • HZ
  • EUC-TW*
  • CP950
  • BIG-5*
  • EUC-KR*
  • UHC(別名:CP949)
  • ISO-2022-KR
  • Windows-1251(別名:CP1251)
  • Windows-1252(別名:CP1252)
  • CP866(別名:IBM866)
  • KOI8-R*
  • KOI8-U*
  • ArmSCII-8(別名:ArmSCII8)

* 表示在正規表達式中也可使用的編碼。

任何接受編碼名稱的 php.ini 項目也可以使用 "auto" 和 "pass" 的值。接受編碼名稱的 mbstring 函數也可以使用 "auto" 的值。

如果設定為 "pass",則不執行字元編碼轉換。

如果設定為 "auto",它會根據 NLS 定義的編碼列表展開。例如,如果 NLS 設定為 Japanese(日文),則該值會被假定為 "ASCII,JIS,UTF-8,EUC-JP,SJIS"。

另請參閱 mb_detect_order()

新增註解

使用者貢獻的註解 3 則註解

6
Tomolimo (olivier dot moron at raynet-it dot com)
11 年前
除了這個列表之外,也支援 GB2312 編碼。
它是簡體中文編碼,現在已被 GB18030 取代,但 GB2312 並不在列表中。
如果您嘗試使用它,即使它不在列表中,結果也會是正確的。
此致,
Tomolimo
4
akniep at rayo dot info
11 年前
在使用 mbstring 的函數之前,請使用 mb_list_encodings() 檢查 mbstring 是否支援該編碼。
1
匿名
10 年前
也支援 CP850 (DOS-Latin-1)。
To Top