2024 年 PHP 日本研討會

日文多位元編碼基礎

日文字元只能以多位元編碼表示,並且根據平台和文字用途使用多種編碼標準。更糟糕的是,這些編碼標準彼此略有不同。為了創建一個可在日文環境中使用的網路應用程式,開發人員必須牢記這些複雜性,以確保使用正確的字元編碼。

  • 一個字元的儲存空間最多可達六個位元組
  • 大多數日文的全形字元(multibyte characters)顯示寬度是單字元(single-byte characters)的兩倍。這些字元在日文中稱為「全角」(zen-kaku),意思是「全寬」。其他較窄的字元稱為「半角」(han-kaku),意思是「半寬」。然而,字元的圖形屬性取決於用來顯示它們的字體。
  • 一些字元編碼使用 ISO-2022 定義的 shift(escape) 序列來切換特定程式碼區域(00h7fh)的程式碼映射。
  • 在 SMTP/NNTP 中應該使用 ISO-2022-JP,並且標頭和實體應該根據 RFC 要求重新編碼。雖然這些不是必要的,但這仍然是一個好主意,因為一些常用的使用者代理無法識別任何其他編碼方法。
  • 為行動電話服務(例如 » i-mode» EZweb)建立的網頁應該使用 Shift_JIS。
  • 支援行動電話服務(例如 » i-mode» EZweb)使用的表情符號 (Emoji)。

新增註解

使用者貢獻的註解

此頁面沒有使用者貢獻的註解。
To Top