2024 年 PHP Conference Japan

簡介

雖然許多語言中的每個必要字元都可以一對一地對應到 8 位元值,但也有一些語言的書面溝通需要大量的字元,以至於它們無法包含在一個位元組所能編碼的範圍內(一個位元組由八個位元組成。每個位元只能包含兩個不同的值,1 或 0。因此,一個位元組只能表示 256 個唯一值(2 的 8 次方))。多位元組字元編碼方案的開發是為了在常規的位元組編碼系統中表示超過 256 個字元。

當您操作(修剪、分割、拼接等)以多位元組編碼編碼的字串時,您需要使用特殊函數,因為在這種編碼方案中,兩個或多個連續位元組可能代表一個字元。否則,如果您將非多位元組感知的字串函數應用於字串,它可能無法檢測多位元組字元的開頭或結尾,最終導致損壞的垃圾字串,很可能會失去其原始含義。

mbstring 提供了多位元組特定的字串函數,可幫助您在 PHP 中處理多位元組編碼。除此之外,mbstring 還處理可能的編碼對之間的字元編碼轉換。mbstring 設計用於處理基於 Unicode 的編碼,例如 UTF-8 和 UCS-2,以及許多單一位元組編碼,以方便使用(列在支援的字元編碼中)。

新增註釋

使用者貢獻的註釋

此頁面沒有使用者貢獻的註釋。
To Top