PHP Conference Japan 2024

mb_encode_numericentity

(PHP 4 >= 4.0.6, PHP 5, PHP 7, PHP 8)

mb_encode_numericentity將字元編碼為 HTML 數字字串參考

說明

mb_encode_numericentity(
    字串 $string,
    陣列 $map,
    ?字串 $encoding = null,
    布林值 $hex = false
): 字串

將指定字串 string 中的字元碼轉換為 HTML 數字字元參考。

參數

string

要編碼的 字串

map

map 是一個陣列,指定要轉換的碼區。

encoding

encoding 參數是字元編碼。如果省略或為 null,則會使用內部字元編碼值。

hex

傳回的實體參考是否應採用十六進位表示法(否則為十進位表示法)。

傳回值

已轉換的 字串

錯誤/例外

如果 map 不是 整數 列表,則會拋出 ValueError

更新日誌

版本 說明
8.4.0 如果 map 不是 整數 列表,mb_encode_numericentity() 現在會拋出 ValueError
8.0.0 encoding 現在可以為 null。

範例

範例 #1 map 範例

<?php
$convmap
= array (
int start_code1, int end_code1, int offset1, int mask1,
int start_code2, int end_code2, int offset2, int mask2,
........
int start_codeN, int end_codeN, int offsetN, int maskN );
// 指定 start_codeN 和 end_codeN 的 Unicode 值
// 將 offsetN 加到值上,並與 maskN 進行位元運算「AND」,然後
// 將值轉換為數字字串參考。
?>

範例 #2 mb_encode_numericentity() 範例

<?php
/* 將 ISO-8859-1 的左側部分轉換為 HTML 數字字元參考 */
$convmap = array(0x80, 0xff, 0, 0xff);
$str = mb_encode_numericentity($str, $convmap, "ISO-8859-1");

/* 將區塊 95-104 中使用者定義的 SJIS-win 代碼轉換為數字
字串參考 */
$convmap = array(
0xe000, 0xe03e, 0x1040, 0xffff,
0xe03f, 0xe0bb, 0x1041, 0xffff,
(... 省略中間程式碼,翻譯方式相同 ...)
0xe32f, 0xe3ab, 0x1151, 0xffff );
$str = mb_encode_numericentity($str, $convmap, "sjis-win");
?>

另請參閱

新增註釋

使用者貢獻的註釋 4 則註釋

Janis
15 年前
要從 UTF-8 字串中取得 Unicode 編號,可以使用以下方法,例如:

<?php
print mb_encode_numericentity('sāш日', array(0x0, 0xffff, 0, 0xffff), 'UTF-8');
?>
dan at boxuk dot com
21 年前
我們在 Solaris 上使用 PHP/Sablotron 時遇到了一些困難;將 HTML 字元參考放入 XSL 轉換中,當設定為輸出 UTF-8 時,會將它們轉換回 UTF-8 編碼的字元。這對於非 Unicode 儲存來說是一個問題。使用 http://homepage.mac.com/marko/ 中的一些程式碼,以下函式將字串轉換回字元參考

function utf2html ($utf2html_string)
{
$f = 0xffff;
$convmap = array(
/* <!ENTITY % HTMLlat1 PUBLIC "-//W3C//ENTITIES Latin 1//EN//HTML">
%HTMLlat1; */
160, 255, 0, $f,
/* <!ENTITY % HTMLsymbol PUBLIC "-//W3C//ENTITIES Symbols//EN//HTML">
%HTMLsymbol; */
402, 402, 0, $f, 913, 929, 0, $f, 931, 937, 0, $f,
945, 969, 0, $f, 977, 978, 0, $f, 982, 982, 0, $f,
8226, 8226, 0, $f, 8230, 8230, 0, $f, 8242, 8243, 0, $f,
8254, 8254, 0, $f, 8260, 8260, 0, $f, 8465, 8465, 0, $f,
8472, 8472, 0, $f, 8476, 8476, 0, $f, 8482, 8482, 0, $f,
8501, 8501, 0, $f, 8592, 8596, 0, $f, 8629, 8629, 0, $f,
8656, 8660, 0, $f, 8704, 8704, 0, $f, 8706, 8707, 0, $f,
8709, 8709, 0, $f, 8711, 8713, 0, $f, 8715, 8715, 0, $f,
8719, 8719, 0, $f, 8721, 8722, 0, $f, 8727, 8727, 0, $f,
8730, 8730, 0, $f, 8733, 8734, 0, $f, 8736, 8736, 0, $f,
8743, 8747, 0, $f, 8756, 8756, 0, $f, 8764, 8764, 0, $f,
8773, 8773, 0, $f, 8776, 8776, 0, $f, 8800, 8801, 0, $f,
8804, 8805, 0, $f, 8834, 8836, 0, $f, 8838, 8839, 0, $f,
8853, 8853, 0, $f, 8855, 8855, 0, $f, 8869, 8869, 0, $f,
8901, 8901, 0, $f, 8968, 8971, 0, $f, 9001, 9002, 0, $f,
9674, 9674, 0, $f, 9824, 9824, 0, $f, 9827, 9827, 0, $f,
9829, 9830, 0, $f,
/* <!ENTITY % HTMLspecial PUBLIC "-//W3C//ENTITIES Special//EN//HTML">
%HTMLspecial; */
/* 為了啟用 HTML,以下這些被排除:34, 38, 60, 62 */
338, 339, 0, $f, 352, 353, 0, $f, 376, 376, 0, $f,
710, 710, 0, $f, 732, 732, 0, $f, 8194, 8195, 0, $f,
8201, 8201, 0, $f, 8204, 8207, 0, $f, 8211, 8212, 0, $f,
8216, 8218, 0, $f, 8218, 8218, 0, $f, 8220, 8222, 0, $f,
8224, 8225, 0, $f, 8240, 8240, 0, $f, 8249, 8250, 0, $f,
8364, 8364, 0, $f);

return mb_encode_numericentity($utf2html_string, $convmap, "UTF-8");
}
fboes at berlinonline dot de
15 年前
為了改善 dan at boxuk dot com 的函式中歐元符號的處理,請在 $convmap 中加入以下一行:

128, 128, 0, $f,
To Top