mb_ereg_search_setpos

(PHP 4 >= 4.2.0, PHP 5, PHP 7, PHP 8)

mb_ereg_search_setpos — 設定下一次正規表示式比對的起始點

說明

mb_ereg_search_setpos(int $offset): bool

mb_ereg_search_setpos() 設定 mb_ereg_search() 比對的起始點。

參數

offset: 要設定的位置。如果是負數，則從字串的尾端開始計算。

回傳值

成功時回傳 true，失敗時回傳 false。

更新日誌

版本	說明
7.1.0	已新增支援負數 `offset`。

注意事項

注意:
此函數會使用內部編碼或由 mb_regex_encoding() 指定的字元編碼。

另請參閱

mb_regex_encoding() - 設定/取得多位元組正規表達式的字元編碼
mb_ereg_search_init() - 為多位元組正規表達式比對設定字串和正規表達式

發現問題了嗎？

學習如何改進此頁面 • 提交拉取請求 • 回報錯誤

＋新增註解

使用者貢獻的註解 1 則註解

往上

往下

-4

phpnet at osps dot net ¶

3 年前

這個方法，就像 mb_ereg_search_pos 一樣，似乎使用的是位元組偏移量，而不是字元偏移量。這對於 mb_* 方法來說似乎違反直覺，因為這些方法天生就採用字串的「字元」視角，而不是「位元組」視角。即使是 mb_strpos 方法也會返回字元偏移量。

以下程式碼揭示了這種以位元組為導向的行為

<?php
 $x = 'abc456789'. "\u{1000}" .'abc4567890';
 $re = 'ab.';
 echo 'x='. $x .PHP_EOL;
 echo 're='. $re .PHP_EOL;
 mb_ereg_search_init( $x );
 mb_internal_encoding( mb_detect_encoding( $x) );
 echo 'mb_strlen='. mb_strlen( $x ) .PHP_EOL;
 echo 'strlen='. strlen( $x ) .PHP_EOL;
 foreach ( array( 0, 9, 10, 11, 12, 13 ) as $o ) {

 mb_ereg_search_setpos( $o );
 echo 'Offset='. $o
 .' mb_substr='. mb_substr( $x, $o )
 .' substr='. substr( $x, $o )
 .' mb_ereg_search_regs='. print_r( mb_ereg_search_regs( $re ), true )
 .PHP_EOL;
 }

?>
如果使用字元偏移量，我們預期偏移量 11 和以上將不會返回任何搜尋結果，然而我們看到的卻是

<?php

=abc456789ကabc4567890
re=ab
mb_strlen=20
strlen=22
Offset=0 mb_substr=abc456789ကabc4567890 substr=abc456789ကabc4567890 mb_ereg_search_regs=陣列
(
 [0] => abc
)

Offset=9 mb_substr=ကabc4567890 substr=ကabc4567890 mb_ereg_search_regs=陣列
(
 [0] => abc
)

Offset=10 mb_substr=abc4567890 substr=��abc4567890 mb_ereg_search_regs=陣列
(
 [0] => abc
)

Offset=11 mb_substr=bc4567890 substr=�abc4567890 mb_ereg_search_regs=陣列
(
 [0] => abc
)

Offset=12 mb_substr=c4567890 substr=abc4567890 mb_ereg_search_regs=陣列
(
 [0] => abc
)

Offset=13 mb_substr=4567890 substr=bc4567890 mb_ereg_search_regs=
?>

＋新增註解