正規表達式的強大之處在於能夠在模式中包含替代方案和重複。這些替代方案和重複會使用中繼字元在模式中編碼,中繼字元本身並不代表字面意義,而會以特殊方式詮釋。
有兩組不同的中繼字元:一組在模式中的任何位置(方括號內除外)都會被識別,另一組則在方括號內被識別。在方括號外,中繼字元如下:
中繼字元 | 說明 |
---|---|
\ | 通用跳脫字元,有多種用途 |
^ | 斷言目標的開頭(或多行模式下的行首) |
$ | 斷言主體結尾或終止換行符之前(或在多行模式下為行尾) |
. | 匹配除換行符以外的任何字符(預設) |
[ | 開始字符類別定義 |
] | 結束字符類別定義 |
| | 開始分支選項 |
( | 開始子模式 |
) | 結束子模式 |
? | 擴展 ( 的含義,也是 0 或 1 量詞,也使貪婪量詞變為惰性(參見 重複) |
* | 0 或更多次量詞 |
+ | 1 或更多次量詞 |
{ | 開始最小/最大量詞 |
} | 結束最小/最大量詞 |
中繼字元 | 說明 |
---|---|
\ | 一般跳脫字符 |
^ | 否定類別,但僅當它是第一個字符時 |
- | 指示字符範圍 |