正则表达式(Regular Expression)是计算机科学的一个概念,正则表达式是使用单个字符串来描述和匹配一系列符合句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索和替换那些符合某个模式的文本。
字面量字符和元字符
在正则表达式中,文字字符是仅表示其自身字符含义的字符。事实上,大多数字符都是文字。例如:
[En]
In a regular expression, a literal character is a character that only represents its own character meaning. In fact, most characters are literal. For example:
/a/ #匹配 'a'/b/ #匹配 'b'/ab/ #匹配 'ab'
还有一些字符表示特殊含义,而不是它们自己的含义,称为元字符,例如:
[En]
There are also some characters that represent special meanings rather than their own meanings, called metacharacters, such as:
|
字符表示"或"运算,匹配|
字符左边或右边的字符串,|
的数量可推广。
/a|b/ #匹配 'a' 或者 'b'/a|b|c/ #匹配 'a' 或 'b' 或 'c'/ab|cd/ #匹配 'ab' 或 'cd' 而不匹配 'a' 或 'b' 或 'c' 或 'd'
.
字符匹配除了回车、换行、行分隔符和段分割符的字符。