正则表达式语法解析(正则表达式在线测试工具)

编程之家2026-06-15867次浏览

这篇文章给大家聊聊关于正则表达式语法解析，以及正则表达式在线测试工具对应的知识点，希望对各位有所帮助，不要忘了收藏本站哦。

谁知道JavaScript正则表达式该怎么解析

正则表达式是一个描述字符模式的对象。

JavaScript的RegExp对象和String对象定义了使用正则表达式来执行强大的模式匹配和文本检索与替换函数的方法.在JavaScript中,正则表达式是由一个RegExp对象表示的.当然,可以使用一个RegExp()构造函数来创建RegExp对象,也可以用JavaScript 1.2中的新添加的一个特殊语法来创建RegExp对象.就像字符串直接量被定义为包含在引号内的字符一样,正则表达式直接量也被定义为包含在一对斜杠(/)之间的字符.所以,JavaScript可能会包含如下的代码:var pattern=/s$/;这行代码创建一个新的RegExp对象,并将它赋给变量parttern.这个特殊的RegExp对象和所有以字母"s"结尾的字符串都匹配.用RegExp()也可以定义一个等价的正则表达式,代码如下:var pattern= new RegExp("s$");无论是用正则表达式直接量还是用构造函数RegExp(),创建一个RegExp对象都是比较容易的.较为困难的任务是用正则表达式语法来描述字符的模式.JavaScript采用的是Perl语言正则表达式语法的一个相当完整的子集.正则表达式的模式规范是由一系列字符构成的.大多数字符(包括所有字母数字字符)描述的都是按照字面意思进行匹配的字符.这样说来,正则表达式/java/就和所有包含子串"java"的字符串相匹配.虽然正则表达式中的其它字符不是按照字面意思进行匹配的,但它们都具有特殊的意义.正则表达式/s$/包含两个字符.第一个特殊字符"s"是按照字面意思与自身相匹配.第二个字符"$"是一个特殊字符,它所匹配的是字符串的结尾.所以正则表达式/s$/匹配的就是以字母"s"结尾

的字符串.1.直接量字符我们已经发现了,在正则表达式中所有的字母字符和数字都是按照字面意思与自身相匹配的.JavaScript的正则表达式还通过以反斜杠(\)开头的转义序列支持某些非字母字符.例如,序列"\n"在字符串中匹配的是一个直接量换行符.在正则表达式中,许多标点符号都有特殊的含义.下面是这些字符和它们的含义:正则表达式的直接量字符字符匹配

________________________________

字母数字字符自身

\ f换页符

\ n换行符

\ r回车

\ t制表符

\ v垂直制表符

\/一个/直接量

\\一个\直接量

\.一个.直接量

\*一个*直接量

\+一个+直接量

\?一个?直接量

\|一个|直接量

\(一个(直接量

\)一个)直接量

\ [一个 [直接量

\ ]一个 ]直接量

\{一个{直接量

\}一个}直接量

\ XXX由十进制数 XXX指定的ASCII码字符

\ Xnn由十六进制数 nn指定的ASCII码字符

\ cX控制字符^X.例如,\cI等价于\t,\cJ等价于\n如果想在正则表达式中使用特殊的标点符号,必须在它们之前加上一个"\".2.字符类将单独的直接符放进中括号内就可以组合成字符类.一个字符类和它所包含的任何一个字符都匹配,所以正则表达式/ [abc]/和字母"a","b","c"中的任何一个都匹配.另外还可以定义否定字符类,这些类匹配的是除那些包含在中括号之内的字符外的所有字符.定义否定字符尖时,要将一个 ^符号作为从左中括号算起的第一个字符.正则表达式的集合是/ [a-zA-z0-9]/.由于某些字符类非常常用,所以JavaScript的正则表达式语法包含一些特殊字符和转义序列来表示这些常用的类.例如,\s匹配的是空格符,制表符和其它空白符,\s匹配的则是空白符之外的任何字符.正则表灰式的字符类字符匹配

[...]位于括号之内的任意字符

[^...]不在括号之中的任意字符

.除了换行符之外的任意字符,等价于[^\n]

\w任何单字字符,等价于[a-zA-Z0-9]

\W任何非单字字符,等价于[^a-zA-Z0-9]

\s任何空白符,等价于[\ t\ n\ r\ f\ v]

\S任何非空白符,等价于[^\ t\ n\ r\ f\ v]

\d任何数字,等价于[0-9]

\D除了数字之外的任何字符,等价于[^0-9]

[\b]一个退格直接量(特例)3.复制用以上的正则表式的语法,可以把两位数描述成/\ d\ d/,把四位数描述成/\d\ d\ d\ d/.但我们还没有一种方法可以用来描述具有任意多数位的数字或者是一个字符串.这个串由三个字符以及跟随在字母之后的一位数字构成.这些复杂的模式使用的正则表达式语法指定了该表达式中每个元素要重复出现的次数.指定复制的字符总是出现在它们所作用的模式后面.由于某种复制类型相当常用.所以有一些特殊的字符专门用于表示它们.例如:+号匹配的就是复制前一模式一次或多次的模式.下面的表列出了复制语法.先看一个例子:/\d{2, 4}///匹配2到4间的数字./\w{3}\d?///匹配三个单字字符和一个任意的数字./\s+java\s+///匹配字符串"java",并且该串前后可以有一个或多个空格./[^"]*///匹配零个或多个非引号字符.

正则表达式的复制字符字符含义{n, m}匹配前一项至少n次,但是不能超过m次

{n,}匹配前一项n次,或者多次

{n}匹配前一项恰好n次

?匹配前一项0次或1次,也就是说前一项是可选的.等价于{0, 1}

+匹配前一项1次或多次,等价于{1,}

*匹配前一项0次或多次.等价于{0,}4.选择,分组和引用正则表达式的语法还包括指定选择项,对子表达式分组和引用前一子表达式的特殊字符.字符|用于分隔供选择的字符.例如:/ab|cd|ef/匹配的是字符串"ab",或者是字符串"cd",又或者"ef"./\d{3}|[a-z]{4}/匹配的是要么是一个三位数,要么是四个小写字母.在正则表达式中括号具有几种作用.它的主要作用是把单独的项目分组成子表达式,以便可以像处理一个独立的单元那种用*、+或?来处理那些项目.例如:/java(script)?/匹配的是字符串"java",其后既可以有"script",也可以没有./(ab|cd)+|ef)/匹配的既可以是字符串"ef",也可以是字符串"ab"或者"cd"的一次或多次重复.在正则表达式中,括号的第二个用途是在完整的模式中定义子模式。当一个正则表达式成功地和目标字符串相匹配时,可以从目标串中抽出和括号中的子模式相匹配的部分.例如,假定我们正在检索的模式是一个或多个字母后面跟随一位或多位数字,那么我们可以使用模式/ [a-z]+\ d+/.但是由于假定我们真正关心的是每个匹配尾部的数字,那么如果我们将模式的数字部分放在括号中(/ [a-z]+(\d+)/),我们就可以从所检索到的任何匹配中抽取数字了,之后我们会对此进行解析的.代括号的子表达式的另一个用途是,允许我们在同一正则表达式的后面引用前面的子表达式.这是通过在字符串\后加一位或多位数字来实现的.数字指的是代括号的子表达式在正则表达式中的位置.例如:\1引用的是第一个代括号的子表达式.\3引用的是第三个代括号的子表达式.注意,由于子表达式可以嵌套在其它子表达式中,所以它的位置是被计数的左括号的位置.例如:在下面的正则表达式被指定为\2:

/([Jj]ava([Ss]cript))\sis\s(fun\w*)/

对正则表达式中前一子表达式的引用所指定的并不是那个子表达式的模式,而是与那个模式相匹配的文本.这样,引用就不只是帮助你输入正则表达式的重复部分的快捷方式了,它还实施了一条规约,那就是一个字符串各个分离的部分包含的是完全相同的字符.例如:下面的正则表达式匹配的就是位于单引号或双引号之内的所有字符.但是,它要求开始和结束的引号匹配(例如两个都是双引号或者都是单引号):/['"] [^'"]*['"]/

如果要求开始和结束的引号匹配,我们可以使用如下的引用:/( ['"]) [^'"]*\1/\1匹配的是第一个代括号的子表达式所匹配的模式.在这个例子中,它实施了一种规约,那就是开始的引号必须和结束的引号相匹配.注意,如果反斜杠后跟随的数字比代括号的子表达式数多,那么它就会被解析为一个十进制的转义序列,而不是一个引用.你可以坚持使用完整的三个字符来表示转义序列,这们就可以避免混淆了.例如,使用\044,而不是\44.下面是正则表达式的选择、分组和引用字符:字符含义

|选择.匹配的要么是该符号左边的子表达式,要么它右边的子表达式

(...)分组.将几个项目分为一个单元.这个单元可由*、+、？和|等符号使用,而且还可以记住和这个组匹配的字符以供此后引用使用

\n和第n个分组所匹配的字符相匹配.分组是括号中的子表达式(可能是嵌套的).分组号是从左到右计数的左括号数5.指定匹配的位置我们已经看到了,一个正则表达式中的许多元素才能够匹配字符串的一个字符.例如:\s匹配的只是一个空白符.还有一些正则表达式的元素匹配的是字符之间宽度为0的空间,而不是实际的字符例如:\b匹配的是一个词语的边界,也就是处于一个/w字字符和一个\w非字字符之间的边界.像\b这样的字符并不指定任何一个匹配了的字符串中的字符,它们指定的是匹配所发生的合法位置.有时我们称这些元素为正则表达式的锚.因为它们将模式定位在检索字符串中的一个特定位置.最常用的锚元素是 ^,它使模式依赖于字符串的开头,而锚元素$则使模式定位在字符串的末尾.例如:要匹配词"javascript",我们可以使用正则表达式/^ javascript$/.如果我们想检索"java"这个词自身(不像在"javascript"中那样作为前缀),那么我们可以使用模式/\s java\s/,它要求在词语java之前和之后都有空格.但是这样作有两个问题.第一:如果"java"出现在一个字符的开头或者是结尾.该模式就不会与之匹配,除非在开头和结尾处有一个空格.第二:当这个模式找到一个与之匹配的字符时,它返回的匹配的字符串前端和后端都有空格,这并不是我们想要的.因此,我们使用词语的边界\b来代替真正的空格符\s进行匹配.结果表达式是/\b java\b/.下面是正则表达式的锚字符:

字符含义

^匹配的是字符的开头,在多行检索中,匹配的是一行的开头

$匹配的是字符的结尾,在多行检索中,匹配的是一行的结尾

\b匹配的是一个词语的边界.简而言之就是位于字符\w和\w之间的位置(注意:[\b]匹配的是退格符)

\B匹配的是非词语的边界的字符6.属性有关正则表达式的语法还有最后一个元素,那就是正则表达式的属性,它说明的是高级模式匹配的规则.和其它正则表达式语法不同,属性是在/符号之外说明的.即它们不出现在两个斜杠之间,而是位于第二个斜杠之后.javascript 1.2支持两个属性.属性 i说明模式匹配应该是大小写不敏感的.属性 g说明模式匹配应该是全局的.也就是说,应该找出被检索的字符串中所有的匹配.这两种属性联合起来就可以执行一个全局的,大小写不敏感的匹配.例如:要执行一个大小不敏感的检索以找到词语"java"(或者是"java"、"JAVA"等)的第一个具体值,我们可以使用大小不敏感的正则表达式/\b java\b/i.如果要在一个字符串中找到"java"所有的具体值,我们还可以添加属性 g,即/\b java\b/gi.以下是正则表达式的属性:

字符含义

i执行大小写不敏感的匹配

g执行一个全局的匹配,简而言之,就是找到所有的匹配,而不是在找到第一个之后就停止了除属性 g和 i之外,正则表达式就没有其它像属性一样的特性了.如果将构造函数 RegExp的静态属性 multiline设置为 true,那么模式匹配将以多行的模式进行.在这种模式下,锚字符 ^和$匹配的不只是检索字符串的开头和结尾,还匹配检索字符串内部的一行的开头和结尾.例如:模式/Java$/匹配的是"Java",但是并不匹配"Java\nis fun".如果我们设置了 multiline属性,那么后者也将被匹配:RegExp.multiline= true;正则表达式(regular expression)对象包含一个正则表达式模式(pattern)。它具有用正则表达式模式去匹配或代替一个串(string)中特定字符(或字符集合)的属性(properties)和方法(methods)。要为一个单独的正则表达式添加属性,可以使用正则表达式构造函数(constructor function)，无论何时被调用的预设置的正则表达式拥有静态的属性(the predefined RegExp object has static properties that are set whenever any regular expression is used,我不知道我翻得对不对，将原文列出，请自行翻译)。创建：

一个文本格式或正则表达式构造函数

文本格式：/pattern/flags

正则表达式构造函数： new RegExp("pattern"[,"flags"]);

参数说明：

pattern--一个正则表达式文本

flags--如果存在，将是以下值：

g:全局匹配

i:忽略大小写

gi:以上组合

[注意]文本格式的参数不用引号，而在用构造函数时的参数需要引号。如：/ab+c/i new RegExp("ab+c","i")是实现一样的功能。在构造函数中，一些特殊字符需要进行转意(在特殊字符前加"\")。如：re= new RegExp("\\w+")正则表达式中的特殊字符字符含意

\做为转意，即通常在"\"后面的字符不按原来意义解释，如/b/匹配字符"b"，当b前面加了反斜杆后/\b/，转意为匹配一个单词的边界。

-或-

对正则表达式功能字符的还原，如"*"匹配它前面元字符0次或多次，/a*/将匹配a,aa,aaa，加了"\"后，/a\*/将只匹配"a*"。

^匹配一个输入或一行的开头，/^a/匹配"an A"，而不匹配"An a"

$匹配一个输入或一行的结尾，/a$/匹配"An a"，而不匹配"an A"

*匹配前面元字符0次或多次，/ba*/将匹配b,ba,baa,baaa

+匹配前面元字符1次或多次，/ba*/将匹配ba,baa,baaa

?匹配前面元字符0次或1次，/ba*/将匹配b,ba

(x)匹配x保存x在名为$1...$9的变量中

x|y匹配x或y

{n}精确匹配n次

{n,}匹配n次以上

{n,m}匹配n-m次

[xyz]字符集(character set)，匹配这个集合中的任一一个字符(或元字符)

[^xyz]不匹配这个集合中的任何一个字符

[\b]匹配一个退格符

\b匹配一个单词的边界

\B匹配一个单词的非边界

\cX这儿，X是一个控制符，/\cM/匹配Ctrl-M

\d匹配一个字数字符，/\d/=/[0-9]/

\D匹配一个非字数字符，/\D/=/[^0-9]/

\n匹配一个换行符

\r匹配一个回车符

\s匹配一个空白字符，包括\n,\r,\f,\t,\v等

\S匹配一个非空白字符，等于/[^\n\f\r\t\v]/

\t匹配一个制表符

\v匹配一个重直制表符

\w匹配一个可以组成单词的字符(alphanumeric，这是我的意译，含数字)，包括下划线，如[\w]匹配"$5.98"中的5，等于[a-zA-Z0-9]

\W匹配一个不可以组成单词的字符，如[\W]匹配"$5.98"中的$，等于[^a-zA-Z0-9]。

正则表达式语法

一个正则表达式就是由普通字符（例如字符 a到 z）以及特殊字符（称为元字符）组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。

这里有一些可能会遇到的正则表达式示例：

JScript VBScript匹配

/^\[\t]*$/"^\[\t]*$"匹配一个空白行。

/\d{2}-\d{5}/"\d{2}-\d{5}"验证一个 ID号码是否由一个 2位数字，一个连字符以及一个 5位数字组成。

/<(.*)>.*<\/\1>/"<(.*)>.*<\/\1>"匹配一个 HTML标记。

下表是元字符及其在正则表达式上下文中的行为的一个完整列表：

字符描述

\将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如，'n'匹配字符"n"。'\n'匹配一个换行符。序列'\'匹配"\"而"\("则匹配"("。

^匹配输入字符串的开始位置。如果设置了 RegExp对象的 Multiline属性，^也匹配'\n'或'\r'之后的位置。

$匹配输入字符串的结束位置。如果设置了 RegExp对象的 Multiline属性，$也匹配'\n'或'\r'之前的位置。

*匹配前面的子表达式零次或多次。例如，zo*能匹配"z"以及"zoo"。*等价于{0,}。

+匹配前面的子表达式一次或多次。例如，'zo+'能匹配"zo"以及"zoo"，但不能匹配"z"。+等价于{1,}。

?匹配前面的子表达式零次或一次。例如，"do(es)?"可以匹配"do"或"does"中的"do"。?等价于{0,1}。

{n} n是一个非负整数。匹配确定的 n次。例如，'o{2}'不能匹配"Bob"中的'o'，但是能匹配"food"中的两个 o。

{n,} n是一个非负整数。至少匹配n次。例如，'o{2,}'不能匹配"Bob"中的'o'，但能匹配"foooood"中的所有 o。'o{1,}'等价于'o+'。'o{0,}'则等价于'o*'。

{n,m} m和 n均为非负整数，其中n<= m。最少匹配 n次且最多匹配 m次。例如，"o{1,3}"将匹配"fooooood"中的前三个 o。'o{0,1}'等价于'o?'。请注意在逗号和两个数之间不能有空格。

?当该字符紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时，匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如，对于字符串"oooo"，'o+?'将匹配单个"o"，而'o+'将匹配所有'o'。

.匹配除"\n"之外的任何单个字符。要匹配包括'\n'在内的任何字符，请使用象'[.\n]'的模式。

(pattern)匹配 pattern并获取这一匹配。所获取的匹配可以从产生的 Matches集合得到，在VBScript中使用 SubMatches集合，在 JScript中则使用$0…$9属性。要匹配圆括号字符，请使用'$'或'$'。

(?attern)匹配 pattern但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储供以后使用。这在使用"或"字符(|)来组合一个模式的各个部分是很有用。例如，'industr(?:y|ies)就是一个比'industry|industries'更简略的表达式。

(?=pattern)正向预查，在任何匹配 pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，'Windows(?=95|98|NT|2000)'能匹配"Windows 2000"中的"Windows"，但不能匹配"Windows 3.1"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。

(?!pattern)负向预查，在任何不匹配 pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如'Windows(?!95|98|NT|2000)'能匹配"Windows 3.1"中的"Windows"，但不能匹配"Windows 2000"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始

x|y匹配 x或 y。例如，'z|food'能匹配"z"或"food"。'(z|f)ood'则匹配"zood"或"food"。

[xyz]字符集合。匹配所包含的任意一个字符。例如，'[abc]'可以匹配"plain"中的'a'。

[^xyz]负值字符集合。匹配未包含的任意字符。例如，'[^abc]'可以匹配"plain"中的'p'。

[a-z]字符范围。匹配指定范围内的任意字符。例如，'[a-z]'可以匹配'a'到'z'范围内的任意小写字母字符。

[^a-z]负值字符范围。匹配任何不在指定范围内的任意字符。例如，'[^a-z]'可以匹配任何不在'a'到'z'范围内的任意字符。

\b匹配一个单词边界，也就是指单词和空格间的位置。例如，'er\b'可以匹配"never"中的'er'，但不能匹配"verb"中的'er'。

\B匹配非单词边界。'er\B'能匹配"verb"中的'er'，但不能匹配"never"中的'er'。

\cx匹配由 x指明的控制字符。例如，\cM匹配一个 Control-M或回车符。x的值必须为 A-Z或 a-z之一。否则，将 c视为一个原义的'c'字符。

\d匹配一个数字字符。等价于 [0-9]。

\D匹配一个非数字字符。等价于 [^0-9]。

\f匹配一个换页符。等价于\x0c和\cL。

\n匹配一个换行符。等价于\x0a和\cJ。

\r匹配一个回车符。等价于\x0d和\cM。

\s匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [\f\n\r\t\v]。

\S匹配任何非空白字符。等价于 [^\f\n\r\t\v]。

\t匹配一个制表符。等价于\x09和\cI。

\v匹配一个垂直制表符。等价于\x0b和\cK。

\w匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。

\W匹配任何非单词字符。等价于'[^A-Za-z0-9_]'。

\xn匹配 n，其中 n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如，'\x41'匹配"A"。'\x041'则等价于'\x04'&"1"。正则表达式中可以使用 ASCII编码。.

\num匹配 num，其中 num是一个正整数。对所获取的匹配的引用。例如，'(.)\1'匹配两个连续的相同字符。

\n标识一个八进制转义值或一个向后引用。如果\n之前至少 n个获取的子表达式，则 n为向后引用。否则，如果 n为八进制数字(0-7)，则 n为一个八进制转义值。

\nm标识一个八进制转义值或一个向后引用。如果\nm之前至少有 nm个获得子表达式，则 nm为向后引用。如果\nm之前至少有 n个获取，则 n为一个后跟文字 m的向后引用。如果前面的条件都不满足，若 n和 m均为八进制数字(0-7)，则\nm将匹配八进制转义值 nm。

\nml如果 n为八进制数字(0-3)，且 m和 l均为八进制数字(0-7)，则匹配八进制转义值 nml。

\un匹配 n，其中 n是一个用四个十六进制数字表示的 Unicode字符。例如，\u00A9匹配版权符号(?)。

在正则表达式中\\.和.有什么区别

一、作为Java的转义字符

1.在Java中，反斜杠（\）是一个特殊的字符，被称为转义字符，它的作用是用来转义后面一个字符。转义后的字符通常用于表示一个不可见的字符或具有特殊含义的字符，例如换行（\n）、回车符(\r)、制表符(\t)。

2.在Java中以下字符都有特殊意义，无法直接表示

单引号：char c='a';表示字符类型的数据时需要使用单引号将字符左右括起来。所以要表示字符'则需要使用\'

双引号：String str="abc";表示字符串类型的数据时需要使用双引号将字符串左右括起来。要表示字符串"则需要\"

反斜杠：String regex="你好\n\t阿";在Java代码中\表示转义字符，所以如果要表示字面意思的\，则需要使用\\

所以用反斜杠加上本身字符来进行表示。

二、在正则表达式中

2.1Java中正则表达式的\

\表示将下一字符标记为特殊字符。如\d表示数字字符匹配，等效于 [0-9]。\w表示匹配任何字类字符（字母数字下划线），注意包括下划线。与"[A-Za-z0-9_]"等效。

在其他语言中，\\表示：我想要在正则表达式中插入一个普通的（字面上的）反斜杠，请不要给它任何特殊的意义。

在 Java中，\\表示：我要插入一个正则表达式的反斜线，所以其后的字符具有特殊的意义。

\\中的第一个\表示java的转义字符\由编译器解析，第二个\是正则表达式\由正则表达式引擎解析。

所以，在其他的语言中（如Perl），一个反斜杠\就足以具有转义的作用，而在 Java中正则表达式中则需要有两个反斜杠才能被解析为其他语言中的转义作用。也可以简单的理解在 Java的正则表达式中，两个\\代表其他语言中的一个\，这也就是为什么表示一位数字的正则表达式是\\d，而表示一个普通的反斜杠是\\\\。

所以Java正则表达式中匹配一个普通的反斜杠是\\\\。

所以如果在[]内表示一个]，要写两个\，即[\\]]。

例如，我要在前面不是0-9，也不是） ]}三个反括号的后面位置中，匹配-的后面是数字或者正括号( [{的-前面的位置，须写成:

(?<![0-9)}\\]])(?=-[0-9({\\[])。

若在该位置加0,可写成String s= str.replaceAll("(?<![0-9)}\\]])(?=-[0-9({\\[])","0");

2.2说明：

字符说明

^匹配输入字符串开始的位置。如果设置了 RegExp对象的 Multiline属性，^还会与"\n"或"\r"之后的位置匹配。

$匹配输入字符串结尾的位置。如果设置了 RegExp对象的 Multiline属性，$还会与"\n"或"\r"之前的位置匹配。

*零次或多次匹配前面的字符或子表达式。例如，zo*匹配"z"和"zoo"。*等效于{0,}。

+一次或多次匹配前面的字符或子表达式。例如，"zo+"与"zo"和"zoo"匹配，但与"z"不匹配。+等效于{1,}。

?零次或一次匹配前面的字符或子表达式。例如，"do(es)?“匹配"do"或"does"中的"do”。?等效于{0,1}。

{n} n是非负整数。正好匹配 n次。例如，"o{2}"与"Bob"中的"o"不匹配，但与"food"中的两个"o"匹配。

{n,} n是非负整数。至少匹配 n次。例如，"o{2,}“不匹配"Bob"中的"o”，而匹配"foooood"中的所有 o。"o{1,}“等效于"o+”。"o{0,}“等效于"o*”。

{n,m} m和 n是非负整数，其中 n<= m。匹配至少 n次，至多 m次。例如，"o{1,3}"匹配"fooooood"中的头三个 o。‘o{0,1}’等效于‘o?’。注意：您不能将空格插入逗号和数字之间。

x y

[xyz]字符集。匹配包含的任一字符。例如，"[abc]“匹配"plain"中的"a”。

[ ^xyz]反向字符集。匹配未包含的任何字符。例如，"[^abc]“匹配"plain"中"p”，“l”，“i”，“n”。

[a-z]字符范围。匹配指定范围内的任何字符。例如，"[a-z]"匹配"a"到"z"范围内的任何小写字母。

\d数字字符匹配。等效于 [0-9]。

\D非数字字符匹配。等效于 [ ^0-9]。

\w匹配任何字类字符，包括下划线。与"[A-Za-z0-9_]"等效。

\W与任何非单词字符匹配。与"[ ^A-Za-z0-9_]"等效。

2.3Java正则表达式的使用方法

使用正则表达式需要引入 java.util.regex包，我们就从这里入手讲解：

java.util.regex

java.util.regex包主要包括以下三个类：

Pattern类：

pattern对象是一个正则表达式的编译表示。Pattern类没有公共构造方法。要创建一个 Pattern对象，你必须首先调用其公共静态编译方法，它返回一个 Pattern对象。该方法接受一个正则表达式作为它的第一个参数。

Matcher类：

Matcher对象是对输入字符串进行解释和匹配操作的引擎。与Pattern类一样，Matcher也没有公共构造方法。你需要调用 Pattern对象的 matcher方法来获得一个 Matcher对象。

matches方法

PatternSyntaxException：

PatternSyntaxException是一个非强制异常类，它表示一个正则表达式模式中的语法错误

好了，关于正则表达式语法解析和正则表达式在线测试工具的问题到这里结束啦，希望可以解决您的问题哈！

margin：0 auto含义，CSS中margin的用法程序员论坛？程序员技术论坛