正则匹配所有符号，正则匹配符号大全对照表

编程之家2026-06-27710次浏览

大家好，如果您还对正则匹配所有符号不太了解，没有关系，今天就由本站为大家分享正则匹配所有符号的知识，包括正则匹配符号大全对照表的问题都会给大家分析到，还望可以解决大家的问题，下面我们就开始吧！

正则表达式怎么匹配标点符号

1、Unicode编码并不只是为某个字符简单定义了一个编码，而且还将其进行了归类。

2、\pP其中的小写 p是 property的意思，表示 Unicode属性，用于 Unicode正表达式的前缀。

3、大写 P表示 Unicode字符集七个字符属性之一：标点字符。

其他六个是

L：字母；

M：标记符号（一般不会单独出现）；

Z：分隔符（比如空格、换行等）；

S：符号（比如数学符号、货币符号等）；

N：数字（比如阿拉伯数字、罗马数字等）；

C：其他字符

上面这七个是属性，七个属性下还有若干个子属性，用于更进一步地进行细分。

正则表达式怎样匹配任意字符

在正则中，匹配任意字符，其实写法网上有很多，但因为各种软件或程序写法不支持等原因导致的问题，大家可以多研究。

今天在Java中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则：

(.*)

结果运行之后才发现，无法获得换行之后的文本。于是查了一下手册，才发现正则表达式中，“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时，手册上还有一句话：要匹配包括

'\n'在内的任何字符，请使用像'[.\n]'的模式。于是我将正则表达式的匹配规则修改如下：

([.\n]*)，当然，如果是在java程序中直接写到话，需要改为([.\\n]*)

结果再次运行程序，发现什么内容也取不到了。我百思不得其解，又将其修改为如下规则：

([.|\n]*)以及([\n.]*)

结果还是不行，什么内容都取不到。看来点符号和换行符卯上劲了～

然后上网一查，虽然没有查出上述规则到底是什么地方出问题了，但是查出了一个解决办法，经过一试，果然可以匹配包括换行符在内的任意字符，以下为正确的正则表达式匹配规则：

([\s\S]*)

同时，也可以用“([\d\D]*)”、“([\w\W]*)”来表示。

在文本文件里,

这个表达式可以匹配所有的英文

/[-~]/

这个表达式可以匹配所有的非英文(比如中文)

/[^-~]/

/是VI里用的.

你在editplus或程序里不需要/

正则匹配的中文包括中文标点符号吗

不一定的，需要依表达式范围而定，例如：[\u4e00-\u9fa5]可以识别出任何汉字，但不包含如：\u3002（匹配中文句号）。

解析：

“[\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b]”该表达式可以识别出：。；，：“”（）、？《》这些标点符号。正则表达式“\un”匹配n，其中n是一个用四个十六进制数字表示的Unicode字符。例如，\u00A9匹配版权符号（©）。

正则表达式匹配中文汉字 [\u4e00-\u9fa5]，该表达式可以识别出任何汉字。但上述 \u3002等匹配的符号不在范围内。

扩展资料：

汉字相关的正则表达式：

1、匹配双字节字符(包括汉字在内)：[^\x00-\xff]，注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

2、只含有汉字、数字、字母、下划线，下划线位置不限：^[a-zA-Z0-9_\u4e00-\u9fa5]+$

3、/^([\p{Han}\p{P}A-Za-z0-9])*$/u，其中 \p{Han}表示utf-8编码中的所有中文字符，\p{P}表示中英文标点，A-Z表示大写字母，a-z表示小写英文字母，0-9表示数字，*表示>=0,，/u表示按unicode(utf-8)匹配（主要针对多字节比如汉字）。

参考资料来源：百度百科-正则表达式

文章分享结束，正则匹配所有符号和正则匹配符号大全对照表的答案你都知道了吗？欢迎再次光临本站哦！

计算机基础知识与基本操作？计算机基础知识入门教程html介绍家乡网页模板介绍家乡网页html代码