php正则表达式匹配中文(正则表达式匹配指定字符串)
各位老铁们好,相信很多人对php正则表达式匹配中文都不是特别的了解,因此呢,今天就来为大家分享下关于php正则表达式匹配中文以及正则表达式匹配指定字符串的问题知识,还望可以帮助大家,解决大家的一些困惑,下面一起来看看吧!
求PHP 的正则表达式 大全
匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^\x00-\xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:\n\s*\r评注:可以用来删除空白行匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*?/>评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为匹配首尾空白字符的正则表达式:^\s*|\s*$评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*评注:表单验证时很实用匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*评注:网上流传的版本功能很有限,上面这个基本可以满足需求匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$评注:表单验证时很实用匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}评注:匹配形式如 0511-4405222或 021-87888822匹配腾讯QQ号:[1-9][0-9]{4,}评注:腾讯QQ号从10000开始匹配中国邮政编码:[1-9]\d{5}(?!\d)评注:中国邮政编码为6位数字匹配身份证:\d{15}|\d{18}评注:中国的身份证为15位或18位匹配ip地址:\d+\.\d+\.\d+\.\d+评注:提取ip地址时有用匹配特定数字: ^[1-9]\d*$//匹配正整数 ^-[1-9]\d*$//匹配负整数 ^-?[1-9]\d*$//匹配整数 ^[1-9]\d*|0$//匹配非负整数(正整数+ 0) ^-[1-9]\d*|0$//匹配非正整数(负整数+ 0) ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$//匹配正浮点数 ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$//匹配负浮点数 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$//匹配浮点数 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$//匹配非负浮点数(正浮点数+ 0) ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$//匹配非正浮点数(负浮点数+ 0)评注:处理大量数据时有用,具体应用时注意修正匹配特定字符串: ^[A-Za-z]+$//匹配由26个英文字母组成的字符串 ^[A-Z]+$//匹配由26个英文字母的大写组成的字符串 ^[a-z]+$//匹配由26个英文字母的小写组成的字符串 ^[A-Za-z0-9]+$//匹配由数字和26个英文字母组成的字符串 ^\w+$//匹配由数字、26个英文字母或者下划线组成的字符串/http:\/\/(.*)\//i//匹配外部链接地址
满意请采纳
超常用的PHP正则表达式收集整理
以下就是对超常用的PHP正则表达式进行的收集整理,为了方便大家更快更好的掌握php正则表达式。
一、表单验证匹配
验证账号,字母开头,允许
5-16
字节,允许字母数字下划线:^[a-zA-Z][a-zA-Z0-9_]{4,15}$
验证账号,不能为空,不能有空格,只能是英文字母:^\S+[a-z
A-Z]$
验证账号,不能有空格,不能非数字:^\d+$
验证用户密码,以字母开头,长度在
6-18
之间:^[a-zA-Z]\w{5,17}$
验证是否含有
^%&',;=?$\
等字符:[^%&',;=?$\x22]+
匹配Email地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配腾讯QQ号:[1-9][0-9]{4,}
匹配日期,只能是
2004-10-22
格式:^\d{4}\-\d{1,2}-\d{1,2}$
匹配国内电话号码:^\d{3}-\d{8}|\d{4}-\d{7,8}$------------评注:匹配形式如010-12345678
或0571-12345678
或
0831-1234567
匹配中国邮政编码:^[1-9]\d{5}(?!\d)$
匹配身份证:\d{14}(\d{4}|(\d{3}[xX])|\d{1})------------评注:中国的身份证为15
位或18
位
不能为空且二十字节以上:^[\s|\S]{20,}$
二、字符匹配
匹配由
26
个英文字母组成的字符串:^[A-Za-z]+$
匹配由
26
个大写英文字母组成的字符串:^[A-Z]+$
匹配由
26
个小写英文字母组成的字符串:^[a-z]+$
匹配由数字和
26
个英文字母组成的字符串:^[A-Za-z0-9]+$
匹配由数字、26个英文字母或者下划线组成的字符串:^\w+$
匹配空行:\n[\s|
]*\r
匹配任何内容:[\s\S]*
匹配中文字符:[\x80-\xff]+
或者
[\xa1-\xff]+
只能输入汉字:^[\x80-\xff],{0,}$
匹配双字节字符(包括汉字在内):[^\x00-\xff]
三、匹配数字
只能输入数字:^[0-9]*$
只能输入n位的数字:^\d{n}$
只能输入至少n位数字:^\d{n,}$
只能输入m-n位的数字:^\d{m,n}$
匹配正整数:^[1-9]\d*$
匹配负整数:^-[1-9]\d*$
匹配整数:^-?[1-9]\d*$
匹配非负整数(正整数
+
0):^[1-9]\d*|0$
匹配非正整数(负整数
+
0):^-[1-9]\d*|0$
匹配正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$
匹配负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
匹配浮点数:^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
匹配非负浮点数(正浮点数
+
0):^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
匹配非正浮点数(负浮点数
+
0):^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
四、其他
匹配HTML标记的正则表达式(无法匹配嵌套标签):<(\S*?)[^>]*>.*?</\1>|<.*?
/>
匹配网址
URL
:[a-zA-z]+://[^\s]*
匹配
IP
地址:((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)
匹配完整域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?
提示
上述正则表达式通常都加了
^
与
$
来限定字符的起始和结束,如果需要匹配的内容包括在字符串当中,可能需要考虑去掉
^
和
$
限定符。
以上正则表达式仅供参考,使用时请检验后再使用,希望通过这些超常用的PHP正则表达式
PHP正则表达式的使用技巧
PHP正则表达式的定义
用于描述字符排列和匹配模式的一种语法规则它主要用于字符串的模式分割匹配查找及替换操作
PHP中的正则函数
PHP中有两套正则函数两者功能差不多分别为
一套是由PCRE(Perl Compatible Regular Expression)库提供的使用 preg_为前缀命名的函数
一套由POSIX(Portable Operating System Interface of Unix)扩展提供的使用以 ereg_为前缀命名的函数(POSIX的正则函数库自PHP以后就不在推荐使用从PHP以后就将被移除)
由于POSIX正则即将推出历史舞台并且PCRE和perl的形式差不多更利于我们在perl和php之间切换所以这里重点介绍PCRE正则的使用
PCRE正则表达式
PCRE全称为Perl Compatible Regular Expression意思是Perl兼容正则表达式
在PCRE中通常将模式表达式(即正则表达式)包含在两个反斜线/之间如/apple/
正则中重要的几个概念有元字符转义模式单元(重复)反义引用和断言这些概念都可以在文章[ ]中轻松的理解和掌握
常用的元字符(Meta character)
元字符说明
/A匹配字符串串首的原子
/Z匹配字符串串尾的原子
/b匹配单词的边界//bis/匹配头为is的字符串/is/b/匹配尾为is的字符串//bis/b/定界
/B匹配除单词边界之外的任意字符//Bis/匹配单词 This中的 is
/d匹配一个数字等价于[ ]
/D匹配除数字以外任何一个字符等价于[^ ]
/w匹配一个英文字母数字或下划线等价于[ a zA Z_]
/W匹配除英文字母数字和下划线以外任何一个字符等价于[^ a zA Z_]
/s匹配一个空白字符等价于[/f/t/v]
/S匹配除空白字符以外任何一个字符等价于[^/f/t/v]
/f匹配一个换页符等价于/x c或/cL
匹配一个换行符等价于/x a或/cJ
匹配一个回车符等价于/x d或/cM
/t匹配一个制表符等价于/x/或/cl
/v匹配一个垂直制表符等价于/x b或/ck
/oNN匹配一个八进制数字
/xNN匹配一个十六进制数字
/cC匹配一个控制字符
模式修正符(Pattern Modifiers)
模式修正符在忽略大小写匹配多行中使用特别多掌握了这一个修正符往往能解决我们遇到的很多问题
i-可同时匹配大小写字母
M-将字符串视为多行
S-将字符串视为单行换行符做普通字符看待使匹配任何字符
X-模式中的空白忽略不计
U-匹配到最近的字符串
e-将替换的字符串作为表达使用
格式/apple/i匹配 apple或 Apple等忽略大小写/i
PCRE的模式单元
//提取第一位的属性
/^/d{}([/W])/d{}///d{}$匹配//等字符串但上述正则表达式不匹配/的格式这是因为模式 [/W]的结果/已经被存储下个位置/引用时其匹配模式也是字符/
当不需要存储匹配结果时使用非存储模式单元(?)
例如/(?:a|b|c)(D|E|F)// g/将匹配 aEEg在一些正则表达式中使用非存储模式单元是必要的否则需要改变其后引用的顺序上例还可以写成/(a|b|c)(C|E|F)/ g/
PCRE正则表达式函数
以下为引用的内容
preg_match()和preg_match_all() preg_quote() preg_split() preg_grep() preg_replace()
函数的具体使用我们可以通过PHP手册来找到下面分享一些平时积累的正则表达式
匹配action属性
以下为引用的内容
$str=;$match=; preg_match_all(//s+action=/(?!)(*?)//s/$str$match); print_r($match);
在正则中使用回调函数
以下为引用的内容
/*** replace some string by callback function**/ function callback_replace(){$url=;$str=;$str= preg_replace(/(?<=/saction=/)(?!)(*?)(?=//s)/e search(/$url//)$str); echo$str;} function search($url$match){ return$url/$match;}
带断言的正则匹配
以下为引用的内容
$match=;$str= xxxxxx cn bold font paragraph text
; preg_match_all(/(?<=<(/w{})>)*(?=<///>)/$str$match); echo匹配没有属性的HTML标签中的内容; print_r($match);
替换HTML源码中的地址
以下为引用的内容
$form_= preg_replace(/(?<=/saction=/|/ssrc=/|/s)(?!|javascript)(*?)(?=//s)/e add_url(/$url////)$form_);
lishixinzhi/Article/program/PHP/201311/21027
好了,文章到此结束,希望可以帮助到大家。