根据文本生成正则表达式 正则表达式与字符串处理的相关技巧
大家好,今天来为大家分享根据文本生成正则表达式的一些知识点,和正则表达式与字符串处理的相关技巧的问题解析,大家要是都明白,那么可以忽略,如果不太清楚的话可以看看本篇文章,相信很大概率可以解决您的问题,接下来我们就一起来看看吧!
什么是正则表达式
正则表达式,又称规则表达式。是计算机科学的一个概念。
正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。
正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。
扩展资料
正则表达式的作用:
1、匹配
检查字符串是否符合正则表达式中的规则,有一次不匹配,则返回false。如:
String str="abc";
String reg="[a-zA-Z]\\d?";//次表达式表示字符串的第一位只能是字母,第二位只能是数字或没有boolean flag=str.matches(reg);//返回结果为true。
2、切割
所谓切割,即是按一定的规则将字符串分割成多个子字符串,如:
String str="zhangsan,lishi,wangwu"。
String reg=",";//表示以逗号作为切割符。
String[] arr=str.split(reg);//返回结果为{“zhangsan”,"lisi","wangwu}。
3、替换
即将字符串中符合规则的字符替换成指定字符,如:
String str="sfhjhfh136hjasdf73466247fsjha8437482jfjsfh746376"。
str.replaceAll("\\d{3,}","#");//表示将连续出现三个或三个以上的数字替换成“#”。
参考资料来源:百度百科-正则表达式
Linux如何使用正则表达式命令文本文件操作命令
Linux对文本操作命令及正则表达式:
cat
cat是 concatenate的缩写,所以它的作用其实是连接文件。但默认情况下它会将连接文件的结果送到标准输出。所以我们常用来显示文件内容。类似于 dos中的 type。
more
当一个文件的内容超过一屏后,我们可以用 more这个指令来逐屏察看文件内容。
less
less在 more的基础上,更可以逐行察看,前后翻页。
head
head显示文件开头部分内容,默认显示前十行参数--lines或者–n指明显示行数基本格式:
tail
tail显示文件结尾部分内容,命令用法同 head,参数-f显示文件的纪实更新,用于监视日志文件
tail默认显示文件列表中每个文件的后 10行,如果没有文件名或文件名为“-”则其从标准输入中读取文件,如果有多个文件则其会在文件前面加上“==>文件名<==”以便区别。
# tail/etc/mail/sendmail.mc默认查看文件的后 10行内容
# tail–n 20/etc/passwd查看文件后 20行内容
注意:# tail–f/var/log/message实时监控日志文件更新信息,非常重要
diff
diff用于比较两个文件之间的区别,并送到标准输出。输出时先报告两个文件的哪一行不同。基本格式:
参数:
uniq用于去除文本中相邻的重复行。
-u参数可以只显示那些没有被重复过的行。-d显示有被重复过的行。
cut
cut可以根据一个指定的标记(默认是 tab)来为文本划分列,然后将此列显示。使用权限:所有使用者
基本格式: cut-cnum1-num2 filename
说明:显示每行从开头算起 num1到 num2的文字。
[root@uplooking root]$ cut–f1–d:/etc/shadow表示以:为分隔符,显示/etc/shadow的第一列 sort
sort用来按各种需要重新排列文本,一般运用在一个管道之后。例如:
默认情况下 sort按照字母顺序排列文本。
wc
wc用来统计一个文件的行数、词数、字数并送到标准输出。也可以用-l(行数)、-w(词数)、-c(字数)来指定输出内容。
正则表达式验证文本框只能输入数字和小数点
在浏览器验证正则字符时,如果输入的是数字带小数点后面不再输入数字,那么浏览器会自动截取掉小数点,即:输入"1.",浏览器会处理成"1"
唔…因此当我为求方便直接在浏览器中输出表达式时就踩坑了==
首先我先写了一个验证最多可保留两位小数的正则:
var reg=/^\d+(.\d{1,2})?$/;
\d:0-9的数字
^\d:以0-9数字开头的表达式
^\d+:以一至多个0-9数字开头的表达式
():括号里是一个整体
(.\d{1,2}):.小数点、d{1,2}一至两位数字
(.\d{1,2})?:小数(小数点+一至两位小数)限制出现零到一次
(.\d{1,2})?$:若存在小数点,则以小数点后的一至两位小数结尾
在页面中写一个输入框和点击按钮,测试校验是否成功:
浏器F12打开控制台查看效果:
在这里入图片描述
可以看到输入框输入1.后正常检验是false,然而如果在浏览器中输入校验规则和字符串则不然:
在这里入图片描述
如果输入个带小数点的数字,后面又不再输入数字时,浏览器会自动忽略掉小数点,因而检验"1."类似的格式相当于校验“1”,结果自然是true。
仅记录为主,若有什么错误还望包涵指出
对于文本框输入的校验有不同的思路,本例采用了正则表达式匹配的方法。
1、即时验证:
为了即时对文本框内容进行验证,可以利用控件的validating事件,当控件失去焦点时,便会触发该事件。
2、正则表达式:
将要验证的有效格式写成正则表达式,不仅可以方便快捷地进行匹配,而且对于以后需求更改时也易于修改(只需修改正则表达式即可)。
利用正则表达式时,需要添加引用:< usingSystem.Text.RegularExpressions;>
3、验证完成:
验证通过后进行的操作可以使用控件的validated事件。例如,如果在验证不通过时有错误提示的话,那么验证通过时就可以给出验证通过的提示。该事件可根据实际需要选用。
4、正常退出:
在Validating事件中做验证处理时,如果验证不通过,本例希望焦点仍停留在该文本框内,即只有输入合法才能进行其他操作。这样的负作用之一就是用户在输入不合法时也无法正常退出程序,因此为使关闭程序的操作不受文本框验证的影响而正常使用,可以在FormClosing事件中添加e.Cancel=false来解决。
5、限制输入长度:
如果用户不小心压住了某个数字键,此时文本框里已经输入了100多位的数据,而且又恰好点击了“提交”按钮时,你能保证后台代码能接受这个结果吗?你如果也有这样的担心,那就试试控件的maxLength属性吧。
6、禁用输入法:
本例要求只能输入数字,因此如果禁用输入法后会省去很多麻烦。禁用后,无法直接输入中文,也无法“直接”输入全角字符。去查查控件的ImeMode属性,设置为disabled后就可以了。
7、全角字符串的处理:
知道上一步为什么说禁用输入法后无法“直接”输入全角字符吗?因为还可以“间接”输入!是的,那就是将全角字符串复制后粘贴过来。不要以为抽风的人才会这么无聊帮你去找Bug,程序员还是应该尽量把可能的异常先做好预防。(当然,禁用文本框的粘贴功能也不错,本例为照顾用户可能存在的粘贴较长数据的需要,没有禁用。大家可以自行搜下禁用粘贴的资料。)
如果文本框里含全角字符,在后期做数据运算时很容易出问题,本例解决方法是先检查,若是全角字符串则转换为半角字符串。
心得体会:
写出一个完全正确且符合自己要求的正则表达式确实需要好好构思,尤其是匹配内容较复杂时。但也不必担心,如果一个表达式完不成,可以写多个表达式然后“或”运算。在写正则表达式时不要盲目地参看网上已有的表达式,最好做个测试程序验证下,因为不同的语言正则表达式语法会有细微的不同。
对于正则表达式,大家先对照着MSDN上的介绍,熟悉每个符号的意思,再去理解别人写的表达式,慢慢就能写出自己的表达式了。对于正则表达式的理解,不妨想想中学学过的“排列组合”,会有用的。用排列组合把表达式中可能的各个分支完整走一遍,就都懂了
好了,文章到这里就结束啦,如果本次分享的根据文本生成正则表达式和正则表达式与字符串处理的相关技巧问题对您有所帮助,还望关注下本站哦!