学点Java正则表达式(2)

2008-02-23 09:15:48来源:互联网 阅读 ()

新老客户大回馈,云服务器低至5折


\D 非数字[^0-9]
\s 空白字符[\t\n\r\f\x0B]
\S 非空白字符
\w 单词字符[a-zA-Z0-9_]
\W 非单词字符
\p{name} 一个指定的字符类,见表12-9
\P{name} 指定字符类的补集

边界匹配符
^ $ 输入的开头和结尾(在多行模式(multiline mode)下是行的开头和结尾)
\b 单词边界
\B 非单词边界
\A 输入的开头
\z 输入的结尾
\Z 除最后行终止符之外的输入结尾
\G 上个匹配的结尾

量词
X? 可选的X(即X可能出现,也可能不出现)
X* X,可以重复0次或多次
X X,可以重复1次或多次
X{n} X{n,} X{n,m} X重复n次,至少重复n次,重复n到m次

量词后缀
? 设默认(贪婪)匹配为reluctant匹配
设默认(贪婪)匹配为possessive匹配

集合操作
XY X的匹配后面跟着Y的匹配
X|Y X或Y的匹配

分组
(X) 匹配X并且在一个自动计数的分组中捕获它
\n 与第n个分组的匹配

转义
\c 字符c(必须不是字母)
\Q...\E 逐字地引用...
(?...) 特殊构造,看Pattern类的API


正则表达式的最简单使用是测试一个特殊的字符串是否与之匹配。这里有一个Java写的测试程序。首先从表示正则表达式的字符串构造一个Pattern对象。然后从该模式获得一个Matcher对象,并且调用它的matches()方法:
Pattern pattern = Pattern.compile(patternString);
Matcher matcher = pattern.matcher(input);
if (matcher.matches()) . . .

表12.9 预定义的字符类名(Predefined Character Class Names)

Lower 小写的ASII字符[a-z]
Upper 大写的ASCII字符[A-Z]
Alpha ASCII字母[A-Za-z]
Digit ASCII 数字 [0-9]
Alnum ASCII 字母或数字[A-Za-z0-9]
Xdigit 十六进制数字[0-9A-Fa-f]
Print or Graph 可打印的ASCII字符[\x21-\x7E]
Punct 非字母或数字ASCII [\p{Print}&&\P{Alnum}]
ASCII 所有ASCII字符 [\x00-\x7F]
Cntrl ASCII控制字符[\x00-\x1F]
Blank 空格符或制表符[ \t]
Space 空白符 [ \t\n\r\f\0x0B]
javaLowerCase 取决于Character.isLowerCase()的小写字符
javaUpperCase 取决于Character.isUpperCase()的大写字符
javaWhitespace 取决于Character.isWhitespace()的空白符
javaMirrored 取决于Character.isMirrored()的Mirrored(?)
InBlock 这里的Block是unicode字符的块名,用空格隔开,比如BasicLatin 或 Mongolian。块名列表 参考http://www.unicode.org
Category 或InCategory 这里的Category是Unicode字符的种类名,比如L(字母)或者Sc(货币符号)。种类 名列表参考http://www.unicode.org


matcher的输入可以是实现CharSequence接口的任何类对象,像String,StringBuilder或CharBuffer。

当编译模式时,可以设置一个或多个标志,例如
Pattern pattern = Pattern.compile(patternString,
Pattern.CASE_INSENSITIVE Pattern.UNICODE_CASE);

下面六个标志都是支持的:
CASE_INSENSITIVE:匹配字符时与大小写无关,该标志默认只考虑US ASCII字符。
UNICODE_CASE:当与CASE_INSENSITIVE结合时,使用Unicode字母匹配
MULTILINE:^和$匹配一行的开始和结尾,而不是整个输入
Unix_LINES: 当在多行模式下匹配^和$时,只将'\n'看作行终止符

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:跨越边界: 活动记录和 Java 编程中特定于域的语言

下一篇:华为公司 java 面试题