📜  珀尔 |正则表达式字符类(1)

📅  最后修改于: 2023-12-03 15:40:51.033000             🧑  作者: Mango

Perl | 正则表达式字符类

在 Perl 中,我们可以用特殊的字符类来代表一组字符。

常见的字符类

以下是常见的字符类及其表示的字符:

  • \d:任何数字,相当于 [0-9]
  • \D:除了数字以外的任何字符,相当于 [^0-9]
  • \w:任何字母数字(大小写)以及下划线,相当于 [a-zA-Z0-9_]
  • \W:除了字母数字和下划线以外的任何字符,相当于 [^a-zA-Z0-9_]
  • \s:任何空白字符(空格、制表符、换行符等),相当于 [\t\n\r\f]
  • \S:除了空白字符以外的任何字符,相当于 [^\t\n\r\f]

示例:

my $str = "123 abc xyz\n";
$str =~ s/\d+/NUM/g;  # 匹配所有数字并替换为 "NUM"
$str =~ s/\s+/ /g;    # 将所有连续的空白字符替换为一个空格
print "$str\n";       # 输出 "NUM abc xyz "
自定义字符类

除了上述预定义的字符类,我们还可以自定义字符类,用中括号 [...] 来表示。字符类中的字符可以是任何字符,还可以使用 - 表示字符范围。如 [a-z] 表示所有小写字母,[A-Z] 表示所有大写字母,[0-9] 表示所有数字。

示例:

my $str = "ABcd123XYZ";
if ($str =~ /[a-z]/) {  # 匹配任何小写字母
    print "Matched!\n";
} else {
    print "Not matched!\n";
}

更多的自定义字符类示例:

my $str = "ABcd123XYZ";
$str =~ s/[a-z]/x/g;    # 将所有小写字母替换为 "x"
$str =~ s/[^A-Za-z]/_/g; # 将所有非字母字符替换为下划线
print "$str\n";         # 输出 "ABxx123XYZ"
反义字符类

除了使用 ^ 表示取反之外,我们还可以使用预定义的反义字符类来匹配除了某些字符之外的任何字符。如 \D 表示除了数字以外的任何字符,\W 表示除了字母数字和下划线以外的任何字符,\S 表示除了空白字符以外的任何字符。

示例:

my $str = "ABcd123XYZ";
if ($str =~ /\D/) {      # 匹配任何非数字字符
    print "Matched!\n";
} else {
    print "Not matched!\n";
}

更多的反义字符类示例:

my $str = "ABcd123XYZ";
$str =~ s/\W/ /g;  # 将所有非字母数字和下划线的字符替换为一个空格
print "$str\n";    # 输出 "ABcd123XYZ"
总结

Perl 中的正则表达式字符类可以帮助我们匹配一组特定的字符、排除一些不需要的字符,进而更加灵活地进行文本处理。在实际编程中,我们需要根据具体情况选择合适的字符类来完成需要的匹配。