深圳全飞鸿

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 602|回复: 6
打印 上一主题 下一主题

PHP正则表达式(regular)- 最大匹配与最小匹配

[复制链接]

800

主题

1379

帖子

7705

积分

版主

Rank: 7Rank: 7Rank: 7

积分
7705
跳转到指定楼层
楼主
发表于 2020-12-14 11:16:21 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
PHP正则表达式(regular)- 最大匹配与最小匹配

PHP正则配批的脚本如下

  1. <?php   
  2. $mode="/abc(.*)g/i";   
  3. $str="abcdefgabcdefg";   
  4. preg_match($mode,$str,$res);   
  5. echo $res[0];   
  6. ?>  
复制代码


打印出“abcdefgabcdefg”,因为它尽可能多地匹配模式,直至结尾的‘g’。 要改变匹配特点,只须简单地在量词(加号[+]或星号
  • )后面加一个问号(?)即可。在上面的程序中把模式改为在‘+’之后包含一个‘?’格式如下。

    $mode = "/abc(.*?)g/i";

    输出变成“ abcdefg ”,因为模式不再贪婪,这也是正则的最小匹配,对于需要循环得到的内容,一般是需要用到最小匹配。

    当然在php中你可以在模式之外添加模式修正符 "U" 来设置禁止贪婪匹配。

  • 回复

    使用道具 举报

    800

    主题

    1379

    帖子

    7705

    积分

    版主

    Rank: 7Rank: 7Rank: 7

    积分
    7705
    沙发
     楼主| 发表于 2020-12-14 11:25:03 | 只看该作者
    模式修正符
    说明
    i
    表示在和模式进行匹配进不区分大小写
    m
    将模式视为多行,使用^和$表示任何一行都可以以正则表达式开始或结束
    s
    如果没有使用这个模式修正符号,元字符中的"."默认不能表示换行符号,将字符串视为单行
    x
    表示模式中的空白忽略不计
    e
    正则表达式必须使用在preg_replace替换字符串的函数中时才可以使用(讲这个函数时再说)
    A
    以模式字符串开头,相当于元字符^
    Z
    以模式字符串结尾,相当于元字符$
    U
    正则表达式的特点:就是比较“贪婪”,使用该模式修正符可以取消贪婪模式

    由于i表示匹配不区分大小写,在下面的示例中,我们不再进行演示,我们来看一下其他模式修正符的示例。


    回复 支持 反对

    使用道具 举报

    800

    主题

    1379

    帖子

    7705

    积分

    版主

    Rank: 7Rank: 7Rank: 7

    积分
    7705
    板凳
     楼主| 发表于 2020-12-14 11:27:32 | 只看该作者
    1,模式修正符m。

    1. <?php
    2. $pattern = '/^abc/m';
    3. $string = 'bcd
    4. abc
    5. cba';
    6. if (preg_match($pattern, $string, $arr)) {
    7. echo "正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>";
    8. print_r($arr);
    9. } else {
    10. echo "<font color='red'>正则表达式{$pattern}和字符串{$string}匹配失败</font>";
    11. }
    12. ?>
    复制代码


    匹配结果是成功的。注意:我们在使用模式修正符m的时候,将匹配字符串看成是多行而不是默认的单行,所以任何一行只要是以abc开头,就匹配成功。但是,如果能匹配的行前面有空格的话,就不能匹配了!除非修改正则表达式的匹配模式。
    回复 支持 反对

    使用道具 举报

    800

    主题

    1379

    帖子

    7705

    积分

    版主

    Rank: 7Rank: 7Rank: 7

    积分
    7705
    地板
     楼主| 发表于 2020-12-14 11:28:40 | 只看该作者
    2,模式修正符s。

    1. <?php
    2. $pattern = '/a.*c/s';
    3. $string = 'adsadsa
    4. c';
    5. if (preg_match($pattern, $string, $arr)) {
    6. echo "正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>";
    7. print_r($arr);
    8. } else {
    9. echo "<font color='red'>正则表达式{$pattern}和字符串{$string}匹配失败</font>";
    10. }
    11. ?>
    复制代码


    这次的匹配记过也是成功的。如果你将上例中的模式修正符s去掉的话,匹配就会失败。因为模式修正符s将匹配字符串看作是单行的,所以这个时候,元字符中的"."就可以表示换行符号了。
    回复 支持 反对

    使用道具 举报

    800

    主题

    1379

    帖子

    7705

    积分

    版主

    Rank: 7Rank: 7Rank: 7

    积分
    7705
    5#
     楼主| 发表于 2020-12-14 11:30:08 | 只看该作者
    3,模式修正符x。

    1. <?php
    2. $pattern = '/a c/x';
    3. $string = 'a c';
    4. if (preg_match($pattern, $string, $arr)) {
    5. echo "正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>";
    6. print_r($arr);
    7. } else {
    8. echo "<font color='red'>正则表达式{$pattern}和字符串{$string}匹配失败</font>";
    9. }
    10. ?>
    复制代码


    这次的匹配结果是失败的。因为我们使用模式修正符x取消了模式中的空格。注意:我们无法使用模式修正符取消\s表示的空白。
    回复 支持 反对

    使用道具 举报

    800

    主题

    1379

    帖子

    7705

    积分

    版主

    Rank: 7Rank: 7Rank: 7

    积分
    7705
    6#
     楼主| 发表于 2020-12-14 11:32:25 | 只看该作者
    4,模式修正符A。

    1. <?php
    2. $pattern = '/ac/A';
    3. $string = 'acahgyghvbm';
    4. if (preg_match($pattern, $string, $arr)) {
    5. echo "正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>";
    6. print_r($arr);
    7. } else {
    8. echo "<font color='red'>正则表达式{$pattern}和字符串{$string}匹配失败</font>";
    9. }
    10. ?>
    复制代码


    正则表达式表示的含义是匹配以ac开头的字符串,结果成功。
    模式修正符Z表示的是以字符串结尾的匹配,和A的用法是一样的,我们不再进行演示。
    回复 支持 反对

    使用道具 举报

    800

    主题

    1379

    帖子

    7705

    积分

    版主

    Rank: 7Rank: 7Rank: 7

    积分
    7705
    7#
     楼主| 发表于 2020-12-14 11:37:49 | 只看该作者
    5,模式修正符U。
    这个模式修正符是十分重要的!在正则表达式中,其本身是“贪婪”的。那什么是贪婪模式呢?贪婪模式的意思就是说,正则表达式默认会在查找到第一个匹配后,继续尝试后面的匹配,如果能找到匹配,则匹配最大的范围字符串。但有的时候这并不是我们想要的结果,所以我们需要取消贪婪模式。
    我们还是先看一个贪婪模式的例子:
    复制代码 代码如下:

    <?php
    $pattern = '/<b>.*<\/b>/';
    $string = '<b>welcome</b> <b>to</b> <b>phpfuns</b>';
    if (preg_match($pattern, $string, $arr)) {
    echo "正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>";
    print_r($arr);
    } else {
    echo "<font color='red'>正则表达式{$pattern}和字符串{$string}匹配失败</font>";
    }
    ?>

    这个实例的本意是匹配welcome,但是结果却匹配了welcome to phpfuns整个字符串(注意我们的字符串'welcome to phpfuns',其开头和结尾正好构成了正则表达式的模式匹配,所以匹配成功),这就是正则表达式的贪婪模式。当然,这不是我们要的结果。

    取消贪婪模式

    我们可以使用模式修正符U和元字符?两种方式取消正则表达式的贪婪模式。
    模式修正符U取消贪婪模式
    复制代码 代码如下:

    <?php
    $pattern = '/<b>.*<\/b>/U';
    $string = '<b>welcome</b> <b>to</b> <b>phpfuns</b>';
    if (preg_match($pattern, $string, $arr)) {
    echo "正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>";
    print_r($arr);
    } else {
    echo "<font color='red'>正则表达式{$pattern}和字符串{$string}匹配失败</font>";
    }
    ?>

    元字符?取消贪婪模式
    复制代码 代码如下:

    <?php
    $pattern = '/<b>.*?<\/b>/';
    $string = '<b>welcome</b> <b>to</b> <b>phpfuns</b>dsadsadas';
    if (preg_match($pattern, $string, $arr)) {
    echo "正则表达式<b>{$pattern}</b>和字符串<b>{$string}</b>匹配成功<br>";
    print_r($arr);
    } else {
    echo "<font color='red'>正则表达式{$pattern}和字符串{$string}匹配失败</font>";
    }
    ?>

    注意元字符的位置,我们必须在“”之前结束贪婪模式,才能达到我们的目的,匹配welcome!
    本节我们介绍了正则表达式中的模式修正符,正则表达式的贪婪模式以及演示了正则表达式中模式修正符的使用方法
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|Archiver|手机版|小黑屋|nagomes  

    GMT+8, 2025-5-5 06:32 , Processed in 0.027367 second(s), 20 queries .

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表