编程学习网 > PHP技术 > PHP常用正则表达式大全
2015
03-26

PHP常用正则表达式大全

正则表达式

表单验证匹配

验证账号,字母开头,允许 5-16 字节,允许字母数字下划线:^[a-zA-Z][a-zA-Z0-9_]{4,15}$
验证账号,不能为空,不能有空格,只能是英文字母:^\S+[a-z A-Z]$
验证账号,不能有空格,不能非数字:^\d+$
验证用户密码,以字母开头,长度在 6-18 之间:^[a-zA-Z]\w{5,17}$
验证是否含有 ^%&',;=?$\ 等字符:[^%&',;=?$\x22]+
匹配Email地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配腾讯QQ号:[1-9][0-9]{4,}
匹配日期,只能是 2004-10-22 格式:^\d{4}\-\d{1,2}-\d{1,2}$
匹配国内电话号码(匹配形式如010-12345678或0571-12345678):^\d{3}-\d{8}|\d{4}-\d{7,8}$
匹配中国邮政编码:^[1-9]\d{5}(?!\d)$
匹配身份证(中国的身份证为 15 位或 18 位):\d{14}(\d{4}|(\d{3}[xX])|\d{1})
不能为空且二十字节以上:^[\s|\S]{20,}$

字符匹配

匹配由 26 个英文字母组成的字符串:^[A-Za-z]+$
匹配由 26 个大写英文字母组成的字符串:^[A-Z]+$
匹配由 26 个小写英文字母组成的字符串:^[a-z]+$
匹配由数字和 26 个英文字母组成的字符串:^[A-Za-z0-9]+$
匹配由数字、26个英文字母或者下划线组成的字符串:^\w+$
匹配空行:\n[\s| ]*\r
匹配任何内容:[\s\S]*
匹配中文字符:[\x80-\xff]+ 或者 [\xa1-\xff]+
只能输入汉字:^[\x80-\xff],{0,}$
匹配双字节字符(包括汉字在内):[^\x00-\xff]

匹配数字

只能输入数字:^[0-9]*$
只能输入n位的数字:^\d{n}$
只能输入至少n位数字:^\d{n,}$
只能输入m-n位的数字:^\d{m,n}$
匹配正整数:^[1-9]\d*$
匹配负整数:^-[1-9]\d*$
匹配整数:^-?[1-9]\d*$
匹配非负整数(正整数 + 0):^[1-9]\d*|0$
匹配非正整数(负整数 + 0):^-[1-9]\d*|0$
匹配正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$
匹配负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
匹配浮点数:^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
匹配非负浮点数(正浮点数 + 0):^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
匹配非正浮点数(负浮点数 + 0):^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$

匹配 IP 地址

((25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(25[0-5]|2[0-4]\d|[01]?\d\d?)

验证域名

检验一个字符串是否是个有效域名

$url = "/"; 
if (preg_match('/^(http|https|ftp)://([A-Z0-9][A-Z0-9_-]*(?:.[A-Z0-9][A-Z0-9_-]*)+):?(d+)?/?/i', $url)) { 
    echo "Your url is ok."; 
} else { 
    echo "Wrong url."; 
}

从一个字符串中突出某个单词

这是一个非常有用的在一个字符串中匹配出某个单词 并且突出它,非常有效的搜索结果

$text = "Sample sentence from KomunitasWeb, regex has become popular in web programming. Now we learn regex. According to wikipedia, Regular expressions (abbreviated as regex or regexp, with plural forms regexes, regexps, or regexen) are written in a formal language that can be interpreted by a regular expression processor";

$text = preg_replace("/b(regex)b/i", '<span style="background:#5fc9f6">1</span>', $text);

echo $text;

突出查询结果在你的 WordPress 博客里就像刚才我说的,上面的那段代码可以很方便的搜索出结果,而这里是一个更好的方式去执行搜索在某个WordPress的博客上打开你的文件 search.php ,然后找到 方法 the_title() 然后用下面代码替换掉它

echo $title;
Now, just before the modified line, add this code:
<?php
    $title = get_the_title();
    $keys= explode(" ",$s);
    $title = preg_replace('/('.implode('|', $keys) .')/iu',
    '<strong>\0</strong>',
    $title);
?>
Save the search.php file and open style.css. Append the following line to it:
strong.search-excerpt { background: yellow; }

HTML文档中获得全部图片

如果你曾经希望去获得某个网页上的全部图片,这段代码就是你需要的,你可以轻松的建立一个图片下载机器人

$images = array(); 
preg_match_all('/(img|src)=("|')[^"'>]+/i', $data, $media); 
unset($data); 
$data=preg_replace('/(img|src)("|'|="|=')(.*)/i',"$3",$media[0]); 
foreach($data as $url) 
{ 
    $info = pathinfo($url); 
    if (isset($info['extension'])) 
    { 
        if (($info['extension'] == 'jpg') || 
           ($info['extension'] == 'jpeg') || 
           ($info['extension'] == 'gif') || 
           ($info['extension'] == 'png')) 
               array_push($images, $url); 
    } 
}

删除重复字母

经常重复输入字母? 这个表达式正适合

$text = preg_replace("/s(w+s)1/i", "$1", $text);

删除重复的标点

功能同上,但只是面对标点,白白重复的逗号

$text = preg_replace("/.+/i", ".", $text);

匹配一个XML或者HTML标签

这个简单的函数有两个参数:第一个是你要匹配的标签,第二个是包含XML或HTML的变量,再强调下,这个真的很强大

function get_tag( $tag, $xml ) { 
    $tag = preg_quote($tag); 
    preg_match_all('{<'.$tag.'[^>]*>(.*?)</'.$tag.'>.'}', 
        $xml, 
        $matches, 
        PREG_PATTERN_ORDER); 
    return $matches[1]; 
}

匹配具有属性值的XML或者HTML标签

这个功能和上面的非常相似,但是它允许你匹配的标签内部有属性值,例如你可以轻松匹配 <div id=”header”>

function get_tag( $attr, $value, $xml, $tag=null ) { 
    if( is_null($tag) ) 
        $tag = '\w+'; 
    else 
        $tag = preg_quote($tag); 
    
    $attr = preg_quote($attr); 
    $value = preg_quote($value); 
    $tag_regex = "/<(".$tag.")[^>]*$attr\s*=\s*(['\"])$value\\2[^>]*>(.*?)<\/\\1>/"; 
 
    preg_match_all($tag_regex, 
        $xml, 
        $matches, 
        PREG_PATTERN_ORDER); 
 
    return $matches[3]; 
}

匹配十六进制颜色值

web开发者的另一个有趣的工具,它允许你匹配和验证十六进制颜色值

$string = "#555555";
if (preg_match('/^#(?:(?:[a-fd]{3}){1,2})$/i', $string)) {
    echo "example 6 successful.";
}

查找页面 title

这段代码方便查找和打印 网页 <title> 和</title> 之间的内容

$fp = fopen("http://www.catswhocode.com/blog","r");
while (!feof($fp) ){
    $page .= fgets($fp, 4096);
}
$titre = eregi("<title>(.*)</title>",$page,$regs);
echo $regs[1];
fclose($fp);

解释 Apache 日志

大多数网站使用的都是著名的Apache服务器,如果你的网站也是,那么使用PHP正则表达式解析 apache 服务器日志 怎么样?

//Logs: Apache web server
//Successful hits to HTML files only. Useful for counting the number of page views.
'^((?#client IP or domain name)S+)s+((?#basic authentication)S+s+S+)s+[((?#date and time)[^]]+)]s+"(?:GET|POST|HEAD) ((?#file)/[^ ?"]+?.html?)??((?#parameters)[^ ?"]+)? HTTP/[0-9.]+"s+(?#status code)200s+((?#bytes transferred)[-0-9]+)s+"((?#referrer)[^"]*)"s+"((?#user agent)[^"]*)"$'

//Logs: Apache web server
//404 errors only
'^((?#client IP or domain name)S+)s+((?#basic authentication)S+s+S+)s+[((?#date and time)[^]]+)]s+"(?:GET|POST|HEAD) ((?#file)[^ ?"]+)??((?#parameters)[^ ?"]+)? HTTP/[0-9.]+"s+(?#status code)404s+((?#bytes transferred)[-0-9]+)s+"((?#referrer)[^"]*)"s+"((?#user agent)[^"]*)"$'

使用智能引号代替双引号

如果你是一个印刷爱好者,你将喜欢这个允许用智能引号代替双引号的正则表达式,这个正则被WORDPRESS在其内容上使用

preg_replace('B"b([^"x84x93x94rn]+)b"B', '?1?', $text);

检验密码的复杂度

这个正则表达式将检测输入的内容是否包含6个或更多字母,数字,下划线和连字符. 输入必须包含至少一个大写字母,一个小写字母和一个数字

'A(?=[-_a-zA-Z0-9]*?[A-Z])(?=[-_a-zA-Z0-9]*?[a-z])(?=[-_a-zA-Z0-9]*?[0-9])[-_a-zA-Z0-9]{6,}z'

WordPress: 使用正则获得 帖子上的图片

我知道很多人是WORDPRESS的使用者,你可能会喜欢并且愿意使用 那些从帖子的内容检索下来的图像代码。使用这个代码在你的BLOG只需要复制下面代码到你的某个文件里

<?php 
if (have_posts()) :
    while (have_posts()) : 
        the_post();
        $szPostContent = $post->post_content;
        $szSearchPattern = '~<img [^>]* />~';

        // Run preg_match_all to grab all the images and save the results in $aPics
        preg_match_all( $szSearchPattern, $szPostContent, $aPics );

        // Check to see if we have at least 1 image
        $iNumberOfPics = count($aPics[0]);

        if ( $iNumberOfPics > 0 ) {
            // Now here you would do whatever you need to do with the images
            // For this example the images are just displayed
            for ( $i=0; $i < $iNumberOfPics ; $i++ ) {
                echo $aPics[0][$i];
            };
        };

    endwhile;
endif;
?>

自动生成笑脸图案

被WordPress使用的另一个方法, 这段代码可使你把图像自动更换一个笑脸符号

$texte='A text with a smiley ';
echo str_replace(':-)','<img src="smileys/souriant.png">',$texte);

移除图片的链接

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

<?php
$str = '<a href="http://www.5idev.com/">5idev</a>其他字符<a href="http://www.sohu.com/">sohu</a><a href="http://www.sohu.com/"><img src="http://www.fashion-press.net/img/news/3176/mot_06.jpg" /></a><br>';

//echo preg_replace("/(<a.*?>)(<img.*?>)(<\/a>)/", '$2', $str);
echo preg_replace("/(<a.*?>)(<img.*?>)(<\/a>)/", '\2', $str);
?>

扫码二维码 获取免费视频学习资料

Python编程学习

查 看2022高级编程视频教程免费获取