php正则表达式取得内容所有链接的方法

清华大佬耗费三个月吐血整理的几百G的资源,免费分享!....>>>

本文实例讲述了php正则表达式取得内容所有链接的方法。分享给大家供大家参考。具体如下:

这里提供二款关于php正则链接的方法,他们可以取得内容所有链接并且保存到一个数组,当然也可以把链接全部替换.

方法一,代码如下:
function get_all_url($code){  

        preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr);  

        return array('name'=>$arr[2],'url'=>$arr[1]);  

}

方法二,代码如下:
$site=substr($url,0,strpos($url,"/",8));//站点 

$base=substr($url,0,strrpos($url,"/")+1);//文件所在目录 

$fp = fopen($url, "r" );//打开url 

 

while(!feof($fp))$contents.=fread($fp,1024);// 

$pattern="|href=['"]?([^ '"]+)['" ]|u"; 

 

preg_match_all($pattern,$contents, $regarr, preg_set_order);//匹配所有href= 

for($i=0;$i<count($regarr);$i++){//遍历所有匹配 

if(!eregi("://",$regarr[$i][1]))//是否是相对路径,即是否还有:// 

if(substr($regarr[$i][1],0,1)=="/")//是否是站点的根目录 

   echo "link".($i+1).":".$site.$regarr[$i][1]."<br/>";//根目录 

else 

   echo "link".($i+1).":".$base.$regarr[$i][1]."<br/>";//当前目录 

else 

echo "link".($i+1).":".$regarr[$i][1]."<br/>";//相对路径 

}

fclose($fp);