标签 seo 下的文章

php正则提取制表符分隔文件的404 url

http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Ahuaihei.com


header("Content-type; text/html; charset=utf-8");
//////////////////////////////
$file="a.txt";//导出的制表符分隔的文件 (我用的xenu)
$head="http://huaihei.com";// 网址
$state="404";//状态码
///////////////////////
preg_match_all("/".str_replace("/","\/",$head)."(.*?)\s".$state."/i",file_get_contents($file),$result);
foreach($result[1] as $row)
{echo $head.$row."
";}
?>


保存为geturl.php放入PHP环境,注意制表符分隔的文件的路径问题。然后运行这个geturl.php,就得到了链接了~