PHP中使用CURL获取页面title例子

yipeiwu_com5年前PHP代码库

通过PHP获取页面title内容的实战演示:

范例代码:

复制代码 代码如下:

<?php  
/* 
功能: 取得 URL 页面上的 <title> 内容  
 
参数:$_POST['url'] 
*/  
  
// 设置最长执行的秒数  
ini_set ("expect.timeout", 30);  
set_time_limit(30);  
  
// 检查 URL  
if(!isset($_POST['url']) || $_POST['url'] == ''){   
   echo "URL 错误";  
   exit;  
}  
  
  
/* 取得 URL 页面数据 */  
// 初始化 CURL  
$ch = curl_init();  
  
// 设置 URL   
curl_setopt($ch, CURLOPT_URL, $_POST['url']);   
// 让 curl_exec() 获取的信息以数据流的形式返回,而不是直接输出。  
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);  
// 在发起连接前等待的时间,如果设置为0,则不等待  
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, 0);  
// 设置 CURL 最长执行的秒数  
curl_setopt ($ch, CURLOPT_TIMEOUT, 30);  
  
// 尝试取得文件内容  
$store = curl_exec ($ch);  
  
  
// 检查文件是否正确取得  
if (curl_errno($ch)){  
   echo "无法取得 URL 数据";  
   //echo curl_error($ch);/*显示错误信息*/  
   exit;  
}  
  
// 关闭 CURL  
curl_close($ch);  
  
  
// 解析 HTML 的 <head> 区段  
preg_match("/<head.*>(.*)<\/head>/smUi",$store, $htmlHeaders);  
if(!count($htmlHeaders)){  
   echo "无法解析数据中的 <head> 区段";  
   exit;  
}      
     
// 取得 <head> 中 meta 设置的编码格式  
if(preg_match("/<meta[^>]*http-equiv[^>]*charset=(.*)(\"|')/Ui",$htmlHeaders[1], $results)){  
   $charset =  $results[1];  
}else{   
   $charset = "None";  
}  
  
// 取得 <title> 中的文字   
if(preg_match("/<title>(.*)<\/title>/Ui",$htmlHeaders[1], $htmlTitles)){  
   if(!count($htmlTitles)){  
       echo "无法解析 <title> 的内容";  
       exit;  
   }  
     
   // 将  <title> 的文字编码格式转成 UTF-8  
   if($charset == "None"){  
       $title=$htmlTitles[1];  
   }else{  
       $title=iconv($charset, "UTF-8", $htmlTitles[1]);  
   }  
   echo $title;  
}  

相关文章

php中理解print EOT分界符和echo EOT的用法区别小结

html与php编写中echo可以同时输出多个字符串,并不需要圆括号。 print只可以同时输出一个字符串,需要圆括号。 print的用法和C语言很像,所以会对输出内容里的%做特殊解释。...

浅谈php(codeigniter)安全性注意事项

1、httponly session一定要用httponly的否则可能被xxs攻击,利用js获取cookie的session_id。 要用框架的ci_session,更长的位数,http...

php正则表达式(regar expression)

php正则表达式(regar expression)

引言: 在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串 的需要。正则表达式就是用于描述这些规则的语法。 例:在判断用户邮件地址格式、手机号码格式或者采集别人网页内容...

php max_execution_time执行时间问题

php.ini 中缺省的最长执行时间是 30 秒,这是由 php.ini 中的 max_execution_time 变量指定,倘若你有一个需要颇多时间才能完成的工作,例如要发送很多电子...

WordPress中用于检索模版的相关PHP函数使用解析

locate_template() 用来检索存在的优先级最高的模板文件,还能直接加载模板文件。 locate_template() 函数检索时,如果有子主题则优先使用子主题的模板,没有再...