<?php
関数 get_url_content($Url,$Method = 'c') {
// 必要な言語エンコーディングを導入します。そうでない場合は、デフォルトで utf-8 になりますが、心配する必要はありません。
グローバル $Charset;
$Urlarr = parse_url($Url);
//ドメイン名が検出できない場合はリターンします。
if (!isset($Urlarr['host'])) {
false を返します。
}
//ヘッダーの複数情報をスマートに定義します。
foreach (@getallheaders() as $key => $val){
$key==='ホスト' && $val = $Urlarr['ホスト'];
$key==='リファラー' && $val ='http://'.$Urlarr['host'];
$str .= "'$key:$val', n";
}
//仮想原点。
!eregi('Referer',$str) && $str .="'Referer:http://{$Urlarr['host']}', n";
//修正後は基本的にソースもそのサイト、ホストもURLサイトになります。
$Header = array(trim($str));
//以下は、収集に使用するプログラムを選択するだけです。
if($Method === 'f'&&function_exists('file_get_contents')) {
$opts = 配列(
'http'=>配列(
'メソッド'=>"GET",
'ヘッダー'=>$ヘッダー、
)
);
$cxContext = stream_context_create($opts);
$file_contents = @file_get_contents($Url, false, $cxContext);
elseif ($Method === 'c'&&function_exists('curl_init')) {
$Ch =curl_init();
$タイムアウト = 5;
curl_setopt($Ch,CURLOPT_HTTPHEADER,$Header);
curl_setopt ($Ch、CURLOPT_URL、$Url);
curl_setopt ($Ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt ($Ch、CURLOPT_CONNECTTIMEOUT、$Timeout);
$file_contents =curl_exec($Ch);
カール_クローズ($Ch);
}
//スタイルを美しく表示するために、ターゲットガイドを追加します。
$file_contents = str_replace('</title>',"</title>n<base href=" http://{$Urlarr['host']}/ " />",$file_contents);
// 最も一般的なエンコーディングを処理します。ターゲット Web サイトにエンコーディングがない場合は、デフォルトで GBK が使用されます。
!preg_match('/charset=([^<>"]*)"/isU',$file_contents,$lang) && $lang[1]='GBK';
function_exists('mb_convert_encoding') && $file_contents = mb_convert_encoding($file_contents,empty($Charset)?'UTF-8':$Charset,$lang[1]);
// コードの一部をログアウトします。
unset($Url,$lang,$Timeout,$Urlarr,$Charset);
$file_contents を返します。
}
//file_get_contents メソッドを使用してテストを開始します
HEADER("CONTENT-TYPE:TEXT/HTML; CHARSET=UTF-8");
//http://www.xtzj.com/read-htm-tid-347550.html これは収集できません。
$file = get_url_content(" http://www.hao123.com",'f' );
$file = ストリップタグ($file,'<a>');
preg_match_all('/(http:[^"<>]*)>/isU',$file,$link);unset($link[0]);
$link = $link[1];
//データ取得をシミュレーションしてみます。以下はcurlを使用した数値です。
$x = 10;
$file = get_url_content($link[$x]);
エコー$ファイル;
?>
説明とコメントをすべて書いてください。
理解できない返信がある場合は、コレクションについての知識を広めます: