作者:Armel Fauveau
原文網址: http://www.phpbuilder.net/columns/armel20010427.php3
譯者:許立強[email protected]
Http://www.phpobject.net/blog/
PHP能夠開啟遠端或本機伺服器的sockets!這裡是一個使用socket的簡單的例子:連接到Usenet的新聞伺服器,與伺服器溝通,並從一個精確的新聞分組中下載一些文章。
使用PHP開啟Socket
使用fsockopen()來開啟一個Socket。這個函數在PHP3和PHP4都存在。函數的原型如下:
<?php
intfsockopen
(string hostname,
int port[,
int errno[,
string errstr[,
double timeout]]])
?>
對於網路主機,它將建立一個TCP的Socket的連接到主機名稱的連接埠上。主機名稱可以是網域名稱或IP位址。對於UDP連接,你需要明確指出其協定:udp://hostname。對於unix主機,主機名稱將在socket的路徑中使用,在這個範例中連接埠必須設定成0。可選項timeout可以用來設定連線逾時的秒數。
關於fsockopen()的更多資訊可以訪問http://www.php.net/manual/function.fsockopen.php
網路新聞傳輸協定(NNTP)
存取一個usenet新聞伺服器需要用到一個特別的協議,稱作NNTP,即網路新聞傳輸協議標準。這個協議的詳細資料在RFC977中,你可以在http://www.w3.org/Protocols/rfc977/rfc977.html查看。這個文件詳細的描述如何使用不同的命令來連接並且和NNTP伺服器對話。
連接伺服器連接到NNTP伺服器需要知道伺服器的主機名稱(或IP位址)和它將要監聽的連接埠。另外建議你加上一個超時的時間,這樣連線失敗的時候就不會「凍結」程式。
<?php
$cfgServer ="your.news.host";
$cfgPort =119;
$cfgTimeOut =10;
// open asocket
if(!$cfgTimeOut)
// without timeout
$usenet_handle=fsockopen($cfgServer,$cfgPort);
else
// with timeout
$usenet_handle=fsockopen($cfgServer,$cfgPort, &$errno, &$errstr,$cfgTimeOut);
if(!$usenet_handle) {
echo"Connexionfailedn";
exit();
}
else {
echo"Connectedn";
$tmp=fgets($usenet_handle,1024);
}
?>
與伺服器互動現在我們已經連接上伺服器了,而且能夠透過先前開啟的socket連線與伺服器進行互動。讓我們對伺服器說「我們要從某一新聞分組中獲取到最新的10篇文章」。 RFC977定義如何選擇正確的新聞分組的指令,如下:
GROUPggg
必要的參數ggg是你將要選擇的新聞分組的名字,例如net.news。使用list指令你可以取得一組有效的新聞清單。成功選擇回應會返回群組中首尾兩篇新聞的新聞號碼以及存檔新聞號估計。
比如
chrome:~$ telnetmy.news.host 119
Trying aa.bb.cc.dd...
Connected tomy.news.host.
Escape character is'^]'.
200 my.news.hostInterNetNews NNRP server INN 2.2.2 13-Dec-1999 ready (posting ok).
GROUP alt.test
211 232 222996 223235alt.test
quit
205 .
在接受到命令“GROUP alt.test”,新聞伺服器返回了“211232 222996 223235 alt.test”。其中211是RFC識別碼(簡單的解釋說命令已經成功的執行—查看RFC你可以獲取更加詳細的資料),返回信息說明其中有232篇文章,其中最舊的新聞的索引號是222996,而最新的新聞索引號碼是223235。現在讓我們來計算下:222996+232並不等於232235。這遺失的文章或從這伺服器移除出去了,或是被他的作者取消了(是的,這是可能的,也是很容易實現的),或是刪除了。
小心起見,在選擇新聞分組之前,伺服器可能需要認證,當然這是由伺服器是否公開或私有來決定的。一般是允許任何人獲取新聞,但發表新聞需要通過認證。
<?php
//$cfgUser = "xxxxxx";
//$cfgPasswd = "yyyyyy";
$cfgNewsGroup ="alt.php";
// identification required on private server
if($cfgUser) {
fputs($usenet_handle,"AUTHINFO USER".$cfgUser."n");
$tmp=fgets($usenet_handle,1024);
fputs($usenet_handle,"AUTHINFOPASS".$cfgPasswd."n");
$tmp=fgets($usenet_handle,1024);
// check error
if($tmp!="281Okrn") {
echo"502Authentication errorn";
exit();
}
}
// select newsgroup
fputs($usenet_handle,"GROUP ".$cfgNewsGroup."n");
$tmp=fgets($usenet_handle,1024);
if($tmp=="480 Authentication required for commandrn") {
echo"$tmpn";
exit();
}
$info=split(" ",$tmp);
$first=$info[2];
$last=$info[3];
print"First : $firstn";
print"Last : $lastn";
?>
取得一些文章現在我們已經有最新文章的A索引號,那就能很容易的取得最新的十篇文章。 RFC977指出使用ARTICLE指令可以和文章的索引號碼或訊息的ID一起使用。為了小心起見,在這裡,文章的索引號碼和訊息ID是不同的,因為每個新聞伺服器定義不同,所以在不同的新聞伺服器上相同文章的索引號碼都會不一樣的,但是訊息ID好是唯一的(包含在文章的頭部)
<?php
$cfgLimit =10;
// upload last articles
$boucle=$last-$cfgLimit;
while ($boucle<=$last) {
set_time_limit(0);
fputs($usenet_handle,"ARTICLE$bouclen");
$article="";
$tmp=fgets($usenet_handle,4096);
if(substr($tmp,0,3) !="220") {
echo"+--------------------+n";
echo"Error onarticle $bouclen";
echo"+--------------------+n";
}
else {
while($tmp!=".rn") {
$tmp=fgets($usenet_handle,4096);
$article=$article.$tmp;
}
echo"+--------------------+n";
echo"Article$bouclen";
echo"+--------------------+n";
echo"$articlen";
}
$boucle++;
}
?>
我們僅僅從這個伺服器的這個分組上獲取了十條最新的新聞。你也可以使用HEAD指令來至取得文章的頭部訊息,或是使用BODY指令來取得新聞的正文。
關閉連線使用fclose()函數你就可以結束與NNTP伺服器之間的會話,當然你可以些一個新的文件,如下:
<?php
// close connexion
fclose($usenet_handle);
?>
更多關於fclose()的信息,請看:http://www.php.net/manual/function.fclose.php
結論本文中,我們只說明了在確定的情況下如何開啟、使用和關閉一個socket連線:連接上一個NNTP伺服器然後從新聞分組中取回一些文章。使用POST指令在NNTP伺服器上發表一篇文章並不複雜多少。
因此,下一步就是寫一個新聞客戶端(並去掉一些Netscape),它需要能輕鬆的保存文章,並使用一些搜尋引擎(例如htgid,http://www.htdig.org/)來索引這些文章,而且要有一個WEB應用程式能進行新聞分組下的關鍵字搜尋。這裡有一個例子,你可以上http://www.phpindex.com/ng/去下載。