百度雲端網盤搜尋引擎是一個以PHP+MySQL進行開發的網盤搜尋引擎原始碼。運行環境:開始之前你需要安裝*PHP5.3.7+*MySQL*Python2.7~*[xunsearch](http://xunsearch.com/)搜尋引擎專案的目錄結構___大致是這樣的--- indexer/#索引---spider/#爬蟲---sql/---web/#網站---application/---config/#設定相關---config.php---database.php#資料庫配置......---static/#存放靜態資源,css|js|font---system/---index.php開始部署建立資料庫建立名為`pan`的資料庫,編碼設為` utf-8`。然後導入`sql`,完成表格的建立。網站部署支援`nginx`,`apache`伺服器。 __apache__需要開啟*mod_rewrite*。 __nginx__配置如下location/{indexindex.php;try_files$uri$uri//index.php/$uri;}
location~[^/].php(/|$){fastcgi_pass127.0.0.1:9000;fastcgi_indexindex.php;includefastcgi.conf;includepathinfo.conf;}
設定檔修改:`config.php`檔案修改網站標題,描述等資訊`database.php`修改資料庫帳號,密碼等資訊>網站是基於CodeIgniter框架開發的,如安裝,部署,或二次開發有問題,請參考[官網文件](http://codeigniter.org.cn/user_guide/general/welcome.html)###啟動爬蟲進入`spider/`目錄,修改`spider.py`中資料庫資訊。
如果你是第一次部署,需運行下面命令,完成做種:pythonspider.py--seed-user上面其實就是抓取百度雲熱門分享用戶的相關信息,然後從他們開始入手爬取數據然後運行pythonspider .py此時爬蟲已經開始工作了###安裝xunsearch目前使用__xunsearch__作為搜尋引擎,後面會更換為`elasticsearch`。安裝過程請參考(不需要安裝,PHPSDK,我已經整合到web裡了)http://xunsearch.com/doc/php/guide/start.installation###索引資料上面我們完成了爬蟲的資料抓取,網站的搭建,但還不能搜索,下面開始最後一步,索引的建立。進入`indexer/`目錄,在`indexer.php`中將$prefix,替換為你web的根路徑require'$prefix/application/helpers/xs/lib/XS.php';並修改資料庫帳號密碼然後執行python./index.php