mini searcher
1.0.0
Mini Site Searcher は、シンプルなサイト インデクサーおよび検索エンジンであり、Web サイトのコンテンツを自動的にクロールおよびキャッシュし、REST API 経由で検索機能を提供します。
静的サイトのブログに検索機能を提供したり、検索可能な個人のナレッジ ベースを構築したりするために使用できます。
まず、クローラーのセットアップ方法を記述する.env
ファイルを作成する必要があります。
たとえば、次の構成では、 https://my.blog
にある Web サイトのインデクサーをセットアップすると、クローラーはhttps://my.blog/index.html
ページの検索を開始し、すべてのページを検索します。 URL に/posts
含まれるリンクなので、その CSS セレクターはa[href*=/posts]
である必要があります。そして、各リンクをたどると、クローラーは<article class="main-content">
タグのテキスト コンテンツを取得します。
BASE_URL="https://my.blog"
ENTRY_POINT="https://my.blog/index.html"
LINK_SEARCH_PATTERN="a[href*='/posts']"
MAIN_CONTENT_PATTERN="article.main-content"
次に、サーバーを実行します。
cargo run
開始後、クローラーが起動し、インデックス作成が完了するまでにしばらく時間がかかる場合があります。REST API も、デフォルトのポート3366
またはPORT
環境変数内の任意のポートで提供されます。検索するには、次のようなGET
リクエストを作成します。
GET /?keyword=<something>
プログラムには 2 つのコンポーネントがあります。