cedrikダウンロード - cedrikソースコードのダウンロード

cedrik

その他のソースコード

1.0.0

ダウンロード

セドリック

Small Data™ に適した小さくて単純な検索エンジンを作成するという、遊びのためのプロジェクトです。

(予定)の機能

☑ インデックス作成
クエリ:
- ☑ すべて一致
- ☑ 期間 (☐ ブースティング)
- ☑ ブール値 (および、または、そうでない)
- ☐ 近く
- ☑ ワイルドカード (単一の先頭または単一の末尾のみがサポートされます)
☐ ランキング
☐ ハイライト
☐ 分散インデックス (mnesia?、KVS?、riak?、redis?)
☐ 永続化 (Redis でサポートされるインデックスを使用することで間接的にサポートされますが、AgentIndex の単純な圧縮バリアントも追加したいと考えています)
☐ デモ Web UI (フェニックス!)

使用法

テスト

単体テストを実行します。

 mix test --exclude external

外部サービスに依存するテストを含むすべてのテストを実行します。 RedisIndexテストなど:

 mix test

config/config.exs に redis の正しい connection_string があることを確認してください。 docker-compose使用すると、redis インスタンスを迅速に起動して実行できます。

インデックス作成

Cedrik の各インデックスは、 Index @behaviourを持つプロセスによって表されます。何かをインデックスにインデックスするには、単純にIndex.index_doc(something, :index_name, type)を呼び出します。ここで、 something Elixir マップまたは構造体になります ( Storableプロトコルを実装する id フィールドを持つ構造体を作成することをお勧めします - を見てください) lib/document.exおよびlib/agent_store.ex (参照用)、 type既存のインデックス実装AgentIndexまたはRedisIndexのいずれかである必要があります。 Index.index_docの最後の引数はオプションであり、デフォルトはAgentIndexです。

既存のインデックスのリストを取得するには、 Index.list/0またはIndex.list/1を使用します。これらは、 {pid, name, module}形式のタプルのリストを返します。

エージェントインデックス

これは単純なメモリ内インデックスタイプで、メモリに収まり、永続化する必要のないものに適しています。

Redisインデックス

これは Redis によってサポートされるインデックスです。これが機能するには、redis インスタンスが稼働している必要があります。 AgentIndex と比較して RedisIndex を使用する主な利点は、データを永続化できることです。

トークン化

今のところ、トークンはスペースで区切られた単なる文字列です。

クエリを実行する

Search.search(query_struct, [:index1, :index2])を使用します。例については、 test/e2e_test.exsおよびtest/query_test.exs参照してください。

Cedrik が理解できるquery_struct取得するには、文字列用の単純な (そして不完全な) パーサーQuery.Parse.parse/1があります。文字列をトークン化し、それに応じて用語とワイルドカードのクエリ構造を構築します。用語とワイルドカードは、必須フィールド内でブール値で囲まれます。

すべて一致

このクエリは、指定されたインデックス内のすべてのドキュメント ID を返します。

学期

TermQuery は、指定された用語を含むドキュメント ID (およびそのドキュメント内の用語の位置) を単純に返します。検索するフィールドを正確に指定することも、すべてのフィールド (デフォルト) を指定することもできます。

ブール値

BooleanQuery を使用すると、より高度なクエリを作成できます。 must 、 optional 、およびmust_not

ワイルドカード

このクエリは、ヒットする範囲を広げるのに役立ちます。たとえば、値"foo*"を持つワイルドカードクエリは、foo と foobar の両方に一致します。現時点では、先頭 ( *foo ) または末尾 ( foo* ) の単一のワイルドカードのみがサポートされていることに注意してください。