Verbose The Indexer
1.0.0
Verbose は Python ベースのアプリケーションで、インデックス作成と優れたユーザー インターフェイスの提供により、PDF ファイルだけでなく txt ファイルも簡単に検索できます。
セットアップ
sudo apt-get install libgtk-3-dev
pip3 install -r requirements.txt
走るには
python3 main.py
クエリが引用符で囲まれている場合、結果にはその結果が正確に含まれます。そうでない場合は、他の順序になる可能性があります。 ( 例:-「良い子」を検索すると、「良い子」と「良い子」の両方が表示されますが、完全検索が「良い子」を選択した場合は、「良い子」の結果のみが表示されます。
特定の単語が見つからない場合は、その単語に最もよく一致するものを見つけようとします。
特定のファイルを選択すると、クエリの出現箇所がすべて表示され、特定の出現箇所をクリックすると、ファイルの特定のページ番号または行番号からファイルが開きます。
プロジェクトで使用されるデータ構造は、辞書、リスト、セットです。
メイン インデックス辞書 = { 単語 : { 本 : { ページ/行 : [出現箇所] } } }
個別ファイル辞書(保存されているもの) = { Word : { ページ/行 : [出現箇所] } }
答え = { 本 : [ページ/行番号] }
Peter Norvig の Did You Mean 実装リンク
基本的なアイデアを与えてくれたQuoraの回答 リンク
GTK+ ドキュメントのリンク
Project Guntenburg、20Newsgroup、その他さまざまなサイトによるデータセット。