Document_Comparison_System
1.0.0
2 つのドキュメント間のコンテキスト比較を実行するための、検索拡張生成 (RAG) ベースのシステム。このシステムは、言語処理と埋め込みに Azure OpenAI、ベクトル ストレージに ChromaDB、バックエンドに FastAPI、ユーザー インターフェイスに Streamlit を使用します。
git clone < repository-url >
cd document-comparison-system
pip install -r requirements.txt
.env
ファイルを作成します。 AZURE_OPENAI_API_KEY=your_api_key
AZURE_OPENAI_ENDPOINT=your_endpoint
AZURE_DEPLOYMENT_NAME=your_deployment_name
AZURE_EMBEDDINGS_DEPLOYMENT_NAME=your_embeddings_deployment_name
project_root/
├── app.py # Streamlit frontend
├── backend.py # FastAPI backend
├── processor.py # Document processing and RAG logic
├── config.py # Configuration settings
└── requirements.txt # Project dependencies
python backend.py
streamlit run app.py
http://localhost:8501
に移動し、アプリケーションにアクセスします。 ドキュメントのアップロード:
ドキュメントを比較します:
結果の表示:
リセット:
FastAPI バックエンドは次のエンドポイントを提供します。
単一のドキュメントをアップロードして処理します。
2 つの文書を比較します。
config.py
の主要な構成設定:
CHUNK_SIZE
: ドキュメントのチャンクのサイズ (デフォルト: 1000)CHUNK_OVERLAP
: チャンク間のオーバーラップ (デフォルト: 200)SUPPORTED_FILES
: サポートされているファイルタイプのリストCHROMA_PERSIST_DIRECTORY
: ベクター データベース ストレージの場所このシステムには、以下に対する包括的なエラー処理が含まれています。
潜在的な機能強化:
貢献は大歓迎です!お気軽にプルリクエストを送信してください。
このプロジェクトは MIT ライセンスに基づいてライセンスされています。詳細については、LICENSE ファイルを参照してください。