このリポジトリは、SQL ウェアハウスや Azure Document Intelligence で分析されたドキュメントなどの豊富なデータ ソースを使用して RAG アプリケーションを改善するためのサンプル コードを提供します。
このリポジトリで提供されるプラグインとスキルを適応させて、新規または既存の RAG アプリケーションに追加して、応答品質を向上させることを目的としています。
重要
uv
使用するようになりました。開始方法の詳細については、uv を参照してください。 ./text_2_sql
には、Text2SQL の生成とクエリのための 3 つのマルチショット実装が含まれており、ナレッジ ベースとしてデータベースに裏付けられた質問に答えるために使用できます。プロンプト ベースとベクトル ベースのアプローチが示されており、どちらも SQL クエリに応答する際に優れたパフォーマンスを示します。さらに、クエリ キャッシュを使用して生成をさらに高速化する、ベクトル ベースのアプローチのさらなる反復が示されています。これらのプラグインを使用すると、RAG アプリケーションは、公開されている SQL テーブルにアクセスしてデータを取得し、質問に答えることができるようになります。./adi_function_app
Azure Document Intelligence をAI Search とリンクしてグラフや画像を含む複雑なドキュメントを処理するためのコードが含まれており、マルチモーダル モデル (gpt4o) を使用してこれらを解釈して理解します。このカスタム スキルを使用すると、RAG アプリケーションはベクトル検索中に複雑なチャートや画像から洞察を引き出すことができます。この関数アプリには、類似した文をインテリジェントにグループ化し、図や表を一緒に保持しながら、個別の文を分離することを目的としたセマンティック テキスト チャンキングメソッドも含まれています。./deploy_ai_search
AI Search と Text2SQL のインデックス、インデクサー、および対応するスキルセットをデプロイするための簡単な Python ベースのユーティリティを提供します。上記のコンポーネントは、実稼働 RAG プロジェクトで使用され、応答の品質を向上させることに成功しています。
このリポジトリで提供されるコードは実装のサンプルであり、運用環境で使用する前に調整する必要があります。
次の図は、Text2SQL と AI Search プラグインを RAG アプリケーションに組み込む方法のワークフローを示しています。 LLM の関数呼び出し機能と併用可能なプラグインを使用すると、LLM は思考連鎖推論を実行して、質問に答えるために必要な手順を決定できます。これにより、LLM は意図を認識し、質問の意図、または両方の組み合わせに基づいて適切なデータ ソースを選択できるようになります。
このプロジェクトは貢献と提案を歓迎します。ほとんどの投稿では、投稿を使用する権利をお客様が有しており、実際に当社に付与することを宣言する投稿者ライセンス契約 (CLA) に同意する必要があります。詳細については、https://cla.opensource.microsoft.com をご覧ください。
プル リクエストを送信すると、CLA ボットが CLA を提供する必要があるかどうかを自動的に判断し、PR を適切に装飾します (ステータス チェック、コメントなど)。ボットが提供する指示に従ってください。 CLA を使用するすべてのリポジトリでこれを 1 回行うだけで済みます。
このプロジェクトはマイクロソフトのオープンソース行動規範を採用しています。詳細については、行動規範に関する FAQ を参照するか、追加の質問やコメントがあれば [email protected] までお問い合わせください。
このプロジェクトには、プロジェクト、製品、またはサービスの商標またはロゴが含まれている場合があります。 Microsoft の商標またはロゴの許可された使用には、Microsoft の商標およびブランド ガイドラインが適用され、それに従わなければなりません。このプロジェクトの修正バージョンで Microsoft の商標またはロゴを使用することは、混乱を引き起こしたり、Microsoft のスポンサーであることを暗示したりしてはなりません。第三者の商標またはロゴの使用には、それらの第三者のポリシーが適用されます。