ongpt ロゴ" style="max-width: 100%;">
ontogpt 、大規模言語モデル (LLM)、指示プロンプト、およびオントロジーベースの基礎を使用してテキストから構造化情報を抽出するための Python パッケージです。
詳細については、完全なドキュメントを参照してください。
ontogptコマンド ラインで実行されますが、最小限の Web アプリ インターフェイスもあります (以下のWeb Application
セクションを参照)。
Python 3.9 以降がインストールされていることを確認してください。
pip
でインストールします。
pip install ontogpt
OpenAI API キーを設定します。
runoak set-apikey -e openai < your openai api key >
すべてのontogptコマンドのリストを参照してください。
ontogpt --help
情報抽出の簡単な例を試してください。
echo " One treatment for high blood pressure is carvedilol. " > example.txt
ontogpt extract -i example.txt -t drug
ontogpt必要なオントロジーを取得し、結果をコマンド ラインに出力します。出力では、抽出されたすべてのオブジェクトが、 extracted_object
という見出しの下に表示されます。
ontogptを実行して結果を表示するための最低限の Web アプリケーションがあります。
まず、次のコマンドを実行して、 pip
で必要な依存関係をインストールします。
pip install ontogpt [web]
次に、次のコマンドを実行して Web アプリケーションを開始します。
web- ontogpt
注: この Web アプリを認証なしでパブリックにホストすることはお勧めしません。
ontogpt litellm
パッケージ (https://litellm.vercel.app/) を使用して LLM とインターフェイスします。
これは、OpenAI、Azure、Anthropic、Mistral、Replicate などを含むほとんどの API がサポートされていることを意味します。
使用するモデル名はontogpt list-models
コマンドから見つけることができます。最初の列の名前を--model
オプションで使用します。
ほとんどの場合、これには上記のように特定のサービスの API キーを設定する必要があります。
runoak set-apikey -e anthropic-key < your anthropic api key >
Azure を介した OpenAI モデルなどの一部のエンドポイントでは、追加の詳細を設定する必要があります。これらも同様に設定できます。
runoak set-apikey -e azure-key < your azure api key >
runoak set-apikey -e azure-base < your azure endpoint url >
runoak set-apikey -e azure-version < your azure api version, e.g. " 2023-05-15 " >
これらの詳細は、次のように環境変数として設定することもできます。
export AZURE_API_KEY= " my-azure-api-key "
export AZURE_API_BASE= " https://example-endpoint.openai.azure.com "
export AZURE_API_VERSION= " 2023-05-15 "
オープン LLM は、 ollama
パッケージ (https://ollama.com/) を通じて取得して実行できます。
ollama
をインストールする必要があり (GitHub リポジトリを参照)、 ollama serve
やsudo systemctl start ollama
などのコマンドを使用してサービスとして開始する必要がある場合があります。
次に、 ollama pull <modelname>
を使用してモデルを取得します (例: ollama pull llama3
。
モデルは、 --model
オプションとともに名前の前にollama/
を付けることでontogptで使用できます (例: ollama/llama3
。
一部の ollam モデルはontogpt list-models
にリストされていない場合がありますが、ダウンロードされた LLM の完全なリストはollama list
コマンドで確認できます。
ontogptの関数はテスト データに対して評価されています。これらの評価の詳細と再現方法については、完全なドキュメントを参照してください。
ontogptで使用される情報抽出アプローチである SPIRES については、Caufield JH、Hegde H、Emonet V、Harris NL、Joachimiak MP、Matentzoglu N、他で詳しく説明されています。 Structured Prompt Interrogation and Recursive Extraction of Semantics (SPIRES): ゼロショット学習を使用して知識ベースを設定する方法。バイオインフォマティクス、第 40 巻、第 3 号、2024 年 3 月、btae104、https://doi.org/10.1093/bioinformatics/btae104。
このプロジェクトは Monarch Initiative の一部です。また、この研究プロジェクトに対する Bosch Research の支援に感謝いたします。