更新 (2023 年 11 月): 新しい GPT-3.5-Turbo バージョンが推奨されます。チャット完了 API をサポートする新しいバージョンを追加しました (GPT-3.5-Turbo でテスト済み)。適切なサブフォルダー ( gpt-3
、 gpt-35-turbo
) に、元のバージョンと新しいバージョンが含まれるようになりました。モデルの変更とそれに対応する調整以外は同じですが、GPT-3 補完は非推奨であるため、 gpt-35-turbo
が優先されます。
Braindump は、メモを取り、より簡単にクエリできるデータベースに変換するためのプロトタイプ アプリケーションです。頭の中にあるものを入力するだけで、アプリケーションがそれを適切に分類、スライスし、後で使用できるように保存します。これは、私のデータ サイエンス @ Microsoft チュートリアル「プロンプトを超えた GPT-3 アプリケーションの構築」で説明されているように、GPT-3 を利用して概念実証から始まるアプリケーションを構築する方法を示すデモとして構築されました。これは、チュートリアルに従うだけでなく、独自の研究やアプリケーションの開始点としても使用できます (たとえば、ユーティリティ関数や全体的なプログラム構造を独自の異なる問題で再利用することによって)。
これは、Streamlit を利用して Web インターフェイスを提供する単純な Python アプリケーションです。実際に GPT-3 モデルを呼び出すには、有効な OpenAI API キーが必要です。この記事の執筆時点では、アカウントを作成すると、チュートリアルに従ってアプリケーションを使い始めるのに十分な無料のクレジットがいくつか得られます。このアプリケーションは、元の OpenAI オファーではなく Azure OpenAI Service でも動作するはずですが、まだテストしていません。
このリポジトリには、アプリケーション自体のほかに、それにつながる研究内容が Jupyter ノートブックの形式で含まれています。
検索用の UI は次のようになります。
事実を追加すると、モデル解釈のオプションの手動検査を含む UI は次のようになります。
アプリケーションは Python 3.8 (GPT-3) および 3.10 (GPT-3.5-Turbo) でテストされています。必要な主なライブラリは、 openai
、 streamlit
、 pandas
、 notebook
、 pytest
です。これらは手動でインストールすることも、次の手順に従って新しい環境を作成して自動的にインストールすることもできます。古いコードベースの場合は、古いバージョンのopenai
ライブラリが必要になることに注意してください。
アプリケーションを実行するには:
conda create -n braindump_py310 python=3.10
を使用して、このアプリケーション専用の新しい環境を作成します。conda activate braindump_py310
使用して新しい環境をアクティブ化します。requirements.txt
にリストされている依存関係をインストールします。これを行うには、プロジェクトのルートからpip install -r requirements.txt
実行します。元の GPT-3 バージョン (非推奨) の場合は、代わりにrequirements.gpt3.txt
を使用して、その操作に必要な古い依存関係を取得します。OPENAI_API_KEY
という環境変数として使用できるようにします。run.gpt3.bat
(GPT-3 バージョン) またはrun.gpt35turbo.bat
(GPT-3.5-Turbo バージョン)。 Linux の場合: run.gpt3.sh
(GPT-3 バージョン) またはrun.gpt35turbo.sh
(GPT-3.5-Turbo バージョン)。スタディを実行するには:
notebooks/
の下にある目的の Jupyter ノートブックを開きます (個人的に、私はそのために VS Code をよく使用します)。 プロジェクトは次のように構成されています。
notebooks/
: プロンプト エンジニアリングに使用される Jupyter ノートブック。src/
: 最終アプリケーションのソースコード。src/gpt-3
: オリジナルの GPT-3 バージョンのソース (非推奨)。src/gpt-3.5-turbo
: GPT-3.5-Turbo バージョンのソース (2023 年 11 月以降推奨)。data/
: アプリケーションによって保存されたデータ。tests/
: アプリケーションの単体テスト。tests/gpt-3/
: 元の GPT-3 バージョンのテスト (非推奨)。tests/gpt-3.5-turbo/
: GPT-3.5-Turbo バージョンのテスト (2023 年 11 月以降推奨)。docs/
: ドキュメントと関連アセット。 このアプローチは、私のデータ サイエンス @ Microsoft チュートリアル「プロンプトを超えた GPT-3 アプリケーションの構築」で詳しく説明されています。それでも、ここでいくつかの重要な点を強調しておきます。
具体的なフェーズに関しては、次のことをお勧めします。
MITライセンス
著作権 (c) 2023 パウロ サレム ダ シルバ
本ソフトウェアおよび関連ドキュメント ファイル (以下「ソフトウェア」) のコピーを入手した人には、使用、コピー、変更、マージする権利を含むがこれらに限定されない、制限なくソフトウェアを取り扱う許可が、ここに無償で与えられます。 、以下の条件を条件として、本ソフトウェアのコピーを出版、配布、サブライセンス、および/または販売すること、および本ソフトウェアが提供される人物にそのことを許可すること。
上記の著作権表示およびこの許可通知は、ソフトウェアのすべてのコピーまたは主要部分に含まれるものとします。
ソフトウェアは「現状のまま」提供され、明示的か黙示的かを問わず、商品性、特定目的への適合性、および非侵害の保証を含むがこれらに限定されない、いかなる種類の保証も行われません。いかなる場合においても、作者または著作権所有者は、契約行為、不法行為、またはその他の行為であるかどうかにかかわらず、ソフトウェアまたはソフトウェアの使用またはその他の取引に起因または関連して生じる、いかなる請求、損害、またはその他の責任に対しても責任を負わないものとします。ソフトウェア。