大規模言語モデルを使用した ArXiv ダイジェストとパーソナライズされた推奨事項。
このリポジトリは、GPT の関連性評価を使用して、ユーザー自身の研究関心と自然言語の説明に基づいて、新しく出版された arXiv 論文のより良い日次ダイジェストを提供することを目的としています。
独自の OpenAI API キーを使用して、Hugging Face で試すことができます。
結果を電子メールで送信する日次サブスクリプション パイプラインを作成することもできます。
arXiv の論文を常に最新の状態に保つには、毎日数百もの新しい論文をフィルタリングする必要があるため、かなりの時間がかかる場合があります。公式の日次ダイジェスト サービスはありますが、cs.AI のような大きなカテゴリでは、依然として 1 日あたり 50 ~ 100 件の論文があります。これらの論文が自分にとって関連性があり重要であるかどうかを判断するには、タイトルと要約を最後まで読む必要があり、これには時間がかかります。
このリポジトリは、大規模な言語モデルを使用して、関連性によってソートされた毎日のダイジェストをキュレーションする方法を提供します。これらのモデルは、個人的な研究関心に基づいて条件付けされており、自然言語で説明されています。
config.yaml
変更します。gpt-3.5-turbo-16k
を使用して、興味との関連性を 1 ~ 10 のスケールでランク付けします。https://huggingface.co/spaces/AutoLLM/ArxivDigest でデモを提供しています。 OpenAI API キーを入力し、右側の設定を入力するだけです。当社はあなたのキーを保管しませんのでご注意ください。
SendGrid アカウントと API キーを作成して、ダイジェストの電子メールを自分に送信することもできます。
このリポジトリの使用を開始するための推奨される方法は次のとおりです。
config.yaml
変更し、変更内容をメイン ブランチにマージします。OPENAI_API_KEY
OpenAI よりSENDGRID_API_KEY
FROM_EMAIL
この値は、SendGrid API キーの作成に使用した電子メールと一致する必要があります。TO_EMAIL
ステップバイステップの画像、さらなるカスタマイズ、別の使用法などの詳細については、「高度な使用法」を参照してください。
Huggign Face スペースと同じ UI をローカルで実行するには:
src/requirements.txt
とgradio
に要件をインストールします。python src/app.py
を実行し、ローカル URL に移動します。そこから、今日の論文と生成されたダイジェストをプレビューすることができます。.env
ファイルを使用する場合は、 .env.template
.env
にコピーし、 .env
に環境変数を設定します。.env.template
自分のキーや電子メール アドレスで編集しないでください.template.env
は git によって追跡されており、編集するとシークレットがコミットされる可能性があるためです。警告:個人キーや電子メール アドレスを使用して
.env.template
を編集したり、コミットしたりしないでください。そうすることで、これらの情報が世界に公開される可能性があります。
個人のニーズに合わせてこのリポジトリのコードを変更することができます (また、変更することをお勧めします)。自分の変更が他の人にとって何らかの形で役立つと思われる場合は、プル リクエストを送信してください。
この種の変更には、プロンプトの変更、異なる言語モデル、ダイジェストを配信するための追加の方法などが含まれます。