タイトル | 絵文字 | 色から | 色に | SDK | 固定された | アプリポート | 埋め込みを無効にする | 短い説明 | hf_oauth | hf_oauth_expiration_ minutes | hf_oauth_scopes | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
AIコミックファクトリー | ?? | 赤 | 黄色 | 港湾労働者 | 真実 | 3000 | 間違い | 単一のプロンプトで独自の AI コミックを作成する | 真実 | 43200 |
|
最終リリース: AI Comic Factory 1.2
AI Comic Factory は間もなく公式 Web サイト aicomicfactory.app を開設します。
私の他のプロジェクトの詳細については、linktr.ee/FLNGR をご覧ください。
まず、すべてがオープンソースであることを強調したいと思います (ここ、ここ、ここ、ここを参照)。
ただし、このプロジェクトは複製してすぐに実行できるモノリシックなスペースではありません。フロントエンド、バックエンド、LLM、SDXL などのさまざまなコンポーネントを実行する必要があります。
プロジェクトを複製しようとすると、 .env
を開くと、いくつかの変数が必要であることがわかります。
プロバイダー構成:
LLM_ENGINE
: INFERENCE_API
、 INFERENCE_ENDPOINT
、 OPENAI
、 GROQ
、 ANTHROPIC
のいずれかを指定できますRENDERING_ENGINE
: カスタム ソリューションをコーディングしない限り、現時点では「INFERENCE_API」、「INFERENCE_ENDPOINT」、「REPLICATE」、「VIDEOCHAIN」、「OPENAI」のいずれかを指定できます。認証構成:
AUTH_HF_API_TOKEN
: LLM エンジン (推論 API モデルまたはカスタム推論エンドポイント) に Hugging Face を使用する場合AUTH_OPENAI_API_KEY
: LLM エンジンに OpenAI を使用します。AUTH_GROQ_API_KEY
: LLM エンジンに Groq を使用します。AUTH_ANTHROPIC_API_KEY
: LLM エンジンに Anthropic (Claude) を使用します。AUTH_VIDEOCHAIN_API_TOKEN
: VideoChain API サーバーにアクセスするためのシークレット トークンAUTH_REPLICATE_API_TOKEN
: Replicate.com を使用する場合レンダリング構成:
RENDERING_HF_INFERENCE_ENDPOINT_URL
: カスタム推論エンドポイントを使用する場合に必要ですRENDERING_REPLICATE_API_MODEL_VERSION
: VideoChain API サーバーへの URLRENDERING_HF_INFERENCE_ENDPOINT_URL
: オプション、デフォルトは何もありませんRENDERING_HF_INFERENCE_API_BASE_MODEL
: オプション、デフォルトは「stabilityai/stable-diffusion-xl-base-1.0」RENDERING_HF_INFERENCE_API_REFINER_MODEL
: オプション、デフォルトは「stabilityai/stable-diffusion-xl-refiner-1.0」RENDERING_REPLICATE_API_MODEL
: オプション、デフォルトは「stabilityai/sdxl」RENDERING_REPLICATE_API_MODEL_VERSION
: バージョンを変更する場合のオプション。言語モデルの構成 (使用することに決めた LLM エンジンに応じて):
LLM_HF_INFERENCE_ENDPOINT_URL
: ""LLM_HF_INFERENCE_API_MODEL
: "HuggingFaceH4/zephyr-7b-beta"LLM_OPENAI_API_BASE_URL
: "https://api.openai.com/v1"LLM_OPENAI_API_MODEL
: "gpt-4-turbo"LLM_GROQ_API_MODEL
: "mixtral-8x7b-32768"LLM_ANTHROPIC_API_MODEL
: "クロード-3-opus-20240229"さらに、無視しても問題ないコミュニティ共有変数がいくつかあります。これらの変数は、自分の Web サイトやコンピューターで AI Comic Factory を実行するためには必要ありません (これらの変数は、Hugging Face コミュニティとの接続を作成することを目的としているため、公式の Hugging Face アプリでのみ意味を持ちます)。
NEXT_PUBLIC_ENABLE_COMMUNITY_SHARING
: これは必要ありませんCOMMUNITY_API_URL
: これは必要ありませんCOMMUNITY_API_TOKEN
: これは必要ありませんCOMMUNITY_API_ID
: これは必要ありません詳細については、 .env
デフォルト設定ファイルをお読みください。変数をローカルでカスタマイズするには、 .env.local
を作成する必要があります (シークレットが含まれるため、このファイルはコミットしないでください)。
-> ローカル、クラウドホスト、および/または独自のモデルで実行する場合は、 ? をコーディングする必要があります。
現在、AI Comic Factory は推論エンドポイントを通じて zephyr-7b-beta を使用しています。
複数のオプションがあります。
これは最近追加された新しいオプションで、Hugging Face Hub のモデルの 1 つを使用できます。デフォルトでは、7b モデルよりも良い結果が得られる zephyr-7b-beta を使用することをお勧めします。
これをアクティブにするには、 .env.local
構成ファイルを作成します。
LLM_ENGINE= " INFERENCE_API "
HF_API_TOKEN= " Your Hugging Face token "
# "HuggingFaceH4/zephyr-7b-beta" is used by default, but you can change this
# note: You should use a model able to generate JSON responses,
# so it is storngly suggested to use at least the 34b model
HF_INFERENCE_API_MODEL= " HuggingFaceH4/zephyr-7b-beta "
Hugging Face Inference Endpoint サービスで実行されているプライベート LLM で AI Comic Factory を実行する場合は、 .env.local
構成ファイルを作成します。
LLM_ENGINE= " INFERENCE_ENDPOINT "
HF_API_TOKEN= " Your Hugging Face token "
HF_INFERENCE_ENDPOINT_URL= " path to your inference endpoint url "
この種の LLM をローカルで実行するには、TGI を使用できます (ライセンスの詳細については、この投稿をお読みください)。
これは最近追加された新しいオプションで、OpenAI API キーを使用して OpenAI API を使用できます。
これをアクティブにするには、 .env.local
構成ファイルを作成します。
LLM_ENGINE= " OPENAI "
# default openai api base url is: https://api.openai.com/v1
LLM_OPENAI_API_BASE_URL= " A custom OpenAI API Base URL if you have some special privileges "
LLM_OPENAI_API_MODEL= " gpt-4-turbo "
AUTH_OPENAI_API_KEY= " Yourown OpenAI API Key "
LLM_ENGINE= " GROQ "
LLM_GROQ_API_MODEL= " mixtral-8x7b-32768 "
AUTH_GROQ_API_KEY= " Your own GROQ API Key "
LLM_ENGINE= " ANTHROPIC "
LLM_ANTHROPIC_API_MODEL= " claude-3-opus-20240229 "
AUTH_ANTHROPIC_API_KEY= " Your own ANTHROPIC API Key "
もう 1 つのオプションは、LLM を完全に無効にして、別の LLM プロトコルおよび/またはプロバイダー (Claude、Replicate など)、または代わりに人間が生成したストーリー (モックまたは静的データを返すことによって) に置き換えることです。
将来的には、AI Comic Factory を簡単にするために修正する可能性があります (例: Claude または Replicate のサポートを追加する)。
この API はパネル画像を生成するために使用されます。これは、Hugging Face でのさまざまなプロジェクトのために作成した API です。
まだドキュメントを書いていませんが、基本的には他の既存の API の「単なるラッパー™」です。
ソースコードをクローンする必要があります
残念ながら、VideoChain のドキュメントを書く時間がまだありません。 (その際には、VideoChain の README を参照するようにこのドキュメントを更新します)
Replicate を使用するには、 .env.local
構成ファイルを作成します。
RENDERING_ENGINE= " REPLICATE "
RENDERING_REPLICATE_API_MODEL= " stabilityai/sdxl "
RENDERING_REPLICATE_API_MODEL_VERSION= " da77bc59ee60423279fd632efb4795ab731d9e3ca9705ef3341091fb989b7eaf "
AUTH_REPLICATE_API_TOKEN= " Your Replicate token "
プロジェクトをフォークすると、選択した Stable Diffusion テクノロジ (ローカル、オープンソース、プロプライエタリ、カスタム HF スペースなど) を使用するようにコードを変更できます。
Dall-E など、他のものになる可能性もあります。