Phi3 Vision huggingface
1.0.0
このリポジトリには、ローカル LLM Phi-3 Vision モデルと Hugging Face ライブラリを使用してビジョン タスクを実行するコードが含まれています。このコードは、入力画像とユーザー定義のプロンプトに基づいて応答を生成する方法を示しています。
transformers
ライブラリを利用このプロジェクトを実行するには、Python と必要な依存関係が必要です。以下の手順に従って環境をセットアップしてください。
git clone https://github.com/manunair1990/Phi3-Vision-huggingface
cd Phi3-Vision-ハグフェイス
pip を使用して必要な Python パッケージをインストールします。
pip install -r 要件.txt
Python phi3_vision_huggingface.py
注 ローカル画像ファイルの代わりに URL を使用するには、関連する行のコメントを解除し、URL を目的の画像 URL に置き換えます。
Hugging Face はモデルとトークナイザー API を提供します。
Phi-3 Vision モデルの作成者。