Phi3 Vision huggingface
1.0.0
이 저장소에는 로컬 LLM Phi-3 Vision 모델 및 Hugging Face 라이브러리를 사용하여 비전 작업을 수행하는 코드가 포함되어 있습니다. 이 코드는 입력 이미지와 사용자 정의 프롬프트를 기반으로 응답을 생성하는 방법을 보여줍니다.
transformers
라이브러리를 활용합니다. 이 프로젝트를 실행하려면 Python과 필요한 종속성이 필요합니다. 환경을 설정하려면 아래 단계를 따르세요.
자식 클론 https://github.com/manunair1990/Phi3-Vision-huggingface
cd Phi3-Vision-huggingface
pip를 사용하여 필수 Python 패키지를 설치합니다.
pip 설치 -r 요구사항.txt
파이썬 phi3_vision_huggingface.py
참고 로컬 이미지 파일 대신 URL을 사용하려면 관련 줄의 주석 처리를 제거하고 URL을 원하는 이미지 URL로 바꾸세요.
모델 및 토크나이저 API를 제공하는 Hugging Face.
Phi-3 Vision 모델의 창시자.