ssebowa
1.0.0
Ssebowa 是一個開源 Python 函式庫,提供生成式 AI 模型,包括:
ssebowa-llm:
用於文字產生的大型語言模型(LLM),ssebowa-vllm:
用於視覺理解的視覺語言模型(VLLM),ssebowa-imagen:
影像生成與客製化微調模型,Ssebowa-vigen:
視訊生成模型。使用 Ssebowa,您可以輕鬆生成文字、翻譯語言、編寫不同類型的創意內容、產生個人化圖像並以翔實的方式回答您的問題。
更詳細的使用資訊請參考:Ssebowa的技術文檔
在運行腳本之前,請確保已安裝所需的庫。您可以透過執行以下命令來完成此操作:
git clone https://github.com/huggingface/diffusers
cd diffusers
pip install .
然後安裝Ssebowa
pip install ssebowa
如果您在 colab 或 jupyter 筆記本中執行此命令,請使用此命令,
! git clone https://github.com/huggingface/diffusers
! cd diffusers
! pip install .
! pip install ssebowa
現在,您可以透過從庫匯入來存取不同的模型:
Ssebowa-Imagen 是一種開源圖像合成模型,它利用diffusion modeling
和generative adversarial networks (GANs)
的組合從text descriptions
生成高品質圖像,還允許將您的幾張照片轉換為能夠生成圖像的custom model
您chosen subject
的令人驚嘆的圖像。它利用100 billion dataset
集,使其能夠準確捕捉現實世界圖像的細微差別,並有效地將文字描述轉換為引人注目的視覺表示。
10-20 high-quality
個人照片(jpg or png)
例如您的、朋友的、產品或寵物等,並將它們放在特定的目錄中。16GB or more
的機器上運作。 (如果您要微調 SDXL,則需要 24GB VRAM。) from ssebowa.dataset import LocalDataset
from ssebowa.model import SdSsebowaModel
from ssebowa.trainer import LocalTrainer
from ssebowa.utils.image_helpers import display_images
from ssebowa.utils.prompt_helpers import make_prompt
DATA_DIR = " data " # The directory where you put your prepared photos
OUTPUT_DIR = " models "
dataset = LocalDataset(DATA_DIR)
dataset = dataset.preprocess_images(detect_face=True)
SUBJECT_NAME = " <YOUR-NAME> "
CLASS_NAME = " person "
model = SdSsebowaModel(subject_name=SUBJECT_NAME, class_name=CLASS_NAME)
trainer = LocalTrainer(output_dir=OUTPUT_DIR)
predictor = trainer.fit(model, dataset)
# Use the prompt helper to create an awesome AI avatar!
prompt = next(make_prompt(SUBJECT_NAME, CLASS_NAME))
images = predictor.predict(
prompt, height=768, width=512, num_images_per_prompt=2,
)
display_images(images, fig_size=10)
from ssebowa import Ssebowa_imgen
model = Ssebowa_imgen ()
就像讓我們生成“一隻貓坐在書架上”
image = model.generate_image( " A cat sitting on a bookshelf " )
image.save( " cat_on_bookshelf.jpg " )
Ssebowa-vllm是Ssebowa AI開發的開源視覺大語言模型(VLLM)。它是一個可以用來理解圖像的強大工具。 Ssebowa-vllm擁有110億個視覺參數和70億個語言參數,支援1120*1120解析度的影像理解。
from ssebowa import ssebowa_vllm
model = ssebowa_vllm ()
response = model.understand(image_path, prompt)
print(response)
Ssebowa 開放供稿!指南正在進行中..
Ssebowa 是在 Apache License 2.0 下發布的。
如果您有任何問題或建議,請隨時在 GitHub 上提出問題或透過 [email protected] 與我們