Basic UI for GPT J 6B with low vram下載 - Basic UI for GPT J 6B with low vram原始碼下載

中文(繁体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首頁>編程相關>其他源碼

Basic UI for GPT J 6B with low vram

其他源碼

1.0.0

下載

具有低 vram 的 GPT-J-6B 的基本 UI

透過使用 ram、vram 和固定內存在低 vram 系統上運行 GPT-J-6B 的儲存庫。

驅動連桿中的配重似乎存在一些問題。似乎存在一些效能損失，很可能是因為 16 位元轉換不佳。

如何運行：

使用 - pip install git+https://github.com/finetuneanon/transformers@gpt-neo-localattention3
使用連結 - https://drive.google.com/file/d/1tboTvohQifN6f1JiSV8hnciyNKvj9pvm/view?usp=sharing 下載已按此處所述保存的模型 - https://github.com/arrmansa/ saving-and -載入大型模型-pytorch

計時（2000 個令牌上下文）

1

系統 -

16 GB DDR4 記憶體。 1070 8GB GPU。
ram 上有 23 個區塊 (ram_blocks = 23)，其中 18 個位於共享/固定記憶體上 (max_shared_ram_blocks = 18)。

計時-

模型（輸入）的單次運行需要 6.5 秒。
35 秒在 2000 個上下文中產生 25 個令牌。（1.4 秒/令牌）

2

系統 -

16 GB DDR4 記憶體。 1060 6GB GPU。
ram 上有 26 個區塊 (ram_blocks = 26)，其中 18 個位於共享/固定記憶體上 (max_shared_ram_blocks = 18)。

計時-

40 秒在 2000 個上下文中產生 25 個令牌。（1.6 秒/令牌）

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2024-11-29
大小 10.68KB
來自於 Github

相關應用

棘手的謎語及答案

2024-11-08
Dead Phone low battery manager漢化版

2024-01-29
用火殺死它

2022-08-16
MyQEE 的管理 UI

2011-05-24
基本的PHPCMS

2009-04-20

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
SmartTube

其他源碼

24.71 Stable
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
wp functions

其他類別

1.0.0
termwind

其他類別

v2.3.0

相關資訊全部