transformers stream generator
1.0.0
これは、Huggingface/Transformers に基づいて、推論中にリアルタイムで各トークンをストリーミング出力するジェネレーターを返すテキスト生成メソッドです。
pip install transformers-stream-generator
from transformers_stream_generator import init_stream_support
init_stream_support ()
model.generate
関数にdo_stream=True
追加し、 do_sample=True
を維持すると、ジェネレーターを取得できます generator = model . generate ( input_ids , do_stream = True , do_sample = True )
for token in generator :
word = tokenizer . decode ( token )
print ( word )