transformers stream generator
1.0.0
Dies ist eine Textgenerierungsmethode, die einen Generator zurückgibt, der jedes Token während der Inferenz in Echtzeit ausströmt, basierend auf Huggingface/Transformers.
pip install transformers-stream-generator
from transformers_stream_generator import init_stream_support
init_stream_support ()
do_stream=True
in der Funktion model.generate
hinzu und behalten Sie do_sample=True
bei, dann können Sie einen Generator erhalten generator = model . generate ( input_ids , do_stream = True , do_sample = True )
for token in generator :
word = tokenizer . decode ( token )
print ( word )