transformers stream generator
1.0.0
Este é um método de geração de texto que retorna um gerador, transmitindo cada token em tempo real durante a inferência, baseado em Huggingface/Transformers.
pip install transformers-stream-generator
from transformers_stream_generator import init_stream_support
init_stream_support ()
do_stream=True
na função model.generate
e mantenha do_sample=True
, então você pode obter um gerador generator = model . generate ( input_ids , do_stream = True , do_sample = True )
for token in generator :
word = tokenizer . decode ( token )
print ( word )