transformers stream generator
1.0.0
Huggingface/Transformers를 기반으로 추론 중에 실시간으로 각 토큰을 스트리밍하여 생성기를 반환하는 텍스트 생성 방법입니다.
pip install transformers-stream-generator
from transformers_stream_generator import init_stream_support
init_stream_support ()
model.generate
함수에 do_stream=True
추가하고 do_sample=True
유지하면 생성기를 얻을 수 있습니다. generator = model . generate ( input_ids , do_stream = True , do_sample = True )
for token in generator :
word = tokenizer . decode ( token )
print ( word )