Image to Speech GenAI Tool Using LLM
1.0.0
AI 工具,通过提示 GenAI LLM 模型、Hugging Face AI 模型以及 OpenAI 和 LangChain,根据上传图像的上下文生成音频短篇故事。分别部署在Streamlit和Hugging Space云上。
在 Streamlit 上启动应用程序
在 HuggingFace 空间上启动应用程序
您可以在相应的img-audio
文件夹中收听此测试演示图像的相应音频文件
一款使用 Hugging Face AI 模型从图像生成文本的应用程序,然后从文本生成音频。
执行分为3部分:
您可以在相应的img-audio
文件夹中收听此测试图像的相应音频文件
克隆存储库:
git clone https://github.com/GURPREETKAURJETHRA/Image-to-Speech-GenAI-Tool-Using-LLM.git
安装所需的 Python 包:
pip install -r requirements.txt
通过在项目的根目录中创建包含以下内容的 .env 文件来设置 OpenAI API 密钥和 Hugging Face 令牌:
OPENAI_API_KEY=<your-api-key-here>
HUGGINGFACE_API_TOKEN=<<your-access-token-here>
运行 Streamlit 应用程序:
streamlit run app.py
根据 MIT 许可证分发。请参阅LICENSE
了解更多信息。