更新到 LiteLLM for openai 相容連接器,可以更輕鬆地添加對各種模型的支持,現在我們使用單一模型 json 檔案進行配置。確保您擁有適當的 API 金鑰來使用 Google Gemini AI Studio。 GPT 4o、Sonnet 3.5 支援。
支持新的克勞德模型,並進行了一些調整。
Python 更新至 3.11。我們還增加了對 GPT-4 128k 和 Claude 2.1 + Claude Instant v1.2 的支援。確保相應地更新您的依賴項。
參見:人類/克勞德 2
也更新了一些依賴項(Anthropic、OpenAI、PRAW、Streamlit)
更新影片概述@YouTube
新文章 @ BetterProgramming/Medium:使用 Claude 100k 和 GPT 16k 改變 Reddit 摘要
擴展設定以使用人擇模型;也增加了對舊版 OpenAI 指令模型的支援——大多數會產生垃圾輸出,但對測試很有用,也就是說,Text Davinci 003 主觀上會產生一些最高品質的輸出。新的 100k 模型通常可以消耗整個 reddit 線程而無需遞歸。
不要忘記將 Anthropic API 金鑰新增到 .env 檔案中。 (ANTHROPIC_API_KEY)
https://www.anthropic.com/index/100k-context-windows
如果您有權存取 API,則現在可以使用更長的上下文視窗。請參閱文件。 https://platform.openai.com/docs/models/gpt-4 在此處註冊等候名單:https://openai.com/waitlist/gpt-4
文章@Better Programming/Medium 使用 ChatGPT API 建立 Reddit 執行緒摘要器
這是一個基於 Python 的 Reddit 線程摘要器,它使用 GPT-3 產生線程評論的摘要。
該腳本用於透過使用 OpenAI API 根據遞歸摘要提示完成文字區塊來產生 Reddit 執行緒摘要。它首先向指定的 Reddit 線程發出請求,提取標題和自我文本,然後查找線程中的所有評論。
然後,這些評論被連接成指定數量標記的群組,並透過使用群組的文字以及 Reddit 線程的標題和自身文字提示 OpenAI API 來為每個群組產生摘要。然後,摘要將儲存到目前工作目錄的outputs
資料夾中的檔案中。
要安裝依賴項,您可以使用poetry
:
poetry install
您還需要提供 OpenAI/Reddit/Anthropic API 憑證。建立一個.env
檔案並加入以下內容:
OPENAI_ORG_ID = YOUR_ORG_ID
OPENAI_API_KEY = YOUR_API_KEY
REDDIT_CLIENT_ID = YOUR_CLIENT_ID
REDDIT_CLIENT_SECRET = YOUR_CLIENT_SECRET
REDDIT_USERNAME = YOUR_USERNAME
REDDIT_PASSWORD = YOUR_PASSWORD
REDDIT_USER_AGENT = linux:com.youragent.reddit-gpt-summarizer:v1.0.0 (by /u/yourusername)
ANTHROPIC_API_KEY = YOUR_ANTHROPIC_KEY
若要安裝開發依賴項,請執行:
poetry install --extras dev
此專案使用 pytest 進行測試,使用 mypy 進行類型檢查。
若要執行測試和類型檢查,請使用下列命令:
poetry run pytest
poetry run mypy .
該專案還使用黑色進行程式碼格式化,使用 pylint 進行 linting。
若要格式化程式碼並檢查 linting 錯誤,請使用以下命令:
poetry run black .
poetry run pylint .
要運行該應用程序,請使用以下命令:
streamlit run app/main.py
這將啟動一個 Web 應用程序,允許您輸入 Reddit 主題 URL 並產生摘要。該應用程式將根據線程的內容自動產生 GPT-3 提示,並根據這些提示產生摘要。
您可以使用config.py
檔案自訂應用程式的行為。可以使用以下配置選項:
ATTACH_DEBUGGER
:是否將偵錯器附加到應用程式。WAIT_FOR_CLIENT
:是否在啟動應用程式之前等待用戶端連線。DEFAULT_DEBUG_PORT
:調試器使用的預設連接埠。DEBUGPY_HOST
:用於調試器的主機。DEFAULT_CHUNK_TOKEN_LENGTH
:評論區塊的預設長度。DEFAULT_NUMBER_OF_SUMMARIES
:要產生的預設摘要數量。DEFAULT_MAX_TOKEN_LENGTH
:摘要的預設最大長度。LOG_FILE_PATH
:日誌檔案的路徑。LOG_COLORS
:日誌的顏色字典。REDDIT_URL
:要彙整的 Reddit 執行緒的 URL。TODAYS_DATE
:今天的日期。LOG_NAME
:日誌檔案的名稱。APP_TITLE
:應用程式的標題。MAX_BODY_TOKEN_SIZE
:評論正文的最大標記數。DEFAULT_QUERY_TEXT
:用於 GPT-3 提示的預設文字。HELP_TEXT
:當使用者將滑鼠懸停在說明圖示上時顯示的文字。 如果您想為此專案做出貢獻,請建立拉取請求。
該專案根據 MIT 許可證獲得許可。