HN Summary是一個開源機器人,它總結 Hacker News 上的頭條新聞並將摘要發佈到 Telegram 頻道。
加入 Telegram 上的HN 摘要頻道,查看機器人的運作並欣賞故事摘要:
https://t.me/hn_summary
使用 ? 在電報頻道上標記不良摘要幫助緩解和改善。
您也可以在這裡找到當前熱門駭客新聞文章的摘要:
https://news.jiggy.ai
請隨時打開 PR/issue 或在 telegram 或 Twitter 上透過 @wskish 私訊我並提供回饋。
每當 Hacker News API /topstories.json 端點上出現新故事時,該機器人都會對其進行總結(目前使用 OpenAI gpt-3.5-turbo)並將故事標題、摘要和 url 發送到 Telegram 上的 hn_summary 頻道。
該計畫的目的是幫助建立對當前一代大型語言模型功能的直覺,同時呈現更廣泛的頂級駭客新聞內容。它也可以作為實驗其他語言模型功能(例如語義搜尋)的平台。
像 GPT-3 這樣的大型語言模型很容易產生瘋狂的幻覺,有時會用非常權威的語氣來胡編亂造。
從 html 提取文字的程式碼非常基礎且容易出錯。 (歡迎公關。)此外,許多網站(例如新聞網站)要么是付費牆,要么很難提取文字。我們現在嘗試透過快速工程來捕捉此案例,但當某個案例漏掉時,我們往往會僅根據標題和 FQDN 產生奇特的幻覺。
目前會忽略 PDF 和 HTML 之外的內容類型的連結。
從 Reddit 和 Twitter 以及其他商業連結中提取的文字已被破壞,並且可能會產生嚴重的幻覺摘要。
Telegram 訊息僅限 4K。目前響應截斷為 4K。
以下環境變數用於注入主要依賴項的憑證和其他所需配置:
開放人工智慧
PostgresQL
用於追蹤我們已經看到的項目和相關項目資訊的資料庫。
電報