HN Summary是一个开源机器人,它总结 Hacker News 上的头条新闻并将摘要发布到 Telegram 频道。
加入 Telegram 上的HN 摘要频道,查看机器人的运行情况并欣赏故事摘要:
https://t.me/hn_summary
使用 ? 在电报频道上标记不良摘要帮助缓解和改善。
您还可以在这里找到当前热门黑客新闻文章的摘要:
https://news.jiggy.ai
请随时打开 PR/issue 或在 telegram 或 Twitter 上通过 @wskish 私信我并提供反馈。
每当 Hacker News API /topstories.json 端点上出现新故事时,该机器人都会对其进行总结(当前使用 OpenAI gpt-3.5-turbo)并将故事标题、摘要和 url 发送到 Telegram 上的 hn_summary 频道。
该项目的目的是帮助建立对当前一代大型语言模型功能的直觉,同时呈现更广泛的顶级黑客新闻内容。它还可以作为实验其他语言模型功能(例如语义搜索)的平台。
像 GPT-3 这样的大型语言模型很容易产生疯狂的幻觉,有时会用非常权威的语气来胡编乱造。
从 html 中提取文本的代码非常基础且容易出错。 (欢迎公关。)此外,许多网站(例如新闻网站)要么是付费墙,要么很难提取文本。我们现在尝试通过快速工程来捕获此案例,但当某个案例漏掉时,我们往往会仅根据标题和 FQDN 产生奇特的幻觉。
当前会忽略除 PDF 和 HTML 之外的内容类型的链接。
从 Reddit 和 Twitter 以及其他商业链接中提取的文本已被破坏,并且可能会产生严重的幻觉摘要。
Telegram 消息仅限 4K。目前响应被截断为 4K。
以下环境变量用于注入主要依赖项的凭据和其他所需配置:
开放人工智能
PostgresQL
用于跟踪我们已经看到的项目和相关项目信息的数据库。
电报