Ringkasan HN adalah bot sumber terbuka yang merangkum berita utama di Hacker News dan menerbitkan ringkasannya ke saluran Telegram.
Bergabunglah dengan saluran Ringkasan HN di Telegram untuk melihat bot beraksi dan nikmati ringkasan ceritanya:
https://t.me/hn_summary
Tandai ringkasan buruk di saluran telegram dengan ? untuk membantu mitigasi dan perbaikan.
Anda juga dapat menemukan ringkasan artikel Berita Peretas teratas saat ini di sini:
https://news.jiggy.ai
Jangan ragu untuk membuka PR/masalah atau dm saya di @wskish di telegram atau twitter dengan umpan balik.
Setiap kali cerita baru muncul di titik akhir Hacker News API /topstories.json, bot ini merangkumnya (saat ini menggunakan OpenAI gpt-3.5-turbo) dan mengirimkan judul Cerita, ringkasan, dan url ke saluran hn_summary di Telegram.
Tujuan dari proyek ini adalah untuk membantu membangun intuisi tentang kemampuan model bahasa besar generasi saat ini sambil menampilkan konten Berita Peretas teratas yang lebih luas. Ini juga bisa berfungsi sebagai platform untuk bereksperimen dengan kemampuan model bahasa lain seperti pencarian semantik.
Model bahasa besar seperti GPT-3 rentan terhadap halusinasi gila dan terkadang mengada-ada saat menulis dengan nada yang sangat berwibawa.
Kode untuk mengekstrak teks dari html sangat mendasar dan rawan kesalahan. (Humas diterima.) Selain itu, banyak situs (seperti situs berita) yang berbayar atau menyulitkan ekstraksi teks. Kami sekarang mencoba untuk menangkap kasus ini melalui rekayasa cepat, tetapi jika kasus ini lolos, kami cenderung mendapatkan halusinasi khayalan hanya berdasarkan judul dan FQDN.
Tautan ke tipe konten selain PDF dan HTML saat ini diabaikan.
Ekstraksi teks dari reddit dan twitter serta tautan komersial lainnya rusak dan mungkin menghasilkan ringkasan yang sangat berhalusinasi.
Pesan Telegram dibatasi hingga 4K. Saat ini responsnya terpotong menjadi 4K.
Variabel lingkungan berikut digunakan untuk memasukkan kredensial dan konfigurasi lain yang diperlukan untuk dependensi utama:
OpenAI
PostgresQL
Basis data untuk melacak item yang telah kami lihat dan info item terkait.
Telegram