HN Summary เป็นบอทโอเพ่นซอร์สที่สรุปเรื่องเด่นใน Hacker News และเผยแพร่บทสรุปไปยังช่อง Telegram
เข้าร่วมช่อง HN Summary บน Telegram เพื่อดูการทำงานของบอทและเพลิดเพลินไปกับบทสรุปเรื่องราว:
https://t.me/hn_summary
ตั้งค่าสถานะสรุปที่ไม่ดีในช่องโทรเลขด้วย ? เพื่อช่วยบรรเทาและปรับปรุง
คุณสามารถดูบทสรุปของบทความข่าวแฮ็กเกอร์ยอดนิยมในปัจจุบันได้ที่นี่เช่นกัน:
https://news.jiggy.ai
อย่าลังเลที่จะเปิดประชาสัมพันธ์/ปัญหาหรือ dm ฉันที่ @wskish ทางโทรเลขหรือ twitter พร้อมข้อเสนอแนะ
เมื่อใดก็ตามที่เรื่องราวใหม่ปรากฏบนจุดสิ้นสุด Hacker News API /topstories.json บอทนี้จะสรุปเรื่องราว (ปัจจุบันใช้ OpenAI gpt-3.5-turbo) และส่งชื่อเรื่องราว ข้อมูลสรุป และ URL ไปยังช่อง hn_summary บน Telegram
วัตถุประสงค์ของโครงการนี้คือการช่วยสร้างสัญชาตญาณเกี่ยวกับความสามารถของโมเดลภาษาขนาดใหญ่รุ่นปัจจุบัน ขณะเดียวกันก็แสดงเนื้อหา Hacker News ชั้นนำในวงกว้างมากขึ้น นอกจากนี้ยังสามารถใช้เป็นแพลตฟอร์มสำหรับการทดลองกับความสามารถของโมเดลภาษาอื่นๆ เช่น การค้นหาความหมาย
โมเดลภาษาขนาดใหญ่ เช่น GPT-3 มีแนวโน้มที่จะเกิดอาการประสาทหลอนอย่างบ้าคลั่ง และบางครั้งก็แต่งเรื่องในขณะที่เขียนด้วยน้ำเสียงที่น่าเชื่อถือมาก
โค้ดสำหรับแยกข้อความจาก html นั้นเป็นโค้ดพื้นฐานมากและเกิดข้อผิดพลาดได้ง่าย (ยินดีต้อนรับประชาสัมพันธ์) นอกจากนี้ ไซต์จำนวนมาก (เช่น ไซต์ข่าว) มีเพย์วอลล์หรือทำให้แยกข้อความได้ยาก ตอนนี้เราพยายามที่จะจับคดีนี้โดยอาศัยวิศวกรรมที่ทันท่วงที แต่เมื่อมีผู้ใดหลุดลอยไป เรามักจะมีอาการประสาทหลอนเพ้อฝันตามชื่อเรื่องและ FQDN
ลิงก์ไปยังเนื้อหาประเภทอื่นที่ไม่ใช่ PDF และ HTML จะถูกละเว้นในขณะนี้
การแยกข้อความจาก Reddit และ Twitter และลิงก์เชิงพาณิชย์อื่นๆ ใช้งานไม่ได้ และอาจสร้างบทสรุปที่หลอนประสาทอย่างมาก
ข้อความโทรเลขถูกจำกัดไว้ที่ 4K ขณะนี้การตอบสนองถูกตัดทอนเป็น 4K
ตัวแปรสภาพแวดล้อมต่อไปนี้ใช้เพื่อแทรกข้อมูลรับรองและการกำหนดค่าที่จำเป็นอื่นๆ สำหรับการขึ้นต่อกันหลัก:
OpenAI
PostgresQL
ฐานข้อมูลสำหรับติดตามรายการที่เราได้เห็นแล้วและข้อมูลรายการที่เกี่ยวข้อง
โทรเลข