นักวิจัย
Researcher ช่วยคุณประหยัดเวลาโดยใช้ Google และ GPT-3 เพื่อตอบคำถามที่กระชับและถูกต้อง รวมถึงการอ้างอิงเพื่อให้คุณสามารถค้นหาแหล่งที่มาได้
เป็นกระบวนทัศน์การค้นหาที่แตกต่างจากการใช้ Google หรือ GPT เพียงอย่างเดียว ด้วย Google คุณจะต้องสแกนเนื้อหาสแปม SEO หลายส่วนเพื่อค้นหาคำตอบ ด้วย GPT คุณจะไม่แน่ใจว่าคำตอบที่คุณได้รับนั้นถูกต้องหรือมาจากไหน
นักวิจัยแก้ไขปัญหาเหล่านี้โดยป้อนส่วนที่เกี่ยวข้องจากผลการค้นหาของ Google ลงใน GPT-3 เพื่อสร้างภาพรวม
การเปรียบเทียบ
ด้วยการป้อนบริบทของเว็บลงในโมเดลภาษาขนาดใหญ่ คุณสามารถปรับปรุงความถูกต้องและตรวจสอบข้อมูลได้ ในตัวอย่างนี้ คุณไม่มีทางยืนยันข้อมูลจาก ChatGPT ได้ นอกจากนี้ยังไม่เฉพาะเจาะจงมาก ผู้วิจัยให้แหล่งอ้างอิงและข้อมูลที่เฉพาะเจาะจงมากขึ้นแก่คุณโดยอาศัยบริบทจาก Google
ChatGPT | นักวิจัย |
---|
| |
ภาพหน้าจอ
ถามตอบทางเทคนิค | คำแนะนำ |
---|
| |
การติดตั้ง
- โคลนที่เก็บนี้ด้วยคอมไพล์
- ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Python 3.8+ แล้ว ณ วันที่ 22/12 Pytorch ไม่รองรับ Python 3.11 ในทุกแพลตฟอร์ม ดังนั้นจึงแนะนำให้ใช้ Python 3.10
- เรียกใช้
cd researcher
เพื่อเข้าไปในโฟลเดอร์ที่เก็บ - รัน
pip install -r requirements.txt
เพื่อติดตั้งแพ็คเกจที่จำเป็น - ป้อนคีย์ OpenAI API ของคุณใน
settings.py
ในตัวแปร OPENAI_KEY
- เรียกใช้
python app.py
เพื่อเรียกใช้แอปพลิเคชัน โดยค่าเริ่มต้นมันจะทำงานบนพอร์ต 5000
- [ไม่บังคับ] ตามค่าเริ่มต้น Researcher จะดึงผลการค้นหาของ Google สิ่งนี้ไม่น่าเชื่อถือเสมอไป หากคุณต้องการความน่าเชื่อถือมากขึ้น ให้ลงทะเบียนเครื่องมือค้นหาที่กำหนดเองกับ Google จากนั้น:
- ป้อนคีย์ API ใน
settings.py
ในตัวแปร SEARCH_KEY
- ป้อนรหัสเครื่องมือค้นหาที่กำหนดเองใน
SEARCH_ID
- เปลี่ยน
SEARCH_METHOD
เป็น api
การใช้งาน
- ไปที่
http://127.0.0.1:5000
เพื่อดูอินเทอร์เฟซการค้นหา - ป้อนคำค้นหาแล้วคลิก "ค้นหา" คำถามทำงานได้ดีที่สุด
- อาจใช้เวลา 10-20 วินาทีในการรับผลลัพธ์ ขึ้นอยู่กับข้อความค้นหา คุณจะเห็นข้อมูลสรุปและแหล่งที่มาที่ใช้ในการสร้างข้อมูลสรุป
มันทำงานอย่างไร
- ผลการค้นหาเบื้องต้นจะถูกดึงมาจาก Google
- แต่ละไซต์ถูกคัดลอกโดยใช้คำขอ
- HTML ของไซต์ถูกเก็บไว้ในฐานข้อมูล sqlite ท้องถิ่น
- ผลลัพธ์จะถูกกรองเพื่อลบไซต์ที่มีโฆษณาหรือเครื่องมือติดตามมากเกินไป
- ข้อความจำนวนมากถูกดึงมาจากแต่ละไซต์ และจัดอันดับตามคำค้นหา
- ส่วนข้อความ N ด้านบนใช้เพื่อสร้างสรุปโดยใช้ GPT-3
- สรุปจะแสดงพร้อมกับแหล่งที่มาที่ใช้ในการสร้าง
คำถามที่พบบ่อย
- สิ่งนี้มีค่าใช้จ่ายหรือไม่? สิ่งนี้ใช้ OpenAI API ซึ่งสามารถเสียค่าใช้จ่ายได้ขึ้นอยู่กับเครดิตของคุณ การค้นหาแต่ละครั้งควรมีราคาประมาณ 1/3 ของเซ็นต์ หากคุณใช้โหมด API อาจต้องเสียค่าใช้จ่ายตามการค้นหาใน Google ของคุณ Google Custom Search ให้การค้นหาฟรี 100 ครั้งต่อวัน จากนั้นจะมีค่าใช้จ่าย 5 ดอลลาร์ต่อการค้นหา 1,000 ครั้ง
- เหตุใดจึงใช้เวลานานมากในการรับผลลัพธ์? ผู้วิจัยทำการค้นหา จากนั้นคัดลอกไซต์เพื่อดูบริบทที่เกี่ยวข้อง จากนั้นเรียก API เพื่อสรุปบริบท การดำเนินการเหล่านี้ใช้เวลานาน การปรับการตั้งค่าบางอย่างอาจทำให้การดำเนินการนี้เร็วขึ้น โดยเฉพาะความยาวชิ้นและการนับผลลัพธ์
- เหตุใดฉันจึงได้รับข้อผิดพลาด 429 ตามค่าเริ่มต้น ผู้วิจัยจะดึงผลลัพธ์ของ Google หากคุณทำเช่นนี้บ่อยเกินไป คุณจะได้รับข้อผิดพลาด 429 เปลี่ยนไปใช้โหมด API (อธิบายไว้ข้างต้น) เพื่อหลีกเลี่ยงปัญหานี้
- เหตุใดฉันจึงได้รับข้อผิดพลาดที่ไม่สามารถสร้างข้อมูลสรุปได้ OpenAI API จะมีปัญหาในบางครั้ง ซึ่งจะทำให้ไม่แสดงข้อมูลสรุป เพียงทำการค้นหาอีกครั้งเพื่อแก้ไขปัญหานี้
การปรับปรุงในอนาคต
- เร่งกระบวนการค้นหา
- ปรับปรุงอัลกอริทึมเพื่อค้นหาส่วนข้อความที่เหมาะสมที่สุด
- ลองใช้โมเดลที่โฮสต์เองแทน GPT-3 (อาจเป็น PEGASUS สำหรับการสรุป หรือตัวแปร BLOOM หรือ T5 ที่ปรับแต่งอย่างละเอียด)
- สรุปส่วนข้อความก่อนส่งต่อไปยัง GPT-3