ai vinyl specialist ดาวน์โหลด - ai vinyl specialist ดาวน์โหลดซอร์สโค้ด

ai vinyl specialist

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

ผู้เชี่ยวชาญด้านไวนิลของเดวิด

เดวิดเป็นผู้เชี่ยวชาญด้านแผ่นเสียง คุณสามารถขอคำแนะนำหรือข้อมูลเพิ่มเติมเกี่ยวกับบันทึกใดๆ ในคอลเลกชัน Discogs ของคุณได้ เดวิดยินดีที่จะช่วยเหลือคุณ

รายละเอียดทางเทคนิค

แอปพลิเคชัน LLM นี้เป็นตัวอย่างง่ายๆ ของตัวแทนการสนทนาที่ใช้ Discogs API เพื่อให้ข้อมูลเกี่ยวกับแผ่นเสียง ประกอบด้วย 4 ส่วนหลัก:

ไคลเอ็นต์ Discogs API : เมื่อระบุชื่อผู้ใช้ จะดึงชุดบันทึกไวนิลจาก Discogs API
เอ็นจิ้นผู้ช่วย AI (David) : เมื่อพิจารณาจากคอลเลกชันบันทึก จะมีอินเทอร์เฟซการสนทนาเกี่ยวกับบันทึก
เซิร์ฟเวอร์ Websockets : มีเซิร์ฟเวอร์ websockets เพื่อโต้ตอบกับผู้ช่วย AI
ส่วนต่อประสานผู้ใช้ : มีส่วนต่อประสานผู้ใช้ที่เรียบง่ายเพื่อโต้ตอบกับผู้ช่วย AI ผ่านทางเว็บซ็อกเก็ต

ปัจจุบันใช้ LangChain4j เป็นเฟรมเวิร์ก โดยมี GPT-4o เป็นเอ็นจิ้นผู้ช่วย AI แต่สามารถปรับใช้กับเอ็นจิ้นอื่นได้อย่างง่ายดาย

สถาปัตยกรรมแอปพลิเคชันจากแผนภาพด้านล่างบังคับใช้โดยเฟรมเวิร์ก ArchUnit ผ่านการทดสอบในคลาส ArchitectureTest

แผนภาพสถาปัตยกรรม

บทเรียนที่ได้รับ

UI สำหรับโครงการนี้ได้รับการพัฒนาโดยใช้พร้อมท์ต่อไปนี้:

 I need the code for an HTML 5 page that contains an input field for a Discogs username 
and a text area for inserting prompts for the application to send to AI agents. 
Above the text area there should be the space in which the AI responses are displayed, in the ChatGPT style

โค้ด HTML5 ที่สร้างขึ้นจาก GitHub Copilot ให้ภาพเริ่มต้นสำหรับ UI ซึ่งฉันแก้ไขจากนั้นเพื่อเพิ่มการเชื่อมต่อ websocket และตรรกะในการส่งและรับข้อความจากผู้ช่วย AI ฉันพบว่านี่เป็นแนวทางที่รวดเร็วมากในการสร้างต้นแบบ จากนั้น ฉันย้ายไปยังส่วนประกอบที่มีประสิทธิภาพมากขึ้นจาก ant-design รวมถึง pro-chat

ตอนแรกฉันต้องการใช้ llama3 ปัจจุบันโมเดล llama3 ไม่มีการรองรับเครื่องมือ (มิถุนายน 2024) ซึ่งหมายความว่าผู้ช่วย AI ไม่สามารถรวบรวมชื่อผู้ใช้ Discogs และเรียกค้นคอลเลกชันบันทึกได้ด้วยตัวเอง เราย้ายไปที่ GPT-4o เพื่อให้ David สามารถขอข้อมูล Discogs และไม่จำเป็นต้องใช้แบบฟอร์มใดๆ

LLM บางแห่งไม่ฉลาดเท่าคนอื่นๆ แม้ว่ารุ่น Mistral 7b จะรองรับเครื่องมือต่างๆ แต่ฉันก็ไม่สามารถรับคำตอบที่ดีได้ มันจะไม่ผ่านการทดสอบบูรณาการของฉันด้วยซ้ำ ด้วยเหตุนี้ ฉันจึงไม่สามารถเรียกใช้ LLM ด้วยเครื่องมือได้ฟรีๆ

ภาพหลอนเป็นความเจ็บปวด ฉันกำลังเริ่มต้นการเดินทางสู่ RAG เพื่อลดปัญหาดังกล่าว เนื่องจาก David ดำเนินงานในด้านดนตรี Wikipedia จึงเป็นฐานความรู้แรกที่นึกถึงสำหรับ RAG บางทีฉันอาจใช้ประโยชน์จาก MediaWiki API เพื่อค้นหาหน้าเพลงที่เกี่ยวข้องกับการสนทนาได้ สำหรับตอนนี้ ฉันใช้แค่ Google Search และบางครั้งก็ช่วยได้ แต่ก็ไม่เพียงพอสำหรับค่าใช้จ่ายที่เพิ่มขึ้นด้วยโทเค็นอย่างแน่นอน

การทดสอบแอปพลิเคชัน LLM ถือเป็นความท้าทาย ฉันทำการทดสอบบูรณาการมากกว่าปกติ สิ่งนี้นำไปสู่วงจรการพัฒนาที่ช้าลง นอกจากนี้ ลักษณะความน่าจะเป็นของผู้ช่วย AI ทำให้การทดสอบแอปพลิเคชันในลักษณะที่กำหนดเป็นเรื่องยาก

ในการทดสอบหน่วยของโลก LLM เกี่ยวข้องกับการแจ้งโมเดล AI แทนที่จะเรียกหน่วยของโค้ดเท่านั้น เมื่อใช้โมเดลบนคลาวด์ การรันการทดสอบหน่วยมีค่าใช้จ่าย ฉันยังได้ทดลองใช้เอเจนต์ AI ตัวที่สองเพื่อช่วยฉันในการยืนยันผลลัพธ์จาก AI หลัก นี่เป็นแนวทางที่น่าหวังเนื่องจากเราสามารถยืนยันความหมายได้ ไม่ใช่แค่การประมวลผลสตริงเท่านั้น ข้อดีข้อเสียก็คือ ยังสร้างต้นทุน และวางซ้อนความเสี่ยงของข้อผิดพลาดที่น่าจะเกิดจาก LLM

ไปถูก/ผิด

ไปทางขวา: แจ้งสองสามช็อต ผลลัพธ์จากผู้แนะนำได้รับการปรับปรุงอย่างมากเมื่อฉันใช้เทคนิคนี้กับข้อความแจ้งของระบบ ฉันได้เพิ่มบุคลิก น้ำเสียง บริบทเบื้องหลังการสนทนา และตัวอย่างเล็กๆ น้อยๆ เกี่ยวกับสิ่งที่ AI คาดหวังให้ทำ
ไปทางขวา: ผู้ตรวจสอบการทดสอบ AI การยืนยันจากการทดสอบการรวม AI มักเกี่ยวข้องกับการประมวลผลสตริง ฉันคิดว่าการใช้ AI อื่นที่เชี่ยวชาญในการตรวจสอบผลการทดสอบจะช่วยอำนวยความสะดวกในกระบวนการนี้ ฉันจะแถลงและตอบกลับจาก AI หลัก และผู้ตรวจสอบการทดสอบจะกลับมาอีกครั้งหากผ่านหรือล้มเหลว มันนำไปสู่การทดสอบที่ไม่แน่นอนด้วยการใช้ llama3 เนื่องจากการสะสมข้อผิดพลาดที่น่าจะเป็นของ AI ทั้งสองที่ทำงานร่วมกัน เมื่อเปลี่ยนไปใช้ GPT-4o มันพิสูจน์แล้วว่าเป็นเครื่องมือที่ดีมาก มันเปิดใช้งานการยืนยันความหมาย ใช้ LLM ที่ทรงพลังที่สุดของคุณเพื่อยืนยันการทดสอบ
ไปทางขวา: เครื่องมือ ในตอนแรกฉันดึงคอลเลคชันแผ่นเสียงไวนิลจาก Discogs โดยใช้โค้ดแอปพลิเคชัน และเพิ่มลงในพรอมต์ของระบบของ LLM วิธีการนี้จำเป็นต้องมีช่องป้อนข้อมูลบน UI เพื่อรวบรวมข้อมูลนี้ เมื่อเปลี่ยนใช้เครื่องมือ AI จะสามารถรวบรวมชื่อผู้ใช้ Discogs จากผู้ใช้ได้ด้วยตัวเอง และทำให้ทุกอย่างมีการสนทนามากขึ้น ช่วยลดความจำเป็นในการใช้แบบฟอร์ม UI
ผิดพลาด: ราคา การเพิ่มคุณสมบัติให้กับตัวแทน AI เกี่ยวข้องกับการเพิ่มจำนวนโทเค็นที่ใช้ในแต่ละแชท จะเพิ่มมากขึ้นเมื่อใช้โมเดลที่ได้รับการปรับแต่งอย่างละเอียด ยิ่งเราเพิ่มจำนวนตัวอย่างในพรอมต์ไม่กี่ช็อตมากเท่าไร เราก็จะยิ่งจ่ายค่าข้อความพร้อมต์ของระบบมากขึ้นเท่านั้น การใช้ GPT-4o มีค่าใช้จ่ายสูงในขณะนี้ และควรพิจารณาทางเลือกของ LLM อย่างรอบคอบ LangChain ช่วยด้วยเลเยอร์นามธรรมที่ทำให้ง่ายต่อการเปลี่ยน LLM พื้นฐาน
ผิดพลาด: ใช้ Ollama และ llama3 ในตอนแรกฉันใช้ llama3 ที่ทำงานอยู่ใน Ollama เพื่อสร้างต้นแบบแอปพลิเคชัน Gen AI ฟรี มันใช้งานได้ในตอนแรก แต่นำไปสู่วงจรการพัฒนาที่ช้ามากอย่างรวดเร็ว ชุดการทดสอบของฉันจะใช้เวลา 5 นาทีในการทำงานกับการทดสอบ 20 ครั้งในขณะที่ใช้งานคอนเทนเนอร์ทดสอบที่นำกลับมาใช้ใหม่ได้ การเรียกใช้แอปพลิเคชันมีความล่าช้าในการเริ่มการสนทนาประมาณ 1 นาที ฉันต้องแทนที่ด้วย LLM บนคลาวด์อย่าง ChatGPT 3.5