Cognition ได้เปิดตัวโปรแกรมเมอร์ AI ที่น่าทึ่ง Genie ซึ่งเอาชนะ Devin และ GPT-4 ด้วยคะแนน 30.08% บนแพลตฟอร์มทดสอบที่เชื่อถือได้ SWE-Bench กลายเป็นผู้ช่วยเขียนโปรแกรม AI ที่แข็งแกร่งที่สุดในโลก บรรณาธิการของ Downcodes จะทำให้คุณมีความเข้าใจเชิงลึกเกี่ยวกับความก้าวหน้าทางเทคโนโลยีและโอกาสในอนาคตที่อยู่เบื้องหลัง Genie
Cognition สตาร์ทอัพด้าน AI ได้เปิดตัวโปรแกรมเมอร์ AI ตัวใหม่ "Genie" เอาชนะ Devin และ GPT-4 ได้ในทันที และกลายเป็นผู้ช่วยด้านการเขียนโปรแกรม AI ที่ทรงพลังที่สุดในโลก
โปรแกรมเมอร์ AI รายนี้ทำคะแนนได้สูงถึง 30.08% บนแพลตฟอร์มการทดสอบที่เชื่อถือได้ SWE-Bench ซึ่งสูงกว่า Devin ที่ 13.8% และ Swe-agent+GPT-4 ที่ 12.47% มาก
คุณอาจสงสัยว่า Genie ทำอย่างไร เมื่อเดือนธันวาคม 2022 Alistair Pullen ผู้ร่วมก่อตั้ง Genie ได้สาธิตโครงการนี้ที่มหาวิทยาลัยลอนดอน เขาหวังที่จะสร้างโปรแกรม AI ที่สามารถเขียนโค้ด แก้ไขจุดบกพร่อง และเพิ่มประสิทธิภาพได้โดยอัตโนมัติเหมือนมนุษย์ หลังจากใช้เวลาพัฒนานานกว่าหนึ่งปี ในที่สุด Genie ก็เข้าสู่ขั้นตอนการทดสอบ และได้รับเงินทุนสนับสนุนรอบ Seed Round มูลค่า 2.5 ล้านดอลลาร์สหรัฐ
Alistair กล่าวว่าความสำเร็จของ Genie มีความเกี่ยวข้องอย่างใกล้ชิดกับข้อมูลและวิธีการฝึกอบรม แตกต่างจากการปรับแต่งโมเดลขนาดใหญ่แบบดั้งเดิม Genie ใช้ชุดข้อมูลพิเศษที่รวมเอากระบวนการให้เหตุผลของโปรแกรมเมอร์ที่เป็นมนุษย์ ข้อมูลครอบคลุมการค้นพบความรู้ทีละขั้นตอนและกระบวนการตัดสินใจตามกรณี ช่วยให้ Genie สามารถแสดงวิจารณญาณได้คล้ายกับวิจารณญาณของมนุษย์เมื่อต้องเผชิญกับปัญหาที่ซับซ้อน
นอกจากนี้ Genie ยังใช้ "กลไกการพัฒนาตนเอง" อันเป็นเอกลักษณ์ ในตอนแรก Genie ฝึกฝนเกี่ยวกับข้อมูลคุณภาพสูงและเข้าสู่สถานะ "สมบูรณ์แบบ" แต่ในกระบวนการนี้ Genie ล้มเหลวในการตัดสินข้อผิดพลาดของตัวเองและล้มเหลวในการปรับปรุง เพื่อเอาชนะปัญหานี้ นักพัฒนาจึงใช้ Genie เพื่อสร้างข้อมูลสังเคราะห์บางส่วนเพื่อปรับปรุงเนื้อหาการฝึกอบรมให้ดียิ่งขึ้น เปรียบเสมือนแม่สอนลูกให้เดินและให้คำแนะนำที่ถูกต้องทุกครั้งหลังล้ม
หลังจากการฝึกฝนหลายครั้ง ความสามารถของ Genie ก็พัฒนาขึ้นอย่างมาก และยังสามารถแสดงวิธีแก้ปัญหาที่สร้างสรรค์สำหรับปัญหาที่มองไม่เห็นอีกด้วย ในด้านการใช้งาน Genie รองรับงานการพัฒนาที่หลากหลาย รวมถึงการพัฒนาฟังก์ชั่น การซ่อมแซม BUG การสร้างโค้ดใหม่ การทดสอบโค้ด ฯลฯ ครอบคลุมภาษาการเขียนโปรแกรมมากมาย เช่น JavaScript, Python และ Java
ขณะนี้ Genie ได้เปิดรับสมัครให้ทดลองใช้งานแล้ว โดยคาดว่าจะสามารถลงทะเบียนผ่านเว็บไซต์อย่างเป็นทางการได้แล้ว
บล็อกอย่างเป็นทางการ: https://cosine.sh/blog/state-of-the-art
ที่อยู่ประสบการณ์: https://cosine.sh/register
ไฮไลท์:
Genie ทำคะแนนได้สูงถึง 30.08% ในการทดสอบ SWE-Bench กลายเป็นโปรแกรมเมอร์ AI ที่แข็งแกร่งที่สุดในโลก
การใช้ชุดข้อมูลพิเศษและกลไกการพัฒนาตนเอง ทำให้ Genie เป็นเลิศในการเขียนโค้ดที่ซับซ้อน
? ขณะนี้เปิดรับสมัครรุ่นทดลองใช้อยู่ และจะมีฟีเจอร์เซอร์ไพรส์อีกมากมายที่จะเปิดตัวในอนาคต!
การเกิดขึ้นของ Genie นับเป็นความก้าวหน้าครั้งใหม่ในด้านผู้ช่วยการเขียนโปรแกรม AI วิธีการฝึกอบรมที่เป็นเอกลักษณ์และกลไกการพัฒนาตนเองสมควรได้รับความสนใจจากอุตสาหกรรม บรรณาธิการของ Downcodes รอคอยที่ Genie จะนำความประหลาดใจมาสู่นักพัฒนาในอนาคต!