บรรณาธิการของ Downcodes ได้เรียนรู้ว่าบริษัทปัญญาประดิษฐ์ Anthropic ได้อัปเกรดโมเดลซีรีส์ Claude 3.5 และเปิดตัว Claude 3.5 Sonnet และ Claude 3.5 Haiku ใหม่ จุดเด่นหลักของการอัปเกรดนี้คือ ปรับปรุงความสามารถในการเขียนโค้ดได้อย่างมาก และทำให้ Claude สามารถจำลองการทำงานของมนุษย์บนคอมพิวเตอร์ได้ ซึ่งถือเป็นก้าวสำคัญของ Anthropic ในการขยายโมเดล AI เชิงพาณิชย์ไปสู่ "ตัวแทน AI" ที่ครอบคลุม คะแนนของ Sonnet บน SWE-bench Verified เพิ่มขึ้นเป็น 49.0% แซงหน้าโมเดลที่เผยแพร่ต่อสาธารณะทั้งหมด รวมถึงโมเดล o1-preview ของ OpenAI ไฮกุทำงานได้ดีในการทดสอบเกณฑ์มาตรฐานอัจฉริยะหลายรายการด้วยความเร็วที่เร็วขึ้นและความสามารถในการติดตามคำสั่งที่แม่นยำยิ่งขึ้น การอัปเกรดนี้จะนำเครื่องมือช่วยเหลือ AI ที่ทรงพลังยิ่งขึ้น และประสบการณ์ที่สะดวกสบายยิ่งขึ้นมาสู่นักพัฒนาและผู้ใช้
บริษัทปัญญาประดิษฐ์ Anthropic ได้ประกาศการอัพเกรดครั้งใหญ่ในซีรีส์ Claude 3.5 รวมถึง Claude 3.5 Sonnet และ Claude 3.5 Haiku ใหม่ เวอร์ชันอัปเกรดอ้างว่าอนุญาตให้ปัญญาประดิษฐ์เข้าควบคุมพีซีของคุณ โดยทำงานพื้นฐาน เช่น การจำลองการป้อนข้อมูลด้วยแป้นพิมพ์และการคลิกเมาส์เพื่อใช้แอปพลิเคชันใดๆ ที่ติดตั้งบนคอมพิวเตอร์ของคุณ
ความสามารถในการเขียนโค้ดได้รับการปรับปรุงอย่างมีนัยสำคัญ เหนือกว่ารุ่นตัวอย่าง OpenAI o1
Claude3.5Sonnet ใหม่ได้รับการปรับปรุงอย่างมากในทุกด้าน โดยเฉพาะอย่างยิ่งในแง่ของความสามารถในการเขียนโค้ด คะแนนบน SWE-bench Verified เพิ่มขึ้นจาก 33.4% เป็น 49.0% ซึ่งเหนือกว่ารุ่นที่เผยแพร่ต่อสาธารณะทั้งหมด รวมถึงโมเดล o1-preview ของ OpenAI
นอกจากนี้ ประสิทธิภาพบน TAU-bench ยังได้รับการปรับปรุง โดยเฉพาะในภาคการค้าปลีกและการบิน ทั้งหมดนี้ยังคงราคาและความเร็วเท่าเดิม
ความคิดเห็นของลูกค้าแสดงให้เห็นว่า Claude3.5Sonnet ที่อัปเกรดแล้วได้ก้าวกระโดดในเชิงคุณภาพในการเขียนโค้ด AI ตัวอย่างเช่น GitLab ทดสอบโมเดลนี้สำหรับงาน DevSecOps และพบว่ามีการปรับปรุงที่สำคัญในความสามารถในการให้เหตุผลโดยไม่เพิ่มเวลาแฝง
Claude3.5Haiku เป็นรุ่นถัดไปที่เร็วที่สุดของ Claude ซึ่งมีประสิทธิภาพเหนือกว่า Claude3Opus ในราคาและความเร็วเท่ากัน และทำงานได้ดีบนการวัดประสิทธิภาพอัจฉริยะหลายตัว โดยเฉพาะในงานการเข้ารหัส เวลาแฝงที่ต่ำและความสามารถตามคำสั่งที่แม่นยำยิ่งขึ้นของ Claude3.5Haiku ทำให้เหมาะอย่างยิ่งสำหรับการสร้างผลิตภัณฑ์อินเทอร์เฟซผู้ใช้และประสบการณ์ส่วนบุคคล
ควบคุมคอมพิวเตอร์ได้เหมือนมนุษย์
ฟังก์ชั่นการใช้งานคอมพิวเตอร์ที่เพิ่งเปิดตัวใหม่ถือเป็นความพยายามครั้งใหม่โดยสิ้นเชิง เจ้าหน้าที่กล่าวว่านี่ไม่ใช่การพัฒนาเครื่องมือเฉพาะสำหรับ Claude แต่เป็นการสอนทักษะคอมพิวเตอร์ทั่วไปเพื่อให้สามารถใช้เครื่องมือมาตรฐานและโปรแกรมซอฟต์แวร์ที่หลากหลาย นักพัฒนาสามารถใช้ความสามารถนี้เพื่อทำให้กระบวนการที่ซ้ำกันเป็นอัตโนมัติ สร้างและทดสอบซอฟต์แวร์ ดำเนินการวิจัยแบบเปิด และอื่นๆ
แน่นอนว่าความสามารถในการใช้คอมพิวเตอร์ของ Claude ในปัจจุบันยังต้องได้รับการปรับปรุง การใช้งานง่ายๆ บางอย่าง เช่น การเลื่อนและการลาก ยังคงเป็นสิ่งที่ท้าทายสำหรับ Claude เพื่อความปลอดภัย เจ้าหน้าที่ยังได้พัฒนาตัวแยกประเภทใหม่ที่สามารถระบุได้ว่าการใช้คอมพิวเตอร์ก่อให้เกิดอันตรายที่อาจเกิดขึ้นหรือไม่
“เรากำลังเข้าสู่ยุคใหม่ที่ปัญญาประดิษฐ์สามารถใช้ประโยชน์จากเครื่องมือทั้งหมดที่คุณใช้ในฐานะบุคคลเพื่อทำงานให้สำเร็จ” Jared Kaplan หัวหน้าเจ้าหน้าที่วิทยาศาสตร์ของ Anthropic กล่าวในการสัมภาษณ์ ขั้นตอนสำคัญได้ดำเนินการในการขยาย AI เชิงพาณิชย์ แบบจำลองจากเฟรมเวิร์กการแชทแบบดั้งเดิมไปจนถึง "ตัวแทน AI" เต็มรูปแบบ
ในการสาธิตครั้งหนึ่ง Claude ถูกขอให้วางแผนการเดินทางให้เพื่อนดูพระอาทิตย์ขึ้นเหนือสะพานโกลเดนเกต AI ไม่เพียงเปิดหน้าเว็บ แต่ยังพบจุดดูที่เหมาะสมบน Google และเพิ่มกำหนดการเดินทางลงในแอปปฏิทิน แม้ว่าประสิทธิภาพนี้จะน่าประทับใจ แต่ Wired ชี้ให้เห็นว่าไม่ได้ให้ข้อมูลเพิ่มเติมบางอย่าง เช่น วิธีไปยังจุดหมายปลายทางของคุณ
นอกจากนี้ ในการสาธิตอีกครั้ง Claude ถูกขอให้สร้างเว็บไซต์ที่เรียบง่าย ด้วยเหตุนี้ เขาจึงสร้างเว็บไซต์โดยใช้ Visual Studio Code ของ Microsoft ได้สำเร็จ และเปิดเซิร์ฟเวอร์ภายในเครื่องเพื่อทำการทดสอบ อย่างไรก็ตาม ในระหว่างนี้ พบข้อบกพร่องเล็กๆ น้อยๆ บางอย่างแต่สามารถแก้ไขโค้ดได้สำเร็จเมื่อได้รับแจ้ง
Claude 3.5 Sonne แสดงให้เห็นถึงความสามารถของเขาในการทำงานหลายขั้นตอนบนแพลตฟอร์มซอฟต์แวร์ต่างๆ โดยการดึงข้อมูลที่จำเป็นจากระบบการจัดการลูกค้าสัมพันธ์ (CRM) เพื่อกรอกแบบฟอร์มคำขอของซัพพลายเออร์โดยอัตโนมัติ
Claude3.5Sonnet ที่อัปเกรดแล้วพร้อมให้ผู้ใช้ทุกคนใช้งานได้แล้ว เริ่มตั้งแต่วันนี้เป็นต้นไป นักพัฒนาสามารถสร้างคอมพิวเตอร์เบต้าบน Anthropic API, Amazon Bedrock และ Vertex AI ของ Google Cloud ได้ Claude3.5Haiku ใหม่จะเปิดตัวในปลายเดือนนี้
บล็อกอย่างเป็นทางการ: https://www.anthropic.com/news/3-5-models-and-computer-use
ไฮไลท์:
รุ่น Claude3.5Sonnet และ Haiku ได้รับการอัปเกรดอย่างมาก และความสามารถในการเขียนโค้ดได้รับการปรับปรุงอย่างมาก
? ฟังก์ชั่นการใช้งานคอมพิวเตอร์ที่เพิ่งเปิดตัวช่วยให้ Claude สามารถใช้งานคอมพิวเตอร์ได้เหมือนมนุษย์ และเปิดโอกาสที่เป็นไปได้มากขึ้น
การใช้ผู้ช่วย AI นำมาซึ่งความเสี่ยงด้านความปลอดภัย และ Anthropic เน้นการสังเกตและการปรับปรุงอย่างค่อยเป็นค่อยไปเพื่อความปลอดภัย
โดยรวมแล้ว การอัพเกรดโมเดลซีรีส์ Claude 3.5 ของ Anthropic แสดงให้เห็นถึงการพัฒนาอย่างรวดเร็วของเทคโนโลยี AI และยังบ่งชี้ว่า AI จะมีบทบาทที่ทรงพลังมากขึ้นในสาขาต่างๆ มากขึ้นในอนาคต แม้ว่ายังคงมีความท้าทายอยู่บ้าง แต่โอกาสในการพัฒนาก็คุ้มค่าที่จะรอคอย บรรณาธิการของ Downcodes จะยังคงให้ความสนใจกับการพัฒนาล่าสุดในสาขานี้และนำเสนอรายงานที่น่าตื่นเต้นแก่ผู้อ่านมากขึ้น