โซลูชันการฝึกอบรมโอเพ่นซอร์ส AI2 Tülu 3 ทำลายการผูกขาดของเทคโนโลยีหลังการฝึกอบรมโมเดลขนาดใหญ่ - บทความ AI

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-01-29 05:16:01

ขอบเขตของ AI แบบโอเพ่นซอร์สถูกจำกัดมานานแล้วโดยข้อดีของบริษัทเทคโนโลยีขนาดใหญ่ในด้านพลังการประมวลผลและเทคโนโลยีหลังการฝึกอบรม อย่างไรก็ตาม โปรแกรมหลังการฝึกอบรมTülu3 ที่ AI2 (เดิมชื่อ Allen Artificial Intelligence Institute) เปิดตัว กำลังพยายามเปลี่ยนแปลงสถานการณ์นี้ Tülu3 มอบกระบวนการหลังการฝึกอบรมที่สมบูรณ์และปรับแต่งได้ โดยช่วยให้ผู้ใช้สามารถปรับความสามารถของโมเดลได้ตามความต้องการ และบรรลุการประยุกต์ใช้โมเดลอย่างมีประสิทธิภาพในสาขาเฉพาะในที่สุด ความก้าวหน้าทางเทคโนโลยีนี้ไม่เพียงแต่ลดเกณฑ์การใช้งานของ AI แบบโอเพ่นซอร์สเท่านั้น แต่ยังช่วยให้องค์กรและสถาบันต่างๆ มีทางเลือกที่เป็นอิสระและควบคุมได้มากขึ้น โดยเฉพาะอย่างยิ่งในสาขาที่เกี่ยวข้องกับการประมวลผลข้อมูลที่ละเอียดอ่อน เช่น การวิจัยทางการแพทย์

ในด้าน AI แบบโอเพ่นซอร์ส ช่องว่างระหว่างบริษัทเทคโนโลยีขนาดใหญ่ไม่ได้สะท้อนให้เห็นเพียงพลังการประมวลผลเท่านั้น AI2 (เดิมชื่อ Allen Artificial Intelligence Institute) กำลังเชื่อมช่องว่างนี้ผ่านโครงการริเริ่มใหม่ๆ ที่แหวกแนวหลังการฝึกอบรม Tülu3 ทำให้สามารถแปลงโมเดลภาษาขนาดใหญ่ "ดั้งเดิม" ให้เป็นระบบ AI ที่ใช้งานได้จริง

แตกต่างจากการรับรู้ทั่วไป โมเดลภาษาพื้นฐานไม่สามารถนำไปใช้โดยตรงหลังการฝึกอบรมล่วงหน้า อันที่จริง กระบวนการหลังการฝึกอบรมคือจุดเชื่อมโยงสำคัญที่กำหนดค่าสุดท้ายของแบบจำลอง ในขั้นตอนนี้โมเดลได้เปลี่ยนจากเครือข่ายที่ "รู้ทุกอย่าง" แต่ขาดวิจารณญาณ มาเป็นเครื่องมือที่ใช้งานได้จริงและมีทิศทางการทำงานที่เฉพาะเจาะจง

เป็นเวลานานแล้วที่บริษัทใหญ่ๆ มีความลับเกี่ยวกับโปรแกรมหลังการฝึกอบรม แม้ว่าใครๆ ก็สามารถสร้างแบบจำลองโดยใช้เทคโนโลยีล่าสุดได้ แต่เทคนิคหลังการฝึกอบรมที่เป็นเอกลักษณ์นั้นจำเป็นต่อการสร้างแบบจำลองที่มีประโยชน์ในสาขาเฉพาะ เช่น การให้คำปรึกษาทางจิตวิทยาหรือการวิเคราะห์การวิจัย แม้แต่โปรเจ็กต์อย่าง Meta's Llama ซึ่งโฆษณาว่าเป็น "โอเพ่นซอร์ส" แหล่งที่มาของโมเดลดั้งเดิมและวิธีการฝึกอบรมทั่วไปยังคงเป็นความลับอย่างเคร่งครัด

การเกิดขึ้นของTülu3 ทำให้เกิดการเปลี่ยนแปลงสถานการณ์นี้ โซลูชันหลังการฝึกอบรมครบชุดนี้ครอบคลุมกระบวนการทั้งหมดตั้งแต่การเลือกหัวข้อไปจนถึงการจัดการข้อมูล ตั้งแต่การเรียนรู้แบบเสริมกำลังไปจนถึงการปรับแต่งอย่างละเอียด ผู้ใช้สามารถปรับความสามารถของโมเดลได้ตามความต้องการ เช่น การเสริมความสามารถด้านคณิตศาสตร์และการเขียนโปรแกรม หรือการลดลำดับความสำคัญของการประมวลผลหลายภาษา

การทดสอบ AI2 แสดงให้เห็นว่าประสิทธิภาพของโมเดลที่ฝึกฝนโดย Tülu3 ได้ไปถึงระดับของโมเดลโอเพ่นซอร์สชั้นนำแล้ว ความก้าวหน้าครั้งนี้มีความสำคัญ: ช่วยให้บริษัทต่างๆ มีตัวเลือกที่เป็นอิสระและควบคุมได้อย่างเต็มที่ โดยเฉพาะอย่างยิ่งสำหรับสถาบันที่จัดการข้อมูลที่ละเอียดอ่อน เช่น การวิจัยทางการแพทย์ พวกเขาไม่จำเป็นต้องพึ่งพา API ของบุคคลที่สามหรือบริการที่กำหนดเองอีกต่อไป พวกเขาสามารถดำเนินกระบวนการฝึกอบรมทั้งหมดในพื้นที่ให้เสร็จสิ้นได้ ซึ่งช่วยประหยัดค่าใช้จ่ายและปกป้องความเป็นส่วนตัว

AI2 ไม่เพียงแต่เปิดตัวโซลูชันนี้เท่านั้น แต่ยังเป็นผู้นำในการนำไปใช้กับผลิตภัณฑ์ของตัวเองอีกด้วย แม้ว่าผลการทดสอบในปัจจุบันจะขึ้นอยู่กับโมเดล Llama แต่พวกเขามีแผนจะเปิดตัวโมเดลใหม่โดยใช้ OLMo ของตนเองและฝึกฝนโดย Tülu3 ซึ่งจะเป็นโซลูชันโอเพ่นซอร์สที่สมบูรณ์อย่างแท้จริงตั้งแต่ต้นจนจบ

เทคโนโลยีโอเพ่นซอร์สนี้ไม่เพียงแต่แสดงให้เห็นถึงความมุ่งมั่นของ AI2 ในการส่งเสริมการทำให้ AI เป็นประชาธิปไตยเท่านั้น แต่ยังช่วยส่งเสริมชุมชน AI โอเพ่นซอร์สทั้งหมดอีกด้วย มันนำเราเข้าใกล้ระบบนิเวศ AI ที่เปิดกว้างและโปร่งใสอย่างแท้จริงอีกก้าวหนึ่ง

โอเพ่นซอร์สของTülu3ได้เติมพลังใหม่ให้กับการพัฒนาด้าน AI และประกาศอนาคต AI ที่เปิดกว้างและโปร่งใสมากขึ้น สิ่งนี้จะส่งเสริมความนิยมและการประยุกต์ใช้เทคโนโลยี AI ส่งเสริมกระบวนการทำให้เป็นประชาธิปไตยของ AI และช่วยให้ผู้คนจำนวนมากขึ้นได้รับประโยชน์จากความก้าวหน้าของเทคโนโลยี AI