OpenAI กำลังจะเปิดตัวการอัปเกรดครั้งใหญ่ของ ChatGPT ซึ่งเป็นบริการ ChatGPT Pro ในราคา 200 เหรียญสหรัฐต่อเดือน และมีแผนจะเปิดตัวโมเดล "สตรอเบอร์รี่" ใหม่ในอีกสองสัปดาห์ข้างหน้า แกนหลักของโมเดลนี้อยู่ที่วิธีการให้เหตุผลที่เป็นเอกลักษณ์ ซึ่งจะใช้เวลาคิดและดึงข้อมูลประมาณ 10-20 วินาที ก่อนที่จะตอบคำถาม เพื่อปรับปรุงประสิทธิภาพของการใช้พลังงานประมวลผลของ AI และสร้างเนื้อหาที่แม่นยำยิ่งขึ้น แม้ว่าในปัจจุบันจะรองรับเฉพาะการประมวลผลข้อความเท่านั้น แต่ความพยายามเชิงนวัตกรรมในการเลียนแบบกระบวนการคิดของมนุษย์ก็คุ้มค่าที่จะได้รับความสนใจ
OpenAI กำลังจะนำการอัปเกรดครั้งใหญ่มาสู่ ChatGPT มีรายงานว่า ChatGPT Pro ซึ่งมีราคาอยู่ที่ 200 เหรียญสหรัฐต่อเดือน ได้เปิดตัวอย่างเป็นทางการแล้ว แม้ว่าจะยังไม่มีการเปิดตัวฟีเจอร์หรือโมเดลใหม่ แต่ผู้ใช้สามารถคาดหวังที่จะได้สัมผัสประสบการณ์สตรอเบอร์รี่รุ่นใหม่ในอีกสองสัปดาห์ข้างหน้า โมเดล AI ระดับสูงนี้ไม่เพียงแต่ให้การสนับสนุนด้านเทคนิคที่มีประสิทธิภาพสำหรับ ChatGPT เท่านั้น แต่ยังดึงดูดความสนใจของอุตสาหกรรมด้วยวิธีการใช้เหตุผลที่เป็นเอกลักษณ์อีกด้วย
คุณลักษณะหลักของโมเดลสตรอเบอร์รี่คือความสามารถในการเลียนแบบกระบวนการคิดของมนุษย์ อาจใช้เวลา 10 ถึง 20 วินาทีในการคิดและดึงข้อมูลก่อนที่จะให้คำตอบ วิธีการประมวลผลที่เป็นนวัตกรรมนี้ได้รับการออกแบบมาเพื่อปรับปรุงประสิทธิภาพของการใช้พลังงานในการประมวลผลของ AI และด้วยเหตุนี้จึงสร้างเนื้อหาที่แม่นยำยิ่งขึ้น
อย่างไรก็ตาม เป็นที่น่าสังเกตว่ารุ่นสตรอเบอร์รี่รองรับการประมวลผลข้อความในระยะเริ่มแรกเท่านั้น และยังไม่มีความสามารถในการประมวลผลภาพและเสียงของ GPT-4
ในความเป็นจริง เทคโนโลยีการขยายเวลาการอนุมานและการปรับแบบปรับตัวนี้ไม่ใช่เทคโนโลยีแรกใน OpenAI Google DeepMind ได้ทำการวิจัยเชิงลึกในสาขานี้และเผยแพร่เอกสารที่เกี่ยวข้องแล้ว นักวิจัยพบว่าด้วยเทคโนโลยีคอมพิวเตอร์เวลาทดสอบ ประสิทธิภาพของโมเดลภาษาขนาดใหญ่สามารถปรับปรุงได้อย่างมีนัยสำคัญ โดยทำลายข้อจำกัดของโมเดลปัจจุบันในชุดข้อมูลการฝึกอบรมและทรัพยากรการประมวลผลอนุมาน
กลยุทธ์การปรับให้เหมาะสมมีสองประเภทหลักสำหรับโมเดลสตรอเบอร์รี่ ประเภทแรกนั้นขึ้นอยู่กับแบบจำลองรางวัลการตรวจสอบเชิงกระบวนการที่เข้มข้น ซึ่งต้องใช้แบบจำลองไม่เพียงแต่ในผลลัพธ์เท่านั้น แต่ยังต้องมีกระบวนการให้เหตุผลเชิงตรรกะด้วย ซึ่งเหมาะอย่างยิ่งสำหรับงานการให้เหตุผลทางคณิตศาสตร์และตรรกะที่ซับซ้อน
กลยุทธ์ที่สองคือการปรับคำตอบที่ตามมาแบบไดนามิกโดยอิงจากเนื้อหาที่สร้างขึ้นก่อนหน้านี้ และปรับคุณภาพผลลัพธ์ให้เหมาะสมอย่างต่อเนื่องผ่านการวนซ้ำหลายรอบ กลยุทธ์การปรับการคำนวณให้เหมาะสมที่สุดที่เสนอโดยนักวิจัยมีเป้าหมายเพื่อเลือกวิธีการคำนวณเวลาทดสอบที่เหมาะสมที่สุดตามสถานการณ์เฉพาะ ซึ่งช่วยปรับปรุงประสิทธิภาพการคำนวณได้อย่างมาก
อย่างไรก็ตาม โมเดลสตรอเบอร์รี่ยังเผชิญกับความท้าทายบางประการเช่นกัน แม้ว่าจะช่วยลดข้อผิดพลาดและภาพหลอนได้ดีเยี่ยม แต่เวลาตอบสนอง 10 ถึง 20 วินาทีอาจส่งผลต่อประสบการณ์ของผู้ใช้ได้ มีข้อเสนอแนะจากผู้ใช้ทดลองใช้ว่าคำตอบที่แม่นยำกว่าเล็กน้อยเหล่านี้ดูเหมือนจะไม่เพียงพอที่จะชดเชยเวลารอคอยที่นานขึ้น
นอกจากนี้ เนื่องจากความสามารถขั้นสูงอาจนำไปสู่การใช้ทรัพยากรการประมวลผลที่สูงขึ้น ต้นทุนการใช้งานจึงอาจเพิ่มขึ้นด้วย เพื่อสร้างสมดุลระหว่างประสบการณ์ผู้ใช้และการใช้ทรัพยากร OpenAI อาจกำหนดขีดจำกัดบนของความถี่ในการส่งข้อความ และพิจารณาเปิดตัวแพ็คเกจที่มีราคาสูงกว่าเพื่อให้เวลาตอบสนองเร็วขึ้น
โดยรวมแล้ว โมเดล "Strawberry" แสดงถึงความพยายามที่มีประโยชน์ของ OpenAI ในการปรับปรุงความแม่นยำและความสามารถในการให้เหตุผลของโมเดลภาษาขนาดใหญ่ แต่เวลาตอบสนอง 10-20 วินาทีและปัญหาด้านต้นทุนที่อาจเกิดขึ้นยังคงต้องมีการสังเกตและปรับปรุงเพิ่มเติม ความสำเร็จในอนาคตขึ้นอยู่กับว่า OpenAI สามารถสร้างสมดุลความสัมพันธ์ระหว่างความแม่นยำ ความเร็ว และต้นทุนได้อย่างมีประสิทธิภาพหรือไม่