โมเดล “Strawberry” ของ OpenAI เน้นการอนุมานจะเปิดตัวในอีกสองสัปดาห์ข้างหน้า? ถือเป็นความก้าวหน้าครั้งสำคัญครั้งต่อไปในด้านปัญญาประดิษฐ์

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-11-22 11:12:01

เมื่อวันอังคารที่ 10 กันยายน ตามรายงานของ The Information สื่อเทคโนโลยีและธุรกิจชื่อดัง อ้างหลายคนที่ได้ทดสอบโมเดล OpenAI ซึ่งเป็น "ที่รักของ AI" ที่ยืนหยัดอยู่แถวหน้าของยุคสมัย มีแผนจะเปิดตัวระบบปฏิบัติการจำลองใหม่ล่าสุด หน่วยสืบราชการลับที่เรียกว่า "สตรอเบอร์รี่" ในอีกสองสัปดาห์ข้างหน้าผลิตภัณฑ์อัจฉริยะซึ่งเป็นส่วนหนึ่งของบริการของ ChatGPT ซึ่งเร็วกว่า "การเปิดตัวในช่วงฤดูใบไม้ร่วง" (กันยายนถึงพฤศจิกายน) ที่มีข่าวลือเมื่อสองสัปดาห์ก่อน

รายงานข้างต้นระบุว่ายังมีปัญหาเร่งด่วนที่ต้องแก้ไขก่อนและหลังการเปิดตัวปัญญาประดิษฐ์ "Strawberry" ที่เน้นความสามารถในการให้เหตุผล แต่ดูเหมือนว่า "การเปิดตัวที่เร่งรีบ" ดูเหมือนจะบ่งบอกว่า OpenAI รู้สึกดุร้าย ความกดดันด้านการแข่งขันในด้านผลิตภัณฑ์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่ และหวังว่าจะได้ใช้โครงการ The Strawberry ล่าสุดซึ่งตลาดรอคอยมานานเป็นเวลาหลายเดือน จะช่วยฟื้นคืนแรงผลักดันที่ ChatGPT ได้รับมาเกือบสองปี นับตั้งแต่เปิดตัว

“สตรอเบอร์รี่” รุ่นอะไร? การมุ่งเน้นไปที่ความสามารถในการให้เหตุผลถือเป็นความก้าวหน้าครั้งสำคัญครั้งต่อไปของปัญญาประดิษฐ์

เมื่อสองสัปดาห์ที่แล้วมีข่าวว่า OpenAI เร่งเปิดตัว "Strawberry" เหตุผลโมเดลปัญญาประดิษฐ์เพื่อส่งเสริมธุรกิจหุ่นยนต์แชท มีรายงานเมื่อสี่สัปดาห์ก่อนว่า CEO ของ Perplexity ซึ่งเป็นบริษัทค้นหา AI ที่มีชื่อเสียง แย้มว่าได้ใช้ "Strawberry" รุ่นล่าสุดของ OpenAI ล่วงหน้าแล้ว

Wall Street News กล่าวว่าช่วงต้นเดือนพฤษภาคม มีข่าวลือว่า OpenAI กำลังพัฒนาโครงการชื่อรหัสว่า "Strawberry" อย่างลึกลับ เมื่อสองเดือนที่แล้ว เมื่อวันที่ 13 กรกฎาคม มีข่าวว่า "Strawberry" เป็นโมเดลปัญญาประดิษฐ์ใหม่ที่พัฒนาโดย OpenAI โดยหวังว่าจะเพิ่มความสามารถในการให้เหตุผลขั้นสูงยิ่งขึ้น เพื่อสร้างความก้าวหน้าครั้งสำคัญสู่ปัญญาประดิษฐ์ทั่วไป (agi)

ด้วยความสามารถในการให้เหตุผลที่เพิ่มขึ้น โมเดล "Strawberry" สามารถจัดการกับปัญหาทางวิทยาศาสตร์และคณิตศาสตร์ที่ซับซ้อนได้ดีขึ้น ซึ่งทำให้โมเดล AI ก่อนหน้านี้ "เป็นรอย" ไม่เพียงแต่ช่วยให้โมเดลภาษาขนาดใหญ่ (LLM) สร้างคำตอบตามคำค้นหาที่ซับซ้อนของผู้ใช้เท่านั้น คุณยังสามารถวางแผนล่วงหน้าเพื่อท่องอินเทอร์เน็ตได้โดยอัตโนมัติและเชื่อถือได้ และดำเนินการ "การวิจัยเชิงลึก" ตามที่กำหนดโดย OpenAI

โดยทั่วไปนักวิจารณ์เชื่อว่า "โครงการสตรอเบอร์รี่" ของ OpenAI คาดว่าจะกลายเป็นความก้าวหน้าครั้งสำคัญครั้งต่อไปในด้านปัญญาประดิษฐ์ ความสามารถในการให้เหตุผลขั้นสูงยิ่งขึ้นหมายความว่าเทคโนโลยีสามารถทำงานที่ซับซ้อนมากขึ้นได้ "โดยอัตโนมัติ" แทนที่จะอาศัยการแจ้งเตือนทีละขั้นตอนจากผู้ใช้ การใช้เหตุผลเป็นหนึ่งในปัญหาที่ยากที่สุดของ AI ในการแสวงหาความฉลาดเหมือนมนุษย์มาโดยตลอด และแบบจำลอง AI ที่มีความสามารถในการให้เหตุผลไม่เพียงแต่ปรับปรุงความสามารถทางคณิตศาสตร์และการเขียนโปรแกรมเท่านั้น แต่ยังปฏิวัติการวิจัยทางวิทยาศาสตร์และปรับปรุงการตัดสินใจในสาขาที่ซับซ้อน เช่น การดูแลสุขภาพและ การเงินที่แข็งแกร่งและเร่งสร้างนวัตกรรมทางเทคโนโลยี

จะมีราคาแพงกว่ามากหรือไม่? รูปแบบการตั้งสำรองเฉพาะและรูปแบบการกำหนดราคาของรูปแบบ "สตรอเบอร์รี่" ยังไม่แน่นอน

มีรายงานว่าแม้ว่า "Strawberry" จะเปิดตัวโดยเป็นส่วนหนึ่งของ ChatGPT แต่ก็เป็นผลิตภัณฑ์อิสระและอาจรวมอยู่ในเมนูแบบเลื่อนลงของโมเดล AI ที่ลูกค้าเลือกไว้เพื่อรองรับการทำงานของ ChatGPT อย่างไรก็ตาม ข้อกำหนดเฉพาะ รูปแบบและราคายังไม่แน่นอน

ต่างจาก AI การสนทนาทั่วไปตรงที่ "Strawberry" จะ "คิด" เป็นเวลา 10 ถึง 20 วินาทีก่อนที่จะตอบสนองต่อข้อความแจ้งของผู้ใช้ แทนที่จะให้คำตอบทันที สำหรับข้อความค้นหาที่ซับซ้อนหรือต้องมีขั้นตอนการดำเนินการหลายขั้นตอน "Strawberry" จะใช้งานได้ง่ายกว่าเวอร์ชัน GPT-4o ที่มีอยู่ และไม่ต้องการให้ผู้ใช้บอก ChatGPT อย่างชัดเจนให้ "ทำตามขั้นตอนการใช้เหตุผลระดับกลางเพื่อให้ได้คำตอบสุดท้าย" และการดำเนินการเพิ่มเติมอื่น ๆ

นักวิเคราะห์บางคนกล่าวว่านี่หมายความว่า "Strawberry" จะกลายเป็นผู้ช่วยที่ชาญฉลาดมากขึ้น ไม่เพียงแต่แก้ปัญหาทางคณิตศาสตร์และการเขียนโค้ดได้ดีขึ้นเท่านั้น แต่ยังดีกว่าในงานทางธุรกิจ "ส่วนตัว" เช่น การระดมความคิดเกี่ยวกับกลยุทธ์การตลาดผลิตภัณฑ์ และในงานสร้างสรรค์ดังกล่าว โมเดลจะให้คำแนะนำโดยละเอียดมากขึ้นซึ่งเจาะจงมากขึ้นตามความต้องการของบริษัทของผู้ใช้ เช่น การสร้างแผนการดำเนินการรายสัปดาห์

อย่างไรก็ตาม สมมติว่าทุกอย่างเป็นไปด้วยดีในการเปิดตัว ในเวอร์ชันเริ่มต้น "Strawberry" สามารถรับและสร้างข้อมูลข้อความได้เท่านั้น แต่ไม่มีรูปภาพ ซึ่งหมายความว่าไม่มีฟังก์ชัน "multi-modal" เช่นเดียวกับรุ่น OpenAI อื่น ๆ ซึ่งก็คือ หนึ่งใน "ข้อบกพร่อง" .

ขณะเดียวกัน แม้ว่าระยะ "คิด" จะช่วยหลีกเลี่ยงข้อผิดพลาดของ AI และสามารถคาดเดาวิธีตอบคำถามผู้ใช้ได้อย่างครอบคลุม แต่บางคนที่ทดสอบโมเดลนี้กล่าวว่าคำถามง่ายๆ บางข้อจะทำให้สตรอเบอร์รี่ "คิด" และไม่สามารถให้คำตอบได้อย่างรวดเร็ว ; คุณภาพของคำตอบดีขึ้นเพียงเล็กน้อยเท่านั้นและไม่คุ้มกับการรอคอยเพิ่มเติม และบางครั้งอาจเกิดความล้มเหลวในการจดจำและรวมการสนทนาก่อนหน้านี้กับผู้ใช้ก่อนที่จะตอบคำถามใหม่

ในด้านราคา มีข่าวเมื่อสัปดาห์ที่แล้วว่าราคาที่จ่ายในปัจจุบันของ ChatGPT Plus อยู่ที่ 20 เหรียญสหรัฐต่อเดือน แต่ OpenAI กำลังพิจารณาร่างโมเดลขนาดใหญ่ใหม่ ๆ เช่น "Strawberry" และ "Orion" ซึ่งเรียกว่า "ChatGPT 5" การชำระเงินรายเดือน 2,000 เหรียญสหรัฐฯ เท่ากับราคาที่เพิ่มขึ้น 100 เท่า นักวิเคราะห์เชื่อว่า OpenAI สามารถพิจารณาช่วงราคาที่สูงดังกล่าวได้สาเหตุหลักมาจากการขาดเงิน ผลิตภัณฑ์ใหม่ที่แข็งแกร่งเพียงพอ และผู้ใช้หลายร้อยล้านคน

ทำไมโมเดล “สตรอเบอร์รี่” จึงมีความสำคัญ? หรือกำหนดขอบเขตความสามารถของ AI ใหม่ และ ให้ข้อมูลการฝึกสังเคราะห์คุณภาพสูง สำหรับ GPT 5

Sam Altman ซีอีโอของ OpenAI กล่าวเมื่อต้นปีนี้ว่า "ทิศทางที่สำคัญที่สุดของความก้าวหน้าในด้านปัญญาประดิษฐ์คือความสามารถในการให้เหตุผล"

โครงการ "Strawberry" ถือเป็นแผน OpenAI "Q*" ที่เปิดเผยเมื่อปีที่แล้ว ผู้ที่ชมการสาธิตกล่าวว่าสามารถตอบคำถามทางวิทยาศาสตร์และคณิตศาสตร์ที่ยากลำบาก ซึ่งโมเดล AI เชิงพาณิชย์ในปัจจุบันไม่สามารถแก้ไขได้

การโพสต์ของอุลตร้าแมนเมื่อต้นเดือนสิงหาคมถือเป็นการอุ่นเครื่องสำหรับโปรเจ็กต์ "Strawberry" จากโลกภายนอก

OpenAI ได้ให้ แผนงานห้าขั้นตอนสำหรับการพัฒนา AI ในอนาคต เมื่อวันที่ 11 สิงหาคม ระยะแรกคือแชทบอท AI ในปัจจุบันพร้อมภาษาสนทนา และระยะที่สองคือ "ผู้ให้เหตุผล" ที่มีความสามารถในการแก้ปัญหาระดับมนุษย์ ขั้นตอนที่สามคือ “ตัวแทน” (ai agent) ที่สามารถดำเนินการได้ด้วยตนเอง ตามมาด้วย “นักประดิษฐ์” ที่สามารถช่วยในการประดิษฐ์ และ “ผู้จัดงาน” ที่สามารถดำเนินงานขององค์กรให้เสร็จสิ้นได้

" Strawberry" น่าจะเป็นกุญแจสำคัญในการช่วยให้ OpenAI บรรลุ AI ระดับที่สอง เมื่อประสบความสำเร็จ มันจะกำหนด ขอบเขตความสามารถของ AI ใหม่ ทำงานที่ซับซ้อนโดยอัตโนมัติ แก้ปัญหาที่ซับซ้อนอย่างอิสระ และตรวจสอบเนื้อหาเอาต์พุต ซึ่งเป็นตัวแทนของมนุษย์ในขั้นตอนเดียว ใกล้เคียงกับปัญญาประดิษฐ์ทั่วไป (AGI) "สตรอเบอร์รี่" ที่เน้นการใช้เหตุผลอาจเป็นวิธีเดียวที่จะวางรากฐานสำหรับโมเดล AI รุ่นต่อไป "Orion" หรือ ChatGPT 5

Ghazenfer Mansoor ผู้ก่อตั้งและซีอีโอของ Technology Rivers ซึ่งเป็นหน่วยงานพัฒนาซอฟต์แวร์ ชี้ให้เห็นว่าด้วยโครงการ "Strawberry" การแสวงหาระดับการใช้เหตุผลของมนุษย์ของ OpenAI ไม่เพียงแต่เป็นปาฏิหาริย์ทางเทคนิคเท่านั้น แต่ยังสามารถทลายขอบเขตและสร้างแรงบันดาลใจความเป็นไปได้ใหม่ๆ ในทุก ๆ ด้าน สนาม. ตัวอย่างเช่น ในด้านธุรกิจ ปัญญาประดิษฐ์จะสามารถเปลี่ยนวิธีการจัดการห่วงโซ่อุปทานได้อย่างมาก คาดการณ์แนวโน้มของตลาดได้อย่างแม่นยำ และทำให้ประสบการณ์ของลูกค้าเป็นส่วนตัวในวงกว้าง

ในระดับผู้ใช้ทั่วไป ประสบการณ์ผู้ใช้จะได้รับการปรับปรุงด้วย ตัวอย่างเช่น โมเดล AI ที่มีความสามารถในการให้เหตุผลไม่เพียงแต่สามารถจัดเตรียมแผนการเดินทางและคำแนะนำด้านสุขภาพที่เหมาะสมยิ่งขึ้นเท่านั้น แต่ยังวิเคราะห์พฤติกรรมการบริโภคของผู้ใช้และสร้างแผนงบประมาณที่ปรับแต่งได้อย่างเต็มที่อีกด้วย มาเป็นผู้ช่วยที่ชาญฉลาดยิ่งขึ้น

โดยรวมแล้ว ในสถานการณ์ที่เหมาะสมที่สุด Strawberry จะสามารถแก้ไขปัญหาและงานที่เกินความสามารถของโมเดล AI ในปัจจุบัน และดำเนินการ "เจาะลึก" ที่ "มีประสิทธิภาพเหนือกว่าแชทบอทที่มีอยู่"

นักวิเคราะห์คนอื่นๆ ชี้ให้เห็นว่าแผน "Strawberry" มีเป้าหมายที่จะระดมทุนเพิ่มเติม ซึ่ง OpenAI จำเป็นต้องสนับสนุนการพัฒนาโมเดลล้ำสมัยรุ่นต่อไปที่มีชื่อรหัสว่า "Orion" นอกจากนี้ การสร้างข้อมูลการฝึกสังเคราะห์คุณภาพสูงสำหรับโมเดล Orion ถือเป็นหนึ่งในแอปพลิเคชันหลักของ Strawberry "ซึ่งมีความสำคัญเนื่องจากข้อมูลการฝึกส่วนใหญ่บนอินเทอร์เน็ตหมดลงแล้ว":

ชุดข้อมูลขนาดใหญ่ที่โมเดล AI พึ่งพาอาจมีแนวโน้มที่จะเกิดอคติและข้อผิดพลาด หรือมีข้อมูลที่ไม่สมบูรณ์หรือไม่ถูกต้อง ข้อมูลสังเคราะห์คุณภาพสูงที่สร้างโดย Project Strawberry สามารถเติมเต็มช่องว่างในชุดข้อมูลในโลกแห่งความเป็นจริง และมอบชุดการฝึกอบรมที่ครอบคลุม ครอบคลุม และสมดุลมากขึ้น
หลายคนเชื่อว่าการใช้ข้อมูลสังเคราะห์สามารถช่วยให้โมเดลปัญญาประดิษฐ์ในอนาคตมีความเป็นกลางและยุติธรรมมากขึ้น และลดสัญญาณรบกวน ภาพหลอน และข้อมูลที่ไม่เกี่ยวข้อง ซึ่งจะช่วยปรับปรุงประสิทธิภาพของการฝึกอบรมและความแม่นยำของโมเดล
Project Strawberry ปรับปรุงการใช้เหตุผล ตรรกะ และความสามารถในการวางแผนและดำเนินการวิจัยตามสิ่งที่ทราบ ช่วยให้แบบจำลองดำเนินการทดลอง วิเคราะห์ข้อมูล และกำหนดสมมติฐานใหม่ได้โดยอัตโนมัติ สิ่งนี้อาจนำไปสู่ความก้าวหน้าทางวิทยาศาสตร์ รวมถึงการค้นพบยาใหม่ๆ โมเดลเหล่านี้ยังสามารถให้การศึกษาส่วนบุคคลและสร้างเนื้อหาทางการศึกษาและหลักสูตรแบบโต้ตอบได้

ตามที่ผู้คนคุ้นเคยกับเรื่องนี้ โครงการ "Strawberry" มีวิธี "หลังการฝึกอบรม" แบบพิเศษ กล่าวคือ หลังจากที่โมเดล AI แบบกำเนิดได้รับการฝึกอบรมล่วงหน้ากับชุดข้อมูลขนาดใหญ่แล้ว โมเดลดังกล่าวจะได้รับการปรับเปลี่ยนเพิ่มเติมเพื่อปรับปรุง ประสิทธิภาพในงานเฉพาะ ซึ่งคล้ายกับวิธี "Self-Taught Reasoner" (STaR) ที่พัฒนาโดยมหาวิทยาลัยสแตนฟอร์ดในปี 2022

Noah Goodman หนึ่งในผู้สร้าง STAR และศาสตราจารย์แห่งมหาวิทยาลัยสแตนฟอร์ด เคยกล่าวไว้ว่า STAR อนุญาตให้โมเดล AI สามารถสร้างข้อมูลการฝึกอบรมของตนเองซ้ำๆ และ "นำทาง" ตัวเองไปสู่ระดับสติปัญญาที่สูงขึ้น ตามทฤษฎีแล้ว สามารถนำมาใช้ได้ อนุญาตให้โมเดลภาษาบรรลุความฉลาดที่เหนือกว่ามนุษย์ แต่เขายังยอมรับด้วยว่า "นี่ทั้งน่าตื่นเต้นและน่ากลัว และมนุษย์จำเป็นต้องคิดอย่างจริงจังเกี่ยวกับสถานการณ์ของพวกเขา"