ห้องปฏิบัติการการวิจัยของ AI โอเพนซอร์ส Kyutai เพิ่งเปิดตัวโมเดลหลายรูปแบบที่เรียกว่า Moshi การเปิดตัวของ Moshi แสดงให้เห็นถึงศักยภาพที่ยิ่งใหญ่ของเทคโนโลยี AI ในการโต้ตอบด้วยเสียงและการใช้เหตุผลแบบเรียลไทม์นำประสบการณ์ใหม่มาสู่ผู้ที่ชื่นชอบ AI ทั่วโลก
ในตอนเช้าของวันที่ 4 กรกฎาคม Kyutai ประกาศการเกิดของ Moshi อย่างเป็นทางการผ่านเว็บไซต์ทางการ โมเดลนี้มีฟังก์ชั่นเช่นเดียวกับ GPT-4O ของ OpenAI และสามารถทำการถามตอบแบบเรียลไทม์ผ่านเสียง อย่างไรก็ตามแตกต่างจากโหมดเสียงของ GPT-4O ที่ต้องรอจนกว่าจะถึงฤดูใบไม้ร่วงที่จะเปิดอย่างเต็มที่ Moshi ได้เปิดให้สาธารณชนเข้าชมซึ่งทำให้เป็นรอบปฐมทัศน์ในตลาด
คุณสมบัติหลักของ Moshi นั้นรวมถึงความสามารถในหลายรูปแบบนั่นคือมันสามารถฟังคำถามเสียงของผู้ใช้และดำเนินการตอบรับการอนุมานแบบเรียลไทม์ นอกจากนี้โหมดเสียงของ Moshi ยังเปิดอย่างเต็มที่และเปรียบเทียบกับแผนการเปิดตัวฤดูใบไม้ร่วงของ GPT-4O Moshi มอบประสบการณ์ที่เร็วขึ้นผู้ใช้ ที่สำคัญกว่านั้น Moshi ไม่มีข้อ จำกัด ในระดับภูมิภาคและสามารถใช้งานได้โดยผู้ใช้ทั่วโลกและรองรับโทรศัพท์มือถือ
Kyutai ยังวางแผนที่จะโอเพ่นซอร์ส Moshi และจะเผยแพร่รหัสน้ำหนักและเอกสารการเคลื่อนไหวนี้ไม่เพียง แต่สะท้อนให้เห็นถึงการคงอยู่ของ Kyutai ในจิตวิญญาณโอเพ่น
การเปิดตัวของ Moshi นั้นเป็นความพยายามอย่างกล้าหาญสำหรับเทคโนโลยี AI อย่างไม่ต้องสงสัย ไม่เพียง แต่มีความสามารถในการฟังและพูด แต่ยังอาจแสดงความสามารถในการมองเห็นในอนาคตซึ่งทำให้เราตั้งตารออนาคตของ AI กระบวนการใช้ Moshi นั้นง่ายมาก
เป็นมูลค่าการกล่าวขวัญว่าการสนับสนุนของ Moshi สำหรับแมนดารินจำเป็นต้องได้รับการปรับปรุงและการถามคำถามเป็นภาษาอังกฤษจะให้ประสบการณ์ที่ดีขึ้นแก่คุณ นอกจากนี้ Moshi ไม่ได้ถูกล็อคและสามารถใช้งานได้โดยตรงไม่ว่าคุณจะอยู่ที่ไหนซึ่งไม่ต้องสงสัยเลยว่าจะให้ความสะดวกสบายอย่างมากสำหรับผู้ที่ชื่นชอบ AI ทั่วโลก
การเคลื่อนไหวครั้งนี้โดยห้องปฏิบัติการ Kyutai ยังแสดงให้เห็นถึงความเพียรของพวกเขาในจิตวิญญาณโอเพ่นซอร์ส พวกเขาวางแผนที่จะโอเพนซอร์สโมชิเร็ว ๆ นี้เผยแพร่รหัสน้ำหนักแบบจำลองและเอกสารเพื่อให้นักพัฒนาและนักวิจัยทั่วโลกสามารถมีส่วนร่วมในการพัฒนาและการเพิ่มประสิทธิภาพของ Moshi
ในแง่ของประสบการณ์การใช้งานความเร็วในการตอบสนองของ Moshi นั้นเร็วมากและแม้เมื่อใช้กับเส้นทางระดับชาติก็สามารถตอบคำถามได้โดยแทบจะไม่ล่าช้า ปัจจุบัน Moshi ส่วนใหญ่สนับสนุนการสนับสนุนภาษาอังกฤษและฝรั่งเศสและจีนและจีนจะต้องได้รับการปรับปรุง กระบวนการลงทะเบียนนั้นง่ายเพียงส่งที่อยู่อีเมลของคุณ Moshi แสดงให้เห็นถึงความสามารถในการฟังและพูดและอาจเพิ่มความสามารถในการดูในอนาคต โทนสีมานุษยวิทยาของ Moshi เป็นหนึ่งในคุณสมบัติที่สำคัญของมันด้วยกลิ่นของเครื่องน้อยมากซึ่งทำให้ประสบการณ์การสนทนาเป็นธรรมชาติและราบรื่นยิ่งขึ้น
แน่นอนคำตอบปัจจุบันของ Moshi ยังคงค่อนข้าง จำกัด และสามารถให้โครงร่างและสรุปทั่วไปเท่านั้น แต่ด้วยการทำซ้ำอย่างต่อเนื่องและการเพิ่มประสิทธิภาพของผลิตภัณฑ์เราเชื่อว่าคำตอบของ Moshi จะมีรายละเอียดและแม่นยำมากขึ้น
นอกจากนี้การเปิดตัวของ Moshi จะส่งผลกระทบอย่างลึกซึ้งต่ออุตสาหกรรมการศึกษา ตัวอย่างเช่น AI สามารถให้คำอธิบายแบบวงกลมแก่นักเรียนซึ่งมีขนาดใหญ่สำหรับการศึกษา เราหวังว่าจะได้ผลิตภัณฑ์ที่คล้ายคลึงกันมากขึ้นในอนาคตสนับสนุนภาษาท้องถิ่นมากขึ้นและทำให้เทคโนโลยี AI ใกล้ชิดกับชีวิตของผู้คนมากขึ้น