เมื่อเร็วๆ นี้ Step Star ได้เปิดตัว Step-1o ซึ่งเป็นโมเดลคำพูดแบบ end-to-end ตัวแรกของจีนที่มีพารามิเตอร์ 100 พันล้านรายการ ถือเป็นความก้าวหน้าครั้งสำคัญในด้านเทคโนโลยีเสียงพูดในประเทศ ขั้นตอนที่ 1o ไม่เพียงแต่ประสบความสำเร็จในการบูรณาการความเข้าใจและการสร้างคำพูดอย่างสมบูรณ์แบบเท่านั้น แต่ยังปรับปรุงความฉลาดทางอารมณ์ของโมเดลและขีดจำกัดบนของ IQ อย่างก้าวกระโดด ทำให้ผู้ใช้ได้รับประสบการณ์การโต้ตอบด้วยเสียงที่เหนือธรรมชาติและมีคุณภาพสูง รองรับอินพุตและเอาท์พุตผสมเสียงและข้อความ สามารถตอบสนองได้อย่างรวดเร็วและขัดจังหวะได้ตลอดเวลา ช่วยเพิ่มความสะดวกในการโต้ตอบอย่างมาก
รุ่น Step-1o รองรับอินพุตและเอาท์พุตแบบผสม เช่น เสียงและข้อความ สามารถตอบสนองได้อย่างรวดเร็วและขัดจังหวะได้ตลอดเวลา ให้ประสบการณ์การโต้ตอบที่สะดวกสบาย นอกจากนี้ยังสามารถเข้าใจและเลียนแบบลักษณะเสียงได้อย่างลึกซึ้ง เช่น ทำนอง จังหวะ ภาษาถิ่น และนิสัยการแสดงออกทางวาจาส่วนบุคคล ทำให้เกิดเอฟเฟกต์ที่แสดงออกซึ่งมีความยืดหยุ่นและเต็มไปด้วยอารมณ์เหมือนคนจริง นอกจากนี้ Step-1o ยังเป็นโมเดลเสียงที่ "ชาญฉลาด" ที่ปรับปรุงคุณภาพการตอบสนองอย่างต่อเนื่องผ่านการศึกษาด้วยตนเองและเลียนแบบ โดยมีความรู้มากมายและสามารถให้คำแนะนำอย่างมืออาชีพและมิตรภาพที่มีคุณค่าทางอารมณ์สูง
คุณสมบัติหลักสามประการของโมเดลคำพูดขนาดใหญ่ Step-1o ได้แก่ ความฉลาดทางอารมณ์ออนไลน์ ซึ่งสามารถเข้าใจข้อมูลทางอารมณ์ที่อยู่เบื้องหลังความหมายและน้ำเสียงของมนุษย์ที่ซับซ้อน และมีความเข้าใจอย่างลึกซึ้งเกี่ยวกับจริยธรรมและกฎเกณฑ์ทางสังคม ซึ่งสามารถตอบคำถามได้ ในสาขาวิชาชีพต่างๆ ที่มีคุณภาพสูง มีความสามารถในการคิด มีความสามารถสูงในการเข้าใจ เลียนแบบ และสร้างสรรค์ สามารถเข้าใจรายละเอียดของการแสดงออกทางเสียงได้อย่างแม่นยำ และสร้างและบอกเล่าเรื่องราวเสียงที่แปลกประหลาดได้แบบเรียลไทม์
Step-1o มีแอปพลิเคชันที่หลากหลายและสามารถรองรับความต้องการของเทคโนโลยีการโต้ตอบด้วยเสียงในการออกอากาศข่าว เพื่อนสนทนา หนังสือเสียง การศึกษาออนไลน์ ฮาร์ดแวร์อัจฉริยะ รถยนต์ และอุตสาหกรรมอื่น ๆ
ในอนาคตอันใกล้นี้ Step-1o จะเชื่อมต่อกับแอป Yuewen เพื่อให้บริการโทรด้วยเสียงแบบเรียลไทม์ ในขณะนั้น ผู้ใช้สามารถสื่อสารกับ Step-1o ทางโทรศัพท์ และเพลิดเพลินกับบริการรับฟังและให้คำปรึกษาจากผู้ป่วย การเปิดตัวฟีเจอร์ใหม่นี้จะขยายสถานการณ์การใช้งานของขั้นตอนที่ 1o ต่อไป และมอบประสบการณ์การโต้ตอบด้วยเสียงที่สมบูรณ์ยิ่งขึ้นแก่ผู้ใช้
การเกิดขึ้นของ Step-1o ไม่เพียงแต่ทำให้ผู้ใช้ได้รับประสบการณ์การโต้ตอบด้วยเสียงที่สะดวกและชาญฉลาดมากขึ้นเท่านั้น แต่ยังบ่งชี้ว่าเทคโนโลยีปัญญาประดิษฐ์ด้วยเสียงกำลังพัฒนาไปในทิศทางที่มีมนุษยธรรมและชาญฉลาดมากขึ้น แนวโน้มการใช้งานในอนาคตนั้นคุ้มค่ากับการรอคอย ฟังก์ชันอันทรงพลังและสถานการณ์การใช้งานที่หลากหลายย่อมมีผลกระทบอย่างมากต่ออุตสาหกรรมต่างๆ