วันนี้ด้วยการพัฒนาที่เพิ่มขึ้นของเทคโนโลยีอินเทอร์เฟซสมอง (BCI) เทคโนโลยี Meta AI รุ่นล่าสุดของ Meta AI ได้นำความหวังใหม่มาสู่สาขานี้ BCI ได้รับการออกแบบมาเพื่อให้การสื่อสารสำหรับผู้ที่มีความผิดปกติในการพูดหรือการเคลื่อนไหว แต่วิธีการดั้งเดิมมักจะต้องมีการผ่าตัดรุกรานเช่นการปลูกฝังขั้วไฟฟ้าซึ่งไม่เพียง แต่มีความเสี่ยงทางการแพทย์ แต่ยังต้องมีการบำรุงรักษาระยะยาว ดังนั้นนักวิจัยจึงเริ่มสำรวจทางเลือกที่ไม่รุกรานโดยเฉพาะอย่างยิ่งผู้ที่ใช้ Electroencephalography (EEG) อย่างไรก็ตามเทคโนโลยี EEG เผชิญกับปัญหาของการแก้ไขสัญญาณต่ำซึ่งส่งผลต่อความแม่นยำ
หมายเหตุแหล่งที่มาของภาพ: ภาพถูกสร้างขึ้นโดย AI และผู้ให้บริการที่ได้รับอนุญาตภาพ Midjourney
Brain2Qwerty เปิดตัวเพื่อแก้ปัญหานี้ รูปแบบการเรียนรู้ลึกนี้สามารถถอดรหัสประโยคป้อนข้อมูลของผู้เข้าร่วมจากกิจกรรมสมองที่ EEG หรือการถ่ายภาพด้วยคลื่นสนามแม่เหล็กสมอง (MEG) ในการศึกษาผู้เข้าร่วมเข้าร่วมประโยคที่จดจำสั้น ๆ ในคีย์บอร์ด QWERTY ในขณะที่กิจกรรมสมองของพวกเขาถูกบันทึกไว้แบบเรียลไทม์ ซึ่งแตกต่างจากความพยายามก่อนหน้านี้ในการมุ่งเน้นไปที่การกระตุ้นภายนอกหรือการเคลื่อนไหวที่จินตนาการ Brain2Qwerty ใช้การเคลื่อนไหวการพิมพ์ตามธรรมชาติเพื่อให้วิธีที่ใช้งานง่ายมากขึ้นในการตีความคลื่นสมอง
สถาปัตยกรรมของ Brain2Qwerty แบ่งออกเป็นสามโมดูลหลัก อย่างแรกคือโมดูล Convolution ซึ่งรับผิดชอบในการแยกลักษณะทางโลกและเชิงพื้นที่ในสัญญาณ EEG หรือ MEG ถัดไปคือโมดูลหม้อแปลงซึ่งประมวลผลลำดับของอินพุตปรับความเข้าใจและการแสดงออกให้เหมาะสม ในที่สุดก็มีโมดูลโมเดลภาษาซึ่งเป็นรูปแบบภาษาระดับตัวละครที่ผ่านการฝึกอบรมมาก่อนที่ใช้ในการแก้ไขและปรับปรุงความแม่นยำของการถอดรหัสผลลัพธ์
เมื่อประเมินประสิทธิภาพของ Brain2Qwerty นักวิจัยใช้อัตราความผิดพลาดของตัวละคร (CER) เป็นมาตรการ ผลการวิจัยพบว่าการถอดรหัส CER ที่ใช้ EEG คือ 67%ซึ่งค่อนข้างสูง ในการทดลองนักแสดงที่ดีที่สุดถึง 19% ของ CERS แสดงศักยภาพของแบบจำลองภายใต้เงื่อนไขที่เหมาะสม
แม้ว่า Brain2Qwerty ได้แสดงให้เห็นถึงโอกาสในเชิงบวกในสนาม BCI ที่ไม่รุกราน แต่ก็เผชิญกับความท้าทายหลายประการ ขั้นแรกโมเดลปัจจุบันจำเป็นต้องประมวลผลประโยคที่สมบูรณ์แทนการถอดรหัสคีย์ทีละตัว ประการที่สองแม้ว่า MEG จะมีประสิทธิภาพที่ดีกว่า EEG แต่อุปกรณ์ของมันไม่สามารถพกพาได้และมีความนิยมไม่เพียงพอ ในที่สุดการศึกษาครั้งนี้ได้ดำเนินการเป็นหลักในผู้เข้าร่วมที่มีสุขภาพดีและจำเป็นต้องสำรวจการบังคับใช้กับผู้ที่มีความผิดปกติของการออกกำลังกายหรือการพูดในอนาคต
กระดาษ: https://ai.meta.com/research/publications/brain-to-text-decoding-a-non-invasive-approach-via-typing/
ประเด็นสำคัญ:
โมเดล Brain2Qwerty ที่เปิดตัวโดย Meta AI สามารถถอดรหัสเนื้อหาการพิมพ์ผ่าน EEG และ MEG นำความหวังใหม่มาสู่เทคโนโลยี BCI
ผลการศึกษาพบว่าอัตราความผิดพลาดของตัวละครที่ใช้สำหรับการถอดรหัสโดยใช้ MEG นั้นต่ำกว่า EEG อย่างมีนัยสำคัญโดยผู้เข้าร่วมที่ดีที่สุดถึง 19% ของ CER
ความท้าทายในอนาคตรวมถึงการถอดรหัสแบบเรียลไทม์การเข้าถึงอุปกรณ์ MEG และเอฟเฟกต์แอปพลิเคชันระหว่างคนพิการ
ผลลัพธ์เหล่านี้แสดงให้เห็นว่าเทคโนโลยี BCI ที่ไม่รุกรานค่อยๆถูกนำไปใช้และคาดว่าจะให้เครื่องมือการสื่อสารที่มีประสิทธิภาพสำหรับผู้คนจำนวนมากในอนาคต