โมเดลภาษาขนาดใหญ่ราศีเมถุน (LLM) ของ Google แสดงให้เห็นศักยภาพที่น่าทึ่งในเวลาเพียงหกเดือน โดยเฉพาะอย่างยิ่งในด้านสุขภาพ รุ่นอนุพันธ์ PH-LLM ได้รับการออกแบบมาเพื่อประมวลผลข้อมูลอุปกรณ์ที่สวมใส่ได้ และมีประสิทธิภาพเหนือกว่าผู้เชี่ยวชาญที่มีประสบการณ์ในด้านคำแนะนำการนอนหลับและการออกกำลังกาย บทความนี้จะเจาะลึกถึงประสิทธิภาพที่โดดเด่นของ PH-LLM ข้อจำกัด และทิศทางการพัฒนาในอนาคต
โมเดล Gemini ของ Google มีอายุเพียง 6 เดือนและได้แสดงให้เห็นความสามารถที่น่าประทับใจในด้านความปลอดภัย การเขียนโค้ด การแก้ไขจุดบกพร่อง และด้านอื่นๆ แล้ว แน่นอนว่ายังแสดงให้เห็นถึงข้อจำกัดที่ร้ายแรงอีกด้วย อย่างไรก็ตาม โมเดลภาษาขนาดใหญ่ (LLM) นี้มีประสิทธิภาพเหนือกว่ามนุษย์ในด้านคำแนะนำการนอนหลับและการออกกำลังกาย นักวิจัยที่ Google ได้เปิดตัวโมเดลภาษาขนาดใหญ่ด้านสุขภาพส่วนบุคคล (PH-LLM) ซึ่งเป็นเวอร์ชันที่ได้รับการปรับแต่งอย่างละเอียดของ Gemini ซึ่งสามารถเข้าใจและให้เหตุผลเกี่ยวกับข้อมูลสุขภาพส่วนบุคคลอนุกรมเวลาจากอุปกรณ์สวมใส่ได้ เช่น นาฬิกาอัจฉริยะ และเครื่องวัดอัตราการเต้นของหัวใจ ในการทดลอง แบบจำลองนี้ตอบและทำนายคำถามได้ดีกว่าผู้เชี่ยวชาญที่มีประสบการณ์ด้านสุขภาพและฟิตเนสมานานหลายปี
เทคโนโลยีอุปกรณ์สวมใส่สามารถช่วยให้ผู้คนติดตามสุขภาพของตนเองและทำการเปลี่ยนแปลงที่มีความหมายได้ อุปกรณ์ดังกล่าวมี "แหล่งข้อมูลที่สมบูรณ์และยาวนาน" ซึ่งสามารถ "รับมาแบบเฉยๆ และต่อเนื่อง" จากข้อมูลต่างๆ เช่น บันทึกการออกกำลังกายและอาหาร ไดอารี่อารมณ์ และบางครั้งก็แม้แต่กิจกรรมบนโซเชียลมีเดีย อย่างไรก็ตาม ข้อมูลที่พวกเขารวบรวมเกี่ยวกับการนอนหลับ การออกกำลังกาย สุขภาพของหัวใจและเมตาบอลิซึม และความเครียด ไม่ค่อยถูกรวมเข้ากับการตั้งค่าทางคลินิกแบบ "ทีละน้อย" นักวิจัยคาดการณ์ว่านี่อาจเป็นเพราะข้อมูลถูกบันทึกโดยไม่มีบริบท และต้องใช้คอมพิวเตอร์จำนวนมากในการจัดเก็บและวิเคราะห์ นอกจากนี้ การตีความข้อมูลเหล่านี้อาจทำได้ยาก
อย่างไรก็ตาม นักวิจัยที่ Google ได้สร้างความก้าวหน้าในการฝึกอบรมโมเดล PH-LLM เพื่อให้คำแนะนำ ตอบคำถามในการสอบระดับมืออาชีพ และคาดการณ์ผลลัพธ์ของการรบกวนการนอนหลับและความผิดปกติของการนอนหลับที่รายงานด้วยตนเอง แบบจำลองนี้ได้รับคำถามแบบปรนัย และนักวิจัยยังใช้วิธี "การเชื่อมโยงความคิด" (เลียนแบบการใช้เหตุผลของมนุษย์) และวิธี "zero-shot" (ระบุวัตถุและแนวคิดที่ไม่เคยพบมาก่อน)
สิ่งที่น่าประทับใจคือ PH-LLM ได้คะแนนในการทดสอบการนอนหลับ 79% และการทดสอบสมรรถภาพทางกาย 88% ซึ่งทั้งสองคะแนนเกินคะแนนเฉลี่ยของกลุ่มตัวอย่างผู้เชี่ยวชาญที่เป็นมนุษย์ ซึ่งรวมถึงผู้ฝึกสอนกีฬามืออาชีพ 5 คน (ประสบการณ์เฉลี่ย 13.8 ปี) และ ผู้เชี่ยวชาญด้านเวชศาสตร์การนอนหลับ 5 คน (ประสบการณ์เฉลี่ย 25 ปี) คะแนนเฉลี่ยของผู้เชี่ยวชาญที่เป็นมนุษย์ในด้านฟิตเนสและการนอนหลับอยู่ที่ 71% และ 76% ตามลำดับ
“ในขณะที่จำเป็นต้องมีการพัฒนาและประเมินผลเพิ่มเติมในด้านสุขภาพส่วนบุคคล ผลลัพธ์เหล่านี้แสดงให้เห็นถึงฐานความรู้ที่กว้างขวางและความสามารถของแบบจำลองราศีเมถุน” นักวิจัยตั้งข้อสังเกต
เพื่อให้บรรลุผลดังกล่าว นักวิจัยได้สร้างและรวบรวมชุดข้อมูล 3 ชุดเพื่อทดสอบข้อมูลเชิงลึกส่วนบุคคลและคำแนะนำจากอุปกรณ์สวมใส่ได้ ความเชี่ยวชาญเฉพาะด้าน และการคาดการณ์คุณภาพการนอนหลับที่รายงานด้วยตนเอง พวกเขาทำงานร่วมกับผู้เชี่ยวชาญในโดเมนเพื่อสร้างกรณีศึกษา 857 กรณีซึ่งนำเสนอสถานการณ์ในชีวิตจริงในด้านการนอนหลับและการออกกำลังกาย Sleep Scenes ใช้ตัวชี้วัดแต่ละตัวเพื่อระบุปัจจัยพื้นฐานและให้คำแนะนำส่วนบุคคลเพื่อช่วยปรับปรุงคุณภาพการนอนหลับ งานด้านฟิตเนสใช้ข้อมูลจากการฝึก การนอนหลับ ตัวชี้วัดสุขภาพ และความคิดเห็นของผู้ใช้เพื่อพัฒนาคำแนะนำสำหรับความเข้มข้นของการออกกำลังกายในแต่ละวัน
กรณีศึกษาทั้งสองประกอบด้วยข้อมูลเซ็นเซอร์ที่สวมใส่ได้ รวมถึงข้อมูลการนอนหลับสูงสุด 29 วัน และข้อมูลการออกกำลังกายนานกว่า 30 วัน พร้อมด้วยข้อมูลประชากร (อายุและเพศ) และการวิเคราะห์โดยผู้เชี่ยวชาญ
แม้ว่านักวิจัยจะตั้งข้อสังเกตว่า PH-LLM เป็นเพียงจุดเริ่มต้น เช่นเดียวกับเทคโนโลยีเกิดใหม่อื่นๆ แต่ก็ยังมีปัญหาบางอย่างที่ต้องแก้ไข ตัวอย่างเช่น การตอบสนองที่สร้างโดยแบบจำลองไม่สอดคล้องกันเสมอไป มีข้อสมมติเกี่ยวกับ "ความแตกต่างที่มีนัยสำคัญ" ในกรณีศึกษา และบางครั้ง LLM ก็ดูอนุรักษ์นิยมหรือระมัดระวังในการตอบสนอง ในกรณีศึกษาด้านฟิตเนส แบบจำลองดังกล่าวไวต่อการฝึกมากเกินไป และในกรณีหนึ่ง ผู้เชี่ยวชาญที่เป็นมนุษย์ตั้งข้อสังเกตว่าแบบจำลองนี้ล้มเหลวในการระบุสาเหตุที่เป็นไปได้ของการบาดเจ็บจากการอดนอน นอกจากนี้ กรณีศึกษายังครอบคลุมถึงกลุ่มประชากรที่หลากหลายและบุคคลที่ค่อนข้างกระตือรือร้น ดังนั้นจึงอาจไม่ได้เป็นตัวแทนของประชากรทั้งหมดหรือแก้ไขปัญหาการนอนหลับและการออกกำลังกายในวงกว้าง
โดยสรุป การประยุกต์ใช้ PH-LLM ในด้านสุขภาพส่วนบุคคลแสดงให้เห็นถึงศักยภาพที่ดี แต่ยังต้องมีการปรับปรุงเพิ่มเติม การวิจัยในอนาคตควรมุ่งเน้นไปที่ความสม่ำเสมอ ความทนทาน และการนำไปประยุกต์ใช้กับประชากรในวงกว้าง เพื่อให้มั่นใจว่าการใช้งานจะปลอดภัยและมีประสิทธิภาพในสถานการณ์จริง