ในยุคแห่งการระเบิดของข้อมูล การวิเคราะห์ข้อมูลข้อความสั้นกลายเป็นความท้าทายที่สำคัญในด้านปัญญาประดิษฐ์ เนื่องจากข้อมูลในข้อความสั้นมีจำนวนจำกัดและขาดการเชื่อมโยงตามบริบท วิธีการวิเคราะห์แบบดั้งเดิมจึงยากต่อการประมวลผลอย่างมีประสิทธิภาพ Justin Miller นักศึกษาระดับบัณฑิตศึกษาจากมหาวิทยาลัยซิดนีย์ ได้ใช้แนวทางที่แตกต่างออกไป และพัฒนาวิธีการวิเคราะห์ข้อความสั้นแบบใหม่โดยใช้โมเดลภาษาขนาดใหญ่ (LLM) เพื่อมอบแนวทางแก้ไขปัญหาที่เป็นนวัตกรรมใหม่ให้กับปัญหานี้ ผลการวิจัยของเขาไม่เพียงแต่ปรับปรุงประสิทธิภาพและความแม่นยำของการวิเคราะห์ข้อความสั้นเท่านั้น แต่ยังแสดงให้เห็นถึงศักยภาพมหาศาลของปัญญาประดิษฐ์ในการประมวลผลและการทำความเข้าใจข้อมูล โดยให้ข้อมูลเชิงลึกที่ลึกซึ้งยิ่งขึ้นสำหรับสาขาต่างๆ ของสังคม
ในโลกดิจิทัลปัจจุบัน การใช้ข้อความสั้นกลายเป็นศูนย์กลางของการสื่อสารออนไลน์ อย่างไรก็ตาม เนื่องจากข้อความเหล่านี้มักจะขาดคำศัพท์หรือบริบทที่เหมือนกัน ปัญญาประดิษฐ์ (AI) จึงเผชิญกับความท้าทายมากมายเมื่อวิเคราะห์สิ่งเหล่านี้ ในเรื่องนี้ จัสติน มิลเลอร์ นักศึกษาระดับบัณฑิตศึกษาวรรณคดีอังกฤษและนักวิทยาศาสตร์ข้อมูลที่มหาวิทยาลัยซิดนีย์ ได้เสนอวิธีการใหม่ที่ใช้โมเดลภาษาขนาดใหญ่ (LLM) เพื่อทำความเข้าใจเชิงลึกและวิเคราะห์ข้อความสั้น
การวิจัยของมิลเลอร์มุ่งเน้นไปที่วิธีการจำแนกข้อความสั้นจำนวนมากอย่างมีประสิทธิภาพ เช่น โปรไฟล์โซเชียลมีเดีย ความคิดเห็นของลูกค้า หรือความคิดเห็นออนไลน์ที่เกี่ยวข้องกับเหตุการณ์ภัยพิบัติ เครื่องมือ AI ที่เขาพัฒนาขึ้นสามารถจัดกลุ่มโปรไฟล์ผู้ใช้ Twitter นับหมื่นเป็นสิบหมวดหมู่ที่เข้าใจง่าย กระบวนการนี้วิเคราะห์โพสต์เกี่ยวกับประธานาธิบดีทรัมป์ของสหรัฐอเมริกาได้สำเร็จเกือบ 40 รายการในสองวันในเดือนกันยายน 2563 โปรไฟล์ผู้ใช้ Twitter 000 ราย การจัดหมวดหมู่นี้สามารถช่วยระบุได้ไม่เพียงแต่ความโน้มเอียงทางอาชีพของผู้ใช้ จุดยืนทางการเมือง และแม้แต่อิโมจิที่พวกเขาใช้เท่านั้น
"จุดเด่นของการวิจัยครั้งนี้คือแนวคิดของการออกแบบที่เห็นอกเห็นใจ" มิลเลอร์กล่าวว่าการจำแนกประเภทที่สร้างขึ้นโดยใช้แบบจำลองภาษาขนาดใหญ่ไม่เพียงแต่มีประสิทธิภาพในการคำนวณเท่านั้น แต่ยังสอดคล้องกับความเข้าใจตามสัญชาตญาณของมนุษย์อีกด้วย งานวิจัยของเขายังแสดงให้เห็นว่า generative AI เช่น ChatGPT ในบางกรณีสามารถให้ชื่อการจำแนกประเภทที่ชัดเจนและสอดคล้องกันมากกว่าผู้ตรวจสอบที่เป็นมนุษย์ โดยเฉพาะอย่างยิ่งเมื่อพูดถึงรูปแบบที่มีความหมายที่แยกแยะจากเสียงรบกวนในพื้นหลัง
เครื่องมือของมิลเลอร์มีศักยภาพในการใช้งานที่หลากหลาย งานวิจัยของเขาแสดงให้เห็นว่าชุดข้อมูลขนาดใหญ่สามารถลดลงเป็นกลุ่มที่สามารถจัดการได้และมีความหมาย ตัวอย่างเช่น ในโครงการเกี่ยวกับสงครามรัสเซีย-ยูเครน เขาได้รวบรวมโพสต์บนโซเชียลมีเดียมากกว่า 1 ล้านโพสต์ และระบุหัวข้อที่แตกต่างกัน 10 หัวข้อ รวมถึงการรณรงค์บิดเบือนข้อมูลของรัสเซีย และการใช้สัตว์เป็นสัญลักษณ์ในการบรรเทาทุกข์ด้านมนุษยธรรม นอกจากนี้ องค์กร รัฐบาล และธุรกิจต่างๆ สามารถรับข้อมูลเชิงลึกที่นำไปใช้ได้จริงเพื่อช่วยในการตัดสินใจอย่างมีข้อมูลมากขึ้นผ่านคลัสเตอร์เหล่านี้
Miller สรุป: “แอปพลิเคชัน AI แบบใช้คู่นี้ไม่เพียงแต่ลดการพึ่งพาการตรวจสอบโดยมนุษย์ซึ่งมีค่าใช้จ่ายสูงเท่านั้น แต่ยังช่วยให้เรามีวิธีที่ปรับขนาดได้ในการทำความเข้าใจข้อมูลข้อความจำนวนมาก ตั้งแต่การวิเคราะห์แนวโน้มของโซเชียลมีเดียไปจนถึงการติดตามภาวะวิกฤติและข้อมูลเชิงลึกของลูกค้า แนวทางนี้เป็นการผสมผสานประสิทธิภาพของเครื่องจักรเข้ากับความเข้าใจของมนุษย์อย่างมีประสิทธิภาพ โดยให้แนวคิดใหม่ๆ สำหรับองค์กรและการตีความข้อมูล”
การวิจัยของมิลเลอร์นำเสนอแนวคิดใหม่สำหรับการวิเคราะห์ข้อมูลข้อความสั้น ๆ เครื่องมือ AI ที่พัฒนาโดยเขามีแนวโน้มการใช้งานที่กว้างขวางและให้การสนับสนุนที่แข็งแกร่งสำหรับการวิเคราะห์ข้อมูลและการตัดสินใจในด้านต่าง ๆ ซึ่งบ่งชี้ว่าปัญญาประดิษฐ์จะมีบทบาทสำคัญมากขึ้น ด้านการประมวลผลข้อมูลมีบทบาทสำคัญมากขึ้น