في عصر الانفجار المعلوماتي، أصبح تحليل البيانات النصية القصيرة تحديًا كبيرًا في مجال الذكاء الاصطناعي. نظرًا للكمية المحدودة من المعلومات في النصوص القصيرة وعدم وجود ارتباط سياقي، يصعب معالجة طرق التحليل التقليدية بشكل فعال. اتخذ جاستن ميلر، وهو طالب دراسات عليا في جامعة سيدني، نهجا مختلفا وطور طريقة جديدة لتحليل النص القصير باستخدام نماذج لغوية كبيرة (LLMs) لتوفير حل مبتكر لهذه المشكلة. ولا تعمل نتائج بحثه على تحسين كفاءة ودقة تحليل النص القصير فحسب، بل توضح أيضًا الإمكانات الهائلة للذكاء الاصطناعي في معالجة المعلومات وفهمها، مما يوفر رؤى أعمق للبيانات لمختلف مجالات المجتمع.
في العالم الرقمي اليوم، أصبح استخدام النصوص القصيرة أمرًا أساسيًا في التواصل عبر الإنترنت. ومع ذلك، نظرًا لأن هذه النصوص غالبًا ما تفتقر إلى مفردات أو سياق مشترك، يواجه الذكاء الاصطناعي (AI) العديد من التحديات عند تحليلها. وفي هذا الصدد، اقترح جوستين ميلر، طالب الدراسات العليا في الأدب الإنجليزي وعالم البيانات في جامعة سيدني، طريقة جديدة تستخدم نماذج اللغة الكبيرة (LLMs) لإجراء فهم وتحليل متعمق للنصوص القصيرة.
تركز أبحاث ميلر على كيفية تصنيف كميات كبيرة من النصوص القصيرة بشكل فعال، مثل ملفات تعريف الوسائط الاجتماعية، أو تعليقات العملاء، أو التعليقات عبر الإنترنت المتعلقة بأحداث الكوارث. يمكن لأداة الذكاء الاصطناعي التي طورها تجميع عشرات الآلاف من الملفات الشخصية لمستخدمي تويتر في عشر فئات سهلة الفهم، وقد نجحت هذه العملية في تحليل ما يقرب من 40 مشاركة حول الرئيس الأمريكي ترامب في يومين في سبتمبر 2020. وقد تم تحليل 000 ملف شخصي لمستخدمي تويتر. يمكن أن يساعد هذا التصنيف في تحديد الميول المهنية للمستخدمين ومواقفهم السياسية وحتى الرموز التعبيرية التي يستخدمونها.
"إن أهم ما يميز هذا البحث هو مفهومه للتصميم الإنساني." وقال ميلر إن التصنيف الذي تم إنشاؤه باستخدام نماذج لغوية كبيرة ليس فعالاً من الناحية الحسابية فحسب، بل يتوافق أيضًا مع الفهم البشري البديهي. يُظهر بحثه أيضًا أن الذكاء الاصطناعي التوليدي مثل ChatGPT يمكنه في بعض الحالات توفير أسماء تصنيف أكثر وضوحًا واتساقًا من المراجعين البشريين، خاصة عندما يتعلق الأمر بتمييز أنماط ذات معنى من ضجيج الخلفية.
تتمتع أداة ميلر بإمكانية استخدام مجموعة متنوعة من التطبيقات. يُظهر بحثه أنه يمكن تقليل مجموعات البيانات الكبيرة إلى مجموعات ذات معنى ويمكن التحكم فيها. على سبيل المثال، في مشروع حول الحرب الروسية الأوكرانية، قام بتجميع أكثر من مليون منشور على وسائل التواصل الاجتماعي وحدد عشرة مواضيع مختلفة، بما في ذلك حملة التضليل الروسية واستخدام الحيوانات كرموز في الإغاثة الإنسانية. بالإضافة إلى ذلك، من خلال هذه المجموعات، يمكن للمؤسسات والحكومات والشركات الحصول على رؤى قابلة للتنفيذ للمساعدة في اتخاذ قرارات أكثر استنارة.
واختتم ميلر قائلاً: "إن هذا التطبيق ثنائي الاستخدام للذكاء الاصطناعي لا يقلل الاعتماد على المراجعة البشرية المكلفة والموضوعية فحسب، بل يمنحنا أيضًا طريقة قابلة للتطوير لفهم كميات كبيرة من البيانات النصية بدءًا من تحليل اتجاهات وسائل التواصل الاجتماعي وحتى مراقبة الأزمات ورؤى العملاء ويجمع هذا النهج بشكل فعال بين كفاءة الآلات والفهم البشري، مما يوفر أفكارًا جديدة لتنظيم البيانات وتفسيرها.
يقدم بحث ميلر أفكارًا جديدة لتحليل بيانات النصوص القصيرة. تتمتع أدوات الذكاء الاصطناعي التي طورها بآفاق تطبيقية واسعة وتوفر دعمًا قويًا لتحليل البيانات واتخاذ القرار في مختلف المجالات مجال معالجة المعلومات الدور الأكثر أهمية.