وفي الأوساط الأكاديمية، أصبح انتشار الأبحاث الكاذبة مشكلة خطيرة، مما يعيق بشكل خطير تقدم البحث العلمي ونشر المعرفة. ولمواجهة هذا التحدي، قام الباحث أحمد عابدين حميد من جامعة بينغهامتون في ولاية نيويورك بتطوير خوارزمية للتعلم الآلي تسمى xFakeSci، والتي يمكنها التعرف بشكل فعال على الأوراق الأكاديمية المزورة وتوفر الحفاظ على النزاهة الأكاديمية وسائل تقنية جديدة. ستستكشف هذه المقالة بعمق المبادئ والتطبيقات واتجاهات التطوير المستقبلية لخوارزمية xFakeSci، مما يوضح إمكاناتها الهائلة في مكافحة الاحتيال الأكاديمي.
في عصر الانفجار المعلوماتي الذي نعيشه اليوم، وخاصة في مجال البحث العلمي، أصبح من الصعب الوقاية من ظهور الأوراق المزورة.
ومؤخرًا، قام أحمد عابدين حامد، الباحث من جامعة بينجهامتون بولاية نيويورك، بتطوير خوارزمية للتعلم الآلي تسمى xFakeSci، يمكنها التعرف بدقة تصل إلى 94% على الأوراق الأكاديمية المزورة .
وقال حميد إن اتجاه بحثه الرئيسي هو المعلوماتية الطبية الحيوية، وخلال الوباء، ظهرت مقالات بحثية علمية مزيفة إلى ما لا نهاية.
أجرى هو وفريقه عددًا كبيرًا من التجارب، وأنتجوا 50 مقالًا مزيفًا حول ثلاثة موضوعات طبية شائعة: مرض الزهايمر والسرطان والاكتئاب، وأجروا تحليلًا مقارنًا بمقالات حقيقية حول نفس الموضوع. وبهذه الطريقة يأمل في اكتشاف الاختلافات والأنماط.
أثناء عملية البحث، استخرج حميد الأدبيات ذات الصلة باستخدام قاعدة بيانات PubMed التابعة للمعاهد الوطنية للصحة واستخدم الكلمات الرئيسية نفسها لطلب ChatGPT لإنشاء الأبحاث. أخبره حدسه أنه لا بد أن يكون هناك نمط ما بين الأوراق المزيفة والحقيقية.
نسبة العقدة إلى الحافة لمجموعات البيانات المختلفة ChatGPT والمقالات العلمية.
بعد تحليل متعمق، تركز خوارزمية xFakeSci بشكل أساسي على سمتين رئيسيتين: أولاً، الصور الكبيرة في المقالة، مثل "تغير المناخ"، "التجربة السريرية"، وما إلى ذلك، وثانيًا، ربط هذه الصور الكبيرة بكلمات وكلمات أخرى. المفاهيم.
ووجد أن عدد مجموعات الكلمات المزدوجة التي ظهرت في الأوراق المزيفة كان أقل بكثير من تلك الموجودة في الأوراق الحقيقية، على الرغم من أن هذه المجموعات كانت مرتبطة ارتباطًا وثيقًا بمحتوى آخر في الأوراق المزيفة.
وأشار إلى أن الأوراق البحثية التي ينتجها الذكاء الاصطناعي غالبا ما تكون مصممة لإقناع القراء، في حين أن هدف الباحثين البشريين هو الإبلاغ بصدق عن النتائج والأساليب التجريبية.
ويخطط حامد في المستقبل لتوسيع خوارزمية xFakeSci لتشمل المزيد من المجالات، بما في ذلك الهندسة والعلوم والعلوم الإنسانية، للتحقق مما إذا كانت خصائص الأوراق المزيفة متسقة. وأكد أنه مع التقدم المستمر لتكنولوجيا الذكاء الاصطناعي، سيزداد صعوبة التعرف على الأوراق الصحيحة والكاذبة. ولذلك، فإن تصميم حل شامل له أهمية خاصة.
على الرغم من أن الخوارزمية الحالية يمكنها اكتشاف 94% من الأوراق المزيفة، إلا أن 6% من الأوراق المزيفة قد تفلت من خلال الشبكة. وقال بكل تواضع إنه على الرغم من التقدم المهم الذي تم إحرازه، إلا أنه لا تزال هناك حاجة إلى بذل جهود متواصلة لتحسين معدلات الاعتراف وزيادة الوعي العام.
مدخل الورق: https://www.nature.com/articles/s41598-024-66784-6
تسليط الضوء على:
** الأداة الجديدة xFakeSci يمكنها التعرف على الأوراق البحثية العلمية المزيفة بدقة تصل إلى 94%، مما يحمي البحث العلمي. **
** أنتج الباحثون عددا كبيرا من الأوراق المزورة وقارنوها بالأوراق الحقيقية ووجدوا أن هناك اختلافات كبيرة في أساليب الكتابة بين الاثنين. **
** في المستقبل، سيتم توسيع نطاق تطبيق الخوارزمية لمواجهة التحديات المتزايدة التعقيد للأوراق البحثية التي يتم إنشاؤها بواسطة الذكاء الاصطناعي. **
يوفر ظهور خوارزمية xFakeSci سلاحًا قويًا لمكافحة الاحتيال الأكاديمي، لكنها لا تزال بحاجة إلى التحسين والتحسين المستمر. يتطلب تقدم التكنولوجيا والحفاظ على النزاهة الأكاديمية بذل جهود مشتركة لإنشاء نظام بيئي أكاديمي أكثر صحة.