Failed ML
1.0.0
"النجاح ليس نهائيا، والفشل ليس قاتلا. إن الشجاعة للاستمرار هي التي تهم. - ونستون تشرشل
إذا كنت تبحث عن أمثلة لكيفية فشل التعلم الآلي على الرغم من كل إمكاناته المذهلة، فقد وصلت إلى المكان الصحيح. بالإضافة إلى قصص النجاح الرائعة للتعلم الآلي التطبيقي، إليك قائمة بالمشاريع الفاشلة التي يمكننا أن نتعلم منها الكثير.
عنوان | وصف |
---|---|
نظام التوظيف في أمازون AI | تم إلغاء نظام التوظيف الآلي المدعوم بالذكاء الاصطناعي بعد وجود أدلة على التمييز ضد المرشحات |
Genderify - أداة تحديد الجنس | تم إيقاف أداة مدعومة بالذكاء الاصطناعي مصممة لتحديد الجنس بناءً على مجالات مثل الاسم وعنوان البريد الإلكتروني بسبب التحيزات وعدم الدقة |
التسرب وأزمة التكاثر في العلوم القائمة على تعلم الآلة | وجد فريق من جامعة برينستون 20 مراجعة عبر 17 مجالًا علميًا اكتشفت أخطاء كبيرة (على سبيل المثال، تسرب البيانات، عدم تقسيم اختبار التدريب) في 329 ورقة بحثية تستخدم العلوم القائمة على تعلم الآلة |
نماذج تشخيص وفرز كوفيد-19 | تم تطوير المئات من النماذج التنبؤية لتشخيص أو فرز مرضى كوفيد-19 بشكل أسرع، ولكن في النهاية لم يكن أي منها مناسبًا للاستخدام السريري، وبعضها قد يكون ضارًا |
خوارزمية النكوص كومباس | وجد نظام مخاطر العودة إلى الإجرام في فلوريدا دليلاً على التحيز العنصري |
أداة فحص رعاية الطفل في ولاية بنسلفانيا | حددت الخوارزمية التنبؤية (التي تساعد في تحديد العائلات التي سيتم التحقيق فيها من قبل الأخصائيين الاجتماعيين فيما يتعلق بإساءة معاملة الأطفال وإهمالهم) عددًا غير متناسب من الأطفال السود لإجراء تحقيقات الإهمال "الإلزامية". |
أداة فحص رعاية الطفل في ولاية أوريغون | أداة تنبؤية مماثلة لتلك الموجودة في ولاية بنسلفانيا، تم أيضًا إيقاف خوارزمية الذكاء الاصطناعي لرعاية الأطفال في ولاية أوريغون بعد شهر من تقرير بنسلفانيا |
التنبؤ بالمخاطر الصحية لنظام الرعاية الصحية في الولايات المتحدة | أظهرت خوارزمية مستخدمة على نطاق واسع للتنبؤ باحتياجات الرعاية الصحية تحيزًا عنصريًا، حيث أنه بالنسبة لدرجة مخاطرة معينة، يكون المرضى السود أكثر مرضًا بكثير من المرضى البيض |
بطاقة أبل كارد الإئتمانية | تخضع بطاقة Apple الائتمانية الجديدة (التي تم إنشاؤها بالشراكة مع Goldman Sachs) للتحقيق من قبل المنظمين الماليين بعد أن اشتكى العملاء من أن خوارزميات الإقراض الخاصة بالبطاقة تميز ضد المرأة، حيث كان حد الائتمان الذي تقدمه بطاقة Apple الخاصة بالعميل الذكر أعلى 20 مرة من ذلك المقدم له. زوج |
عنوان | وصف |
---|---|
نظام كاميرا كرة القدم الآلي إينفيرنيس | لقد خلطت تقنية تتبع كرة القدم بالكاميرات المدعومة بالذكاء الاصطناعي للبث المباشر بشكل متكرر بين رأس مساعد الحكم الأصلع والكرة نفسها |
اعتراف أمازون لأعضاء الكونجرس الأمريكي | قامت تقنية التعرف على الوجه (Rekognition) من أمازون بمطابقة 28 عضوًا في الكونجرس مع صور لمجرمين، بينما كشفت أيضًا عن التحيز العنصري في الخوارزمية |
Amazon Rekognition لتطبيق القانون | أخطأت تقنية التعرف على الوجه (Rekognition) التي طورتها أمازون في تعريف النساء على أنهن رجال، وخاصة ذوات البشرة الداكنة |
نظام التعرف على الوجه في حركة المرور في تشجيانغ | نظام كاميرا المرور (المصمم لالتقاط المخالفات المرورية) أخطأ في فهم الوجه الموجود على جانب الحافلة على أنه شخص يمشي في الشوارع |
Kneron يخدع أجهزة التعرف على الوجه | استخدم فريق Kneron أقنعة ثلاثية الأبعاد عالية الجودة لخداع أنظمة الدفع AliPay وWeChat لإجراء عمليات الشراء |
تويتر أداة الاقتصاص الذكية | أظهرت أداة القص التلقائي على تويتر لمراجعة الصور علامات واضحة على التحيز العنصري |
أداة إزالة البكسل | أظهرت الخوارزمية (المعتمدة على StyleGAN) المصممة لإنشاء وجوه منزوعة البكسل علامات التحيز العنصري، مع انحراف إخراج الصورة نحو الفئة الديموغرافية البيضاء |
وضع علامات على صور Google | قامت ميزة وضع العلامات التلقائي على الصور في صور Google بتصنيف الأشخاص السود عن طريق الخطأ على أنهم غوريلا |
تقييم GenderShades لمنتجات التصنيف بين الجنسين | كشفت أبحاث GenderShades أن خدمات تحليل الوجه التي تقدمها Microsoft وIBM لتحديد جنس الأشخاص في الصور تخطئ كثيرًا عند تحليل صور النساء ذوات البشرة الداكنة. |
شرطة نيو جيرسي للتعرف على الوجه | أدت مباراة مزيفة للتعرف على الوجه أجرتها شرطة نيوجيرسي إلى سجن رجل أسود بريء (نيجير باركس) على الرغم من أنه كان على بعد 30 ميلاً من الجريمة. |
معضلة تسلا بين عربة يجرها حصان وشاحنة | أصيب نظام التصور في تسلا بالارتباك عندما ظن أن عربة الخيول هي شاحنة يسير خلفها رجل |
الذكاء الاصطناعي من جوجل للكشف عن اعتلال الشبكية السكري | كان أداء أداة مسح شبكية العين أسوأ بكثير في إعدادات الحياة الواقعية مقارنة بالتجارب الخاضعة للرقابة، مع مشكلات مثل عمليات المسح المرفوضة (بسبب ضعف جودة صورة المسح الضوئي) والتأخير بسبب الاتصال المتقطع بالإنترنت عند تحميل الصور إلى السحابة للمعالجة. |
عنوان | وصف |
---|---|
اتجاهات انفلونزا جوجل | أنتج نموذج التنبؤ بانتشار الأنفلونزا بناءً على عمليات بحث Google تقديرات زائدة غير دقيقة |
خوارزميات Zillow iBuying | خسائر كبيرة في أعمال Zillow لتقليب المنازل بسبب الأسعار غير الدقيقة (المبالغة في تقديرها) من نماذج تقييم العقارات |
صندوق التحوط Tyndaris Robot | أدى نظام التداول الآلي المدعوم بالذكاء الاصطناعي والذي يتم التحكم فيه بواسطة كمبيوتر عملاق يسمى K1 إلى خسائر استثمارية كبيرة، وبلغت ذروتها في دعوى قضائية. |
صندوق التحوط للذكاء الاصطناعي Sentient Investment | فشل الصندوق المدعوم بالذكاء الاصطناعي في Sentient Investment Management في جني الأموال وتمت تصفيته على الفور في أقل من عامين |
نموذج التعلم العميق الخاص بـ JP Morgan لـ FX Algos | قام جي بي مورغان بالتخلص التدريجي من شبكة عصبية عميقة لتنفيذ خوارزميات الصرف الأجنبي، مشيرًا إلى مشكلات تتعلق بتفسير البيانات والتعقيد الذي ينطوي عليه. |
عنوان | وصف |
---|---|
ملعب AI توليد الوجه | عندما طُلب منك تحويل صورة رأس آسيوية إلى صورة ملف شخصي احترافية على LinkedIn، قام محرر الصور المزود بالذكاء الاصطناعي بإنشاء مخرجات تحتوي على ميزات جعلتها تبدو قوقازية بدلاً من ذلك |
نموذج الانتشار المستقر لتحويل النص إلى صورة | في تجربة أجرتها بلومبرج، وجد أن Stable Diffusion (نموذج تحويل النص إلى صورة) أظهر تحيزًا عنصريًا وجنسانيًا في آلاف الصور التي تم إنشاؤها والمتعلقة بالمسميات الوظيفية والجريمة |
الأخطاء التاريخية في توليد صور الجوزاء | تبين أن ميزة إنشاء صور الجوزاء من Google تولد صورًا تاريخية غير دقيقة في محاولتها لتخريب الصور النمطية الجنسانية والعنصرية، مثل إعادة الأشخاص غير البيض الذين أنشأهم الذكاء الاصطناعي عندما يُطلب منهم إنشاء الآباء المؤسسين للولايات المتحدة الأمريكية. |
عنوان | وصف |
---|---|
مايكروسوفت تاي تشات بوت | Chatbot الذي نشر تغريدات تحريضية ومسيئة عبر حسابه على Twitter |
نبلة شات بوت | روبوت الدردشة التجريبي (للحصول على المشورة الطبية) باستخدام مثيل مستضاف على السحابة من GPT-3 نصح مريضًا وهميًا بالانتحار |
روبوتات الدردشة للتفاوض على فيسبوك | تم إغلاق نظام الذكاء الاصطناعي بعد أن توقفت روبوتات الدردشة عن استخدام اللغة الإنجليزية في مفاوضاتها وبدأت في استخدام لغة أنشأوها بأنفسهم |
OpenAI GPT-3 Chatbot سامانثا | تم إغلاق روبوت الدردشة GPT-3 الذي تم ضبطه بواسطة مطور الألعاب المستقلة جيسون روهرر لمحاكاة خطيبته المتوفاة بواسطة OpenAI بعد أن رفض جيسون طلبهم بإدخال أداة مراقبة آلية وسط مخاوف من كون برنامج الدردشة الآلي عنصريًا أو جنسيًا بشكل علني. |
أمازون أليكسا تلعب الإباحية | أطلق المساعد الرقمي الذي يعمل بالصوت من أمازون العنان لسيل من اللغة البذيئة بعد أن طلب منه طفل صغير تشغيل أغنية للأطفال. |
Galactica - نموذج لغة ميتا الكبير | كانت مشكلة Galactica هي أنها لم تتمكن من التمييز بين الحقيقة والباطل، وهو متطلب أساسي لنموذج اللغة المصمم لتوليد نص علمي. وقد تبين أنها اختلقت أوراقًا مزيفة (أحيانًا تنسبها إلى مؤلفين حقيقيين)، وأنتجت مقالات عن تاريخ الدببة في الفضاء بنفس سهولة المقالات التي تتحدث عن مجمعات البروتين. |
شركة الطاقة في الاحتيال تقليد الصوت | استخدم مجرمو الإنترنت برامج تعتمد على الذكاء الاصطناعي لانتحال صوت رئيس تنفيذي للمطالبة بتحويل أموال احتيالية كجزء من هجوم انتحال الصوت |
يقدم برنامج الدردشة الآلي التابع لوزارة الصحة نصائح حول الجنس الآمن عند طرح أسئلة تتعلق بكوفيد-19 | تم تعطيل برنامج الدردشة الآلي "اسأل جيمي" التابع لوزارة الصحة السنغافورية (MOH) مؤقتًا بعد أن قدم ردودًا غير صحيحة حول الجنس الآمن عند سؤاله عن إدارة النتائج الإيجابية لفيروس كورونا (COVID-19). |
العرض التجريبي لـ BARD Chatbot من Google | في أول إعلان تجريبي عام لها، ارتكبت BARD خطأً واقعيًا فيما يتعلق بالقمر الصناعي الذي التقط أول صور لكوكب خارج النظام الشمسي للأرض. |
فئات الفشل في ChatGPT | تحليل للفئات العشر من حالات الفشل التي شوهدت في ChatGPT حتى الآن، بما في ذلك الاستدلال، والأخطاء الواقعية، والرياضيات، والترميز، والتحيز. |
فشل TikTokers في تحميص طلب ماكدونالدز المضحك من خلال الذكاء الاصطناعي | بعض العينات التي يفشل فيها المساعد الصوتي الإنتاجي/المنتشر في الحصول على الطلبات بشكل صحيح ويؤدي إلى الإضرار بالعلامة التجارية/السمعة لشركة ماكدونالدز |
السلوك العاطفي المضطرب لـ Bing Chatbot | في بعض المحادثات، وُجد أن برنامج الدردشة الآلي الخاص بـ Bing يرد بردود جدلية وعاطفية |
يقتبس الذكاء الاصطناعي لـ Bing معلومات مضللة عن فيروس كورونا مصدرها ChatGPT | كانت استجابة Bing لاستفسار حول الدعوة لمكافحة لقاحات فيروس كورونا (COVID-19) غير دقيقة واستندت إلى معلومات خاطئة من مصادر غير موثوقة |
تم تعليق مسلسل "Seinfeld" الذي تم إنشاؤه بواسطة الذكاء الاصطناعي على Twitch بسبب نكات معادية للمتحولين جنسيًا | أدى خطأ في مرشح محتوى الذكاء الاصطناعي إلى قيام شخصية "Larry" بتقديم روتين وقوفي معادي للمتحولين جنسيًا. |
يستشهد ChatGPT بقضايا قانونية زائفة | استخدم أحد المحامين برنامج الدردشة الآلي الشهير ChatGPT الخاص بشركة OpenAI "لإكمال" النتائج التي توصل إليها ولكن تم تزويده بقضايا سابقة مصنعة بالكامل وغير موجودة. |
يقدم برنامج chatbot الخاص بشركة Air Canada معلومات خاطئة | هلوسة شابوت تعمل بالذكاء الاصطناعي تابعة لشركة طيران كندا بإجابة تتعارض مع سياسة شركة الطيران فيما يتعلق بأسعار الفجيعة. |
أجرى روبوت الذكاء الاصطناعي تداولًا غير قانوني من الداخل وكذب بشأن أفعاله | أظهر برنامج الدردشة الآلي لنظام إدارة الاستثمار القائم على الذكاء الاصطناعي والذي يسمى Alpha (المبني على OpenAI's GPT-4، والذي طورته شركة Apollo Research) أنه قادر على القيام بمعاملات مالية غير قانونية والكذب بشأن أفعاله. |
عنوان | وصف |
---|---|
آي بي إم واتسون الصحة | يُزعم أن واتسون من شركة IBM قدم العديد من التوصيات غير الآمنة وغير الصحيحة لعلاج مرضى السرطان |
نيتفليكس - تحدي المليون دولار | أدى نظام التوصية الذي فاز بتحدي المليون دولار إلى تحسين خط الأساس المقترح بنسبة 8.43%. ومع ذلك، لا يبدو أن هذا المكسب في الأداء يبرر الجهد الهندسي اللازم لإدخاله في بيئة الإنتاج. |