أعرب إيلون ماسك مؤخرًا عن مخاوفه بشأن استنفاد بيانات تدريب الذكاء الاصطناعي في بث مباشر، ويعتقد أن البيانات المستخدمة لتدريب نماذج الذكاء الاصطناعي في العالم الحقيقي تقترب من الاستنفاد. يعكس هذا الرأي آراء خبراء آخرين في مجال الذكاء الاصطناعي، مما يثير تفكير الصناعة حول نماذج تطوير الذكاء الاصطناعي المستقبلية. ويرى ماسك أن البيانات الاصطناعية ستكون حلا رئيسيا لمشكلة نقص البيانات، مشيرا إلى أن العديد من شركات التكنولوجيا بدأت في اعتماد هذا النهج، والذي سيكون له تأثير عميق على طريقة وتكلفة تدريب نماذج الذكاء الاصطناعي.
في محادثة بث مباشر أجريت مؤخرًا، قال إيلون ماسك، الرئيس التنفيذي لشركة Tesla وSpaceX، إن بيانات العالم الحقيقي المتاحة لتدريب نماذج الذكاء الاصطناعي قد استنفدت تقريبًا. الشخص الذي أجرى المحادثة معه كان مارك باين، رئيس مجلس إدارة ستاجويل. ذكر ماسك: "لقد استهلكنا الآن بشكل أساسي كل تراكم المعرفة البشرية... البيانات المستخدمة في تدريب الذكاء الاصطناعي. حدثت هذه الظاهرة بشكل أساسي في العام الماضي."
وتشبه وجهة نظر ماسك نظرية "ذروة البيانات" التي اقترحها إيليا سوتسكوف، كبير العلماء السابق في OpenAI، في مؤتمر NeurIPS في ديسمبر من العام الماضي. وقال سوزكوفر إن صناعة الذكاء الاصطناعي تواجه التحدي المتمثل في نقص البيانات، كما أن عدم وجود بيانات تدريب كافية في المستقبل سيفرض تغييرات في طريقة تطوير نماذج الذكاء الاصطناعي.
ولحل هذه المشكلة، يعتقد ماسك أن البيانات الاصطناعية ستصبح بديلاً قابلاً للتطبيق. ويشير إلى أن الطريقة الوحيدة لتكملة بيانات العالم الحقيقي هي من خلال البيانات الاصطناعية، حيث يقوم الذكاء الاصطناعي بإنشاء بيانات التدريب الخاصة به. وقال ماسك إن الذكاء الاصطناعي يمكنه تحسين الأداء من خلال التقييم الذاتي وتحسين نفسه باستمرار.
في الوقت الحالي، بدأت العديد من شركات التكنولوجيا مثل Microsoft وMeta وOpenAI وAnthropic في استخدام البيانات الاصطناعية لتدريب نماذج الذكاء الاصطناعي الرئيسية الخاصة بها. وتتوقع مؤسسة جارتنر أنه بحلول عام 2024، سيتم إنشاء 60% من البيانات المستخدمة في مشاريع الذكاء الاصطناعي وتحليل البيانات بشكل صناعي.
من المزايا المهمة للبيانات الاصطناعية أنه يمكن تقليل تكاليف التطوير بشكل كبير. ومع ذلك، يشير ماسك وخبراء آخرون أيضًا إلى أن البيانات الاصطناعية لا تخلو من المخاطر. تظهر الأبحاث أن البيانات الاصطناعية يمكن أن تتسبب في تدهور أداء النموذج، ويمكن أن تكون المخرجات أقل ابتكارًا ومن المحتمل أن تتأثر بالتحيز. إذا كانت البيانات الاصطناعية نفسها بها قيود، فإن مخرجات النموذج النهائي ستعاني أيضًا من هذه المشكلات.
تسليط الضوء على:
يشعر " ماسك " بالقلق من أن البيانات الواقعية المتاحة لتدريب الذكاء الاصطناعي قد استنفدت تقريبًا.
تعتبر البيانات الاصطناعية حلاً مهمًا للمستقبل والعديد من شركات التكنولوجيا تتبناها بالفعل.
يمكن أن يؤدي استخدام البيانات الاصطناعية إلى تقليل تكاليف التطوير بشكل كبير، ولكنه يحمل أيضًا خطر تدهور أداء النموذج.
وبشكل عام، أصبحت مشكلة نفاد بيانات التدريب على الذكاء الاصطناعي وشيكة. وعلى الرغم من أن البيانات الاصطناعية توفر فرصًا جديدة، إلا أنها تمثل تحديات أيضًا. سيعتمد الاتجاه المستقبلي لتطوير الذكاء الاصطناعي على كيفية الاستخدام الفعال للبيانات الاصطناعية وتحسينها، وموازنة تكاليفها ومخاطرها، وتحقيق التقدم المستمر في تكنولوجيا الذكاء الاصطناعي في نهاية المطاف.