في دفتر الملاحظات هذا ، باستخدام Gemini API (Gemini 1.5 Flash) ، سأقوم باستخراج معلومات معينة من نص الوصف الوظيفي الذي قمت بتخليصه وجمعته من موقع البحث عن وظيفة في الماضي
في مشروعي السابق ، قمت بتجميع وجمع مواقف مهندس البرمجيات التي تم الإعلان عنها على موقع البحث عن وظيفة ، لمزيد من التفاصيل ، يرجى زيارة - https://github.com/morikaglobal/jobsite_selenium
باستخدام رمز الكشط الخاص بي ، يتم كشط البيانات ، ومعالجة البيانات اللازمة ، ويتم تخزين البيانات في ملف CSV مثل هذا: نتيجة بحث العمل (ملف CSV)
ومع ذلك ، فقد لاحظت أن بعض المناصب تبدو وكأنها غير مرتبطة بمواقف مهندس البرمجيات ، على الرغم من أن عناوين الوظائف تتضمن عبارة "مهندس البرمجيات" ، ولغات ومهارات برمجة محددة مطلوبة لكل وظيفة فقط عند توصيف الوظيفة تقرأ يدويًا.
باستخدام Gemini 1.5 Flash ، أريد تحديد ما إذا كان الموضع مرتبطًا بمهندس البرمجيات أم لا ، لذلك إذا لم يكن الأمر كذلك ، فيمكنني إزالة المواضع من القائمة/DataFrame. في الوقت نفسه ، أريد الاستفادة من استخراج الكيان من واجهة برمجة تطبيقات الجوزاء حتى أتمكن
سأستورد واستخدام البيانات التي تم جمعها من المشروع أعلاه المتاح على - https://github.com/morikaglobal/jobsite_selenium/blob/master/jobsite.csv