ในสมุดบันทึกนี้การใช้ Gemini API (Gemini 1.5 Flash) ฉันจะแยกข้อมูลบางอย่างจากข้อความรายละเอียดงานที่ฉันได้คัดลอกและรวบรวมจากเว็บไซต์ค้นหางานในอดีต
ในโครงการที่ผ่านมาของฉันฉันได้คัดลอกและรวบรวมตำแหน่งวิศวกรซอฟต์แวร์ที่โฆษณาไว้ในเว็บไซต์ค้นหางานสำหรับรายละเอียดเพิ่มเติมกรุณาเยี่ยมชม - https://github.com/morikaglobal/jobsite_selenium
การใช้รหัสการขูดของฉันข้อมูลจะถูกคัดลอกการประมวลผลข้อมูลที่จำเป็นเสร็จสิ้นและข้อมูลจะถูกเก็บไว้ในไฟล์ CSV เช่นนี้: ผลการค้นหาไซต์งาน (ไฟล์ CSV)
อย่างไรก็ตามฉันสังเกตเห็นว่าบางตำแหน่งดูเหมือนว่าพวกเขาไม่เกี่ยวข้องกับตำแหน่งวิศวกรซอฟต์แวร์แม้ว่าตำแหน่งงานจะรวมวลี 'วิศวกรซอฟต์แวร์' และภาษาการเขียนโปรแกรมเฉพาะและทักษะที่จำเป็นสำหรับแต่ละงานเท่านั้น อ่านด้วยตนเอง
การใช้ Gemini 1.5 Flash ฉันต้องการระบุว่าตำแหน่งที่เกี่ยวข้องกับวิศวกรซอฟต์แวร์ที่เกี่ยวข้องหรือไม่ดังนั้นหากไม่ได้ฉันสามารถลบตำแหน่งออกจากรายการ/dataframe ในเวลาเดียวกันฉันต้องการใช้การสกัดเอนทิตีของราศีเมถุน API เพื่อให้ฉันสามารถแยกข้อมูลบางอย่าง - ตำแหน่งจริงที่นายจ้างกำลังมองหาผู้สมัครรวมถึงประสบการณ์และทักษะที่จำเป็น
ฉันจะนำเข้าและใช้ข้อมูลที่รวบรวมจากโครงการด้านบนที่มีอยู่ที่ - https://github.com/morikaglobal/jobsite_selenium/blob/master/jobsite.csv