Dalam buku catatan ini, menggunakan Gemini API (Gemini 1.5 Flash), saya akan mengekstrak informasi tertentu dari teks deskripsi pekerjaan yang telah saya kikahkan dan kumpulkan dari situs pencarian pekerjaan di masa lalu
Dalam proyek masa lalu saya, saya telah menggores dan mengumpulkan posisi insinyur perangkat lunak yang diiklankan di situs pencarian kerja, untuk lebih jelasnya, silakan kunjungi - https://github.com/morikaglobal/jobsite_selenium
Menggunakan kode pengikis saya, data dikikis, pemrosesan data yang diperlukan dilakukan dan data disimpan dalam file CSV seperti ini: hasil pencarian di lokasi kerja (file CSV)
Namun, saya telah memperhatikan bahwa beberapa posisi terlihat tidak terkait dengan posisi insinyur perangkat lunak, meskipun judul pekerjaan memang mencakup frasa 'insinyur perangkat lunak', dan bahasa pemrograman spesifik dan keterampilan yang diperlukan untuk setiap pekerjaan hanya dapat ditemukan ketika deskripsi pekerjaan pekerjaan dibaca secara manual.
Menggunakan Gemini 1.5 Flash, saya ingin mengidentifikasi apakah posisi itu terkait dengan insinyur perangkat lunak atau tidak, sehingga jika tidak, saya dapat menghapus posisi dari daftar/dataframe. Pada saat yang sama, saya ingin memanfaatkan ekstraksi entitas Gemini API sehingga saya dapat mengekstrak informasi tertentu - posisi aktual yang dikelola oleh para pengusaha, serta pengalaman dan keterampilan yang diperlukan
Saya akan mengimpor dan menggunakan data yang dikumpulkan dari proyek di atas yang tersedia di - https://github.com/morikaglobal/jobsite_selenium/blob/master/jobsite.csv