Gemini_API_Entity_Extraction
1.0.0
在此筆記本中,使用Gemini API(Gemini 1.5 Flash),我將從工作描述文本中提取某些信息,我過去從工作搜索網站刮擦和收集
在我過去的項目中,我在求職站點上刮了和收集了軟件工程師職位,有關更多詳細信息,請訪問-https://github.com/morikagaglobal/jobsite_selenium
使用我的刮擦代碼,刮擦數據,完成了必要的數據處理,並且數據存儲在CSV文件中:Jobsite搜索結果(CSV文件)
但是,我注意到某些職位看起來與軟件工程師的職位無關,儘管該職位確實包括“軟件工程師”短語,並且只有在工作描述時才能找到每個工作所需的特定編程語言和技能手動閱讀。
使用Gemini 1.5 Flash,我想確定該位置是否與軟件工程師相關,因此,如果沒有,我可以從列表/DataFrame中刪除職位。同時,我想利用雙子API的實體提取的實體,以便我可以提取某些信息 - 雇主正在尋找候選人的實際職位,以及所需的經驗和技能
我將導入並使用從上述項目中收集的數據,網址為-https://github.com/morikaglobal/jobsite_selenium/blob/master/jobsite.csv