Gemini_API_Entity_Extraction
1.0.0
在此笔记本中,使用Gemini API(Gemini 1.5 Flash),我将从工作描述文本中提取某些信息,我过去从工作搜索网站刮擦和收集
在我过去的项目中,我在求职站点上刮了和收集了软件工程师职位,有关更多详细信息,请访问-https://github.com/morikagaglobal/jobsite_selenium
使用我的刮擦代码,刮擦数据,完成了必要的数据处理,并且数据存储在CSV文件中:Jobsite搜索结果(CSV文件)
但是,我注意到某些职位看起来与软件工程师的职位无关,尽管该职位确实包括“软件工程师”短语,并且只有在工作描述时才能找到每个工作所需的特定编程语言和技能手动阅读。
使用Gemini 1.5 Flash,我想确定该位置是否与软件工程师相关,因此,如果没有,我可以从列表/DataFrame中删除职位。同时,我想利用双子API的实体提取的实体,以便我可以提取某些信息 - 雇主正在寻找候选人的实际职位,以及所需的经验和技能
我将导入并使用从上述项目中收集的数据,网址为-https://github.com/morikaglobal/jobsite_selenium/blob/master/jobsite.csv