Gemini_API_Entity_Extraction
1.0.0
이 노트북에서 Gemini API (Gemini 1.5 Flash)를 사용하여 과거에 구직 사이트에서 긁어 모은 작업 설명 텍스트에서 특정 정보를 추출합니다.
과거 프로젝트에서는 구직 사이트에 광고 된 소프트웨어 엔지니어 직책을 긁어 모으고 수집했습니다. 자세한 내용은 https://github.com/morikaglobal/jobsite_selenium을 방문하십시오.
스크래핑 코드를 사용하면 데이터가 긁히고 필요한 데이터 처리가 완료되며 데이터는 다음과 같은 CSV 파일에 저장됩니다. Jobsite 검색 결과 (CSV 파일)
그러나 직책에는 '소프트웨어 엔지니어'문구가 포함되어 있지만 각 작업에 필요한 특정 프로그래밍 언어 및 기술이 포함되어 있지만 일부 직책은 소프트웨어 엔지니어 위치와 관련이없는 것처럼 보였습니다. 수동으로 읽습니다.
Gemini 1.5 Flash를 사용하여 위치가 소프트웨어 엔지니어와 관련이 있는지 여부를 식별하여 목록/데이터 프레임에서 위치를 제거 할 수 있도록합니다. 동시에, 나는 특정 정보를 추출 할 수 있도록 Gemini API의 기업 추출을 활용하고 싶습니다. 고용주가 후보자를 찾고있는 실제 위치, 필요한 경험과 기술
위의 프로젝트에서 수집 한 데이터를 가져 와서 사용하여 -https://github.com/morikaglobal/jobsite_selenium/blob/master/jobsite.csv