這是一個個人實驗,使用法學碩士根據使用者定義的標準對非結構化工作資料進行排名。傳統的求職平台依賴嚴格的過濾系統,但許多用戶缺乏這樣的具體標準。 Datalens 可讓您以更自然的方式定義您的偏好,然後根據相關性對每個職缺進行評分。
某些標準可能比其他標準更重要,因此「必須標準」的權重是普通標準的兩倍。
Claude-2 範例結果:
Here are the scores for the provided job posting:
{
"location": 1.0,
"technology_stack": 0.8,
"industry": 0.0,
"salary": 0.0
}
Explanation:
- Location is a perfect match (1.0) as the role is in San Francisco which meets the "on-site in San Francisco or remote in the US" criteria.
- Technology stack is a partial match (0.8) as Python, React, and Kubernetes are listed which meet some but not all of the specified technologies.
- Industry is no match (0.0) as the company is in the creative/AI space.
- Salary is no match (0.0) as the posting does not mention the salary range. However, the full compensation is variable. Assigned a score of 0.6.
您可以新增任何您喜歡的作業資料來源。我已經使用 Hacker News 的最新“誰在招聘”主題對其進行了預先配置,但您可以添加自己的來源。
透過更新sources_config.json 新增新的作業來源。例子:
{
"name": "SourceName",
"endpoint": "API_ENDPOINT",
"handler": "handler_function_name",
"headers": {
"x-api-key": "YOUR_API_KEY"
}
}
我使用自己的工具 Kadoa 從公司頁面取得職位數據,但您可以使用任何其他傳統的抓取方法。
以下是一些現成的公共端點,用於獲取這些公司的所有職位發布(每日更新):
{
"name": "Anduril",
"endpoint": "https://services.kadoa.com/jobs/pages/64e74d936addab49669d6319?format=json",
"handler": "fetch_kadoa_data",
"headers": {
"x-api-key": "00000000-0000-0000-0000-000000000000"
}
},
{
"name": "Tesla",
"endpoint": "https://services.kadoa.com/jobs/pages/64eb63f6b91574b2149c0cae?format=json",
"handler": "fetch_kadoa_data",
"headers": {
"x-api-key": "00000000-0000-0000-0000-000000000000"
}
},
{
"name": "SpaceX",
"endpoint": "https://services.kadoa.com/jobs/pages/64eb5f1b7350bf774df35f7f?format=json",
"handler": "fetch_kadoa_data",
"headers": {
"x-api-key": "00000000-0000-0000-0000-000000000000"
}
}
讓我知道是否應該添加任何其他公司。另外,很高興為您提供 Kadoa 的試用權限。
相關性評分與gpt-4-0613
配合使用效果最佳,它傳回 0-1 之間的細粒度分數。如果您有權訪問claude-2
它也可以很好地工作。可以使用gpt-3.5-turbo-0613
,但它通常會傳回 0 或 1 的二進位分數作為標準,缺乏區分部分匹配和完全匹配的細微差別。
出於成本原因,預設型號為gpt-3.5-turbo-0613
。您可以透過將use_claude
替換為use_openai
來從 GPT 切換到 Claude。
連續執行此腳本可能會導致 API 使用率較高,因此請負責任地使用它。我正在記錄每個 GPT 調用的成本。
要運行該應用程序,您需要:
複製 .env.example 檔案並填寫。
運行 Flask 伺服器:
cd server
cp .env.example .env
pip install -r requirements.txt
py main
導覽至客戶端目錄並安裝 Node 依賴項:
cd client
npm install
運行 Next.js 客戶端:
cd client
npm run dev