datalens下載 - datalens原始碼下載

datalens

其他源碼

1.0.0

下載

Datalens：利用 AI 自動化求職

概述

這是一個個人實驗，使用法學碩士根據使用者定義的標準對非結構化工作資料進行排名。傳統的求職平台依賴嚴格的過濾系統，但許多用戶缺乏這樣的具體標準。 Datalens 可讓您以更自然的方式定義您的偏好，然後根據相關性對每個職缺進行評分。

某些標準可能比其他標準更重要，因此「必須標準」的權重是普通標準的兩倍。

數據透鏡預覽

Claude-2 範例結果：

 Here are the scores for the provided job posting:
 
{
  "location": 1.0,
  "technology_stack": 0.8,
  "industry": 0.0,
  "salary": 0.0 
}

Explanation:
- Location is a perfect match (1.0) as the role is in San Francisco which meets the "on-site in San Francisco or remote in the US" criteria.
- Technology stack is a partial match (0.8) as Python, React, and Kubernetes are listed which meet some but not all of the specified technologies. 
- Industry is no match (0.0) as the company is in the creative/AI space.
- Salary is no match (0.0) as the posting does not mention the salary range. However, the full compensation is variable. Assigned a score of 0.6.

數據來源

您可以新增任何您喜歡的作業資料來源。我已經使用 Hacker News 的最新“誰在招聘”主題對其進行了預先配置，但您可以添加自己的來源。

透過更新sources_config.json 新增新的作業來源。例子：

 {
    "name": "SourceName",
    "endpoint": "API_ENDPOINT",
    "handler": "handler_function_name",
    "headers": {
        "x-api-key": "YOUR_API_KEY"
    }
}

抓取職業頁面

我使用自己的工具 Kadoa 從公司頁面取得職位數據，但您可以使用任何其他傳統的抓取方法。

以下是一些現成的公共端點，用於獲取這些公司的所有職位發布（每日更新）：

  {
    "name": "Anduril",
    "endpoint": "https://services.kadoa.com/jobs/pages/64e74d936addab49669d6319?format=json",
    "handler": "fetch_kadoa_data",
    "headers": {
      "x-api-key": "00000000-0000-0000-0000-000000000000"
    }
  },
  {
    "name": "Tesla",
    "endpoint": "https://services.kadoa.com/jobs/pages/64eb63f6b91574b2149c0cae?format=json",
    "handler": "fetch_kadoa_data",
    "headers": {
      "x-api-key": "00000000-0000-0000-0000-000000000000"
    }
  },
  {
    "name": "SpaceX",
    "endpoint": "https://services.kadoa.com/jobs/pages/64eb5f1b7350bf774df35f7f?format=json",
    "handler": "fetch_kadoa_data",
    "headers": {
      "x-api-key": "00000000-0000-0000-0000-000000000000"
    }
  }

讓我知道是否應該添加任何其他公司。另外，很高興為您提供 Kadoa 的試用權限。

型號選擇

相關性評分與gpt-4-0613配合使用效果最佳，它傳回 0-1 之間的細粒度分數。如果您有權訪問claude-2它也可以很好地工作。可以使用gpt-3.5-turbo-0613 ，但它通常會傳回 0 或 1 的二進位分數作為標準，缺乏區分部分匹配和完全匹配的細微差別。

出於成本原因，預設型號為gpt-3.5-turbo-0613 。您可以透過將use_claude替換為use_openai來從 GPT 切換到 Claude。

成本警告

連續執行此腳本可能會導致 API 使用率較高，因此請負責任地使用它。我正在記錄每個 GPT 調用的成本。

要求

要運行該應用程序，您需要：

OpenAI API 或 Anthropic Claude 金鑰。
Python 3.7 或更高版本以及 Flask 伺服器的 pipelinev。
用於 Next.js 客戶端的 Node.js 和 npm。

設立和發展

伺服器

複製 .env.example 檔案並填寫。

運行 Flask 伺服器：

 cd server
cp .env.example .env
pip install -r requirements.txt
py main

客戶

導覽至客戶端目錄並安裝 Node 依賴項：

 cd client
npm install

運行 Next.js 客戶端：

 cd client
npm run dev

使用瀏覽器開啟 http://localhost:3000 以查看該應用程式。
定義您的排名標準
點擊分析

改進

流式處理：前端透過一次長 REST 呼叫獲取所有分析結果，這可能會導致較長的等待時間。我們應該切換到流/網路套接字。
可擴展性：該應用程式目前僅關注作業資料。我們應該使系統可擴展到其他類型的數據，如事件、產品等。
儲存：目前使用文件存儲，考慮切換到SQLite
微調：微調 llama-2 或 gpt-3.5 可能會帶來更好、更便宜的結果

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2024-11-29
大小 237.33KB
來自於 Github

相關應用

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
SmartTube

其他源碼

24.71 Stable
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
wp functions

其他類別

1.0.0
termwind

其他類別

v2.3.0

相關資訊全部