Эта система разработана с использованием Python + Программа-сканер Selenium собирает данные о наборе персонала с веб-сайта прямого набора персонала BOSS , сохраняет собранные данные о наборе персонала в базе данных MySQL , а затем выполняет очистку данных о наборе персонала, хранящихся в базе данных, включая дедупликацию данных, унификацию типов полей и контента, удаление нерелевантные данные и другие операции, а затем анализировать очищенные данные, включая количество наймов на определенный тип должности, академическую квалификацию и опыт работы. Анализ с точки зрения опыта, типа компании, размера компании, распределения по городам и т. д. Анализ уровня заработной платы определенного типа должности с точки зрения академической квалификации, опыта работы, типа компании, размера компании и т. д.; высокочастотные слова-навыки, которые появляются в позициях определенного типа и объединяют их. Навыки, которые необходимо освоить, были получены путем анализа результатов. Наконец, для интуитивного отображения результатов анализа была разработана и внедрена система визуального анализа данных о наборе персонала. отображать результаты анализа в виде наглядных диаграмм. Технически платформа SpringBoot используется для создания доступа к серверной части, а RESTful API используется для предоставления данных во внешний интерфейс. Интерфейс системного внешнего интерфейса построен с использованием инфраструктуры Vue + Element-UI , а визуальные диаграммы генерируются с использованием v-charts. + библиотека диаграмм Echarts .
Импортируйте программу-сканер из каталога боссзп-паука в Pycharm , откройте файл SpiderMain , найдите в программе основную функцию и измените код SpiderObj = Spider('copywriting', city, 1) в основной функции, чтобы изменить копирайтинг. Измените его на сообщение, которое нужно сканировать, затем с помощью терминала войдите в каталог установки Google Chrome и запустите ./chrome.exe. -remote-debugging-port=9222 , затем откройте сайт прямого набора BOSS в запущенном Google Chrome и отсканируйте QR-код для входа в систему. После выполнения вышеуказанных действий вы можете запустить программу-сканер.
找到listen 80,然后在它下面添加或替换如下配置
listen 80;
server_name localhost;
sendfile on;
keepalive_timeout 65;
charset utf-8;
#access_log logs/host.access.log main;
location / {
add_header 'Access-Control-Allow-Origin' $http_origin;
add_header 'Access-Control-Allow-Credentials' 'true';
add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS';
add_header 'Access-Control-Allow-Headers' 'DNT,web-token,app-token,Authorization,Accept,Origin,Keep-Alive,User-Agent,X-Mx-ReqToken,X-Data-Type,X-Auth-Token,X-Requested-With,If-Modified-Since,Cache-Control,Content-Type,Range';
add_header 'Access-Control-Expose-Headers' 'Content-Length,Content-Range';
if ($request_method = 'OPTIONS') {
add_header 'Access-Control-Max-Age' 1728000;
add_header 'Content-Type' 'text/plain; charset=utf-8';
add_header 'Content-Length' 0;
return 204;
}
root /upload/;
index index.html index.htm; # 需要转发的url地址
}
location ^~/apm/ {
proxy_pass http://localhost:8890/;
}
location ^~/apj/ {
proxy_pass http://localhost:8890/admin/;
}
Используйте IDEA для импорта всего фонового кода в каталог анализа . После загрузки всех зависимостей измените содержимое конфигурации в файле application.yml в соответствии с вашей ситуацией. После завершения изменения используйте Navicat для создания базы данных с именем Bosszp и. импортируйте его на тот же уровень, что и файл конфигурации Bosszp.sql , после импорта собранной таблицы базы данных. Данные о наборе персонала импортируются в таблицу заданий созданной базы данных с помощью Navicat . Перед запуском фонового кода данные в базе данных необходимо очистить. Сначала данные дедуплицируются и удаляются ненужные данные, а затем ключевые слова, которые появляются в. используются имя задания. Классифицируйте информацию о каждой позиции и, наконец, унифицируйте тип или содержимое полей. Ниже приведены два обработанных примера данных: (Отображается только информация о поле, подлежащая обработке).
адрес | обработанныйадрес | ПреобразоватьАдрес | тип | обработанныйтип | расстояние |
---|---|---|---|---|---|
Пекин | Пекин-Шуньи Район | Пекин | Инженер по эксплуатации и техническому обслуживанию | Инженер по эксплуатации | Шуньский район |
Шэньчжэнь | Шэньчжэнь-Лунганский район | Шэньчжэнь | Инженер по эксплуатации и техническому обслуживанию | Инженер по эксплуатации | Район Лунган |
рабочий тег | обработанныйWorkTag | зарплата | обработаноЗарплата | средняя зарплата | зарплатаМесяц |
---|---|---|---|---|---|
["Конфигурация сервера", "Несколько процессов", "Несколько потоков", "Linux", "Основы алгоритмов", "Структура данных", ""] | Конфигурация сервера, многопроцессный, многопоточный алгоритм Linux, базовая структура данных | [9000, 11000] | 9-11 тыс./мес. | 10000 | 0 зарплата |
["Python", "Java", "Go", "TypeScript", "Распределенная технология", "Контейнерная технология", "", ""] | Python Java Go TypeScript распределенная технология контейнерная технология | [15000, 25000] | 15-25тыс/мес·13 оклад | 20000 | 13 зарплата |
компанияТеги | обработаноКомпанияТеги | компанияЛюди | обработанКомпанияЛюди |
---|---|---|---|
никто | [0, 20] | 0-20 человек | |
["Периодический медицинский осмотр", "Дополнительное медицинское страхование", "Закуски и полдник", "Командировочные", "Добавка за сверхурочную работу", "Акционные опционы", "Пособие на питание", "Отпускные", "Премия по итогам года" », «Пять страховок и золото»] | Регулярный медицинский осмотр, дополнительная медицинская страховка, закуски, послеобеденный чай, субсидии на командировочные и сверхурочные часы, опционы на акции, надбавки к питанию, праздничные льготы, бонус в конце года, пять страховок и один фонд. | [0, 10000] | Более 10 000 человек |
После завершения обработки данных работа по подготовке фоновых данных завершается. Наконец, запускается основная программа фонового кода. Если не происходит никаких аномальных ошибок, фоновая операция выполнена успешно.
Сначала используйте команду npm для глобальной установки менеджера пакетов Yarn . Затем используйте WebStorm для импорта всего внешнего кода в каталог анализа данных набора персонала . После завершения импорта используйте команду Yarn install для установки необходимых модулей. После завершения установки модуля запустите команду Yarn run build, чтобы установить проект. После завершения упаковки будет создана папка dist . Поместите все файлы из этой папки в папку загрузки , созданную выше. После завершения адрес локального доступа стойки регистрации в Windows 11 : http://localhost/