ระบบนี้ได้รับการพัฒนาโดยใช้ Python + โปรแกรมรวบรวมข้อมูลการสรรหา Selenium รวบรวมข้อมูลการสรรหาจากเว็บไซต์การสรรหาโดยตรงของ BOSS จัดเก็บข้อมูลการสรรหาที่รวบรวมไว้ในฐานข้อมูล MySQL จากนั้นดำเนินการล้างข้อมูลในข้อมูลการสรรหาบุคลากรที่จัดเก็บไว้ในฐานข้อมูล รวมถึงการขจัดข้อมูลซ้ำซ้อน การรวมประเภทฟิลด์และเนื้อหาเข้าด้วยกัน ลบ ข้อมูลที่ไม่เกี่ยวข้องและการดำเนินการอื่น ๆ จากนั้นวิเคราะห์ข้อมูลที่สะอาด รวมถึงจำนวนการรับสมัครสำหรับตำแหน่งบางประเภท คุณวุฒิการศึกษา และประสบการณ์การทำงาน วิเคราะห์จากมุมมองของประสบการณ์ ประเภทบริษัท ขนาดบริษัท การกระจายเมือง ฯลฯ วิเคราะห์ระดับเงินเดือนของตำแหน่งบางประเภทจากมุมมองของคุณวุฒิการศึกษา ประสบการณ์การทำงาน ประเภทบริษัท ขนาดบริษัท ฯลฯ คำนวณ คำทักษะความถี่สูงที่ปรากฏในตำแหน่งบางประเภทและรวมเข้าด้วยกัน ทักษะที่จะเชี่ยวชาญนั้นได้มาจากการวิเคราะห์ผลลัพธ์ ในที่สุดเพื่อที่จะแสดงผลการวิเคราะห์อย่างสังหรณ์ใจ จึงได้ออกแบบและปรับใช้ระบบการวิเคราะห์ภาพข้อมูลการสรรหาบุคลากร แสดงผลการวิเคราะห์ในรูปแบบแผนภูมิภาพ ในทางเทคนิคแล้ว กรอบงาน SpringBoot ใช้เพื่อสร้างการเข้าถึงแบ็กเอนด์ และใช้ RESTful API เพื่อจัดเตรียมข้อมูลให้กับส่วนหน้า อินเทอร์เฟซส่วนหน้าของระบบสร้างขึ้นโดยใช้กรอบงาน Vue + Element-UI และแผนภูมิภาพจะถูกสร้างขึ้นโดยใช้ v-charts + ไลบรารีแผนภูมิ echarts
นำเข้าโปรแกรมรวบรวมข้อมูลในไดเร็กทอรี bosszp-spider ไปยัง Pycharm เปิดไฟล์ SpiderMain ค้นหาฟังก์ชัน หลัก ในโปรแกรม และแก้ไขโค้ด SpiderObj = Spider('copywriting', city, 1) ในฟังก์ชัน หลัก เพื่อเปลี่ยนการเขียนคำโฆษณา เปลี่ยนเป็นโพสต์ที่จะรวบรวมข้อมูล จากนั้นใช้เทอร์มินัลเพื่อเข้าสู่ไดเร็กทอรีการติดตั้งของ Google Chrome และเรียกใช้ ./chrome.exe -remote-debugging-port=9222 จากนั้นเปิดเว็บไซต์รับสมัครงานโดยตรง ของ BOSS ใน Google Chrome ที่เปิดตัวแล้วสแกนโค้ด QR เพื่อเข้าสู่ระบบ หลังจากทำตามขั้นตอนข้างต้นเสร็จแล้ว คุณสามารถเรียกใช้โปรแกรมรวบรวมข้อมูลได้
找到listen 80,然后在它下面添加或替换如下配置
listen 80;
server_name localhost;
sendfile on;
keepalive_timeout 65;
charset utf-8;
#access_log logs/host.access.log main;
location / {
add_header 'Access-Control-Allow-Origin' $http_origin;
add_header 'Access-Control-Allow-Credentials' 'true';
add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS';
add_header 'Access-Control-Allow-Headers' 'DNT,web-token,app-token,Authorization,Accept,Origin,Keep-Alive,User-Agent,X-Mx-ReqToken,X-Data-Type,X-Auth-Token,X-Requested-With,If-Modified-Since,Cache-Control,Content-Type,Range';
add_header 'Access-Control-Expose-Headers' 'Content-Length,Content-Range';
if ($request_method = 'OPTIONS') {
add_header 'Access-Control-Max-Age' 1728000;
add_header 'Content-Type' 'text/plain; charset=utf-8';
add_header 'Content-Length' 0;
return 204;
}
root /upload/;
index index.html index.htm; # 需要转发的url地址
}
location ^~/apm/ {
proxy_pass http://localhost:8890/;
}
location ^~/apj/ {
proxy_pass http://localhost:8890/admin/;
}
ใช้ IDEA เพื่อนำเข้าโค้ดพื้นหลังทั้งหมดในไดเร็กทอรี analyse หลังจากดาวน์โหลดการอ้างอิงทั้งหมดแล้ว ให้แก้ไขเนื้อหาการกำหนดค่าในไฟล์ application.yml ตามสถานการณ์ของคุณเอง หลังจากการแก้ไขเสร็จสิ้น ให้ใช้ Navicat เพื่อสร้างฐานข้อมูลชื่อ bosszp และ นำเข้าไปยังระดับเดียวกับไฟล์การกำหนดค่า bosszp.sql หลังจากนำเข้าตารางฐานข้อมูลแล้ว ข้อมูลการรับสมัครจะถูกนำเข้าไปยัง ตารางงาน ของฐานข้อมูลที่สร้างขึ้นโดยใช้ Navicat ก่อนที่จะรันโค้ดพื้นหลัง ข้อมูลในฐานข้อมูลจะต้องถูกล้าง ขั้นแรก ข้อมูลจะถูกกรองข้อมูลซ้ำออกและข้อมูลที่ไม่เกี่ยวข้องจะถูกลบออก จากนั้นจึงลบคำสำคัญที่ปรากฏขึ้น มีการใช้ชื่องาน แยกประเภทข้อมูลแต่ละตำแหน่ง และสุดท้ายรวมประเภทหรือเนื้อหาของฟิลด์ที่ประมวลผลไว้ด้านล่าง: (แสดงเฉพาะข้อมูลฟิลด์ที่จะประมวลผล)
ที่อยู่ | ที่อยู่ที่จัดการ | เปลี่ยนที่อยู่ | พิมพ์ | ประเภทการจัดการ | เขต |
---|---|---|---|---|---|
ปักกิ่ง | เขตปักกิ่ง-ซุ่นยี่ | ปักกิ่ง | วิศวกรฝ่ายปฏิบัติการและบำรุงรักษา | วิศวกรฝ่ายปฏิบัติการ | เขตซุนยี่ |
เซินเจิ้น | เขตเซินเจิ้น-หลงกัง | เซินเจิ้น | วิศวกรฝ่ายปฏิบัติการและบำรุงรักษา | วิศวกรฝ่ายปฏิบัติการ | อำเภอหลงกัง |
แท็กงาน | จัดการWorkTag | เงินเดือน | เงินเดือนที่ได้รับการจัดการ | เงินเดือนเฉลี่ย | เงินเดือนเดือน |
---|---|---|---|---|---|
["การกำหนดค่าเซิร์ฟเวอร์", "หลายกระบวนการ", "หลายเธรด", "Linux", "พื้นฐานอัลกอริทึม", "โครงสร้างข้อมูล", ""] | การกำหนดค่าเซิร์ฟเวอร์โครงสร้างข้อมูลพื้นฐานของอัลกอริธึมลินุกซ์แบบมัลติเธรดแบบหลายกระบวนการ | [9000, 11000] | 9-11K/เดือน | 10,000 | 0 เงินเดือน |
["Python", "Java", "Go", "TypeScript", "เทคโนโลยีแบบกระจาย", "เทคโนโลยีคอนเทนเนอร์", "", ""] | Python Java Go TypeScript เทคโนโลยีการกระจายเทคโนโลยีคอนเทนเนอร์ | [15000, 25000] | 15-25K/เดือน·13 เงินเดือน | 20,000 | 13 เงินเดือน |
แท็กบริษัท | จัดการแท็กบริษัท | บริษัทคน | จัดการบริษัทคน |
---|---|---|---|
ไม่มี | [0, 20] | 0-20 คน | |
["การตรวจร่างกายตามปกติ", "ประกันสุขภาพเสริม", "ของว่างและน้ำชายามบ่าย", "การเดินทางของพนักงาน", "ค่าล่วงเวลา", "ตัวเลือกหุ้น", "ค่าอาหาร", "สวัสดิการวันหยุด", "โบนัสสิ้นปี , "ห้าประกันภัยและทองคำ"] | การตรวจร่างกายเป็นประจำ, ประกันสุขภาพเสริม, ของว่าง, น้ำชายามบ่าย, เงินช่วยเหลือค่าเดินทางและค่าล่วงเวลาของพนักงาน, สิทธิซื้อหุ้น, อาหารเสริม, สวัสดิการวันหยุด, โบนัสสิ้นปี, ประกัน 5 ประการ และกองทุน 1 กองทุน | [0, 10,000] | มากกว่า 10,000 คน |
หลังจากการประมวลผลข้อมูลเสร็จสิ้น งานเตรียมข้อมูลพื้นหลังจะเสร็จสิ้น ในที่สุด โปรแกรมหลักของโค้ดพื้นหลังก็จะเริ่มทำงาน หากไม่มีข้อผิดพลาดผิดปกติเกิดขึ้น การดำเนินการในพื้นหลังก็จะสำเร็จ
ขั้นแรก ให้ใช้คำสั่ง npm เพื่อติดตั้ง Yarn Package Manager แบบโกลบอล จากนั้นใช้ WebStorm เพื่อนำเข้าโค้ดส่วนหน้าทั้งหมดในไดเร็กทอรี การสรรหาบุคลากร-การวิเคราะห์ข้อมูล-การวิเคราะห์ หลังจากการนำเข้าเสร็จสิ้น ให้ใช้คำสั่ง Yarn Install เพื่อติดตั้งโมดูลที่จำเป็น หลังจากการติดตั้งโมดูลเสร็จสมบูรณ์ ให้รันคำสั่ง Yarn Run เพื่อติดตั้งโปรเจ็กต์ หลังจาก ทำ แพ็กเกจเสร็จแล้ว โฟลเดอร์ dist จะถูกสร้างขึ้น เสร็จสิ้น ที่อยู่การเข้าถึงท้องถิ่นของแผนกต้อนรับใน Windows 11 คือ: http://localhost/