تم تطوير هذا النظام باستخدام لغة Python+ يقوم برنامج زاحف السيلينيوم بجمع بيانات التوظيف من موقع التوظيف المباشر BOSS ، ويخزن بيانات التوظيف المجمعة في قاعدة بيانات MySQL ، ومن ثم يقوم بإجراء تنظيف البيانات على بيانات التوظيف المخزنة في قاعدة البيانات، بما في ذلك إلغاء البيانات المكررة، وتوحيد أنواع الحقول والمحتوى، وحذفها البيانات غير ذات الصلة والعمليات الأخرى، ثم تحليل البيانات التي تم تنظيفها، بما في ذلك عدد التعيينات لنوع معين من الوظائف، والمؤهلات الأكاديمية، والخبرة العملية. التحليل من منظور الخبرة، ونوع الشركة، وحجم الشركة، وتوزيع المدينة، وما إلى ذلك؛ تحليل مستوى الراتب لنوع معين من الوظائف من منظور المؤهلات الأكاديمية، والخبرة العملية، ونوع الشركة، وحجم الشركة، وما إلى ذلك؛ كلمات مهارة عالية التردد تظهر في نوع معين من المواقف وتجمعها تم الحصول على المهارات التي سيتم إتقانها من خلال تحليل النتائج وأخيرًا، من أجل عرض نتائج التحليل بشكل حدسي، تم تصميم وتنفيذ نظام التحليل البصري لبيانات التوظيف عرض نتائج التحليل في شكل رسوم بيانية مرئية. من الناحية الفنية، يتم استخدام إطار عمل SpringBoot لبناء الوصول إلى الواجهة الخلفية، ويتم استخدام واجهة برمجة تطبيقات RESTful لتوفير البيانات للواجهة الأمامية. تم إنشاء واجهة الواجهة الأمامية للنظام باستخدام إطار عمل Vue + Element-UI ، ويتم إنشاء المخططات المرئية باستخدام مخططات v. + مكتبة الرسوم البيانية الإلكترونية .
قم باستيراد برنامج الزاحف في دليل Bosszp-spider إلى Pycharm ، وافتح ملف SpiderMain ، وابحث عن الوظيفة الرئيسية في البرنامج، وقم بتعديل الكود SpiderObj = Spider('copywriting', city, 1) في الوظيفة الرئيسية لتغيير كتابة النصوص قم بتغييره إلى المنشور الذي سيتم الزحف إليه، ثم استخدم الوحدة الطرفية للدخول إلى دليل تثبيت Google Chrome وتشغيل ./chrome.exe -remote-debugging-port=9222 الأمر، ثم افتح موقع BOSS للتوظيف المباشر في Google Chrome الذي تم إطلاقه وقم بمسح رمز الاستجابة السريعة لتسجيل الدخول. بعد إكمال الخطوات المذكورة أعلاه، يمكنك تشغيل برنامج الزاحف.
找到listen 80,然后在它下面添加或替换如下配置
listen 80;
server_name localhost;
sendfile on;
keepalive_timeout 65;
charset utf-8;
#access_log logs/host.access.log main;
location / {
add_header 'Access-Control-Allow-Origin' $http_origin;
add_header 'Access-Control-Allow-Credentials' 'true';
add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS';
add_header 'Access-Control-Allow-Headers' 'DNT,web-token,app-token,Authorization,Accept,Origin,Keep-Alive,User-Agent,X-Mx-ReqToken,X-Data-Type,X-Auth-Token,X-Requested-With,If-Modified-Since,Cache-Control,Content-Type,Range';
add_header 'Access-Control-Expose-Headers' 'Content-Length,Content-Range';
if ($request_method = 'OPTIONS') {
add_header 'Access-Control-Max-Age' 1728000;
add_header 'Content-Type' 'text/plain; charset=utf-8';
add_header 'Content-Length' 0;
return 204;
}
root /upload/;
index index.html index.htm; # 需要转发的url地址
}
location ^~/apm/ {
proxy_pass http://localhost:8890/;
}
location ^~/apj/ {
proxy_pass http://localhost:8890/admin/;
}
استخدم IDEA لاستيراد جميع أكواد الخلفية في دليل التحليل ، بعد تنزيل جميع التبعيات، قم بتعديل محتوى التكوين في ملف application.yml وفقًا لحالتك الخاصة، بعد اكتمال التعديل، استخدم Navicat لإنشاء قاعدة بيانات باسم Bosszp و قم باستيراده إلى نفس مستوى ملف التكوين Bosszp.sql ، بعد استيراد جدول قاعدة البيانات يتم استيراد بيانات التوظيف إلى جدول الوظائف لقاعدة البيانات التي تم إنشاؤها باستخدام Navicat . قبل تشغيل رمز الخلفية، يجب تنظيف البيانات الموجودة في قاعدة البيانات أولاً، ويتم حذف البيانات المكررة وحذف البيانات غير ذات الصلة، ثم الكلمات الرئيسية التي تظهر فيها يتم استخدام اسم الوظيفة، وتصنيف كل معلومات الوظيفة، وأخيرًا توحيد نوع الحقول أو محتواها، ويرد أدناه نموذجان من البيانات المعالجة: (يتم عرض معلومات الحقل المطلوب معالجتها فقط).
عنوان | HandledAddress | this.transformAddress | يكتب | HandleType | حي |
---|---|---|---|---|---|
بكين | منطقة بكين-شونيي | بكين | مهندس التشغيل والصيانة | OperationsEngineer | منطقة شونيي |
شنتشن | منطقة شنتشن - لونغ قانغ | شنتشن | مهندس التشغيل والصيانة | OperationsEngineer | منطقة لونجانج |
WorkTag | HandleWorkTag | مرتب | HandleSalary | متوسط الراتب | راتبشهر |
---|---|---|---|---|---|
["تكوين الخادم"، "عمليات متعددة"، "خيوط متعددة"، "Linux"، "أساسيات الخوارزمية"، "بنية البيانات"، ""] | تكوين الخادم متعدد العمليات وبنية البيانات الأساسية لخوارزمية Linux متعددة الخيوط | [9000، 11000] | 9-11 ألف/شهر | 10000 | 0 الراتب |
["Python"، "Java"، "Go"، "TypeScript"، "التكنولوجيا الموزعة"، "تقنية الحاويات"، ""، ""] | Python Java Go TypeScript تكنولوجيا حاوية التكنولوجيا الموزعة | [15000، 25000] | 15-25 ألف شهريًا · 13 راتبًا | 20000 | 13 الراتب |
علامات الشركة | HandleCompanyTags | com.companyPeople | HandledCompanyPeople |
---|---|---|---|
لا أحد | [0، 20] | 0-20 شخص | |
["الفحص البدني المنتظم"، "التأمين الطبي التكميلي"، "الوجبات الخفيفة والشاي بعد الظهر"، "سفر الموظف"، "بدل العمل الإضافي"، "خيارات الأسهم"، "بدل الوجبات"، "مزايا العطلات"، "مكافأة نهاية العام" "،"خمسة التأمين والذهب"] | الفحص البدني المنتظم، والتأمين الطبي التكميلي، والوجبات الخفيفة، والشاي بعد الظهر، ودعم سفر الموظفين والعمل الإضافي، وخيارات الأسهم، ومكملات الوجبات، واستحقاقات العطلات، ومكافأة نهاية العام، وخمسة تأمينات وصندوق واحد | [0، 10000] | أكثر من 10000 شخص |
بعد اكتمال معالجة البيانات، يتم الانتهاء من عمل إعداد بيانات الخلفية، وأخيرًا، يبدأ البرنامج الرئيسي لرمز الخلفية. في حالة عدم حدوث أخطاء غير طبيعية، تكون عملية الخلفية ناجحة.
أولاً، استخدم الأمر npm لتثبيت مدير حزم الغزل عالميًا، ثم استخدم WebStorm لاستيراد جميع أكواد الواجهة الأمامية في دليل تحليل بيانات التوظيف ، بعد اكتمال الاستيراد، استخدم أمر تثبيت الغزل لتثبيت الوحدات المطلوبة بعد اكتمال تثبيت الوحدة ، قم بتشغيل أمر الغزل Run Build لتثبيت المشروع. بعد اكتمال التعبئة، سيتم إنشاء مجلد dist عند الانتهاء، عنوان الوصول المحلي لمكتب الاستقبال في Windows 11 هو: http://localhost/