kroomsa
1.0.0
محرك بحث للفضوليين. إنها خوارزمية بحث مصممة لجذب المستخدمين من خلال تعريضهم لمحتوى ذي صلة ولكنه مثير للاهتمام أثناء الجلسة.
تؤثر خوارزمية البحث المطبقة في موقع الويب الخاص بك بشكل كبير على تفاعل الزائرين. يمكن أن يؤدي التنفيذ اللائق إلى تقليل الاعتماد بشكل كبير على محركات البحث القياسية مثل Google لكل استعلام، وبالتالي زيادة المشاركة. تبحث الطرق التقليدية في المصطلحات أو العبارات في استعلامك للعثور على المحتوى ذي الصلة بناءً على المطابقة النحوية. يستخدم Kroomsa المطابقة الدلالية للعثور على المحتوى ذي الصلة باستعلامك. هناك تدوينة تتوسع في دوافع كرومسا وجوانبها التقنية.
python3 ./setup.py
في الدليل الجذر./vectorizer
./config
ضمن معلمة bot_codes
بالتنسيق التالي: "client_id client_secret user_agent"
كعناصر قائمة مفصولة بـ ,
python3 -m pip install -r ./preprocess_requirements.txt
python3 ./pre_processing/scraping/questions/scrape_questions.py
. يقوم بتشغيل برنامج نصي يقوم بإلغاء subreddits بشكل تسلسلي حتى بدايتها ويخزن التقديمات ككائنات JSON في /pre_processing/scraping/questions/scraped_questions
. ثم يقوم بعد ذلك بتقسيم عمليات الإرسال المسروقة إلى أجزاء متساوية بقدر ما توجد مثيلات مسجلة للروبوتات.bot_codes
، يمكننا البدء في حذف التعليقات باستخدام ملفات الإرسال المقسمة التي تم إنشاؤها أثناء إلغاء عمليات الإرسال. باستخدام الأمر التالي: python3 ./pre_processing/scraping/comments/scrape_comments.py
يتم إنشاء عمليات متعددة تجلب تدفقات التعليقات في وقت واحد.python3 ./pre_processing/db_insertion/insertion.py
. يقوم بإدراج المشاركات والتعليقات المرتبطة بها في مونغو.python3 ./post_processing/post_processing.py
. وبصرف النظر عن التنظيف، فإنه يضيف أيضًا رموزًا تعبيرية إلى كل كائن إرسال (هذا السلوك قابل للتكوين).python3 ./index/build_index.py
. افتراضيًا، يقوم بإنشاء IDMap, Flat
ولكنه قابل للتكوين من خلال الملف /config
./mongo_dump
. استخدم الأمر التالي في الدليل الجذر لإنشاء تفريغ قاعدة البيانات. mongodump --db database_name(default: red) --collection collection_name(default: questions) -o ./mongo_dump
.python3 -m pip install -r ./inference_requirements.txt
gunicorn -c ./gunicorn_config.py server:app
demo_mode
على True
في /config
.docker-compose build
docker-compose up
تم ترخيص هذا المشروع بموجب ترخيص Apache الإصدار 2.0