kroomsa
1.0.0
เครื่องมือค้นหาสำหรับผู้อยากรู้อยากเห็น เป็นอัลกอริธึมการค้นหาที่ออกแบบมาเพื่อดึงดูดผู้ใช้โดยเปิดเผยเนื้อหาที่เกี่ยวข้องและน่าสนใจในระหว่างเซสชัน
อัลกอริธึมการค้นหาที่ใช้ในเว็บไซต์ของคุณมีอิทธิพลอย่างมากต่อการมีส่วนร่วมของผู้เข้าชม การใช้งานที่เหมาะสมสามารถลดการพึ่งพาเครื่องมือค้นหามาตรฐานเช่น Google ลงได้อย่างมากสำหรับทุกข้อความค้นหา ซึ่งจะเป็นการเพิ่มการมีส่วนร่วม วิธีการแบบดั้งเดิมจะดูคำหรือวลีในแบบสอบถามของคุณเพื่อค้นหาเนื้อหาที่เกี่ยวข้องโดยพิจารณาจากการจับคู่วากยสัมพันธ์ Kroomsa ใช้การจับคู่ความหมายเพื่อค้นหาเนื้อหาที่เกี่ยวข้องกับข้อความค้นหาของคุณ มีโพสต์ในบล็อกที่ขยายความเกี่ยวกับแรงจูงใจของ Kroomsa และแง่มุมทางเทคนิค
python3 ./setup.py
ในไดเร็กทอรีราก/vectorizer
/config
ภายใต้พารามิเตอร์ bot_codes
ในรูปแบบต่อไปนี้: "client_id client_secret user_agent"
เป็นองค์ประกอบรายการที่คั่นด้วย ,
python3 -m pip install -r ./preprocess_requirements.txt
python3 ./pre_processing/scraping/questions/scrape_questions.py
เปิดตัวสคริปต์ที่คัดลอก subreddits ตามลำดับจนถึงการเริ่มต้นและจัดเก็บการส่งเป็นวัตถุ JSON ใน /pre_processing/scraping/questions/scraped_questions
จากนั้นจะแบ่งพาร์ติชันการส่งที่คัดลอกออกเป็นส่วนเท่าๆ กันตามที่มีอินสแตนซ์ของบอทที่ลงทะเบียนไว้bot_codes
แล้ว เราก็สามารถเริ่มคัดลอกความคิดเห็นได้โดยใช้ไฟล์การส่งแบบแบ่งพาร์ติชันที่สร้างขึ้นขณะคัดลอกการส่ง การใช้คำสั่งต่อไปนี้: python3 ./pre_processing/scraping/comments/scrape_comments.py
มีกระบวนการหลายกระบวนการที่ดึงข้อมูลสตรีมความคิดเห็นพร้อมกันpython3 ./pre_processing/db_insertion/insertion.py
มันแทรกโพสต์และความคิดเห็นที่เกี่ยวข้องใน mongopython3 ./post_processing/post_processing.py
นอกเหนือจากการทำความสะอาดแล้ว ยังเพิ่มอิโมจิให้กับวัตถุการส่งแต่ละรายการด้วย (ลักษณะการทำงานนี้สามารถกำหนดค่าได้)python3 ./index/build_index.py
ตามค่าเริ่มต้น ระบบจะสร้าง IDMap, Flat
แต่สามารถกำหนดค่าได้ผ่าน /config
/mongo_dump
ใช้คำสั่งต่อไปนี้ที่ root dir เพื่อสร้างดัมพ์ฐานข้อมูล mongodump --db database_name(default: red) --collection collection_name(default: questions) -o ./mongo_dump
python3 -m pip install -r ./inference_requirements.txt
gunicorn -c ./gunicorn_config.py server:app
demo_mode
เป็น True
ใน /config
docker-compose build
docker-compose up
โครงการนี้ได้รับอนุญาตภายใต้ Apache License เวอร์ชัน 2.0