mfqp
1.0.0
เว็บไซต์สำหรับค้นหากระดาษคำถาม
$ jq ' . | length ' data/data.json
$ jq ' .[].Link ' data/data.json | awk -F ' " ' ' { if (match($2, /pdf$/) == 0 && match($2, /drive.google.com/) == 0) { print $2 } } ' | wc
# Find the original number of papers
$ jq ' .[].Link ' data/data.json | wc
# Find the number of unique records
$ jq ' .[].Link ' data/data.json | sort | uniq | wc
# Subtract the result of the second command
# from the first to get the number of duplicates
# oneliner to find the number of duplicates
$ echo $(( `jq '.[].Link' data / data.json | sort | uniq - D | wc - l` - `jq '.[].Link' data / data.json | sort | uniq - d | wc - l` ))
เรียกใช้สิ่งต่อไปนี้จากโฟลเดอร์ data
:
python3 ../scripts/pdfFinder.py data.json
คุณต้องติดตั้ง BS4 เพื่อสิ่งนั้น หากต้องการติดตั้ง ให้รัน:
pip3 install bs4 --user
สิ่งนี้จะอัปเดตไฟล์ data.json
ด้วยลิงก์ pdf ที่พบในไซต์ห้องสมุด จากนั้นจากไดเร็กทอรีรากของที่เก็บ ให้รัน:
python3 remove_dups.py
วิธีนี้จะตัดรายการที่ซ้ำกันทั้งหมด
รันคำสั่งต่อไปนี้ คอมมิตไฟล์ data.json ใหม่แล้วพุชไปที่ที่เก็บนี้:
sed -ie " s/http://10.17.32.9/https://static.metakgp.org/g " data/data.json
หรือถ้าคุณต้องการกลับไปที่ไซต์ห้องสมุด:
sed -ie " s/https://static.metakgp.org/http://10.17.32.9/g " data/data.json
ได้รับอนุญาตภายใต้ GNU General Public License v3.0 (GPLv3)
โปรดอ่านคู่มือ CONTRIBUTING.md เพื่อทราบข้อมูลเพิ่มเติม