mfqp
1.0.0
試卷搜尋網站
$ jq ' . | length ' data/data.json
$ jq ' .[].Link ' data/data.json | awk -F ' " ' ' { if (match($2, /pdf$/) == 0 && match($2, /drive.google.com/) == 0) { print $2 } } ' | wc
# Find the original number of papers
$ jq ' .[].Link ' data/data.json | wc
# Find the number of unique records
$ jq ' .[].Link ' data/data.json | sort | uniq | wc
# Subtract the result of the second command
# from the first to get the number of duplicates
# oneliner to find the number of duplicates
$ echo $(( `jq '.[].Link' data / data.json | sort | uniq - D | wc - l` - `jq '.[].Link' data / data.json | sort | uniq - d | wc - l` ))
從data
資料夾執行以下命令:
python3 ../scripts/pdfFinder.py data.json
為此,您需要安裝 BS4。要安裝它,請運行:
pip3 install bs4 --user
這將使用圖書館網站上找到的 pdf 連結更新data.json
文件。然後從儲存庫的根目錄運行:
python3 remove_dups.py
這將刪除所有重複的條目。
執行以下命令,提交新的 data.json 檔案並推送到此儲存庫:
sed -ie " s/http://10.17.32.9/https://static.metakgp.org/g " data/data.json
或者如果您需要返回圖書館網站:
sed -ie " s/https://static.metakgp.org/http://10.17.32.9/g " data/data.json
根據 GNU 通用公共授權 v3.0 (GPLv3) 授權。
請閱讀 CONTRIBUTING.md 指南以了解更多資訊。