Download mfqp - download do código-fonte mfqp

mfqp

Outro código-fonte

1.0.0

Baixar

mfqp

Site para pesquisa de documentos de perguntas

Utilitários

Número de artigos no arquivo json

$ jq ' . | length ' data/data.json

Encontre o número de artigos com link que não termina em PDF e não está no Drive

$ jq ' .[].Link ' data/data.json | awk -F ' " ' ' { if (match($2, /pdf$/) == 0 && match($2, /drive.google.com/) == 0) { print $2 } } ' | wc

Calcular o número de duplicatas

 # Find the original number of papers
$ jq ' .[].Link ' data/data.json | wc
# Find the number of unique records
$ jq ' .[].Link ' data/data.json | sort | uniq | wc
# Subtract the result of the second command
# from the first to get the number of duplicates

 # oneliner to find the number of duplicates
$ echo $(( `jq '.[].Link' data / data.json | sort | uniq - D | wc - l` - `jq '.[].Link' data / data.json | sort | uniq - d | wc - l` ))

Obtendo todos os links de papel do novo site da biblioteca

Execute o seguinte na pasta data :

python3 ../scripts/pdfFinder.py data.json

Você precisa instalar o BS4 para isso. Para instalá-lo, execute:

pip3 install bs4 --user

Isso atualizará o arquivo data.json com os links de PDF encontrados no site da biblioteca. Em seguida, no diretório raiz do repositório, execute:

python3 remove_dups.py

Isso eliminará todas as entradas duplicadas.

O site da biblioteca está fora do ar? ( http://10.17.32.9 )

Execute o seguinte comando, envie o novo arquivo data.json e envie para este repositório:

sed -ie " s/http://10.17.32.9/https://static.metakgp.org/g " data/data.json

ou se você precisar voltar ao site da biblioteca:

sed -ie " s/https://static.metakgp.org/http://10.17.32.9/g " data/data.json

LICENÇA

Licenciado sob GNU General Public License v3.0 (GPLv3).

Contribuindo

Leia o guia CONTRIBUTING.md para saber mais.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2024-12-25
tamanho 539.07KB
Vindo de Github

Aplicativos Relacionados

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
SmartTube

Outro código-fonte

24.71 Stable
Sunamu

Outro código-fonte

Release 2.2.0
waymo open dataset

Outro código-fonte

December 2023 Update
wp functions

Outras categorias

1.0.0
termwind

Outras categorias

v2.3.0

Informações Relacionadas Todos