- Recommander quelques outils de recherche scientifique que j'aime (certains se limitent au domaine de l'IA)
- Les outils marqués [À essayer] sont des outils que je n'ai pas encore utilisés mais qui me semblent utiles. Je vais les essayer dès que possible et décider de les conserver en fonction de l'expérience.
- Merci de me recommander à travers des problématiques etc. des outils de recherche scientifique dans le domaine de l'IA que vous trouvez utiles mais qui ne figurent pas sur cette liste Merci.
De manière générale, lorsque j'ai besoin de rechercher des fichiers PDF en fonction du titre d'un article ou d'autres informations, j'utiliserai d'abord dblp (les résultats de la recherche sont clairs et aucun Internet scientifique n'est requis). Pour certains cas particuliers, j'utiliserais à nouveau Google Scholar.
dblp : bibliographie informatique : un site Web de requêtes papier spécialement conçu pour CS, qui comprend des articles de premier ordre pouvant être récupérés. Vous pouvez rechercher les articles de l'auteur en fonction de conférences, de revues, etc., ce qui est utile lorsque vous souhaitez rechercher tous les articles d'une conférence informatique.
Google Scholar : en plus de rechercher des articles, vous pouvez consulter ici les statistiques des articles et les références des citations. Vous pouvez également recevoir des rappels de mise à jour des nouveaux articles en suivant les auteurs ou les articles, et utiliser les recommandations automatisées pour fournir une bibliothèque de base.
Érudit sémantique : peut être combiné avec des documents externes pour effectuer une analyse sémantique de l'article. Les fonctions comprennent : l'affichage des citations et des références, la mesure de l'influence du papier, l'affichage de graphiques papier, la génération automatique de mots-clés (en fonction des titres), l'analyse des auteurs, la recherche de ressources supplémentaires sur Internet (par exemple, des vidéos YouTube pertinentes) et la recommandation d'articles.
arXiv : un site Web de collection de prépublications d'articles.
arXiv-sanity : il présente de grandes améliorations par rapport à arXiv en termes de fonctionnalités, notamment l'affichage de résumés, de commentaires et de fonctions sociales, de recommandations et de bibliothèque très basiques pendant la navigation. La recherche fonctionne également mieux.
Sanité sémantique : un flux adaptatif personnalisé : créez votre propre flux de lecture arXiv personnalisé. Lors de la création de chaque flux, il vous sera demandé de sélectionner d'abord quelques articles, puis de commencer à recommander en fonction de ces articles. Vous pouvez aimer ou ne pas aimer les résultats recommandés pour vous aider à ajuster les résultats recommandés.
Paper Digest – IA pour le suivi et la synthèse des articles : fournit une liste des articles publiés la veille de l'abonnement par courrier électronique, avec un résumé d'une phrase de chaque article. Ce qui est plus important pour moi, c'est que ce site Web organisera également les articles de chaque grande conférence dès leur publication.
Documents avec code : connectez automatiquement les documents au référentiel GitHub et aux ensembles de données qui implémentent le code, et triez-les en fonction des collections GitHub. Affichez le SOTA sur chaque tâche à des fins de comparaison.
labmlai/annotated_deep_learning_paper_implementations : implémentations PyTorch de nombreux algorithmes, avec annotations en ligne. L'inconvénient est que la partie présentée n'est pas implémentée à partir de zéro et qu'une partie du code est placée dans son propre package.
Mendeley : Je l'utilise actuellement. Prend en charge plusieurs plates-formes telles que le Web, les PC, les Mac et les téléphones mobiles, peut directement annoter et mettre en surbrillance les PDF et dispose d'un stockage cloud gratuit avec une limite.
Zotero : Il peut capturer directement les références littéraires dans la page Web de la base de données documentaires. Il est souvent utilisé en conjonction avec Nut Cloud pour réaliser une synchronisation multi-extrémité de la gestion de la littérature (prend en charge MacOS, Windows, iPad, Linux, iOS).
Kimi Chat : produit de type ChatPGT, tout le monde devrait le connaître.
Cool Papers : Un site Web pour rédiger des articles développé par M. Su Jianlin. Vous pouvez l'explorer et l'utiliser vous-même selon le README.
CopyTranslator : Le plus grand avantage est qu'il dispose de fonctions telles que l'épinglage, le clic pour copier et la surveillance du presse-papiers. Il peut être commuté de manière transparente lors de la lecture de documents et est utilisé ensemble, ce qui est très pratique.
Saladict Saladict : Plug-in de traduction de navigateur, avec des paramètres très riches pour correspondre aux habitudes d'utilisation de l'utilisateur. En plus des documents officiels, vous pouvez également consulter Shalaqi + Alfred pour créer la meilleure expérience de traduction de documents ! Venez le découvrir. J'explore également comment implémenter la traduction hors navigateur sur les systèmes Windows.
J'utilisais Evernote, mais je l'ai arrêté et j'envisage de migrer.
Yuque : Très léger, j'utilise habituellement la version web. Parfois, certaines listes peuvent être synchronisées avec le téléphone mobile, ce qui est également très utile. Les nouveaux étudiants peuvent remplir mon code d'invitation QPFTUN pour recevoir un abonnement de 30 jours : kissing_heart :
Notion : Si vous avez besoin d'une collaboration et d'une gestion de projet à plusieurs personnes, Notion peut être plus adaptée.
the-incredible-pytorch : divers tutoriels, projets, vidéos et autres ressources sur PyTorch.
Computervision-recipes : produits par Microsoft, tutoriels sur diverses tâches de CV basés sur PyTorch.
Pytorch-Project-Template : un modèle de projet PyTorch extensible, comprenant des exemples de segmentation d'images, de classification d'objets, de GAN et d'apprentissage par renforcement.
pytorch-template : Un autre modèle de projet PyTorch.
torchinfo : imprime les informations du modèle PyTorch, y compris le nombre de paramètres de chaque couche du modèle, la taille du tenseur de sortie, etc.
flops-counter.pytorch : Calculez le total des FLOP du modèle (opérations en virgule flottante, comprises comme la quantité de calcul, qui peut être utilisée pour mesurer la complexité de l'algorithme/du modèle) et la proportion de chaque couche. L'inconvénient est qu'il ne semble pas prendre en charge les couches liées au RNN et que les informations imprimées ne sont pas très pratiques à lire.
La dernière version de PyTorch est déjà livrée avec Tensorboard. Tutoriel officiel.
visdom : [À essayer] Outil flexible pour créer, organiser et partager des visualisations de données riches en temps réel.
Visualiseur de convolution : si la configuration de la couche de convolution est relativement complexe et qu'il n'est pas pratique de calculer la taille de sortie, vous pouvez utiliser cet outil de visualisation pour vous aider.
Recherche d'ensembles de données Google
Recherche de données | Bifrost : recherche d'ensembles de données visuelles.
optuna : un framework pour l'optimisation automatique des hyperparamètres.
Microsoft/nni : [À essayer] Une boîte à outils open source d'apprentissage automatique automatique (AutoML) pour la recherche de modèles neuronaux et le réglage des hyperparamètres, prenant en charge la plupart des frameworks et environnements d'exploitation courants.
Hyperopt : [À essayer] Optimisation des hyperparamètres asynchrones distribués. J'ai vu quelqu'un le recommander sur Zhihu, mais selon la documentation, seuls deux algorithmes d'optimisation sont actuellement pris en charge et ils n'incluent pas l'optimisation bayésienne.
BoTorch : [A essayer] Bibliothèque d'optimisation bayésienne basée sur PyTorch.
automl/Auto-PyTorch : [À essayer] Recherche automatique de structure et recherche d'hyperparamètres basée sur PyTorch.
Divers modèles LaTeX, notamment des articles, des rapports, des affiches, etc.
Modèles au verso
Modèles LaTeX
Pour une collaboration à plusieurs, je recommande Overleaf, qui est aussi mon choix la plupart du temps. Les projets individuels peuvent utiliser VSCode pour l'écriture LaTeX hors ligne et coopérer avec les bibliothèques privées Github pour la gestion des versions.
Vous pouvez jeter un oeil aux recommandations de cet article : Avec ces sites Internet, rédiger des articles en anglais n'est plus difficile (Conseils d'introduction et d'utilisation de 15 sites d'aide à la rédaction d'articles en anglais) - Zhihu
Lingle : recherchez les collocations de mots anglais les plus fréquentes. À utiliser lorsque vous n'êtes pas sûr que votre expression soit correcte.
Corpus of Contemporary American English (COCA) : vous pouvez vérifier le corpus de collocations de mots en anglais américain et vous pouvez vérifier les phrases spécifiques utilisant ce mot. British National Corpus (BYU-BNC) : Un corpus d'anglais britannique, avec moins de corpus que celui de l'anglais américain.
Thésaurus : convertissez les mots bas de gamme en mots synonymes haut de gamme.
ESODA : un outil de requête de collocation de phrases adapté à l'écriture chinoise anglaise produit par Tsinghua HCI Lab. Un corpus d'articles qui peut changer d'orientation de recherche spécifique, afficher des usages alternatifs pertinents et prendre en charge des recherches mixtes en chinois et en anglais.
Mots et expressions : fréquence, genres, colocalisations, concordances, synonymes et WordNet : utilisez différentes couleurs pour distinguer les mots à haute, moyenne et basse fréquence, affichez le vocabulaire qui représente le type d'article et classez les mots remplaçables associés. Bien qu'il soit considéré comme une aide à la rédaction en anglais, je pense que sa plus grande utilité est d'apprendre le vocabulaire et les collocations couramment utilisés dans les articles dans des domaines connexes.
Quelques options en plus des différentes options de type ChatGPT. Soyez conscient des risques de fuite des outils de détection en ligne et manipulez le texte clé avec prudence.
Grammaire : vérifiez et modifiez la grammaire, les modèles de phrases, la ponctuation et la sélection de mots, avec les plug-ins du navigateur.
Nounplus.net : vérificateur de grammaire anglaise en ligne gratuit.
Mathpix : prenez des captures d'écran d'équations mathématiques complexes et convertissez-les en code LaTeX. Il peut gérer les impressions dans des PDF et les formules manuscrites dans les photos, etc.
MyScript Webdemo : le module Math peut convertir des formules manuscrites en code LaTeX ; en même temps, le module Diagram peut convertir des diagrammes fonctionnels dessinés à la main en diagrammes fonctionnels soignés.
Detexify Reconnaissance des symboles manuscrits LaTeX : Si vous oubliez comment représenter certains caractères dans LaTeX, vous pouvez les interroger par écriture manuscrite sur ce site Web.
OmniGraffle est disponible pour les systèmes Mac OS.
PPT est généralement mon premier choix : il est rapide à démarrer, propose de nombreux types, offre un haut degré de liberté et prend en charge l'exportation de graphiques vectoriels.
Paper-Picture-Writing-Code : code de dessin basé sur LaTex, comprenant des graphiques linéaires, des histogrammes, des nuages de points, une visualisation de l'attention et des graphiques de structure.
Academic-drawing : dessin Matlab/Python, principalement utilisé pour dessiner des données de séries chronologiques.
Awesome-latex-drawing : dessin LaTeX, principalement utilisé pour dessiner des réseaux bayésiens, des décompositions tensorielles, etc.
PlotNeuralNet : Python obtient des graphiques qui peuvent être utilisés dans LaTeX, dessinant principalement CNN.
Il existe de nombreux sites Web proposant des services de conversion d’images dans différents formats. Voici juste une brève liste, vous pouvez également trouver d’autres sites Web similaires via les moteurs de recherche.
Convertir le format PNG/JPEG (Raster) au format EPS/PDF (vecteur) : convertissez les fichiers image au format jpg, png en fichiers eps.
Convertisseur EPS en PDF : Vous pouvez également convertir des fichiers EPS en images dans d'autres formats.
Recadrer des fichiers PDF en ligne - Outils PDF : recadrez les bords blancs des fichiers PDF.
TexLive est livré avec quelques outils en ligne de commande :
epstopdf <file.eps>
;pdfcrop <file.pdf>
. CCF-deadlines : vous pouvez filtrer les conférences avec des dates limites cette année en fonction de l'orientation de la recherche et du niveau du CCF. Il est relativement convivial pour les étudiants nationaux.
Dates limites des conférences sur l'IA : les conférences peuvent être filtrées en fonction des orientations de recherche. Mais il semble qu’il soit nécessaire de surfer scientifiquement sur Internet pour voir toutes les informations.
Liste des conférences : triées par date limite, les conférences expirées n'apparaîtront pas sur la page d'accueil. Il existe une page où vous pouvez voir quelles conférences ont lieu dans chaque direction de recherche, mais il n'y a aucun moyen de filtrer les conférences qui n'ont pas expiré en fonction de la direction de recherche.
Partenaire de la conférence : liste des dernières conférences et revues informatiques internationales. Vous pouvez vous inscrire pour suivre une conférence ou une revue. Il est relativement complet, mais les informations ne sont pas mises à jour en temps opportun.
À des fins d'examen aveugle, les liens vers des fichiers (tels que le code source) doivent parfois être anonymes. Certaines personnes choisissent de créer un compte anonyme sur Github, mais créer un compte pour chaque article de chaque conférence peut s'avérer trop fastidieux. J'ai trouvé quelques outils prenant en charge le partage de fichiers anonymes comme suit.
Dropbox : Probablement le plus couramment utilisé.
Cadre de science ouverte
Partage de figue
Processus de soumission d'article Arxiv - Lisez simplement cet article pour comprendre le processus de soumission d'un article à arXiv.
arxiv-latex-cleaner : nettoyez le code LaTeX du document pour répondre aux exigences de soumission sur arXiv. L'un des points forts est la possibilité de nettoyer automatiquement tout le contenu commenté dans le document.
au verso -> arxiv Processus de soumission fluide : si vous utilisez Overleaf (plutôt que de compiler du code LaTeX dans un article localement), vous pouvez vous référer à cet article pour télécharger d'abord le package de code source approprié, puis envisager d'utiliser arxiv-latex-cleaner.
Fournir un code clair et reproductible pour les articles publiés peut effectivement faire progresser le domaine. Voici quelques outils utiles pour le code open source.
ReproducibilityChecklist-v2.0 : une liste de contrôle de reproductibilité d'apprentissage automatique qui répertorie les documents que vous devez fournir pour améliorer la reproductibilité de votre article.
pigar : un outil permettant de générer automatiquement des fichiers d'exigences pour les projets Python.
Simulateur de pluie Rainyscope : son de pluie.
Salle d'étude musicale de LofiGirl : salle de diffusion de musique Lo-Fi en direct.