Code pour article moyen : "Comment créer une recherche sémantique en langage naturel pour des objets arbitraires avec le Deep Learning"
Les techniques présentées ici sont anciennes et ont été considérablement affinées dans un projet ultérieur appelé CodeSearchNet, avec un article associé.
Je recommande de consulter le projet susmentionné pour une approche plus moderne de ce sujet, car rétrospectivement, ce billet de blog est en quelque sorte un vilain hack.
Vous pouvez utiliser ces conteneurs pour reproduire l'environnement utilisé par les auteurs pour ce tutoriel. Au cas où cela serait utile, j'ai fourni un fichier exigences.txt, cependant, nous vous recommandons fortement d'utiliser les conteneurs Docker fournis ci-dessous car les dépendances peuvent être compliquées à créer vous-même.
hamelsmu/ml-gpu : utilisez ce conteneur pour toutes les parties du didacticiel liées au GPU . Nous vous recommandons d'exécuter l'intégralité du didacticiel sur un aws p3.8xlarge
et d'utiliser cette image.
hamelsmu/ml-cpu : utilisez ce conteneur pour toutes les parties liées au processeur de ce didacticiel.
Le dossier notebooks contient 5 notebooks Jupyter qui correspondent aux parties 1 à 5 du didacticiel.
Ce didacticiel suppose la connaissance du matériel présenté dans un didacticiel précédent sur les modèles séquence à séquence.
Nous avons fait de notre mieux pour que l'exécution de ce didacticiel soit aussi indolore que possible. Si vous pensez que quelque chose peut être amélioré, veuillez soumettre un PR !