Code für mittleren Artikel: „So erstellen Sie eine semantische Suche in natürlicher Sprache nach beliebigen Objekten mit Deep Learning“
Die hier vorgestellten Techniken sind alt und wurden in einem Folgeprojekt namens CodeSearchNet mit einem dazugehörigen Artikel deutlich verfeinert.
Ich empfehle, sich das oben genannte Projekt anzusehen, um einen moderneren Ansatz für dieses Thema zu finden, da dieser Blog-Beitrag im Nachhinein eher ein hässlicher Hack ist.
Mit diesen Containern können Sie die Umgebung reproduzieren, die die Autoren für dieses Tutorial verwendet haben. Falls es hilfreich ist, habe ich eine Datei „requirements.txt“ bereitgestellt. Wir empfehlen jedoch dringend, die unten bereitgestellten Docker-Container zu verwenden, da es schwierig sein kann, die Abhängigkeiten selbst zu erstellen.
hamelsmu/ml-gpu: Verwenden Sie diesen Container für alle GPU- gebundenen Teile des Tutorials. Wir empfehlen, das gesamte Tutorial auf einem aws p3.8xlarge
auszuführen und dieses Image zu verwenden.
hamelsmu/ml-cpu: Verwenden Sie diesen Container für alle CPU- gebundenen Teile dieses Tutorials.
Der Ordner „notebooks“ enthält 5 Jupyter-Notebooks, die den Teilen 1–5 des Tutorials entsprechen.
Dieses Tutorial setzt Kenntnisse des Materials voraus, das in einem früheren Tutorial zu Sequenz-zu-Sequenz-Modellen vorgestellt wurde.
Wir haben unser Bestes gegeben, um sicherzustellen, dass die Durchführung dieses Tutorials so schmerzlos wie möglich ist. Wenn Sie der Meinung sind, dass etwas verbessert werden kann, reichen Sie bitte eine PR ein!