code_search
Code Search Dataset
Code For Medium の記事:「深層学習を使用して任意のオブジェクトの自然言語セマンティック検索を作成する方法」
ここで紹介する手法は古いものですが、CodeSearchNet と呼ばれるその後のプロジェクトと関連する論文で大幅に改良されました。
振り返ってみると、このブログ投稿はやや醜いハックであるため、このトピックに対するより現代的なアプローチについては、前述のプロジェクトを参照することをお勧めします。
これらのコンテナを使用して、作成者がこのチュートリアルで使用した環境を再現できます。役立つ場合に備えて、requirements.txt ファイルを提供しましたが、依存関係を自分で構築するには複雑になる可能性があるため、以下に提供される Docker コンテナーを使用することを強くお勧めします。
Hamelsmu/ml-gpu: チュートリアルのGPUにバインドされた部分にはこのコンテナを使用します。チュートリアル全体を aws p3.8xlarge
で実行し、このイメージを使用することをお勧めします。
Hamelsmu/ml-cpu: このチュートリアルのCPUにバインドされた部分には、このコンテナを使用します。
ノートブック フォルダーには、チュートリアルのパート 1 ~ 5 に対応する 5 つの Jupyter ノートブックが含まれています。
このチュートリアルは、シーケンス間モデルに関する以前のチュートリアルで提示された内容の知識を前提としています。
私たちは、このチュートリアルをできるだけ簡単に実行できるように最善の努力を払ってきました。何か改善できると思われる場合は、PR を送信してください。