code_search
Code Search Dataset
중간 기사용 코드: "딥 러닝을 사용하여 임의 개체에 대한 자연어 의미 검색을 생성하는 방법"
여기에 제시된 기술은 오래되었으며 관련 논문과 함께 CodeSearchNet이라는 후속 프로젝트에서 상당히 개선되었습니다.
이 주제에 대한 보다 현대적인 접근 방식을 위해 앞서 언급한 프로젝트를 살펴보는 것이 좋습니다. 돌이켜보면 이 블로그 게시물은 다소 추악한 해킹에 가깝기 때문입니다.
이러한 컨테이너를 사용하여 작성자가 이 자습서에 사용한 환경을 재현할 수 있습니다. 도움이 될 경우를 대비하여 요구사항.txt 파일을 제공했습니다. 그러나 종속성이 직접 빌드하기 복잡할 수 있으므로 아래 제공된 Docker 컨테이너를 사용하는 것이 좋습니다.
hamelsmu/ml-gpu: 튜토리얼의 모든 GPU 바인딩 부분에 이 컨테이너를 사용합니다. 전체 튜토리얼을 aws p3.8xlarge
에서 실행하고 이 이미지를 사용하는 것이 좋습니다.
hamelsmu/ml-cpu: 이 튜토리얼의 모든 CPU 바인딩 부분에 이 컨테이너를 사용하세요.
노트북 폴더에는 튜토리얼의 1~5부에 해당하는 5개의 Jupyter 노트북이 포함되어 있습니다.
이 튜토리얼에서는 시퀀스-투-시퀀스 모델에 대한 이전 튜토리얼에서 제시된 자료에 대한 지식이 있다고 가정합니다.
우리는 이 튜토리얼을 최대한 쉽게 실행하기 위해 최선의 노력을 다했습니다. 개선할 점이 있다고 생각하시면 PR을 제출해 주세요!