Código para artigo médio: "Como criar pesquisa semântica em linguagem natural para objetos arbitrários com aprendizado profundo"
As técnicas apresentadas aqui são antigas e foram significativamente refinadas em um projeto subsequente chamado CodeSearchNet, com um artigo associado.
Eu recomendo dar uma olhada no projeto mencionado acima para uma abordagem mais moderna deste tópico, já que, em retrospectiva, esta postagem do blog é um hack feio.
Você pode usar esses contêineres para reproduzir o ambiente que os autores usaram neste tutorial. Caso seja útil, forneci um arquivo require.txt, no entanto, é altamente recomendável usar os contêineres docker fornecidos abaixo, pois as dependências podem ser complicadas de construir você mesmo.
hamelsmu/ml-gpu: Use este contêiner para qualquer parte do tutorial vinculada à GPU . Recomendamos executar todo o tutorial em um aws p3.8xlarge
e usar esta imagem.
hamelsmu/ml-cpu: Use este contêiner para qualquer parte vinculada à CPU deste tutorial.
A pasta notebooks contém 5 notebooks Jupyter que correspondem às partes 1 a 5 do tutorial.
Este tutorial pressupõe o conhecimento do material apresentado em um tutorial anterior sobre modelos sequência a sequência.
Fizemos todos os esforços para garantir que a execução deste tutorial fosse o mais simples possível. Se você acha que algo pode ser melhorado, envie um PR!