Obtenha todos os vídeos curtidos, vídeos de um usuário, vídeos com um som específico, etc. do TikTok e crie um script para baixá-los com yt-dlp
Baixe a extensão seguindo as instruções que você pode encontrar no README da extensão. Em seguida, altere as opções de conversão (se desejar) e clique no botão para iniciar a conversão. A extensão cuidará de todo o resto.
Abra a página TikTok do usuário/som/etc. você deseja que todos os vídeos sejam baixados. Pressione Ctrl (ou Cmd se você estiver em um Mac) + Shift + I para abrir as Ferramentas do Desenvolvedor. Vá para a guia Console na parte superior (se não a vir, clique em >>
) e cole o conteúdo que encontrar no arquivo script.js. Se preferir uma versão reduzida, você pode encontrá-la aqui. Pressione Enter.
A página da web rolará automaticamente até que nenhum outro item seja encontrado. Em seguida, um arquivo chamado “TikTokLinks.txt” será baixado. Agora você pode baixar os vídeos com yt-dlp. Um exemplo de script é:
yt-dlp -a TikTokLinks.txt -o "TikTok/%(uploader)s/%(title)s - %(id)s.%(ext)s"
Observe que a parte mais importante deste script é -a TikTokLinks.txt
: ao escrever isso, yt-dlp baixará todos os vídeos que estão no arquivo txt. Você pode então adicionar todos os argumentos que preferir ao yt-dlp
Se você precisar baixar uma lista muito longa de TikTok, você pode começar a baixá-los enquanto a página continua rolando. Para fazer isso, você pode baixar um arquivo intermediário, que conterá todos os links até o ponto em que a página foi rolada. Para fazer isso, escreva no console requestTxtNow()
, pressione enter e um arquivo TikTokLinks.txt
será baixado. Se estiver usando a extensão, você encontrará o botão “Obter arquivo parcial”. Clique nele e o arquivo será baixado automaticamente.
Por padrão, os links nos primeiros arquivos intermediários serão excluídos do arquivo final (ou do segundo/terceiro arquivo, etc., se você quiser baixar mais arquivos intermediários), para que você não baixe nenhuma duplicata. Você pode mudar isso colocando a opção delete_from_next_txt
como false.
Você pode editar os valores das primeiras cinco linhas do script para alterar algumas configurações úteis:
scrolling_min_time
& scrolling_max_time
: altera a suspensão do thread entre uma rolagem e a próxima.min_views
: não adicione um vídeo ao arquivo de texto se ele tiver menos de x visualizações.delete_from_next_txt
: coloque como false se quiser que os arquivos txt finais tenham todos os links, mesmo aqueles que você já baixou com arquivos intermediários.output_name_type
: escolha o formato do nome do arquivo de saída. As entradas válidas são:adapt_text_output
: substitui caracteres inseguros do Windows pelo nome do arquivo de saída.allow_images
: salva também fotos do TikTok (se desabilitado, apenas vídeos serão buscados).export_format
: você pode escolher se deseja salvar o resultado como um arquivo TXT ( txt
) ou como um arquivo JSON ( json
)exclude_from_json
: preencha este array com as chaves que você não deseja salvar em seu arquivo JSON. Por padrão, o arquivo JSON possui as chaves url
, caption
e views
.Essas opções realmente úteis permitem alterar a forma como o script busca os dados e o que deve fazer quando erros são encontrados.
get_array_after_scroll
: altere isto se quiser buscar todos os vídeos do TikTok quando o script terminar de rolar, e não após cada rolagem. Tenha em mente que parece que o TikTok não anexa os vídeos anteriores, então esta opção não deve ser relevante, mas isso pode mudar no futuro.get_link_by_filter
: use o novo método para obter todos os links em um contêiner de vídeo e procure aquele que contém a estrutura de URL do vídeo. Se for falso, será usado o método "antigo" de uso de atributos de dados (mesmo que eu não tenha conseguido encontrar mais tags, não posso garantir que esse método antigo tenha todas elas).check_nullish_link
: verifica se o link é nulo e, como seria inútil anexá-lo, continue com o próximo link. É recomendado deixar este conjunto como verdadeiro.log_link_error
: grava no console se um link for nulo.maximum_downloads
: se o número de itens buscados for superior a este número, o processo de busca será interrompidoget_array_after_scroll
deve ser definida como falsedelete_from_dom
: Exclua os itens anteriores do DOM, para que o desempenho possa ser melhorado. Observe que isso é experimental e pode quebrar a página do TikTok no futuro. Portanto, use-o apenas se precisar (para páginas grandes)get_array_after_scroll
como false. Caso contrário, este valor será ignorado. Este script está licenciado sob a licença MIT.
Mesmo que basicamente a única coisa que esse script faça seja rolar automaticamente a página da web, então não há um risco tão grande, não assumo nenhuma responsabilidade pelo uso deste script e pelas eventuais consequências.